Schulung Java Data Pipelines mit Apache Flink
Alle Schulungen sind eine ausgewogene Mischung aus Theorie und praktischen Übungen und als öffentliche, online oder Inhouse Firmenschulung buchbar. Kontaktieren Sie uns gerne für ein unverbindliches Beratungsgespräch oder buchen Sie diese Schulung direkt bei unserem Partner der GFU Cyrus AG.
Schulungsinhalte
In dem Seminar “Java Data Pipelines mit Apache Flink” lernen Sie, wie Sie skalierbare und fehlertolerante Data-Streams mit Apache Flink entwickeln können. Sie werden eine Einführung in Stateful Stream Processing erhalten, einschließlich der Abgrenzung zu klassischen ETL-Prozessen, der Bedeutung von Parallel-Stream-Verarbeitung, Zeit, Zustand und Konsistenz.
Schulungsziel
Ziel des Workshops ist eine praktische Einführung in Apache Flink. Der Fokus liegt auf der Überwindung von Einstiegshürden. Konzepte und praxisnahe Beispiele werden gleichermaßen erarbeitet.
Wer sollte an der Schulung teilnehmen?
Software-Entwickler (Java) und Data-Scientists, die Apache Flink für Pipeline-Processing und Predictive Analytics verwenden möchten. Die Teilnehmer sollten über gute Programmierkenntnisse in Java, Erfahrung im Umgang mit einer IDE (z.B. IntelliJ, Eclipse) und Grundkenntnisse Datentransformationen und Machine Learning verfügen.
Schulungsaganda
- Stateful Stream Processing: Einführung & Grundlagen
- Abgrenzung zu klassischen Extract-Transform-Load (ETC) -Prozessen
- Parallel-Stream Verarbeitung
- Semantiken: Zeit, Zustand und Konsistenz
- Hello World mit Apache Flink
- Die Einrichtung Ihrer Entwicklungsumgebung
- Einbettung in Java-Projekte (Apache Maven)
- Die Architektur von Apache Flink
- Daten-Transfers
- Event-Time Verarbeitung
- Zustandsverwaltung: Checkpoints, Savepoints und Recovery
- Jobs im Detail
- Die DataStream API
- Time-Based und Window Operators
- Anbindung externer Systeme
- Filesystem
- Apache Kafka
- Machine Learning mit Flink ML
- Classification
- Clustering
- Feature Engineering
- Betrieb
- Kurzeinführung für Entwickler
- Best Praticies für Cluster: Docker oder Standalone?