Schulungsübersicht
Einführung in Apache Iceberg
- Überblick über Apache Iceberg
- Wiederholung der Grundlagen
Tiefgang in die Iceberg-Architektur
- Detaillierte Analyse des Tabellenformats von Iceberg
- Überblick über die detaillierte Architektur, einschließlich Metadaten und Dateilayouts
- Interne Abläufe von Schemakonvertierungen und Partitionierungsevolutionen
Erweiterte Installation und Konfiguration
- Konfiguration von Iceberg für optimale Leistung in verschiedenen Umgebungen
- Integration mit verschiedenen Datenverarbeitungssystemen
- Erweiterte Einrichtung: Sicherheit, Verschlüsselung und Zugriffskontrollen
- Einrichtung von Iceberg in einer verteilten Umgebung
Erweiterte Betriebs- und Wartungsprozesse
- Verwalten von groß angelegten Iceberg-Tabellen
- Implementierung und Verwaltung komplexer Schemakonvertierungen
- Handhabung von Partitionierungsevolutionen und verborgenen Partitionierungen
- Erweiterte CRUD-Operationen mit Schemakonvertierungen und Partitionierungsevolutionen
Abfrageoptimierungstechniken
- Techniken zur Reduzierung der Abfragelatenz
- Partitionierungs- und Dateiausschluss
- Metadatencaching und Optimierungsstrategien
- Implementierung und Testen von Abfrageoptimierungsverfahren
Leistungsoptimierung für große Datensätze
- Optimieren der Leistung für groß angelegte Datensätze
- Nutzung integrierter Iceberg-Funktionen zur Leistungssteigerung
- Fallstudien zur Leistungssteigerung in realen Szenarien
- Tuning der Leistung für groß angelegte Datensätze
Erweiterte Datenmigration und -integration
- Migration komplexer Datenstrukturen von anderen Systemen
- Integration von Iceberg mit Echtzeit-Datenströmen
- Migration komplexer Datensätze und Integration von Echtzeit-Datenströmen
Zuverlässigkeit und Konsistenz
- Sicherstellung der Datenkonsistenz und -integrität in verteilten Umgebungen
- Implementierung und Verwaltung von transaktionalen Garantien
- Handhabung von Fehlern und Wiederherstellungsmethoden
- Implementierung von Zuverlässigkeits- und Konsistenzfunktionen
Erweiterte Funktionen und Anpassungen
- Benutzerdefinierte Katalogimplementierungen
- Erweiterung von Iceberg mit benutzerdefinierten Funktionen
- Implementierung benutzerdefinierter Kataloge und Erweiterung der Iceberg-Funktionalitäten
Datengovernance und Konformität
- Implementierung von Datengovernance-Richtlinien
- Einhaltung von Datenschutzvorschriften
- Verwaltung von Audit-Logs und Datenprovenienz
- Implementierung von Governance- und Konformitätsfunktionen
Zusammenfassung und Nächste Schritte
Voraussetzungen
- Kenntnis der Kernkonzepte, grundlegenden Operationen und Iceberg-Tabellenverwaltung
Zielgruppe
- Data Engineers
- Data Architects
- Data Analysts
- Softwareentwickler
Erfahrungsberichte (5)
Die Live-Beispiele
Ahmet Bolat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Genügend praktische Umsetzung, der Trainer ist kompetent
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Lernen Sie Spark Streaming, Databricks und AWS Redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung