Schulungsübersicht
Einführung in Apache Iceberg
- Überblick über Apache Iceberg
- Wiederholung der Grundlagen
Tiefgang in die Iceberg-Architektur
- Detaillierte Analyse des Tabellenformats von Iceberg
- Überblick über die detaillierte Architektur, einschließlich Metadaten und Dateilayouts
- Interne Abläufe von Schemakonvertierungen und Partitionierungsevolutionen
Erweiterte Installation und Konfiguration
- Konfiguration von Iceberg für optimale Leistung in verschiedenen Umgebungen
- Integration mit verschiedenen Datenverarbeitungssystemen
- Erweiterte Einrichtung: Sicherheit, Verschlüsselung und Zugriffskontrollen
- Einrichtung von Iceberg in einer verteilten Umgebung
Erweiterte Betriebs- und Wartungsprozesse
- Verwalten von groß angelegten Iceberg-Tabellen
- Implementierung und Verwaltung komplexer Schemakonvertierungen
- Handhabung von Partitionierungsevolutionen und verborgenen Partitionierungen
- Erweiterte CRUD-Operationen mit Schemakonvertierungen und Partitionierungsevolutionen
Abfrageoptimierungstechniken
- Techniken zur Reduzierung der Abfragelatenz
- Partitionierungs- und Dateiausschluss
- Metadatencaching und Optimierungsstrategien
- Implementierung und Testen von Abfrageoptimierungsverfahren
Leistungsoptimierung für große Datensätze
- Optimieren der Leistung für groß angelegte Datensätze
- Nutzung integrierter Iceberg-Funktionen zur Leistungssteigerung
- Fallstudien zur Leistungssteigerung in realen Szenarien
- Tuning der Leistung für groß angelegte Datensätze
Erweiterte Datenmigration und -integration
- Migration komplexer Datenstrukturen von anderen Systemen
- Integration von Iceberg mit Echtzeit-Datenströmen
- Migration komplexer Datensätze und Integration von Echtzeit-Datenströmen
Zuverlässigkeit und Konsistenz
- Sicherstellung der Datenkonsistenz und -integrität in verteilten Umgebungen
- Implementierung und Verwaltung von transaktionalen Garantien
- Handhabung von Fehlern und Wiederherstellungsmethoden
- Implementierung von Zuverlässigkeits- und Konsistenzfunktionen
Erweiterte Funktionen und Anpassungen
- Benutzerdefinierte Katalogimplementierungen
- Erweiterung von Iceberg mit benutzerdefinierten Funktionen
- Implementierung benutzerdefinierter Kataloge und Erweiterung der Iceberg-Funktionalitäten
Datengovernance und Konformität
- Implementierung von Datengovernance-Richtlinien
- Einhaltung von Datenschutzvorschriften
- Verwaltung von Audit-Logs und Datenprovenienz
- Implementierung von Governance- und Konformitätsfunktionen
Zusammenfassung und Nächste Schritte
Voraussetzungen
- Kenntnis der Kernkonzepte, grundlegenden Operationen und Iceberg-Tabellenverwaltung
Zielgruppe
- Data Engineers
- Data Architects
- Data Analysts
- Softwareentwickler
Erfahrungsberichte (5)
Die Tatsache, dass wir die meisten Informationen, Kurse, Präsentationen und Übungen mitnehmen konnten, sodass wir sie noch einmal durchgehen und eventuell das Wiederholen können, was wir beim ersten Mal nicht verstanden haben, oder das Verbessern, was wir bereits gemacht haben.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
Maschinelle Übersetzung
sehr interaktiv...
Richard Langford
Kurs - SMACK Stack for Data Science
Maschinelle Übersetzung
Ausreichend praktische Übungen, der Trainer ist wissensreich
Chris Tan
Kurs - A Practical Introduction to Stream Processing
Maschinelle Übersetzung
Erfahren Sie mehr über Spark Streaming, Databricks und AWS Redshift.
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Kurs - Apache Spark in the Cloud
Maschinelle Übersetzung
Übungsaufgaben
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs - Python and Spark for Big Data (PySpark)
Maschinelle Übersetzung