NVIDIA GPU Programming Schulung
In diesem Kurs wird das Programmieren von GPU für Parallel Computing behandelt. Einige der Anwendungen umfassen Deep Learning-, Analytics- und Engineering-Anwendungen.
Schulungsübersicht
Tag 1 – Einführung und Grundlagen
- Warum paralleles Rechnen? Bedarf an Parallel-Computing-Multi-Core-Prozessoren – Architektur und Design Einführung in Threads, Thread-Grundlagen und Grundkonzepte der parallelen Programmierung OpenMP – Ein Standard für direktivbasierte Parallelität Programming Praktische Übungen/Demonstration verschiedener Programme auf Multi-Core-Maschinen
Tag 2 – GPU Programming
- GPUs für paralleles Computing GPUs Programming Praktisches Modell/Demonstration verschiedener Programme auf GPU SDK, Toolkit und Installation der Umgebung für GPU Arbeiten mit verschiedenen Bibliotheken Demonstration von GPU und Tools mit Beispielprogrammen und OpenACC
Voraussetzungen
C Programming, Linux GCC
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
NVIDIA GPU Programming Schulung - Booking
NVIDIA GPU Programming Schulung - Enquiry
NVIDIA GPU Programming - Beratungsanfrage
Erfahrungsberichte (2)
Sehr interaktiv mit verschiedenen Beispielen, mit einer guten Progression in der Komplexität zwischen dem Beginn und dem Ende des Trainings.
Jenny - Andheo
Kurs - GPU Programming with CUDA and Python
Maschinelle Übersetzung
Energie und Humor des Trainers.
Tadeusz Kaluba - Nokia Solutions and Networks Sp. z o.o.
Kurs - NVIDIA GPU Programming - Extended
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Administration of CUDA
35 StundenDiese von einem Trainer geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Systemadministratoren und IT-Experten, die CUDA-Umgebungen installieren, konfigurieren, verwalten und Fehler beheben möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- die Architektur, die Komponenten und die Fähigkeiten von CUDA zu verstehen.
- CUDA Umgebungen zu installieren und zu konfigurieren.
- CUDA-Ressourcen zu verwalten und zu optimieren.
- Häufige CUDA Probleme zu debuggen und zu beheben.
GPU Programming with CUDA and Python
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Entwickler, die CUDA verwenden möchten, um Python Anwendungen zu erstellen, die parallel auf NVIDIA-GPUs laufen.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Verwenden Sie den Numba-Compiler zur Beschleunigung Python von Anwendungen, die auf NVIDIA-GPUs laufen.
- Erstellen, Kompilieren und Starten von benutzerdefinierten CUDA-Kernels.
- Verwaltung des GPU-Speichers.
- Konvertieren Sie eine CPU-basierte Anwendung in eine GPU-beschleunigte Anwendung.
AMD GPU Programming
28 StundenDiese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die ROCm und HIP zur Programmierung von AMD GPUs und zur Ausnutzung ihrer Parallelität verwenden möchten.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Eine Entwicklungsumgebung einzurichten, die die ROCm-Plattform, einen AMD GPU- und Visual Studio-Code enthält.
- Ein grundlegendes ROCm-Programm erstellen, das eine Vektoraddition auf dem GPU durchführt und die Ergebnisse aus dem GPU-Speicher abruft.
- Verwenden Sie die ROCm-API, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kernel zu starten und Threads zu synchronisieren.
- HIP-Sprache verwenden, um Kernel zu schreiben, die auf GPU ausgeführt werden und Daten manipulieren.
- Verwendung der in HIP integrierten Funktionen, Variablen und Bibliotheken, um allgemeine Aufgaben und Operationen auszuführen.
- Verwendung von ROCm- und HIP-Speicherbereichen, wie z. B. global, gemeinsam genutzt, konstant und lokal, um Datenübertragungen und Speicherzugriffe zu optimieren.
- Verwendung von ROCm- und HIP-Ausführungsmodellen zur Steuerung der Threads, Blöcke und Grids, die die Parallelität definieren.
- Debuggen und Testen von ROCm- und HIP-Programmen mit Werkzeugen wie dem ROCm Debugger und dem ROCm Profiler.
- Optimieren von ROCm- und HIP-Programmen mit Techniken wie Coalescing, Caching, Prefetching und Profiling.
Introduction to GPU Programming
21 StundenDiese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die die Grundlagen der GPU-Programmierung sowie die wichtigsten Frameworks und Tools für die Entwicklung von GPU-Anwendungen erlernen möchten.
- Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
den Unterschied zwischen CPU- und GPU-Computing sowie die Vorteile und Herausforderungen der GPU-Programmierung zu verstehen. - Das richtige Framework und Tool für ihre GPU-Anwendung auswählen.
- ein grundlegendes GPU-Programm zu erstellen, das eine Vektoraddition mit einem oder mehreren der Frameworks und Tools durchführt.
- Verwenden Sie die entsprechenden APIs, Sprachen und Bibliotheken, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kernel zu starten und Threads zu synchronisieren.
- Verwendung der jeweiligen Speicherbereiche, wie z. B. global, lokal, konstant und privat, um Datenübertragungen und Speicherzugriffe zu optimieren.
- Verwendung der jeweiligen Ausführungsmodelle, wie Work-Items, Work-Groups, Threads, Blöcke und Grids, um die Parallelität zu steuern.
- Debuggen und Testen von GPU-Programmen mit Tools wie CodeXL, CUDA-GDB, CUDA-MEMCHECK und NVIDIA Nsight.
- Optimieren von GPU-Programmen mit Techniken wie Coalescing, Caching, Prefetching und Profiling.
GPU Programming with CUDA
28 StundenDiese von einem Trainer geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die CUDA zur Programmierung von NVIDIA GPU-Systemen und zur Ausnutzung ihrer Parallelität verwenden möchten.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Eine Entwicklungsumgebung einrichten, die das CUDA Toolkit, einen NVIDIA GPU und Visual Studio Code enthält.
- Ein grundlegendes CUDA Programm erstellen, das eine Vektoraddition auf dem GPU durchführt und die Ergebnisse aus dem GPU Speicher abruft.
- Verwenden Sie die CUDA API, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kernel zu starten und Threads zu synchronisieren.
- Verwendung der Sprache CUDA C/C++ zum Schreiben von Kernels, die auf dem GPU ausgeführt werden und Daten manipulieren.
- Verwendung der in CUDA integrierten Funktionen, Variablen und Bibliotheken, um allgemeine Aufgaben und Operationen durchzuführen.
- Verwendung von CUDA-Speicherbereichen, wie z. B. globale, gemeinsam genutzte, konstante und lokale Speicherbereiche, um Datenübertragungen und Speicherzugriffe zu optimieren.
- Verwendung des CUDA-Ausführungsmodells zur Steuerung der Threads, Blöcke und Grids, die die Parallelität definieren.
- Debuggen und Testen von CUDA Programmen mit Tools wie CUDA-GDB, CUDA-MEMCHECK und NVIDIA Nsight.
- Optimieren von CUDA Programmen mit Techniken wie Coalescing, Caching, Prefetching und Profiling.
GPU Programming with OpenACC
28 StundenDiese von einem Trainer geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die OpenACC zur Programmierung heterogener Geräte und zur Ausnutzung ihrer Parallelität verwenden möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Eine Entwicklungsumgebung einzurichten, die OpenACC SDK, ein Gerät, das OpenACC unterstützt, und Visual Studio Code enthält.
- ein grundlegendes OpenACC-Programm zu erstellen, das eine Vektoraddition auf dem Gerät durchführt und die Ergebnisse aus dem Gerätespeicher abruft.
- Verwenden Sie OpenACC-Direktiven und -Klauseln, um den Code zu kommentieren und die parallelen Regionen, Datenbewegungen und Optimierungsoptionen anzugeben.
- Verwenden Sie die OpenACC-API, um Geräteinformationen abzufragen, die Gerätenummer festzulegen, Fehler zu behandeln und Ereignisse zu synchronisieren.
- Verwendung von OpenACC-Bibliotheken und Interoperabilitätsfunktionen zur Integration von OpenACC mit anderen Programmiermodellen, wie CUDA, OpenMP und MPI.
- OpenACC-Tools verwenden, um OpenACC-Programme zu profilieren und zu debuggen und Leistungsengpässe und -möglichkeiten zu identifizieren.
- OpenACC-Programme mit Techniken wie Datenlokalität, Schleifenfusion, Kernel-Fusion und Auto-Tuning zu optimieren.
GPU Programming with OpenCL
28 StundenDiese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die OpenCL zur Programmierung heterogener Geräte und zur Nutzung ihrer Parallelität verwenden möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein,:
- Eine Entwicklungsumgebung einrichten, die das OpenCL SDK, ein Gerät, das OpenCL unterstützt, und Visual Studio Code enthält.
- Ein grundlegendes OpenCL-Programm erstellen, das eine Vektoraddition auf dem Gerät durchführt und die Ergebnisse aus dem Gerätespeicher abruft.
- Verwenden Sie OpenCL API, um Geräteinformationen abzufragen, Kontexte, Befehlswarteschlangen, Puffer, Kernel und Ereignisse zu erstellen.
- Verwendung der Sprache OpenCL C, um Kernel zu schreiben, die auf dem Gerät ausgeführt werden und Daten manipulieren.
- Verwendung von OpenCL eingebauten Funktionen, Erweiterungen und Bibliotheken, um allgemeine Aufgaben und Operationen durchzuführen.
- Verwendung von OpenCL Host- und Gerätespeichermodellen zur Optimierung von Datenübertragungen und Speicherzugriffen.
- Verwendung des OpenCL-Ausführungsmodells zur Steuerung der Work-Items, Work-Groups und ND-Ranges.
- Debuggen und Testen von OpenCL-Programmen mit Tools wie CodeXL, Intel VTune und NVIDIA Nsight.
- Optimieren von OpenCL-Programmen mit Techniken wie Vektorisierung, Schleifenabwicklung, lokalem Speicher und Profiling.
GPU Programming - OpenCL vs CUDA vs ROCm
28 StundenDiese von einem Trainer geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die verschiedene Frameworks für die GPU-Programmierung verwenden und deren Funktionen, Leistung und Kompatibilität vergleichen möchten.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Eine Entwicklungsumgebung einzurichten, die OpenCL SDK, CUDA Toolkit, ROCm Platform, ein Gerät, das OpenCL, CUDA oder ROCm unterstützt, und Visual Studio Code umfasst.
- Erstellen Sie ein grundlegendes GPU-Programm, das eine Vektoraddition mit OpenCL, CUDA und ROCm durchführt, und vergleichen Sie die Syntax, die Struktur und die Ausführung jedes Frameworks.
- Verwenden Sie die jeweiligen APIs, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kernel zu starten und Threads zu synchronisieren.
- Verwenden Sie die jeweiligen Sprachen, um Kernel zu schreiben, die auf dem Gerät ausgeführt werden und Daten manipulieren.
- Verwenden Sie die jeweiligen eingebauten Funktionen, Variablen und Bibliotheken, um allgemeine Aufgaben und Operationen durchzuführen.
- Verwenden Sie die jeweiligen Speicherbereiche, wie z. B. global, lokal, konstant und privat, um Datenübertragungen und Speicherzugriffe zu optimieren.
- Verwenden Sie die jeweiligen Ausführungsmodelle, um die Threads, Blöcke und Grids zu steuern, die die Parallelität definieren.
- Debuggen und Testen von GPU-Programmen mit Tools wie CodeXL, CUDA-GDB, CUDA-MEMCHECK und NVIDIA Nsight.
- Optimieren von GPU-Programmen mit Techniken wie Coalescing, Caching, Prefetching und Profiling.
NVIDIA GPU Programming - Extended
21 StundenDieser von einem Ausbilder geleitete Live-Schulungskurs in Schweiz deckt ab, wie man GPUs für paralleles Rechnen programmiert, wie man verschiedene Plattformen verwendet, wie man mit der CUDA-Plattform und ihren Funktionen arbeitet und wie man verschiedene Optimierungstechniken mit CUDA durchführt. Einige der Anwendungen umfassen Deep Learning, Analytik, Bildverarbeitung und technische Anwendungen.
ROCm for Windows
21 StundenDiese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und fortgeschrittene Entwickler, die ROCm unter Windows installieren und verwenden möchten, um AMD GPUs zu programmieren und deren Parallelität auszunutzen.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Eine Entwicklungsumgebung einzurichten, die die ROCm-Plattform, einen AMD GPU und Visual Studio Code unter Windows enthält.
- ein grundlegendes ROCm-Programm zu erstellen, das eine Vektoraddition auf dem GPU durchführt und die Ergebnisse aus dem GPU-Speicher abruft.
- Verwenden Sie die ROCm-API, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kernel zu starten und Threads zu synchronisieren.
- HIP-Sprache verwenden, um Kernel zu schreiben, die auf GPU ausgeführt werden und Daten manipulieren.
- Verwendung der in HIP integrierten Funktionen, Variablen und Bibliotheken, um allgemeine Aufgaben und Operationen auszuführen.
- Verwendung von ROCm- und HIP-Speicherbereichen, wie z. B. global, gemeinsam genutzt, konstant und lokal, um Datenübertragungen und Speicherzugriffe zu optimieren.
- Verwendung von ROCm- und HIP-Ausführungsmodellen zur Steuerung der Threads, Blöcke und Grids, die die Parallelität definieren.
- Debuggen und Testen von ROCm- und HIP-Programmen mit Werkzeugen wie dem ROCm Debugger und dem ROCm Profiler.
- Optimieren von ROCm- und HIP-Programmen mit Techniken wie Coalescing, Caching, Prefetching und Profiling.
Hardware-Accelerated Video Analytics
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Entwickler, die hardwarebeschleunigte Modelle zur Objekterkennung und -verfolgung für die Analyse von Streaming-Videodaten erstellen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Installieren und konfigurieren Sie die erforderliche Entwicklungsumgebung, Software und Bibliotheken, um mit der Entwicklung zu beginnen.
- Erstellen, Trainieren und Bereitstellen von Deep-Learning-Modellen zur Analyse von Live-Videobildern.
- Identifizieren, verfolgen, segmentieren und prognostizieren Sie verschiedene Objekte innerhalb von Videobildern.
- Optimieren Sie Modelle zur Objekterkennung und -verfolgung.
- Einsatz einer intelligenten Videoanalyseanwendung (IVA).