Data Mining and Analysis Schulung
Zielsetzung:
Die Teilnehmer sind in der Lage, große Datensätze zu analysieren, Muster zu extrahieren und die richtigen Variablen auszuwählen, die sich auf die Ergebnisse auswirken, so dass ein neues Modell mit prädiktiven Ergebnissen prognostiziert werden kann.
Schulungsübersicht
-
Vorverarbeitung von Daten
- Data Cleaning
- Datenintegration und -umwandlung
- Datenreduktion
- Diskretisierung und Erstellung von Konzepthierarchien
-
Statistische Inferenz
- Wahrscheinlichkeitsverteilungen, Zufallsvariablen, Zentrales Grenzwertsatztheorem
- Stichprobenverfahren
- Konfidenzintervalle
- Statistische Inferenz
- Hypothesentests
-
Multivariate lineare Regression
- Spezifikation
- Auswahl von Teilmengen
- Schätzung
- Validierung
- Vorhersage
-
Klassifizierungsmethoden
- Logistische Regression
- Lineare Diskriminanzanalyse
- K-Nächste Nachbarn
- Naive Bayes
- Vergleich von Klassifizierungsmethoden
-
Neural Networks
- Anpassung neuronaler Netze
- Probleme beim Training neuronaler Netze
-
Entscheidungsbäume
- Regressionsbäume
- Klassifizierungsbäume
- Bäume vs. lineare Modelle
-
Bagging, Random Forests, Boosting
- Bagging
- Random Forests
- Boosten
-
Support-Vektor-Maschinen und flexible Klassifizierung
- Maximal Margin Klassifikator
- Support-Vektor-Klassifikatoren
- Unterstützungsvektor-Maschinen
- 2 und mehr Klassen SVM's
- Beziehung zur logistischen Regression
-
Hauptkomponentenanalyse
-
Clustering
- K-means-Clustering
- K-medoids Clustering
- Hierarchisches Clustering
- Dichtebasiertes Clustering
-
Modellbeurteilung und -auswahl
- Verzerrung, Varianz und Modellkomplexität
- Vorhersagefehler in der Stichprobe
- Der Bayes'sche Ansatz
- Kreuzvalidierung
- Bootstrap Methoden
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Data Mining and Analysis Schulung - Booking
Data Mining and Analysis Schulung - Enquiry
Data Mining and Analysis - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (5)
Ich habe von der Anleitung und den Beispielen aus dem Leben受益于指导和生活实例分享+回答所有问题。 (注意:提供的原文似乎包含中英文混杂的情况,“+ answering all questions”这部分在翻译时假设为需要翻译的英文部分。) Ich habe von der Anleitung und den Lebensbeispielen profitiert sowie die Beantwortung aller Fragen. (调整后的自然表达方式): Ich habe von der Anleitung und den Lebensbeispielen profitiert und alle Fragen beantwortet bekommen.
Marta Melloch - Amazon Development Center Poland Sp. z o.o.
Kurs - Data Mining and Analysis
Maschinelle Übersetzung
Ich habe es wirklich sehr genossen, das Beste von allem.
Halil polat - Amazon Development Center Poland Sp. z o.o.
Kurs - Data Mining and Analysis
Maschinelle Übersetzung
The information given was interesting and the best part was towards the end when we were provided with Data from Durex and worked on Data we are familiar with and perform operations to get results.
Jessica Chaar
Kurs - Data Mining and Analysis
Maschinelle Übersetzung
The hands-on exercise and the trainer capacity to explain complex topics in simple terms.
youssef chamoun
Kurs - Data Mining and Analysis
Maschinelle Übersetzung
I like the exercises done.
Nour Assaf
Kurs - Data Mining and Analysis
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Programming with Big Data in R
21 StundenBig Data ist ein Begriff, der sich auf Lösungen bezieht, mit denen große Datenmengen gespeichert und verarbeitet werden können. Entwickelt von Go Ogle zunächst, diese Big Data haben Lösungen entwickelt und inspiriert andere ähnliche Projekte, von denen viele als Quelle Frei zur Verfügung stehen. R ist eine beliebte Programmiersprache in der Finanzbranche.
R Fundamentals
21 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.
Data Mining with R
14 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R bietet eine Vielzahl von Paketen für das Data Mining.
Econometrics: Eviews and Risk Simulator
21 StundenDiese von einem Ausbilder geleitete Live-Schulung (online oder vor Ort) richtet sich an alle, die die Grundlagen der ökonometrischen Analyse und Modellierung erlernen und beherrschen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Erlernen und Verstehen der Grundlagen der Ökonometrie.
- Eviews und Risikosimulatoren nutzen.
Prognosen mit R
14 StundenDiese Live-Schulung in Schweiz (online oder vor Ort) richtet sich an fortgeschrittene Datenanalysten und Geschäftsleute, die Zeitreihenprognosen erstellen und Datenanalyse-Workflows mit R automatisieren möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Die Grundlagen der Prognosetechniken in R zu verstehen.
- Exponentielle Glättung und ARIMA-Modelle für die Zeitreihenanalyse anwenden.
- das Paket "forecast" zur Erstellung genauer Prognosemodelle zu nutzen.
- Prognose-Workflows für Geschäfts- und Forschungsanwendungen zu automatisieren.
HR Analytics for Public Organisations
14 StundenDiese von einem Ausbilder geleitete Live-Schulung (online oder vor Ort) richtet sich an Personalverantwortliche, die analytische Methoden zur Verbesserung der Unternehmensleistung einsetzen möchten. Dieser Kurs deckt sowohl qualitative als auch quantitative, empirische und statistische Ansätze ab.
Format des Kurses
- Interaktive Vorlesung und Diskussion.
- Viele Übungen und Praxis.
Optionen zur Kursanpassung
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
Marketinganalytik mit R
21 StundenPublikum
Business (Marketingmanager, Produktmanager, Kundenstammmanager) und ihre Teams; Kundeneinblicke Profis.
Überblick
Der Kurs folgt dem Kundenlebenszyklus, indem neue Kunden gewonnen, die bestehenden Kunden auf Rentabilität hin verwaltet, gute Kunden gehalten und schließlich verstanden werden, welche Kunden uns verlassen und warum. Wir werden mit echten (wenn auch anonymen) Daten aus einer Vielzahl von Branchen arbeiten, darunter Telekommunikation, Versicherungen, Medien und High-Tech.
Format
Vom Kursleiter geführtes Training über fünf halbtägige Sitzungen mit Übungen im Unterricht sowie Hausaufgaben. Es kann als Unterrichts- oder Fernkurs (online) angeboten werden.
R für Datenanalyse und Forschung
7 StundenPublikum
- Manager
- Entwickler
- Wissenschaftler
- Studenten
Format des Kurses
Online-Unterricht und Diskussion ODER persönliche Workshops
Einführung in R
21 StundenR ist eine Open-Source-freie Programmiersprache für statistische Computing, Datenanalyse und Grafik. Die Forschung wird von einer wachsenden Anzahl von Managern und Datenanalytikern innerhalb von Unternehmen und Akademien verwendet. R hat auch Nachfolger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Computerprogrammierungsfähigkeiten gefunden, die es einfach zu verwenden finden. Seine Beliebtheit liegt an der zunehmenden Verwendung von Data Mining für verschiedene Ziele, wie z. B. Anzeigenpreise, neue Medikamente schneller zu finden oder fin-tune Finanzmodelle. R verfügt über eine breite Palette von Paketen für die Datenmining.
Dieser Kurs umfasst die Manipulation von Objekten in R einschließlich Lesendaten, Zugriff auf R-Pakete, Schreiben R-Funktionen und Erstellen von informativen Grafiken. Es umfasst die Analyse von Daten mit gemeinsamen statistischen Modellen. Der Kurs lehrt, wie man die R-Software (https://www.r-project.org) sowohl auf einer Befehllinie als auch in einer grafischen Benutzeroberfläche (GUI) verwendet.
R
21 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.
Training Neural Network in R
14 StundenDieser Kurs ist eine Einführung in die Anwendung neuronaler Netze bei realen Problemen mit R-Project-Software.
Fortgeschrittene "R"-Programmierung
7 StundenDieser Kurs richtet sich an Datenwissenschaftler und Statistiker, die bereits über grundlegende R & C++ und R-Code-Kenntnisse verfügen und fortgeschrittene R-Code-Kenntnisse benötigen.
Ziel ist es, Teilnehmern, die an der Anwendung der Methoden bei der Arbeit interessiert sind, einen praktischen Kurs zur fortgeschrittenen R-Programmierung zu geben.
Branchenspezifische Beispiele sollen das Training für das Publikum relevant machen
Statistical Analysis using SPSS
21 StundenDiese von einem Kursleiter geleitete Live-Schulung in Schweiz (online oder vor Ort) richtet sich an Anfänger und Fortgeschrittene, die statistische Analysen mit SPSS durchführen möchten, um Daten genau zu interpretieren, komplexe statistische Tests durchzuführen und aussagekräftige Erkenntnisse zu gewinnen.
Am Ende dieses Kurses werden die Teilnehmer in der Lage sein:
- Die SPSS-Oberfläche zu navigieren und Datensätze effizient zu verwalten.
- Deskriptive und inferentielle statistische Analysen durchzuführen.
- t-Tests, ANOVA, MANOVA, Regressions- und Korrelationsanalysen durchzuführen.
- Nicht-parametrische Tests, Hauptkomponentenanalyse und Faktorenanalyse zur erweiterten Dateninterpretation anzuwenden.
Talent Acquisition Analytics
14 StundenDiese von einem Ausbilder geleitete Live-Schulung (online oder vor Ort) richtet sich an Personalverantwortliche und Rekrutierungsspezialisten, die analytische Methoden zur Verbesserung der Unternehmensleistung einsetzen möchten. Dieser Kurs deckt sowohl qualitative als auch quantitative, empirische und statistische Ansätze ab.
Format des Kurses
- Interaktive Vorlesung und Diskussion.
- Viele Übungen und Praxis.
Optionen zur Kursanpassung
- Wenn Sie eine maßgeschneiderte Schulung für diesen Kurs wünschen, nehmen Sie bitte Kontakt mit uns auf, um dies zu vereinbaren.
Introduction to Data Visualization with Tidyverse and R
7 StundenDas Tidyverse ist eine Sammlung vielseitiger R-Pakete zum Reinigen, Verarbeiten, Modellieren und Visualisieren von Daten. Einige der enthaltenen Pakete sind: ggplot2, dplyr, tidyr, readr, purrr und tibble.
In diesem von Lehrern geleiteten Live-Training lernen die Teilnehmer, wie sie Daten mit den im Tidyverse enthaltenen Tools Tidyverse und visualisieren.
Am Ende dieser Schulung können die Teilnehmer:
- Führen Sie eine Datenanalyse durch und erstellen Sie ansprechende Visualisierungen
- Ziehen Sie nützliche Schlussfolgerungen aus verschiedenen Datensätzen von Beispieldaten
- Filtern, sortieren und fassen Sie Daten zusammen, um Erkundungsfragen zu beantworten
- Wandeln Sie verarbeitete Daten in informative Liniendiagramme, Balkendiagramme und Histogramme um
- Importieren und filtern Sie Daten aus verschiedenen Datenquellen, einschließlich Excel , CSV- und SPSS-Dateien
Publikum
- Anfänger in die R-Sprache
- Einsteiger in die Datenanalyse und Datenvisualisierung
Format des Kurses
- Teilvorlesung, Teildiskussion, Übungen und viel praktisches Üben