Data Mining & Machine Learning with R Training Course
R ist eine kostenlose Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Zahl von Managern und Datenanalysten in Unternehmen und in der Wissenschaft verwendet. R verfügt über eine Vielzahl von Paketen für Data Mining.
Schulungsübersicht
Einführung in Data Mining und Machine Learning
- Statistisches Lernen vs. Maschinelles Lernen
- Iteration und Bewertung
- Bias-Varianz-Abwägung
Regression
- Lineare Regression
- Verallgemeinerungen und Nichtlinearität
- Übungen
Klassifizierung
- Bayessche Auffrischung
- Naiver Bayes
- Dikriminante Analyse
- Logistische Regression
- K-Nächste Nachbarn
- Support-Vektor-Maschinen
- Neuronale Netze
- Entscheidungsbäume
- Übungen
Kreuzvalidierung und Resampling
- Ansätze zur Kreuzvalidierung
- Bootstrap
- Übungen
Unüberwachtes Lernen
- K-Mittel-Clustering
- Beispiele
- Herausforderungen des unüberwachten Lernens und über K-means hinaus
Fortgeschrittene Themen
- Ensemble-Modelle
- Gemischte Modelle
- Verstärkung
- Beispiele
Mehrdimensionale Reduktion
- Faktorenanalyse
- Prinzipielle Komponentenanalyse
- Beispiele
Voraussetzungen
Dieser Kurs ist Teil des Skillsets Data Scientist (Bereich: Analytische Techniken und Methoden)
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
Data Mining & Machine Learning with R Training Course - Booking
Data Mining & Machine Learning with R Training Course - Enquiry
Data Mining & Machine Learning with R - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (1)
The trainer was so knowledgeable and included areas I was interested in.
Mohamed Salama
Kurs - Data Mining & Machine Learning with R
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
From Data to Decision with Big Data and Predictive Analytics
21 StundenPublikum
Wenn Sie versuchen, aus den Daten, auf die Sie Zugriff haben, einen Sinn zu machen, oder wenn Sie unstrukturierte Daten analysieren möchten, die im Internet verfügbar sind (z. B. Twitter, Linked in usw.), ist dieser Kurs für Sie.
Es richtet sich hauptsächlich an Entscheidungsträger und Personen, die entscheiden müssen, welche Daten gesammelt und welche analysiert werden sollten.
Es richtet sich nicht an Personen, die die Lösung konfigurieren. Diese Personen werden jedoch vom Gesamtüberblick profitieren.
Lieferungsmodus
Während des Kurses werden den Teilnehmern Arbeitsbeispiele von meist Open Source-Technologien vorgestellt.
Auf kurze Vorträge folgen Präsentationen und einfache Übungen der Teilnehmer
Inhalt und verwendete Software
Die gesamte verwendete Software wird jedes Mal aktualisiert, wenn der Kurs ausgeführt wird. Wir überprüfen daher die neuesten Versionen.
Es umfasst den Prozess vom Abrufen, Formatieren, Verarbeiten und Analysieren der Daten, um zu erklären, wie der Entscheidungsprozess mit maschinellem Lernen automatisiert werden kann.
Data Mining and Analysis
28 StundenZielsetzung:
Die Teilnehmer sind in der Lage, große Datensätze zu analysieren, Muster zu extrahieren und die richtigen Variablen auszuwählen, die sich auf die Ergebnisse auswirken, so dass ein neues Modell mit prädiktiven Ergebnissen prognostiziert werden kann.
Data Mining
21 StundenDer Kurs kann mit allen Tools bereitgestellt werden, einschließlich kostenloser Open-Source-Data-Mining-Software und Anwendungen
Data Mining with Python
14 StundenDiese Live-Schulung (vor Ort oder per Fernzugriff) richtet sich an Datenanalysten und Datenwissenschaftler, die fortgeschrittenere Datenanalysetechniken für das Data Mining mit Python implementieren möchten.
Am Ende dieser Schulung können die Teilnehmer:
- Wichtige Bereiche des Data Mining verstehen, einschließlich Assoziationsregel-Mining, Textstimmungsanalyse, automatische Textzusammenfassung und Erkennung von Datenanomalien.
- Verschiedene Strategien zur Lösung realer Data-Mining-Probleme vergleichen und implementieren.
- Die Ergebnisse verstehen und interpretieren.
Format des Kurses
- Interaktiver Vortrag und Diskussion.
- Viele Übungen und praktische Anwendungen.
- Praktische Umsetzung in einer Live-Lab-Umgebung.
Anpassungsoptionen für den Kurs
- Um eine individuelle Schulung für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um eine Vereinbarung zu treffen.
Data Mining with R
14 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R bietet eine Vielzahl von Paketen für das Data Mining.
Data Vault: Building a Scalable Data Warehouse
28 StundenIn dieser von einem Ausbilder geleiteten Live-Schulung in Schweiz lernen die Teilnehmer, wie man ein Data Vault erstellt.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- die Architektur und die Designkonzepte hinter Data Vault 2.0 und ihre Interaktion mit Big Data, NoSQL und KI zu verstehen.
- Data Vaulting-Techniken anwenden, um Auditing, Tracing und Inspektion von historischen Daten in einem Data Warehouse zu ermöglichen.
- Entwicklung eines konsistenten und wiederholbaren ETL-Prozesses (Extract, Transform, Load).
- Aufbau und Bereitstellung hoch skalierbarer und wiederholbarer Warehouses.
Data Visualization
28 StundenDieser Kurs richtet sich an Ingenieure und Entscheidungsträger, die im Bereich Data Mining und Knowledge Discovery arbeiten.
Sie lernen, wie Sie effektive Diagramme erstellen und Ihre Daten so präsentieren und darstellen, dass sie die Entscheidungsträger ansprechen und ihnen helfen, verborgene Informationen zu verstehen.
Data Science for Big Data Analytics
35 StundenBig Data sind Datenmengen, die so umfangreich und komplex sind, dass herkömmliche Anwendungssoftware für die Datenverarbeitung nicht ausreicht, um mit ihnen umzugehen. Zu den großen Datenherausforderungen gehören Datenerfassung, Datenspeicherung, Datenanalyse, Suche, Freigabe, Übertragung, Visualisierung, Abfrage, Aktualisierung und Datenschutz.
Foundation R
7 StundenDieser von einem Trainer durchführte Live-Kurs in Schweiz (online oder vor Ort) richtet sich an Anfängerinnen und Anfänger, die eine fundierte Kenntnis der Grundlagen von R und der Arbeit mit Daten erlangen möchten.
Am Ende dieses Kurses werden die TeilnehmerInnen in der Lage sein:
- Das R-Programmierumgebung und die RStudio-Oberfläche zu verstehen.
- Datensätze mithilfe von R-Befehlen und -Paketen einzulesen, zu manipulieren und zu erkunden.
- Einfache statistische Analysen durchzuführen und Daten zusammenzufassen.
- Mithilfe sowohl der Basissyntax von R als auch ggplot2 Visualisierungen zu erstellen.
- Arbeitsumgebungen, Skripte und Pakete effektiv zu verwalten.
KNIME Analytics Platform for BI
21 StundenKNIME Analytics Platform ist eine führende Open-Source-Option für datengetriebene Innovationen. Sie hilft Ihnen dabei, das in Ihren Daten verborgene Potenzial zu entdecken, neue Erkenntnisse zu gewinnen oder neue Zukünfte vorherzusagen. Mit mehr als 1000 Modulen, Hunderten von einsatzbereiten Beispielen, einer umfassenden Palette integrierter Tools und der größten Auswahl an fortschrittlichen Algorithmen ist die KNIME Analytics Platform die perfekte Toolbox für jeden Datenwissenschaftler und Geschäftsanalysten.
Dieser Kurs für die KNIME Analytics-Plattform ist eine ideale Gelegenheit für Anfänger, fortgeschrittene Benutzer und KNIME Experten, um sich mit KNIME zu machen, seine effektivere Verwendung zu erlernen und klare, umfassende Berichte auf der Grundlage von KNIME Workflows zu erstellen
Oracle SQL Intermediate - Data Extraction
14 StundenZiel des Kurses ist es, die Teilnehmer in die Lage zu versetzen, die Arbeit mit der Sprache SQL in der Datenbank Oracle zur Datenextraktion auf mittlerem Niveau zu beherrschen.
Process Mining
21 StundenProcess Mining oder Automated Business Process Discovery (ABPD) ist eine Technik, die Algorithmen auf Ereignisprotokolle anwendet, um Geschäftsprozesse zu analysieren. Process Mining geht über die Datenspeicherung und Datenanalyse hinaus; es verbindet Daten mit Prozessen und bietet Einblicke in die Trends und Muster, die die Prozesseffizienz beeinflussen.
Format des Kurses
- Der Kurs beginnt mit einem Überblick über die am häufigsten verwendeten Techniken für Process Mining. Wir besprechen die verschiedenen Algorithmen und Werkzeuge zur Prozesserkennung, die für die Erkennung und Modellierung von Prozessen auf der Grundlage von Ereignisrohdaten verwendet werden. Es werden Fallstudien aus der Praxis untersucht und Datensätze mit Hilfe des Open-Source-Frameworks ProM analysiert.
Introductory R for Biologists
28 StundenR ist eine freie Open-Source-Programmiersprache für statistische Berechnungen, Datenanalysen und Grafiken. R wird von einer wachsenden Anzahl von Managern und Datenanalysten in Unternehmen und Hochschulen verwendet. R hat auch Anhänger unter Statistikern, Ingenieuren und Wissenschaftlern ohne Programmierkenntnisse gefunden, die es einfach finden, es zu benutzen. Seine Popularität ist auf den zunehmenden Einsatz von Data Mining für verschiedene Zwecke zurückzuführen, z. B. die Festlegung von Anzeigenpreisen, die schnellere Suche nach neuen Arzneimitteln oder die Feinabstimmung von Finanzmodellen. R bietet eine Vielzahl von Paketen für das Data Mining.
Statistik mit SPSS Predictive Analytics SoftWare
14 StundenGoal:
Lernen mit SPSS auf der Ebene der Selbständigkeit zu arbeiten
Die Adressaten:
Analysten, Forscher, Wissenschaftler, Studenten und alle, die die Fähigkeit erwerben wollen, das SPSS-Paket zu verwenden und beliebte Data-Mining-Techniken zu erlernen.
Introduction to Data Visualization with Tidyverse and R
7 StundenZielgruppe
Kursformat
Am Ende des Trainings werden die Teilnehmer in der Lage sein:
In diesem unterrichteten und live durchgeführten Kurs lernen die Teilnehmer, wie man Daten mit den Tools aus dem Tidyverse manipuliert und visualisiert.
Der Tidyverse ist eine Sammlung vielseitiger R-Pakete zur Bereinigung, Verarbeitung, Modellierung und Visualisierung von Daten. Einige der enthaltenen Pakete sind: ggplot2, dplyr, tidyr, readr, purrr und tibble.
- Anfänger in der R-Sprache
- Anfänger im Bereich Datenanalyse und Datavisualisierung
- Teil Vorlesung, teil Diskussion, Übungen und intensives Praktikum
- Datenanalyse durchführen und ansprechende Visualisierungen erstellen
- Nützliche Schlussfolgerungen aus verschiedenen Datensätzen von Beispieldaten ziehen
- Daten filtern, sortieren und zusammenfassen, um forschungsorientierte Fragen zu beantworten
- Verarbeitete Daten in informatische Linien-, Balken- und Histogramme umwandeln
- Daten aus diversen Datensources importieren und filtern, einschließlich Excel, CSV und SPSS-Dateien