Kurs Code
d2dbdpa
Dauer
21 hours (üblicherweise 3 Tage inklusive Pausen)
Voraussetzungen
Understanding of traditional data management and analysis methods like SQL, data warehouses, business intelligence, OLAP, etc... Understanding of basic statistics and probability (mean, variance, probability, conditional probability, etc....)
Überblick
Publikum
Wenn Sie versuchen, aus den Daten, auf die Sie Zugriff haben, einen Sinn zu machen, oder wenn Sie unstrukturierte Daten analysieren möchten, die im Internet verfügbar sind (z. B. Twitter, Linked in usw.), ist dieser Kurs für Sie.
Es richtet sich hauptsächlich an Entscheidungsträger und Personen, die entscheiden müssen, welche Daten gesammelt und welche analysiert werden sollten.
Es richtet sich nicht an Personen, die die Lösung konfigurieren. Diese Personen werden jedoch vom Gesamtüberblick profitieren.
Lieferungsmodus
Während des Kurses werden den Teilnehmern Arbeitsbeispiele von meist Open Source-Technologien vorgestellt.
Auf kurze Vorträge folgen Präsentationen und einfache Übungen der Teilnehmer
Inhalt und verwendete Software
Die gesamte verwendete Software wird jedes Mal aktualisiert, wenn der Kurs ausgeführt wird. Wir überprüfen daher die neuesten Versionen.
Es umfasst den Prozess vom Abrufen, Formatieren, Verarbeiten und Analysieren der Daten, um zu erklären, wie der Entscheidungsprozess mit maschinellem Lernen automatisiert werden kann.
Machine Translated
Schulungsübersicht
Quick Overview
- Data Sources
- Minding Data
- Recommender systems
- Target Marketing
Datatypes
- Structured vs unstructured
- Static vs streamed
- Attitudinal, behavioural and demographic data
- Data-driven vs user-driven analytics
- data validity
- Volume, velocity and variety of data
Models
- Building models
- Statistical Models
- Machine learning
Data Classification
- Clustering
- kGroups, k-means, the nearest neighbours
- Ant colonies, birds flocking
Predictive Models
- Decision trees
- Support vector machine
- Naive Bayes classification
- Neural networks
- Markov Model
- Regression
- Ensemble methods
ROI
- Benefit/Cost ratio
- Cost of software
- Cost of development
- Potential benefits
Building Models
- Data Preparation (MapReduce)
- Data cleansing
- Choosing methods
- Developing model
- Testing Model
- Model evaluation
- Model deployment and integration
Overview of Open Source and commercial software
- Selection of R-project package
- Python libraries
- Hadoop and Mahout
- Selected Apache projects related to Big Data and Analytics
- Selected commercial solution
- Integration with existing software and data sources
Courses Discounts
-
2021-03-17 2021-03-19Basel