Schulungsübersicht
I. Einleitung und Vorbemerkungen
1. Überblick
- R freundlicher machen, R und verfügbare GUIs
- Rstudio
- Verwandte Software und Dokumentation
- R und Statistik
- R interaktiv verwenden
- Eine einführende Sitzung
- Hilfe zu Funktionen und Merkmalen
- R-Befehle, Groß- und Kleinschreibung, etc.
- Aufrufen und Korrigieren von vorherigen Befehlen
- Ausführen von Befehlen aus einer Datei oder Umleiten der Ausgabe in eine Datei
- Datenpermanenz und Entfernen von Objekten
- Good Programmierpraxis: In sich geschlossene Skripte, gute Lesbarkeit z.B. strukturierte Skripte, Dokumentation, Markdown
- Installieren von Paketen; CRAN und Bioconductor
2. Lesen von Daten
- Txt-Dateien (read.delim)
- CSV-Dateien
3. Einfache Manipulationen; Zahlen und Vektoren + Arrays
- Vektoren und Zuweisung
- Vektorielle Arithmetik
- Erzeugen von regulären Sequenzen
- Logische Vektoren
- Fehlende Werte
- Zeichen-Vektoren
- Indexvektoren; Auswählen und Ändern von Teilmengen eines Datensatzes
- Arrays
- Indizierung von Arrays. Unterabschnitte eines Arrays
- Index-Matrizen
- Die Funktion array() + einfache Operationen auf Arrays, z.B. Multiplikation, Transposition
- Andere Arten von Objekten
4. Listen und Datenrahmen
- Listen
- Erstellen und Ändern von Listen
- Verkettung von Listen
- Datenrahmen
- Erstellen von Datenrahmen
- Arbeiten mit Datenrahmen
- Anhängen beliebiger Listen
- Verwalten des Suchpfads
5. Datenmanipulation
- Auswahl, Unterteilung von Beobachtungen und Variablen
- Filtern, Gruppieren
- Umkodierung, Transformationen
- Aggregation, Kombination von Datensätzen
- Bilden von partitionierten Matrizen, cbind() und rbind()
- Die Verkettungsfunktion (), mit Arrays
- Zeichenmanipulation, stringr-Paket
- Kurze Einführung in grep und regexpr
6. Mehr über das Lesen von Daten
- XLS-, XLSX-Dateien
- readr und readxl Pakete
- SPSS, SAS, Stata,... und andere Datenformate
- Exportieren von Daten in txt, csv und andere Formate
6. Gruppierung, Schleifen und bedingte Ausführung
- Gruppierte Ausdrücke
- Kontrollanweisungen
- Bedingte Ausführung: if-Anweisungen
- Wiederholte Ausführung: for-Schleifen, repeat und while
- Einführung in apply, lapply, sapply, tapply
7. Funktionen
- Erstellen von Funktionen
- Optionale Argumente und Standardwerte
- Variable Anzahl von Argumenten
- Umfang und seine Folgen
8. Einfache Grafiken in R
- Erstellen einer Grafik
- Density Plots
- Punktdiagramme
- Balkendiagramme
- Liniendiagramme
- Tortendiagramme
- Boxplots
- Streudiagramme
- Kombinierte Diagramme
II. Statistische Analyse in R
1. Wahrscheinlichkeitsverteilungen
- R als eine Reihe von statistischen Tabellen
- Untersuchung der Verteilung eines Datensatzes
2. Testen von Hypothesen
- Tests über einen Populationsmittelwert
- Likelihood-Ratio-Test
- Tests mit einer und zwei Stichproben
- Chi-Quadrat-Test Goodness-of-Fit-Test
- Kolmogorov-Smirnov-Ein-Stichproben-Statistik
- Wilcoxon Signed-Rank-Test
- Zwei-Stichproben-Test
- Wilcoxon-Rangsummen-Test
- Mann-Whitney-Test
- Kolmogorov-Smirnov-Test
3. Mehrfache Prüfung von Hypothesen
- Typ-I-Fehler und FDR
- ROC-Kurven und AUC
- Mehrfache Testverfahren (BH, Bonferroni usw.)
4. Lineare Regressionsmodelle
- Allgemeine Funktionen zur Extraktion von Modellinformationen
- Aktualisierung der angepassten Modelle
- Verallgemeinerte lineare Modelle
- Familien
- Die Funktion glm()
- Klassifizierung
- Logistische Regression
- Lineare Diskriminanzanalyse
- Unüberwachtes Lernen
- Hauptkomponentenanalyse
- Clustering-Methoden (k-means, hierarchisches Clustering, k-medoids)
5. Überlebensanalyse (Survival-Paket)
- Überlebensobjekte in r
- Kaplan-Meier-Schätzung, Log-Rank-Test, parametrische Regression
- Konfidenzbänder
- Analyse zensierter (intervallzensierter) Daten
- Cox-PH-Modelle, konstante Kovariaten
- Cox-PH-Modelle, zeitabhängige Kovariaten
- Simulation: Modellvergleich (Vergleich von Regressionsmodellen)
6. Analyse der Varianz
- Einfaktorielle ANOVA
- Zweifache Klassifizierung der ANOVA
- MANOVA
III. Bearbeitete Probleme in der Bioinformatik
- Kurze Einführung in das Limma-Paket
- Arbeitsablauf der Microarray-Datenanalyse
- Herunterladen von Daten aus GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Datenverarbeitung (QC, Normalisierung, differentielle Expression)
- Vulkan-Plot
- Custering Beispiele + Heatmaps
Erfahrungsberichte (5)
wie der Trainer sein Wissen im Unterrichtsthema zeigt
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Kurs - Data Vault: Building a Scalable Data Warehouse
Maschinelle Übersetzung
Sehr nützlich, weil es mir hilft zu verstehen, was wir mit den Daten in unserem Kontext tun können. Es wird mich auch dabei unterstützen
Nicolas NEMORIN - Adecco Groupe France
Kurs - KNIME Analytics Platform for BI
Maschinelle Übersetzung
Ich habe die Übungen mit der Hand-zu-Hand-Methode wirklich genossen.
Yunfa Zhu - Environmental and Climate Change Canada
Kurs - Foundation R
Maschinelle Übersetzung
Das Tempo war genau richtig und die entspannte Atmosphäre ließ die Kandidaten zuversichtlich Fragen stellen.
Rhian Hughes - Public Health Wales NHS Trust
Kurs - Introduction to Data Visualization with Tidyverse and R
Maschinelle Übersetzung
Richard's training style kept it interesting, the real world examples used helped to drive the concepts home.
Jamie Martin-Royle - NBrown Group
Kurs - From Data to Decision with Big Data and Predictive Analytics
Maschinelle Übersetzung