Schulungsübersicht

I. Einleitung und Vorbemerkungen

1. Überblick

  • R freundlicher machen, R und verfügbare GUIs
  • Rstudio
  • Verwandte Software und Dokumentation
  • R und Statistik
  • R interaktiv verwenden
  • Eine einführende Sitzung
  • Hilfe zu Funktionen und Merkmalen
  • R-Befehle, Groß- und Kleinschreibung, etc.
  • Aufrufen und Korrigieren von vorherigen Befehlen
  • Ausführen von Befehlen aus einer Datei oder Umleiten der Ausgabe in eine Datei
  • Datenpermanenz und Entfernen von Objekten
  • Good Programmierpraxis: In sich geschlossene Skripte, gute Lesbarkeit z.B. strukturierte Skripte, Dokumentation, Markdown
  • Installieren von Paketen; CRAN und Bioconductor

2. Lesen von Daten

  • Txt-Dateien (read.delim)
  • CSV-Dateien

3. Einfache Manipulationen; Zahlen und Vektoren + Arrays

  • Vektoren und Zuweisung
  • Vektorielle Arithmetik
  • Erzeugen von regulären Sequenzen
  • Logische Vektoren
  • Fehlende Werte
  • Zeichen-Vektoren
  • Indexvektoren; Auswählen und Ändern von Teilmengen eines Datensatzes
    • Arrays
  • Indizierung von Arrays. Unterabschnitte eines Arrays
  • Index-Matrizen
  • Die Funktion array() + einfache Operationen auf Arrays, z.B. Multiplikation, Transposition
  • Andere Arten von Objekten

4. Listen und Datenrahmen

  • Listen
  • Erstellen und Ändern von Listen
    • Verkettung von Listen
  • Datenrahmen
    • Erstellen von Datenrahmen
    • Arbeiten mit Datenrahmen
    • Anhängen beliebiger Listen
    • Verwalten des Suchpfads

5. Datenmanipulation

  • Auswahl, Unterteilung von Beobachtungen und Variablen
  • Filtern, Gruppieren
  • Umkodierung, Transformationen
  • Aggregation, Kombination von Datensätzen
  • Bilden von partitionierten Matrizen, cbind() und rbind()
  • Die Verkettungsfunktion (), mit Arrays
  • Zeichenmanipulation, stringr-Paket
  • Kurze Einführung in grep und regexpr

6. Mehr über das Lesen von Daten

  • XLS-, XLSX-Dateien
  • readr und readxl Pakete
  • SPSS, SAS, Stata,... und andere Datenformate
  • Exportieren von Daten in txt, csv und andere Formate

6. Gruppierung, Schleifen und bedingte Ausführung

  • Gruppierte Ausdrücke
  • Kontrollanweisungen
  • Bedingte Ausführung: if-Anweisungen
  • Wiederholte Ausführung: for-Schleifen, repeat und while
  • Einführung in apply, lapply, sapply, tapply

7. Funktionen

  • Erstellen von Funktionen
  • Optionale Argumente und Standardwerte
  • Variable Anzahl von Argumenten
  • Umfang und seine Folgen

8. Einfache Grafiken in R

  • Erstellen einer Grafik
  • Density Plots
  • Punktdiagramme
  • Balkendiagramme
  • Liniendiagramme
  • Tortendiagramme
  • Boxplots
  • Streudiagramme
  • Kombinierte Diagramme

II. Statistische Analyse in R

1. Wahrscheinlichkeitsverteilungen

  • R als eine Reihe von statistischen Tabellen
  • Untersuchung der Verteilung eines Datensatzes

2. Testen von Hypothesen

  • Tests über einen Populationsmittelwert
  • Likelihood-Ratio-Test
  • Tests mit einer und zwei Stichproben
  • Chi-Quadrat-Test Goodness-of-Fit-Test
  • Kolmogorov-Smirnov-Ein-Stichproben-Statistik
  • Wilcoxon Signed-Rank-Test
  • Zwei-Stichproben-Test
  • Wilcoxon-Rangsummen-Test
  • Mann-Whitney-Test
  • Kolmogorov-Smirnov-Test

3. Mehrfache Prüfung von Hypothesen

  • Typ-I-Fehler und FDR
  • ROC-Kurven und AUC
  • Mehrfache Testverfahren (BH, Bonferroni usw.)

4. Lineare Regressionsmodelle

  • Allgemeine Funktionen zur Extraktion von Modellinformationen
  • Aktualisierung der angepassten Modelle
  • Verallgemeinerte lineare Modelle
    • Familien
    • Die Funktion glm()
  • Klassifizierung
    • Logistische Regression
    • Lineare Diskriminanzanalyse
  • Unüberwachtes Lernen
    • Hauptkomponentenanalyse
    • Clustering-Methoden (k-means, hierarchisches Clustering, k-medoids)

5. Überlebensanalyse (Survival-Paket)

  • Überlebensobjekte in r
  • Kaplan-Meier-Schätzung, Log-Rank-Test, parametrische Regression
  • Konfidenzbänder
  • Analyse zensierter (intervallzensierter) Daten
  • Cox-PH-Modelle, konstante Kovariaten
  • Cox-PH-Modelle, zeitabhängige Kovariaten
  • Simulation: Modellvergleich (Vergleich von Regressionsmodellen)

6. Analyse der Varianz

  • Einfaktorielle ANOVA
  • Zweifache Klassifizierung der ANOVA
  • MANOVA

III. Bearbeitete Probleme in der Bioinformatik

  • Kurze Einführung in das Limma-Paket
  • Arbeitsablauf der Microarray-Datenanalyse
  • Herunterladen von Daten aus GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Datenverarbeitung (QC, Normalisierung, differentielle Expression)
  • Vulkan-Plot
  • Custering Beispiele + Heatmaps
 28 Stunden

Teilnehmerzahl


Price per participant (excl. VAT)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien