Datenanalyse

Aus TBZ_-_Wiki
Version vom 5. November 2020, 18:01 Uhr von Gerd.gesell (Diskussion | Beiträge) (Struktur verändert Und KDD hinzugefügt)
Wechseln zu:Navigation, Suche

Linkliste für den Bereich Datenanalyse

Planung und in Ausarbeitung als eigenes Modul. Die Planung umfasst 20 Lektionen. Die folgenden Kapitel entsprechen der geplanten Gliederung.

Weiterbildung und Kursprogramme

Im System CAS, DAS, MAS: Angebot der ZHAW

Interview mit Jobprofil einer Data-Scientistin

Programmiersprachen

Aktuell buhlen die beiden Programmiersprachen R und Python um die Anwender der Datenanalyse. Die Eingabe von "python versus R" in eine bekannte Suchmaschine ergibt ca. 6,6 Millionen Ergebnisse. Und Perl gibt es ja auch noch (neben ein paar unbekannteren Sachen wie zum Beispiel Tcl - tool command language von Sun)!

Und hier noch ein konkreter Vergleich: kdnuggets

Einige Links und Beschreibungen sind unter Vergleich Programmiersprachenzu finden.

Installation und Einstieg in Python

KDD - Knowledge Discovery in Databases

  • Bereitstellung von Hintergrundwissen
  • Definition Ziele der Wissensfindung
  • Datenauswahl und Datenbereinigung
  • Datenreduktion
  • Auswahl eines Modells
  • Data-Mining, die eigentliche Datenanalyse
  • Interpretation der Erkenntnisse

Datenbanken

Michael Stonebreaker & Vertica

mögliche Kursstruktur

  • Einstieg in Python
  • Daten visualisieren
  • lineare Algebra: Vektoren und Matrizen
  • Statistik und Wahrscheinlichkeit (etwas Modul 100)
  • Hypothesen und Schlussfolgerungen
  • Gradientenmethode
  • Daten sammeln und bearbeiten
  • maschinelles Lernen
  • Regression
  • Entscheidungsbäume
  • map reduce

...