Datenanalyse: Unterschied zwischen den Versionen
Aus TBZ_-_Wiki
(Struktur verändert Und KDD hinzugefügt) |
(→Datenbanken: erweitert) |
||
Zeile 34: | Zeile 34: | ||
* Vergleich von NoSQL und SQL von [https://docs.microsoft.com/en-us/azure/documentdb/documentdb-nosql-vs-sql Microsoft] | * Vergleich von NoSQL und SQL von [https://docs.microsoft.com/en-us/azure/documentdb/documentdb-nosql-vs-sql Microsoft] | ||
* [https://dbs.uni-leipzig.de/file/seminar_1112_tran_ausarbeitung.pdf Uni Leipzig] | * [https://dbs.uni-leipzig.de/file/seminar_1112_tran_ausarbeitung.pdf Uni Leipzig] | ||
− | * [ | + | * [https://hostingdata.co.uk/nosql-database/ die NoSQL-Seite (oder eine von vielen) |
+ | * [https://db-engines.com/de/ranking db-engines] Ranking und viele Zusatzinfos | ||
== Michael Stonebreaker & Vertica == | == Michael Stonebreaker & Vertica == |
Version vom 5. November 2020, 18:05 Uhr
Inhaltsverzeichnis
Linkliste für den Bereich Datenanalyse
Planung und in Ausarbeitung als eigenes Modul. Die Planung umfasst 20 Lektionen. Die folgenden Kapitel entsprechen der geplanten Gliederung.
Weiterbildung und Kursprogramme
Im System CAS, DAS, MAS: Angebot der ZHAW
Interview mit Jobprofil einer Data-Scientistin
Programmiersprachen
Aktuell buhlen die beiden Programmiersprachen R und Python um die Anwender der Datenanalyse. Die Eingabe von "python versus R" in eine bekannte Suchmaschine ergibt ca. 6,6 Millionen Ergebnisse. Und Perl gibt es ja auch noch (neben ein paar unbekannteren Sachen wie zum Beispiel Tcl - tool command language von Sun)!
Und hier noch ein konkreter Vergleich: kdnuggets
Einige Links und Beschreibungen sind unter Vergleich Programmiersprachenzu finden.
Installation und Einstieg in Python
KDD - Knowledge Discovery in Databases
- Bereitstellung von Hintergrundwissen
- Definition Ziele der Wissensfindung
- Datenauswahl und Datenbereinigung
- Datenreduktion
- Auswahl eines Modells
- Data-Mining, die eigentliche Datenanalyse
- Interpretation der Erkenntnisse
Datenbanken
- Vergleich von NoSQL und SQL von Microsoft
- Uni Leipzig
- [https://hostingdata.co.uk/nosql-database/ die NoSQL-Seite (oder eine von vielen)
- db-engines Ranking und viele Zusatzinfos
Michael Stonebreaker & Vertica
- wer ist Michael Stonebreaker?
- zwei Buchstaben (de auf en) geändert und es gibt mehr Informationen auf englisch.
- Video auf Youtube von Michael Stonebreaker Big Data is (at least) Four Different Problems
- Vertica
mögliche Kursstruktur
- Einstieg in Python
- Daten visualisieren
- lineare Algebra: Vektoren und Matrizen
- Statistik und Wahrscheinlichkeit (etwas Modul 100)
- Hypothesen und Schlussfolgerungen
- Gradientenmethode
- Daten sammeln und bearbeiten
- maschinelles Lernen
- Regression
- Entscheidungsbäume
- map reduce
...