DataScience Kurse



•    Dieser Kurs gibt eine kurze Einführung in die wichtigsten Programmiersprachen und Tools, die Data Scientists täglich verwenden. 
•    Es wird erläutert, in welchem Zusammenhang und zu welchem Zweck sie üblicherweise verwendet werden, und es werden die wichtigsten Befehle für Anfänger:innen vorgestellt:
       o    SQL ist zu einem Eckpfeiler der modernen Datenverwaltung geworden. In diesem Kurs werden wir verschiedene Möglichkeiten erkunden, wie SQL zum Abrufen von Daten aus Datenbanken verwendet werden kann.
    o    Wir werden besprechen, was GitHub ist, welche Funktionen es bietet und wie Softwareentwickler davon profitieren können.
•    Am Ende des Kurses kennen die Teilnehmer:innen das Tätigkeitsfeld und die gebräuchlichsten Befehle.

Go to course

This course presents the concept of RStudio Software. We will learn the history the computing environment Analysis Techniques Community, how to install it, and we will explore RStudio Creating a Project Notebook.

Go to course

In diesem Schulungsmodul lernen wir die Anwendung der Diskriminanzanalyse (linear discriminant analysis bzw. LDA) eingeführt. LDA ist eine Methode zum Berechnen von Linearkombinationen von Variablen, die die Beobachtungen am besten in Gruppen oder Klassen einteilen, und wurde ursprünglich von Fisher (1936) entwickelt.

Diese Methode maximiert das Verhältnis der Varianz zwischen den Klassen zur Varianz innerhalb der Klassen in einem bestimmten Datensatz. Auf diese Weise wird die Variabilität zwischen den Gruppen maximiert, was zu einer maximalen Trennbarkeit führt. 

LDA kann für reine Klassifizierungszwecke, aber auch für die Vorhersage von Klassenzugehörigkeiten eingesetzt werden.

Go to course

In diesem Schulungsmodul werden wir die Grundlagen der Stichprobentheorie lernen. Im Zusammenhang mit der Theorie der statistischen Inferenz, genauer gesagt mit den Instrumenten, die die Berechnung von Konfidenzintervallen ermöglichen, werden wir die Verfahren untersuchen, die zur Ermittlung des optimalen Stichprobenumfangs in Abhängigkeit von dem zu schätzenden Merkmal und der verwendeten Stichprobentechnik verwendet werden.

In diesem Modul werden wir die Unterschiede zwischen stichprobenbasierten Daten und populationsbasierten Daten sowie die am häufigsten angewandten Stichprobenverfahren untersuchen: einfache und geschichtete Stichproben. Darüber hinaus werden wir die Regeln für die Ermittlung des optimalen Stichprobenumfangs unter Berücksichtigung einiger Ziele in Bezug auf das Vertrauen und die Fehlerspanne, die wir bei unseren Schlussfolgerungen haben möchten, untersuchen. 
 

Go to course

In diesem Modul zeigen wir dir die Anwendung der allgemeinen linearen Modelle. Wir erklären auch, wie Mittelwertunterschiede auf die Wirkung kategorialer Variablen zurückgeführt werden können oder nicht.
Die hier vorgestellte Analyse ist die Grundlage der linearen Regression, die auch die Wirkung von kontinuierlichen Variablen berücksichtigt. Die in diesem Modul beschriebenen Techniken beschränken sich auf den Fall von kategorialen (qualitativen) Variablen. In dieser Hinsicht sind die Inhalte dieses Moduls als eine Einführung in Allgemeine Lineare Modelle (ALM) geeignet, die nur kategoriale Faktoren zur Erklärung der Variabilität einer (kontinuierlichen) Variablen von Interesse verwendet.
Das hier vorgestellte Verfahren beruht darauf, die in der Stichprobe gemessene Gesamtvariabilität in verschiedene Quellen zu zerlegen: Ein Teil ist residual (oder nicht durch die betrachteten Faktoren erklärbar), während ein anderer Teil aus einem systematischen Anteil stammt, der den verschiedenen Kategorien der kategorialen Faktoren zugeordnet werden kann. 

Go to course

Dieses Skript enthält Definitionen der grundlegenden Konzepte des maschinellen Lernens sowie Beschreibungen der wichtigsten verwendeten Methoden, einschließlich einiger spezifischer Beispiele und Anwendungen.  Du kannst das Skript entweder oberflächlich lesen, um ein grundlegendes Verständnis des Fachgebiets zu erlangen, oder die ausführlicheren Beschreibungen lesen, insbesondere den Abschnitt über die Methoden, um ein Verständnis des maschinellen Lernens auf mittlerem Niveau zu erlangen.  

Statistik und maschinelles Lernen sind die wichtigsten Werkzeuge für deine Arbeit als Datenwissenschaftler:in. Wenn du die verschiedenen Methoden des maschinellen Lernens verstehst - wie sie funktionieren, was ihre Hauptvorteile sind und wie ihre Performance bei einer bestimmten Aufgabe zu bewerten ist – kannst du bessere Entscheidungen darüber treffen, wann du sie einsetzen solltest, und werde zu einer:einem vielseitigeren Data-Science-Expert:in.

Go to course

In diesem Kurs werden wir einen Blick auf die vielen datenwissenschaftlichen Anwendungen werfen, die die Welt ein wenig besser machen können. Anschließend werden wir einen genaueren Blick auf die Überwachung Sozialer Medien am Beispiel von Amnesty International Italien werfen, um besser zu verstehen, wie solche Anwendungen funktionieren können.
Im nächsten Abschnitt werden wir mögliche schädliche Auswirkungen untersuchen, die Data Science und KI mit sich bringen können. Dies wird uns helfen, zu verstehen, warum KI-Systeme vertrauenswürdig sein müssen. 
Schließlich werden wir uns mit einigen der Herausforderungen von Fairness-Metriken vertraut machen und sehen, was diese Metriken in der Praxis bedeuten können.

Go to course

In diesem Modul lernen wir die mehrdimensionale Analysetechnik der Clusteranalyse kennen, die auch automatische Gruppenanalyse genannt wird.

Clusteranalysen dienen dazu, statistische Einheiten, die gemeinsame Merkmale aufweisen, zu gruppieren und sie nicht a priori definierten Kategorien zuzuordnen. Die gebildeten Gruppen müssen innerhalb (Intra-Cluster) möglichst homogen und außerhalb (Inter-Cluster) heterogen sein.

Die Anwendungsmöglichkeiten dieser Art von Analyse sind vielfältig: Clusteranalysen werden z.B. in der Informatik, Medizin, Biologie, oder im Marketing genutzt.

Im letzten Teil des Moduls lernen wir, wie wir die Software R für Clusteranalysen einsetzen können.

Go to course

In diesem Schulungsmodul lernen wir die multidimensionale Analysetechnik der Korrespondenzanalyse kennen. 

Die Korrespondenzanalyse ist eine Form der multidimensionalen Skalierung, bei der im Wesentlichen eine Art räumliches Modell erstellt wird, das die Assoziationen zwischen einer Reihe von kategorialen Variablen aufzeigt. Umfasst der Satz nur zwei Variablen, wird die Methode gewöhnlich als einfache Korrespondenzanalyse (Simple Correspondence Analysis) bezeichnet. 
Umfasst die Analyse mehr als zwei Variablen, wird sie in der Regel als Multiple Korrespondenzanalyse (Multiple Correspondence Analysis) bezeichnet. Ziel dieser Analyse ist es, die Dimensionalität des untersuchten Phänomens zu reduzieren und gleichzeitig die darin enthaltenen Informationen zu erhalten. Diese Methode kann nur mit qualitativen Variablen verwendet werden.
Der letzte Teil des Moduls ist der Anwendung der Korrespondenzanalyse (CA) in der Software R gewidmet.

 

Go to course

In diesem Modul lernen wir die multidimensionale Analysetechnik namens Hauptkomponentenanalyse (HKA oder PCA) kennen. Das Ziel der PCA ist es, die Dimensionalität eines untersuchten Phänomens zu reduzieren, während gleichzeitig die darin enthaltene Information bewahrt wird. Die Technik ist anwendbar auf Phänomene, die mit quantitativen Variablen gemessen werden, und unterscheidet sich damit von anderen Techniken zur Dimensionsreduktion wie der einfachen Korrespondenzanalyse (CA) oder der multiplen Korrespondenzanalyse (MCA), die für die Analyse qualitativer Variablen entwickelt wurden.

Der letzte Teil des Moduls beschäftigt sich mit der Anwendung von PCA mit der Programmiersprache R.

Go to course

In diesem Kurs werden die Konzepte des Datenjournalismus und des Data Storytelling vorgestellt. Diese Konzepte werden in Bezug auf die Welt der Daten beschrieben und erklärt. Es wird erklärt, wie wie Data Science, ein Studienfach, das von Hard Skills geprägt ist, mit Soft Skills verschmolzen wird und welche Vorteile diese Kombination hat.

Go to course

Partner

Università del Salento
Demostene Centro Studi
IHF
IWS
Universidad de Oviedo
ASE
WAI