Data Science Kurs Python - Online

Dieser Data Science Kurs bietet eine umfassende und praxisorientierte Einführung in die Datenanalyse und Machine Learning mit Python. Zu Beginn der Schulung werden die Grundlagen der Programmiersprache Python vermittelt, wobei der Fokus auf den wichtigsten Werkzeugen für die Datenanalyse liegt. Im Zentrum des Kurses steht das Python-Modul pandas, das für die Arbeit mit DataFrames und zur Datenvorbereitung unerlässlich ist. Pandas gilt als eines der führenden Pakete in der Data Science-Welt. Ergänzend dazu lernen die Teilnehmer die Erstellung von Grafiken und Visualisierungen mit den Paketen seaborn und matplotlib kennen. Während matplotlib eine Vielzahl von Anpassungsmöglichkeiten für Plots bietet, überzeugt seaborn durch einfache Handhabung, um komplexe Diagramme mit minimalem Code zu erstellen. Darüber hinaus erhalten die Teilnehmer einen Einblick in die Anwendung erster Machine Learning Algorithmen, darunter Entscheidungsbäume, K-Means Clustering, DBSCAN und Neuronale Netze, mithilfe des scikit-learn Pakets. Dabei liegt der Schwerpunkt auf der praktischen Implementierung dieser Algorithmen, sodass nur das notwendige theoretische Wissen vermittelt wird. Nach Abschluss des Kurses sind Sie in der Lage, eigenständig Datenanalysen durchzuführen und erste, grundlegende Machine Learning Modelle in Python umzusetzen. Besonderes Augenmerk liegt auf der praxisnahen Anwendung. Die Teilnehmer lösen eigenständig Übungsaufgaben, um das Gelernte direkt umzusetzen. Dabei steht der Trainer unterstützend zur Seite, um den praktischen Umgang mit Python, pandas und Machine Learning Algorithmen zu vertiefen.
Dieser Data Science Kurs bietet eine umfassende und praxisorientierte Einführung in die Datenanalyse und Machine Learning mit Python.
Zu Beginn der Schulung werden die Grundlagen der Programmiersprache Python vermittelt, wobei der Fokus auf den wichtigsten Werkzeugen für die Datenanalyse liegt.
Im Zentrum des Kurses steht das Python-Modul pandas, das für die Arbeit mit DataFrames und zur Datenvorbereitung unerlässlich ist. Pandas gilt als eines der führenden Pakete in der Data Science-Welt. Ergänzend dazu lernen die Teilnehmer die Erstellung von Grafiken und Visualisierungen mit den Paketen seaborn und matplotlib kennen. Während matplotlib eine Vielzahl von Anpassungsmöglichkeiten für Plots bietet, überzeugt seaborn durch einfache Handhabung, um komplexe Diagramme mit minimalem Code zu erstellen.
Darüber hinaus erhalten die Teilnehmer einen Einblick in die Anwendung erster Machine Learning Algorithmen, darunter Entscheidungsbäume, K-Means Clustering, DBSCAN und Neuronale Netze, mithilfe des scikit-learn Pakets. Dabei liegt der Schwerpunkt auf der praktischen Implementierung dieser Algorithmen, sodass nur das notwendige theoretische Wissen vermittelt wird.
Nach Abschluss des Kurses sind Sie in der Lage, eigenständig Datenanalysen durchzuführen und erste, grundlegende Machine Learning Modelle in Python umzusetzen. Besonderes Augenmerk liegt auf der praxisnahen Anwendung. Die Teilnehmer lösen eigenständig Übungsaufgaben, um das Gelernte direkt umzusetzen. Dabei steht der Trainer unterstützend zur Seite, um den praktischen Umgang mit Python, pandas und Machine Learning Algorithmen zu vertiefen.
Dieser Kurs vermittelt Ihnen eine umfassende Einführung in Python für Data Science, einer der beliebtesten Programmiersprachen im Bereich Machine Learning und Deep Learning. Wir nutzen die Anaconda Distribution, die sich selbst als "die weltweit populärste Data Science Plattform" bezeichnet, und arbeiten in der Entwicklungsumgebung Jupyter Lab.
Nach dem Seminar sind Sie in der Lage:
- Daten aus verschiedenen Formaten in Python einzulesen
- Daten mit seaborn und matplotlib zu visualisieren
- Datenbereinigung mit pandas durchzuführen, einschließlich des Ersetzens fehlender Werte, Anpassen von Zeilen und Spalten sowie Erstellen neuer Spalten
Sie lernen zudem:
- Wie Sie eigene Funktionen in Python schreiben
- Die Umsetzung von Control Flows wie For-Schleifen und If-Else-Bedingungen
- Das Grundkonzept von pandas DataFrames und wie Sie Data Wrangling und Data Cleaning erfolgreich durchführen
Im Bereich Machine Learning erhalten Sie eine Einführung in die verschiedenen Ansätze: supervised, unsupervised und Reinforcement Learning. Mit scikit-learn werden Sie eigenständig Algorithmen in Python trainieren, validieren, den Train-Test-Split durchführen und Gütekriterien zur Beurteilung der Modelle berechnen und interpretieren können.
Bekannte Machine Learning Algorithmen, die im Seminar behandelt werden, umfassen:
- Entscheidungsbäume
- K-Means Clustering
- DBSCAN Clustering
- K-Nearest Neighbors (KNN)
Diese Algorithmen decken die Bereiche Regression, Klassifikation und Clustering ab. Sie werden lernen, diese Algorithmen zu verstehen und sie in Python zu implementieren.
Nach Abschluss des Kurses verfügen Sie über fundierte Grundlagen in Data Science und haben die Einstiegshürde für den Einsatz von Python im Machine Learning erfolgreich überwunden. Sie werden in der Lage sein, Ihr Wissen selbstständig weiter auszubauen und praktische Anwendungen zu entwickeln. Der Schwerpunkt liegt auf der eigenständigen Umsetzung der Inhalte auf Ihrem Laptop, unterstützt durch den Dozenten.
Grundlagen von Python
- Neue Pakete installieren
- Jupyter Notebook als Entwicklungsumgebung/IDE
- Funktionen und Methoden
Das Paket pandas - DataFrame
- Struktur (Zeilen, Spalten) eines DataFrames
- Auswahl einer Zeile/Spalte
- Zeilen/Spalten erstellen, löschen, ändern
- Boolean indexing: eine logische Abfrage zur Selektion von Zeilen
- Daten zusammenfassen, um einen Überblick zu erhalten.
Berechnen von Statistiken direkt im pandas DataFrame
- Einfache Statistiken direkt auf einem DataFrame (Mittelwert, Min, Max, Summe, Median, Varianz,
)
- Zusammenfassen und Filtern von Daten
- Fehlende Werte ersetzen
- Kreuztabelle (Kontingenztafel)
Daten einlesen und schreiben
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV bzw. Excel einlesen und schreiben
- Von einer URL einlesen
- Überblick über nützliche Parameter
- Lesen und Schreiben vom Python Format pickle
Control Flows
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen: position arguments und keyword arguments
- For-Schleifen
- If-Else Bedingungen
Datenvisualisierung mit seaborn / matplotlib
- Die wichtigsten Grundlagen von matplotlib
- Achsen-Beschriftung, Legende, Titel ändern
- Einen Plot speichern
- In seaborn Linienplot, Boxplot, Histogram, Scatterplot, Barplot erstellen
- Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
String Manipulation im DataFrame, Grundlagen von numpy
- Text zeilenweise in einem DataFrame bearbeiten
- Informationen aus Text extrahieren
- Numpy arrays erstellen und nach Zeilen, Spalten slicen
- Funktionen in numpy auf ein array anwenden
Überblick über Machine Learning
- Einführung in Machine Learning
- Anwendungsbeispiele von Machine Learning
- Künstliche Intelligenz - Machine Learning - Deep Learning
- Unterschied Supervised - Unsupervised Learning (überwachtes - unüberwachtes Lernen)
- Overfitting und Train-Test-Split
Entscheidungsbaum mit scikit-learn
- Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern im Training
Neuronales Netz, K-Nearest Neighbor
- Grundlagen des Algorithmus
- Ein Multi-Layer-Perceptron (MLP) trainieren
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern
K-Means Clustering
- Ein Cluster-Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
DBSCAN
- Wie funktioniert DBSCAN Clustering?
- Grundlagen des Algorithmus und Unterschiede zu K-Means
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
Voraussetzungen für die Python Data Scientist Weiterbildung
Um die Data Science Grundlagen in Python zu lernen, benötigen Sie keine Vorkenntnisse in Python. Jedoch sollten Sie über Grundkenntnisse in einer anderen Programmiersprache besitzen, damit bekannt ist, was eine Variable, eine Funktion bzw. eine for-Schleife ist.
Das Data Science Seminar beinhaltet Machine Learning Algorithmen, welche auf statistischen Verfahren aufbauen, wodurch grundlegende Kenntnisse der Statistik notwendig sind. Begriffe wie Mittelwert, Median, Standardabweichung oder Normalverteilung sollten Ihnen bekannt sein. Auch Symbole in der Mathematik, wie das Integral oder das Summenzeichen oder Begriffe der Mathematik, wie Funktion und Ableitung sind sehr empfohlen. Logische Operatoren Und-Oder-Nicht werden auch kurz verwendet.
Die Teilnehmer der Schulung sollten Vorerfahrung mit dem Umgang von Daten haben, z.B. in Excel oder einer BI-Software, damit Konzepte einer spaltenweisen Berechnung bzw. einfache Statistiken (Mittelwert, Varianz) bekannt sind.
Unterrichtssprache ist Deutsch. Die Folien sind auf Englisch, da Python und die Dokumentation der Pakete sowie Fachbegriffe des Machine Learnings auf Englisch sind. Ein englischer Text sollte daher verstanden werden, um der Schulung folgen zu können.
Technik im Data Science mit Python Kurs
Für die Übungsaufgaben im Kurs benötigen die Teilnehmer einen Laptop. Es wird empfohlen, Ihren eigenen Laptop zu verwenden, auf dem die erforderliche Software vorab installiert ist. Eine detaillierte Installationsanleitung wird Ihnen vor dem Seminar per E-Mail zugeschickt.
Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.
Hinweis
Das Online-Seminar wird über die E-Learningplattform von Enable AI bereitgestellt. Zur Einrichtung des User-Accounts und Zusendung von Zugangsdaten und Nutzung der Lernplattform übermitteln wir Name, Anschrift, Emailadresse der Teilnehmer an Enable AI. In diesem Zusammenhang wird auch die Telefonnummer zur Klärung der technischen Fragen übermittelt.
Veranstaltungs-Code | FB24-522115-60644265 |
Voraussetzungen für die Teilnahme an diesem Kurs:
Dieser Python Data Science Kurs richtet sich an Einsteiger, die die Grundlagen von Data Science erlernen möchten. Der Kurs ist ideal für Personen, die mit Python arbeiten wollen, um Daten zu analysieren und Machine Learning Modelle zu erstellen.
Bildungsziel der Schulung:
Teilnahmebescheinigung
Veranstaltungsort:
Online-Kurs
weitere Orte/Termine
Kursart:
Online-Kurs
Starttermin: 14.07.2025 - 16.07.2025
3 Termine
Kostenlos Info anfordern