Datenanalyse mit Python
Auswertung von Daten mit pandas, NumPy und Jupyter
Diese Publikation zitieren
Accesses
Quotes
Beschreibung / Abstract
Die erste Adresse für die Analyse von Daten mit Python
- Das Standardwerk in der 3. Auflage, aktualisiert auf Python 3.10 und pandas 1.4
- Versorgt Sie mit allen praktischen Details und mit wertvollem Insiderwissen, um Datenanalysen mit Python erfolgreich durchzuführen
- Mit Jupyter-Notebooks für alle Codebeispiele aus jedem Kapitel
Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.10, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.
Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet "Datenanalyse mit Python" einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.
Beschreibung
Inhaltsverzeichnis
- BEGINN
- Impressum
- Inhalt
- Vorwort
- In Memoriam: John D. Hunter (1968–2012)
- Danksagungen für die dritte Auflage (2022)
- Danksagungen für die zweite Auflage (2017)
- Danksagungen für die erste Auflage (2012)
- Kapitel 1: Einleitung
- 1.1 Worum geht es in diesem Buch?
- 1.2 Warum Python für die Datenanalyse?
- 1.3 Grundlegende Python-Bibliotheken
- 1.4 Installation und Einrichtung
- 1.5 Community und Konferenzen
- 1.6 Navigation durch dieses Buch
- Kapitel 2: Grundlagen von Python, IPython und Jupyter-Notebooks
- 2.1 Der Python-Interpreter
- 2.2 IPython-Grundlagen
- 2.3 Grundlagen der Sprache Python
- 2.4 Schlussbemerkung
- Kapitel 3: In Python integrierte Datenstrukturen, Funktionen und Dateien
- 3.1 Datenstrukturen und Sequenzen
- 3.2 Funktionen
- 3.3 Dateien und das Betriebssystem
- 3.4 Schlussbemerkung
- Kapitel 4: Grundlagen von NumPy: Arrays und vektorisierte Berechnung
- 4.1 Das ndarray von NumPy: ein mehrdimensionales Array-Objekt
- 4.2 Erzeugen von Pseudozufallszahlen
- 4.3 Universelle Funktionen: schnelle elementweise Array-Funktionen
- 4.4 Array-orientierte Programmierung mit Arrays
- 4.5 Dateiein- und -ausgabe bei Arrays
- 4.6 Lineare Algebra
- 4.7 Beispiel: Random Walks
- 4.8 Schlussbemerkung
- Kapitel 5: Erste Schritte mit pandas
- 5.1 Einführung in die pandas-Datenstrukturen
- 5.2 Wesentliche Funktionalität
- 5.3 Zusammenfassen und Berechnen deskriptiver Statistiken
- 5.4 Schlussbemerkung
- Kapitel 6: Laden und Speichern von Daten sowie Dateiformate
- 6.1 Lesen und Schreiben von Daten im Textformat
- 6.2 Binäre Datenformate
- 6.3 Interaktion mit Web-APIs
- 6.4 Interaktion mit Datenbanken
- 6.5 Schlussbemerkung
- Kapitel 7: Daten bereinigen und vorbereiten
- 7.1 Der Umgang mit fehlenden Daten
- 7.2 Datentransformation
- 7.3 Extension-Datentypen
- 7.4 Manipulation von Strings
- 7.5 Kategorische Daten
- 7.6 Schlussbemerkung
- Kapitel 8: Datenaufbereitung: Verknüpfen, Kombinieren und Umformen
- 8.1 Hierarchische Indizierung
- 8.2 Kombinieren und Verknüpfen von Datensätzen
- 8.3 Umformen und Transponieren
- 8.4 Schlussbemerkung
- Kapitel 9: Plotten und Visualisieren
- 9.1 Kurze Einführung in die matplotlib-API
- 9.2 Plotten mit pandas und seaborn
- 9.3 Andere Visualisierungswerkzeuge in Python
- 9.4 Schlussbemerkung
- Kapitel 10: Aggregation von Daten und Gruppenoperationen
- 10.1 Grundlagen zu Gruppierungsoperationen
- 10.2 Aggregation von Daten
- 10.3 Apply: Allgemeine Operationen vom Typ split-apply-combine
- 10.4 Gruppentransformationen und »ausgepackte« GroupBys
- 10.5 Pivot-Tabellen und Kreuztabellierung
- 10.6 Schlussbemerkung
- Kapitel 11: Zeitreihen
- 11.1 Datentypen und Werkzeuge für Datum und Zeit
- 11.2 Grundlagen von Zeitreihen
- 11.3 Datumsbereiche, Frequenzen und Verschiebungen
- 11.4 Berücksichtigung von Zeitzonen
- 11.5 Perioden und Arithmetik von Perioden
- 11.6 Resampling und Konvertieren von Frequenzen
- 11.7 Funktionen mit gleitenden Fenstern
- 11.8 Schlussbemerkung
- Kapitel 12: Einführung in Modellierungsbibliotheken in Python
- 12.1 Die Kopplung zwischen pandas und dem Modellcode
- 12.2 Modellbeschreibungen mit Patsy herstellen
- 12.3 Einführung in statsmodels
- 12.4 Einführung in scikit-learn
- 12.5 Schlussbemerkung
- Kapitel 13: Beispiele aus der Datenanalyse
- 13.1 Bitly-Daten von 1.USA.gov
- 13.2 MovieLens-1M-Datensatz
- 13.3 US-Babynamen von 1880–2010
- 13.4 Die USDA-Nahrungsmitteldatenbank
- 13.5 Datenbank des US-Wahlausschusses von 2012
- 13.6 Schlussbemerkung
- Anhang A: NumPy für Fortgeschrittene
- Anhang B: Mehr zum IPython-System
- Index