Datenanalyse mit Python

Auswertung von Daten mit pandas, NumPy und Jupyter

Wes McKinney

Diese Publikation zitieren

Wes McKinney, Datenanalyse mit Python (2023), O'Reilly Verlag, Heidelberg, ISBN: 9783960107521

10542
Accesses
66
Quotes

Beschreibung / Abstract


Die erste Adresse für die Analyse von Daten mit Python



  • Das Standardwerk in der 3. Auflage, aktualisiert auf Python 3.10 und pandas 1.4

  • Versorgt Sie mit allen praktischen Details und mit wertvollem Insiderwissen, um Datenanalysen mit Python erfolgreich durchzuführen

  • Mit Jupyter-Notebooks für alle Codebeispiele aus jedem Kapitel


Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.10, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.

Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet "Datenanalyse mit Python" einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.


Beschreibung

Wes McKinney ist Softwareentwickler und Unternehmer und lebt in Nashville. Nach dem Abschluss seines Mathematikstudiums am MIT im Jahre 2007 arbeitete er im Bereich der quantitativen Finanzen bei AQR Capital Management in Greenwich, Connecticut. Frustriert von umständlichen Datenanalysewerkzeugen lernte er Python und startete das pandas-Projekt. Inzwischen ist er ein aktives Mitglied der wissenschaftlichen Python-Community und ein Verfechter des Einsatzes von Python in Datenanalyse, Finanzen und Statistikanwendungen. Später war Wes Mitbegründer und CEO von DataPad, das im Jahre 2014 von Cloudera übernommen wurde. Seitdem befasst er sich auch mit der Big-Data-Technologie und ist Teil der Projektmanagementkomitees für die Projekte Apache Arrow und Apache Parquet in der Apache Software Foundation. 2018 gründete er die Ursa Labs – eine gemeinnützige Organisation, die sich zusammen mit RStudio und Two Sigma Investments auf die Entwicklung von Apache Arrow konzentriert. 2021 war Wes Mitbegründer des Technologie-Start-ups Voltron Data, in dem er aktuell als Chief Technology Officer arbeitet.

Inhaltsverzeichnis

  • BEGINN
  • Impressum
  • Inhalt
  • Vorwort
  • In Memoriam: John D. Hunter (1968–2012)
  • Danksagungen für die dritte Auflage (2022)
  • Danksagungen für die zweite Auflage (2017)
  • Danksagungen für die erste Auflage (2012)
  • Kapitel 1: Einleitung
  • 1.1 Worum geht es in diesem Buch?
  • 1.2 Warum Python für die Datenanalyse?
  • 1.3 Grundlegende Python-Bibliotheken
  • 1.4 Installation und Einrichtung
  • 1.5 Community und Konferenzen
  • 1.6 Navigation durch dieses Buch
  • Kapitel 2: Grundlagen von Python, IPython und Jupyter-Notebooks
  • 2.1 Der Python-Interpreter
  • 2.2 IPython-Grundlagen
  • 2.3 Grundlagen der Sprache Python
  • 2.4 Schlussbemerkung
  • Kapitel 3: In Python integrierte Datenstrukturen, Funktionen und Dateien
  • 3.1 Datenstrukturen und Sequenzen
  • 3.2 Funktionen
  • 3.3 Dateien und das Betriebssystem
  • 3.4 Schlussbemerkung
  • Kapitel 4: Grundlagen von NumPy: Arrays und vektorisierte Berechnung
  • 4.1 Das ndarray von NumPy: ein mehrdimensionales Array-Objekt
  • 4.2 Erzeugen von Pseudozufallszahlen
  • 4.3 Universelle Funktionen: schnelle elementweise Array-Funktionen
  • 4.4 Array-orientierte Programmierung mit Arrays
  • 4.5 Dateiein- und -ausgabe bei Arrays
  • 4.6 Lineare Algebra
  • 4.7 Beispiel: Random Walks
  • 4.8 Schlussbemerkung
  • Kapitel 5: Erste Schritte mit pandas
  • 5.1 Einführung in die pandas-Datenstrukturen
  • 5.2 Wesentliche Funktionalität
  • 5.3 Zusammenfassen und Berechnen deskriptiver Statistiken
  • 5.4 Schlussbemerkung
  • Kapitel 6: Laden und Speichern von Daten sowie Dateiformate
  • 6.1 Lesen und Schreiben von Daten im Textformat
  • 6.2 Binäre Datenformate
  • 6.3 Interaktion mit Web-APIs
  • 6.4 Interaktion mit Datenbanken
  • 6.5 Schlussbemerkung
  • Kapitel 7: Daten bereinigen und vorbereiten
  • 7.1 Der Umgang mit fehlenden Daten
  • 7.2 Datentransformation
  • 7.3 Extension-Datentypen
  • 7.4 Manipulation von Strings
  • 7.5 Kategorische Daten
  • 7.6 Schlussbemerkung
  • Kapitel 8: Datenaufbereitung: Verknüpfen, Kombinieren und Umformen
  • 8.1 Hierarchische Indizierung
  • 8.2 Kombinieren und Verknüpfen von Datensätzen
  • 8.3 Umformen und Transponieren
  • 8.4 Schlussbemerkung
  • Kapitel 9: Plotten und Visualisieren
  • 9.1 Kurze Einführung in die matplotlib-API
  • 9.2 Plotten mit pandas und seaborn
  • 9.3 Andere Visualisierungswerkzeuge in Python
  • 9.4 Schlussbemerkung
  • Kapitel 10: Aggregation von Daten und Gruppenoperationen
  • 10.1 Grundlagen zu Gruppierungsoperationen
  • 10.2 Aggregation von Daten
  • 10.3 Apply: Allgemeine Operationen vom Typ split-apply-combine
  • 10.4 Gruppentransformationen und »ausgepackte« GroupBys
  • 10.5 Pivot-Tabellen und Kreuztabellierung
  • 10.6 Schlussbemerkung
  • Kapitel 11: Zeitreihen
  • 11.1 Datentypen und Werkzeuge für Datum und Zeit
  • 11.2 Grundlagen von Zeitreihen
  • 11.3 Datumsbereiche, Frequenzen und Verschiebungen
  • 11.4 Berücksichtigung von Zeitzonen
  • 11.5 Perioden und Arithmetik von Perioden
  • 11.6 Resampling und Konvertieren von Frequenzen
  • 11.7 Funktionen mit gleitenden Fenstern
  • 11.8 Schlussbemerkung
  • Kapitel 12: Einführung in Modellierungsbibliotheken in Python
  • 12.1 Die Kopplung zwischen pandas und dem Modellcode
  • 12.2 Modellbeschreibungen mit Patsy herstellen
  • 12.3 Einführung in statsmodels
  • 12.4 Einführung in scikit-learn
  • 12.5 Schlussbemerkung
  • Kapitel 13: Beispiele aus der Datenanalyse
  • 13.1 Bitly-Daten von 1.USA.gov
  • 13.2 MovieLens-1M-Datensatz
  • 13.3 US-Babynamen von 1880–2010
  • 13.4 Die USDA-Nahrungsmitteldatenbank
  • 13.5 Datenbank des US-Wahlausschusses von 2012
  • 13.6 Schlussbemerkung
  • Anhang A: NumPy für Fortgeschrittene
  • Anhang B: Mehr zum IPython-System
  • Index

Mehr von dieser Serie

    Ähnliche Titel

      Mehr von diesem Autor