Datenanalyse mit Python

Wes McKinney

Datenanalyse mit Python

Auswertung von Daten mit pandas, NumPy und Jupyter

Wes McKinney

Produktinformationen

Autor: Wes McKinney
ISBN: 9783960107521
Serie: Programmieren mit Python
Verlag: O'Reilly Verlag
Erscheinungstermin: 2023-02-27
Erscheinungstermin (elektronische Fassung): 2023-03-10
Erscheinungsjahr (elektronische Fassung): 2023
Auflage: Auflage
Seiten: 558
Paket: Neuheiten 2023_1 [3714]

P-ISBN: 9783960092117

Diese Publikation zitieren

Wes McKinney, Datenanalyse mit Python (2023), O'Reilly Verlag, Heidelberg, ISBN: 9783960107521

10542
Accesses

66
Quotes

Beschreibung / Abstract

Die erste Adresse für die Analyse von Daten mit Python

Das Standardwerk in der 3. Auflage, aktualisiert auf Python 3.10 und pandas 1.4

Versorgt Sie mit allen praktischen Details und mit wertvollem Insiderwissen, um Datenanalysen mit Python erfolgreich durchzuführen

Mit Jupyter-Notebooks für alle Codebeispiele aus jedem Kapitel

Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.10, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.

Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet "Datenanalyse mit Python" einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.

Beschreibung

Wes McKinney ist Softwareentwickler und Unternehmer und lebt in Nashville. Nach dem Abschluss seines Mathematikstudiums am MIT im Jahre 2007 arbeitete er im Bereich der quantitativen Finanzen bei AQR Capital Management in Greenwich, Connecticut. Frustriert von umständlichen Datenanalysewerkzeugen lernte er Python und startete das pandas-Projekt. Inzwischen ist er ein aktives Mitglied der wissenschaftlichen Python-Community und ein Verfechter des Einsatzes von Python in Datenanalyse, Finanzen und Statistikanwendungen. Später war Wes Mitbegründer und CEO von DataPad, das im Jahre 2014 von Cloudera übernommen wurde. Seitdem befasst er sich auch mit der Big-Data-Technologie und ist Teil der Projektmanagementkomitees für die Projekte Apache Arrow und Apache Parquet in der Apache Software Foundation. 2018 gründete er die Ursa Labs – eine gemeinnützige Organisation, die sich zusammen mit RStudio und Two Sigma Investments auf die Entwicklung von Apache Arrow konzentriert. 2021 war Wes Mitbegründer des Technologie-Start-ups Voltron Data, in dem er aktuell als Chief Technology Officer arbeitet.

Inhaltsverzeichnis

BEGINN
Impressum
Inhalt
Vorwort
In Memoriam: John D. Hunter (1968–2012)
Danksagungen für die dritte Auflage (2022)
Danksagungen für die zweite Auflage (2017)
Danksagungen für die erste Auflage (2012)
Kapitel 1: Einleitung
1.1 Worum geht es in diesem Buch?
1.2 Warum Python für die Datenanalyse?
1.3 Grundlegende Python-Bibliotheken
1.4 Installation und Einrichtung
1.5 Community und Konferenzen
1.6 Navigation durch dieses Buch
Kapitel 2: Grundlagen von Python, IPython und Jupyter-Notebooks
2.1 Der Python-Interpreter
2.2 IPython-Grundlagen
2.3 Grundlagen der Sprache Python
2.4 Schlussbemerkung
Kapitel 3: In Python integrierte Datenstrukturen, Funktionen und Dateien
3.1 Datenstrukturen und Sequenzen
3.2 Funktionen
3.3 Dateien und das Betriebssystem
3.4 Schlussbemerkung
Kapitel 4: Grundlagen von NumPy: Arrays und vektorisierte Berechnung
4.1 Das ndarray von NumPy: ein mehrdimensionales Array-Objekt
4.2 Erzeugen von Pseudozufallszahlen
4.3 Universelle Funktionen: schnelle elementweise Array-Funktionen
4.4 Array-orientierte Programmierung mit Arrays
4.5 Dateiein- und -ausgabe bei Arrays
4.6 Lineare Algebra
4.7 Beispiel: Random Walks
4.8 Schlussbemerkung
Kapitel 5: Erste Schritte mit pandas
5.1 Einführung in die pandas-Datenstrukturen
5.2 Wesentliche Funktionalität
5.3 Zusammenfassen und Berechnen deskriptiver Statistiken
5.4 Schlussbemerkung
Kapitel 6: Laden und Speichern von Daten sowie Dateiformate
6.1 Lesen und Schreiben von Daten im Textformat
6.2 Binäre Datenformate
6.3 Interaktion mit Web-APIs
6.4 Interaktion mit Datenbanken
6.5 Schlussbemerkung
Kapitel 7: Daten bereinigen und vorbereiten
7.1 Der Umgang mit fehlenden Daten
7.2 Datentransformation
7.3 Extension-Datentypen
7.4 Manipulation von Strings
7.5 Kategorische Daten
7.6 Schlussbemerkung
Kapitel 8: Datenaufbereitung: Verknüpfen, Kombinieren und Umformen
8.1 Hierarchische Indizierung
8.2 Kombinieren und Verknüpfen von Datensätzen
8.3 Umformen und Transponieren
8.4 Schlussbemerkung
Kapitel 9: Plotten und Visualisieren
9.1 Kurze Einführung in die matplotlib-API
9.2 Plotten mit pandas und seaborn
9.3 Andere Visualisierungswerkzeuge in Python
9.4 Schlussbemerkung
Kapitel 10: Aggregation von Daten und Gruppenoperationen
10.1 Grundlagen zu Gruppierungsoperationen
10.2 Aggregation von Daten
10.3 Apply: Allgemeine Operationen vom Typ split-apply-combine
10.4 Gruppentransformationen und »ausgepackte« GroupBys
10.5 Pivot-Tabellen und Kreuztabellierung
10.6 Schlussbemerkung
Kapitel 11: Zeitreihen
11.1 Datentypen und Werkzeuge für Datum und Zeit
11.2 Grundlagen von Zeitreihen
11.3 Datumsbereiche, Frequenzen und Verschiebungen
11.4 Berücksichtigung von Zeitzonen
11.5 Perioden und Arithmetik von Perioden
11.6 Resampling und Konvertieren von Frequenzen
11.7 Funktionen mit gleitenden Fenstern
11.8 Schlussbemerkung
Kapitel 12: Einführung in Modellierungsbibliotheken in Python
12.1 Die Kopplung zwischen pandas und dem Modellcode
12.2 Modellbeschreibungen mit Patsy herstellen
12.3 Einführung in statsmodels
12.4 Einführung in scikit-learn
12.5 Schlussbemerkung
Kapitel 13: Beispiele aus der Datenanalyse
13.1 Bitly-Daten von 1.USA.gov
13.2 MovieLens-1M-Datensatz
13.3 US-Babynamen von 1880–2010
13.4 Die USDA-Nahrungsmitteldatenbank
13.5 Datenbank des US-Wahlausschusses von 2012
13.6 Schlussbemerkung
Anhang A: NumPy für Fortgeschrittene
Anhang B: Mehr zum IPython-System
Index

Datenanalyse mit Python

Auswertung von Daten mit pandas, NumPy und Jupyter

Produktinformationen

Diese Publikation zitieren

Beschreibung / Abstract

Die erste Adresse für die Analyse von Daten mit Python

Beschreibung

Inhaltsverzeichnis

Mehr von dieser Serie

Ähnliche Titel

Mehr von diesem Autor