R für Data Science

Daten importieren, bereinigen, umformen und visualisieren

Hadley Wickham, Garrett Grolemund und Mine Çetinkaya-Rundel

Diese Publikation zitieren

Hadley Wickham, Garrett Grolemund, Mine Çetinkaya-Rundel, R für Data Science (2024), O'Reilly Verlag, Heidelberg, ISBN: 9783960108306

702
Accesses

Beschreibung / Abstract


Mit R Daten analysieren - die anschauliche und verständliche Einführung



  • 2. Auflage des US-Bestellers, jetzt vollständig aktualisiert und erweitert

  • Hadley Wickham ist eine Legende auf dem Gebiet der Data Science: Er hat eine vollkommen neue, bahnbrechende Methode der Datenanalyse mit R entwickelt

  • Wickhams innovative Herangehensweise wird in diesem Buch beschrieben, es ist ein Standardwerk für Datenanalysten


Erfahren Sie, wie Sie mit R aus Ihren Daten Erkenntnisse und Einsichten gewinnen. Dieses Buch führt Sie in R und RStudio ein sowie in Tidyverse, eine Sammlung von R-Paketen, mit denen Data-Science-Aufgaben effektiv und zeitsparend erledigt werden können. Auch wenn Sie keine Programmiererfahrung haben, können Sie mit diesem aktualisierten Standardwerk schnell in die Praxis der Data Science einsteigen.


Sie lernen, Daten zu importieren, aufzubereiten, zu visualisieren und die Ergebnisse zu präsentieren. Darüber hinaus bekommen Sie einen umfassenden Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind. Die zweite Auflage behandelt die neuesten Funktionen und Best Practices von Tidyverse und zeigt Ihnen in neu hinzugekommenen Kapiteln, wie Sie Daten aus Spreadsheets, Datenbanken und Websites nutzen. Zahlreiche Übungen unterstützen Sie dabei, das Gelernte praktisch auszuprobieren.


Themen des Buchs sind:



  • Visualisieren – Erstellen Sie Diagramme für die Datenauswertung und die Kommunikation von Ergebnissen

  • Transformieren – Erkunden Sie Variablentypen und die Werkzeuge, um mit ihnen zu arbeiten

  • Importieren – Lesen Sie Daten in R ein und bringen Sie sie in eine für die Analyse geeignete Form

  • Programmieren – Lernen Sie leistungsfähige R-Tools kennen, mit denen Sie Datenprobleme leichter lösen können

  • Kommunizieren – Verwenden Sie Quarto, um Text, Code und Ergebnisse kombiniert darzustellen


Beschreibung

Hadley Wickham ist Chief Scientist bei Posit und Mitglied der R Foundation. Er erstellt sowohl technische als auch kognitive Tools, die Data Science leichter, schneller und unterhaltsamer machen. Mine Çetinkaya-Rundel ist Professor of the Practice am Department of Statistical Science an der Duke University in Durham, North Carolina. Außerdem ist sie Developer Educator bei Posit.Garrett Grolemund ist Statistiker, Lehrer und Director of Learning bei der Posit Academy. Er ist Autor von Hands-On Programming with R (O'Reilly) und hat schon früh zu Tidyverse beigetragen.

Inhaltsverzeichnis

  • BEGINN
  • Impressum
  • Inhalt
  • Modellieren
  • Big Data
  • Python, Julia und Konsorten
  • R
  • RStudio
  • Das Tidyverse
  • Kapitel 1: Datenvisualisierung
  • Einführung
  • Erste Schritte
  • Zielsetzung
  • ggplot2-Aufrufe
  • Verteilungen visualisieren
  • Beziehungen visualisieren
  • Diagramme speichern
  • Häufige Probleme
  • Zusammenfassung
  • Kapitel 2: Workflow: Grundlagen
  • Grundlagen der Codierung
  • Kommentare
  • Was macht einen Namen aus?
  • Funktionen aufrufen
  • Zusammenfassung
  • Kapitel 3: Datentransformation
  • Einführung
  • Voraussetzungen
  • Zeilen
  • Spalten
  • Die Pipe
  • Gruppen
  • Fallstudie: Aggregate und Stichprobengröße
  • Zusammenfassung
  • Kapitel 4: Workflow: Programmierstil
  • Namen
  • Leerzeichen
  • Pipes
  • ggplot2
  • Abschnittskommentare
  • Übungen
  • Zusammenfassung
  • Kapitel 5: Datenaufbereitung
  • Einführung
  • Aufbereitete Daten
  • Daten länger machen
  • Daten breiter machen
  • Zusammenfassung
  • Kapitel 6: Workflow: Skripte und Projekte
  • Skripte
  • Projekte
  • Übungen
  • Zusammenfassung
  • Kapitel 7: Daten importieren
  • Einführung
  • Daten aus einer Datei lesen
  • Spaltentypen steuern
  • Daten aus mehreren Dateien einlesen
  • In eine Datei schreiben
  • Dateneingabe
  • Zusammenfassung
  • Kapitel 8: Workflow: Hilfe abrufen
  • Google ist Ihr Freund
  • Ein Reprex erstellen
  • Sich selbst einbringen
  • Zusammenfassung
  • Kapitel 9: Datenvisualisierung
  • Einführung
  • Ästhetische Zuordnungen
  • Geometrische Objekte
  • Facetten
  • Statistische Transformationen
  • Positionsanpassungen
  • Koordinatensysteme
  • Die geschichtete Grammatik der grafischen Darstellung
  • Zusammenfassung
  • Kapitel 10: Explorative Datenanalyse
  • Einführung
  • Fragen
  • Variation
  • Ungewöhnliche Werte
  • Kovariation
  • Muster und Modelle
  • Zusammenfassung
  • Kapitel 11: Kommunikation
  • Einführung
  • Beschriftungen
  • Anmerkungen
  • Skalen
  • Themen
  • Layout
  • Zusammenfassung
  • Kapitel 12: Logische Vektoren
  • Einführung
  • Vergleiche
  • Boolesche Algebra
  • Zusammenfassungen
  • Bedingte Transformationen
  • Zusammenfassung
  • Kapitel 13: Zahlen
  • Einführung
  • Zahlen erzeugen
  • Zähler
  • Numerische Transformationen
  • Zahlen in Bereiche aufteilen
  • Allgemeine Transformationen
  • Numerische Zusammenfassungen
  • Zusammenfassung
  • Kapitel 14: Strings
  • Einführung
  • Einen String erzeugen
  • Viele Strings aus Daten erstellen
  • Daten aus Strings extrahieren
  • Buchstaben
  • Nicht englischer Text
  • Zusammenfassung
  • Kapitel 15: Reguläre Ausdrücke
  • Einführung
  • Muster – Grundlagen
  • Wichtige Funktionen
  • Details zu Mustern
  • Mustersteuerung
  • Praxis
  • Reguläre Ausdrücke an anderen Stellen
  • Zusammenfassung
  • Kapitel 16: Faktoren
  • Einführung
  • Faktoren-Basics
  • General Social Survey
  • Faktorreihenfolge ändern
  • Faktorlevels ändern
  • Geordnete Faktoren
  • Zusammenfassung
  • Kapitel 17: Datum und Uhrzeit
  • Einführung
  • Datums-/Zeitwerte erzeugen
  • Datums-/Zeitkomponenten
  • Zeiträume
  • Zeitzonen
  • Zusammenfassung
  • Kapitel 18: Fehlende Werte
  • Einführung
  • Explizit fehlende Werte
  • Implizit fehlende Werte
  • Faktoren und leere Gruppen
  • Zusammenfassung
  • Kapitel 19: Verknüpfungen
  • Einführung
  • Schlüssel
  • Grundlegende Verknüpfungen
  • Wie funktionieren Verknüpfungen?
  • Nicht-Gleichheitsverknüpfungen
  • Zusammenfassung
  • Kapitel 20: Tabellenkalkulationen
  • Einführung
  • Excel
  • Google Sheets
  • Zusammenfassung
  • Kapitel 21: Datenbanken
  • Einführung
  • Datenbankgrundlagen
  • Mit einer Datenbank verbinden
  • Grundlagen von dbplyr
  • SQL
  • Übersetzung von Funktionen
  • Zusammenfassung
  • Kapitel 22: Arrow
  • Einführung
  • Die Daten erhalten
  • Ein Datenset öffnen
  • Das Parquet-Format
  • Das Paket dplyr mit Arrow verwenden
  • Das Paket dbplyr mit Arrow verwenden
  • Zusammenfassung
  • Kapitel 23: Hierarchische Daten
  • Einführung
  • Listen
  • Verschachtelung beseitigen
  • Fallstudien
  • JSON
  • Zusammenfassung
  • Kapitel 24: Web-Scraping
  • Einführung
  • Ethische und rechtliche Anmerkungen zum Scraping
  • HTML-Grundlagen
  • Daten extrahieren
  • Die richtigen Selektoren finden
  • Alles zusammen
  • Dynamische Sites
  • Zusammenfassung
  • Kapitel 25: Funktionen
  • Einführung
  • Vektorfunktionen
  • Dataframe-Funktionen
  • Diagrammfunktionen
  • Stil
  • Zusammenfassung
  • Kapitel 26: Iteration
  • Einführung
  • Mehrere Spalten ändern
  • Mehrere Dateien lesen
  • Mehrere Ausgaben speichern
  • Zusammenfassung
  • Kapitel 27: Ein Praxisleitfaden zu Basis-R
  • Einführung
  • Mehrere Elemente mit [ auswählen
  • Ein einzelnes Element mit $ und [[ auswählen
  • Familie der apply-Funktionen
  • for-Schleifen
  • Diagramme
  • Zusammenfassung
  • Kapitel 28: Quarto
  • Einführung
  • Quarto-Grundlagen
  • Visueller Editor
  • Quelltexteditor
  • Codeblöcke
  • Bilder
  • Tabellen
  • Zwischenspeichern (Caching)
  • Fehlersuche
  • YAML-Header
  • Workflow
  • Zusammenfassung
  • Kapitel 29: Quarto-Formate
  • Einführung
  • Ausgabeoptionen
  • Dokumente
  • Präsentationen
  • Interaktivität
  • Websites und Bücher
  • Andere Formate
  • Zusammenfassung
  • Index
  • Über die Autorin und die Autoren
  • Kolophon

Mehr von dieser Serie

    Ähnliche Titel

      Mehr von diesem Autor