Data Science für Unternehmen

Data Mining und datenanalytisches Denken praktisch anwenden

Foster Provost and Tom Fawcett

Cite this publication as

Foster Provost, Tom Fawcett, Data Science für Unternehmen (2017), mitp-Verlag, Frechen, ISBN: 9783958455474

4308
accesses
23
quotes

Description / Abstract

Die grundlegenden Konzepte der Data Science verstehen, Wissen aus Daten ziehen und für Vorhersagen und Entscheidungen nutzen
Die wichtigsten Data-Mining-Verfahren gezielt und gewinnbringend einsetzen
Zahlreiche Praxisbeispiele zur Veranschaulichung



Die anerkannten Data-Science-Experten Foster Provost und Tom Fawcett stellen in diesem Buch die grundlegenden Konzepte der Data Science vor, die für den effektiven Einsatz im Unternehmen von Bedeutung sind.
Sie erläutern das datenanalytische Denken, das erforderlich ist, damit Sie aus Ihren gesammelten Daten nützliches Wissen und geschäftlichen Nutzen ziehen können. Sie erfahren detailliert, welche Methoden der Data Science zu hilfreichen Erkenntnissen führen, so dass auf dieser Grundlage wichtige Entscheidungsfindungen unterstützt werden können.
Dieser Leitfaden hilft Ihnen dabei, die vielen zurzeit gebräuchlichen Data-Mining-Verfahren zu verstehen und gezielt und gewinnbringend anzuwenden. Sie lernen u.a., wie Sie:

Data Science in Ihrem Unternehmen nutzen und damit Wettbewerbsvorteile erzielen
Daten als ein strategisches Gut behandeln, in das investiert werden muss, um echten Nutzen daraus zu ziehen
Geschäftliche Aufgaben datenanalytisch angehen und den Data-Mining-Prozess nutzen, um auf effiziente Weise sinnvolle Daten zu sammeln

Das Buch beruht auf einem Kurs für Betriebswirtschaftler, den Provost seit rund zehn Jahren an der New York University unterrichtet, und nutzt viele Beispiele aus der Praxis, um die Konzepte zu veranschaulichen.
Das Buch richtet sich an Führungskräfte und Projektmanager, die Data-Science-orientierte Projekte managen, an Entwickler, die Data-Science-Lösungen implementieren sowie an alle angehenden Data Scientists und Studenten.

Aus dem Inhalt:

Datenanalytisches Denken lernen
Der Data-Mining-Prozess
Überwachtes und unüberwachtes Data Mining
Einführung in die Vorhersagemodellbildung: von der Korrelation zur überwachten Segmentierung
Anhand der Daten optimale Modellparameter finden mit Verfahren wie lineare und logistische Regression sowie Support Vector Machines
Prinzip und Berechnung der Ähnlichkeit
Nächste-Nachbarn-Methoden und Clustering
Entscheidungsanalyse I: Was ist ein gutes Modell
Visualisierung der Leistung von Modellen
Evidenz und Wahrscheinlichkeiten
Texte repräsentieren und auswerten
Entscheidungsanalyse II: Analytisches Engineering
Data Science und Geschäftsstrategie

Description

Table of content

  • Cover
  • Titel
  • Impressum
  • Inhaltsverzeichnis
  • Einleitung
  • Über die Autoren
  • Kapitel 1: Einführung: Datenanalytisches Denken
  • 1.1 Allgegenwärtige Datenerfassungsmöglichkeiten
  • 1.2 Beispiel: Hurrikan Frances
  • 1.3 Beispiel: Vorhersage der Kundenfluktuation
  • 1.4 Data Science, Engineering und datengestützte Entscheidungsfindung
  • 1.5 Datenverarbeitung und »Big Data«
  • 1.6 Von Big Data 1.0 zu Big Data 2.0
  • 1.7 Daten und Data-Science-Fähigkeiten als strategisches Gut
  • 1.8 Datenanalytische Denkweise
  • 1.9 Dieses Buch
  • 1.10 Data Mining und Data Science
  • 1.11 In der Chemie geht es nicht um Reagenzgläser: Data Science vs. die Aufgabe des Data Scientists
  • 1.12 Zusammenfassung
  • Kapitel 2: Geschäftliche Aufgaben und Data-Science-Lösungen
  • 2.1 Von geschäftlichen Aufgaben zum Data-Mining- Verfahren
  • 2.2 Überwachte vs. unüberwachte Verfahren
  • 2.3 Ergebnisse des Data Minings
  • 2.4 Der Data-Mining-Prozess
  • 2.5 Auswirkungen auf das Management des Data-Science-Teams
  • 2.6 Weitere Analyseverfahren und -Technologien
  • 2.7 Zusammenfassung
  • Kapitel 3: Einführung in die Vorhersagemodellbildung: Von der Korrelation zur überwachten Segmentierung
  • 3.1 Modelle, Induktion und Vorhersage
  • 3.2 Überwachte Segmentierung
  • 3.3 Segmentierungen visualisieren
  • 3.4 Bäume als Regelsätze
  • 3.5 Wahrscheinlichkeitsabschätzung
  • 3.6 Beispiel: Abwanderungsrate per Entscheidungsbaum ermitteln
  • 3.7 Zusammenfassung
  • Kapitel 4: Ein Modell an Daten anpassen
  • 4.1 Klassifizierung via mathematischer Funktionen
  • 4.2 Regression via mathematischer Funktionen
  • 4.3 Wahrscheinlichkeitsabschätzung der Klassenzugehörigkeit und logistische »Regression«
  • 4.4 Beispiel: Logistische Regression vs. Entscheidungsbaumverfahren
  • 4.5 Nichtlineare Funktionen, Support Vector Machines und neuronale Netze
  • 4.6 Zusammenfassung
  • Kapitel 5: Überanpassung erkennen und vermeiden
  • 5.1 Verallgemeinerungsfähigkeit
  • 5.2 Überanpassung
  • 5.3 Überanpassung im Detail
  • 5.4 Beispiel: Überanpassung linearer Funktionen
  • 5.5 * Beispiel: Nachteile der Überanpassung
  • 5.6 Von der Beurteilung durch Testdatenmengen zur Kreuzvalidierung
  • 5.7 Abwanderungsdaten
  • 5.8 Lernkurven
  • 5.9 Überanpassung vermeiden und Steuerung der Komplexität
  • 5.10 Zusammenfassung
  • Kapitel 6: Ähnlichkeit, Nachbarn und Cluster
  • 6.1 Ähnlichkeit und Distanz
  • 6.2 Nächste-Nachbarn-Methoden
  • 6.3 Ähnlichkeit und Nachbarn: Wichtige technische Details
  • 6.4 Clustering
  • 6.5 Lösen von geschäftlichen Aufgaben vs. Datenerkundung
  • 6.6 Zusammenfassung
  • Kapitel 7: Entscheidungsanalyse I: Was ist ein gutes Modell?
  • 7.1 Beurteilung von Klassifizierern
  • 7.2 Verallgemeinerung über Klassifizierungen hinaus
  • 7.3 Ein wichtiges analytisches Tool: Der Erwartungswert
  • 7.4 Beurteilung, Leistung und die Folgen für Investitionen in Daten
  • 7.5 Zusammenfassung
  • Kapitel 8: Visualisierung der Leistung von Modellen
  • 8.1 Rangfolge statt Klassifizierung
  • 8.2 Profitkurven
  • 8.3 ROC-Diagramme und -Kurven
  • 8.4 Die Fläche unter der ROC-Kurve
  • 8.5 Kumulative Reaktionskurven und Lift-Kurven
  • 8.6 Beispiel: Leistungsanalyse
  • 8.7 Zusammenfassung
  • Kapitel 9: Evidenz und Wahrscheinlichkeiten
  • 9.1 Beispiel: Gezielte Kundenansprache durch Onlinewerbung
  • 9.2 Evidenzen probabilistisch kombinieren
  • 9.3 Anwendung des Satzes von Bayes in der Data Science
  • 9.4 Ein Modell für den Lift der Evidenz
  • 9.5 Beispiel: Lifts der Evidenz von Facebooks-Likes
  • 9.6 Zusammenfassung
  • Kapitel 10: Texte repräsentieren und auswerten
  • 10.1 Die Bedeutung von Text
  • 10.2 Probleme bei der Auswertung von Text
  • 10.3 Repräsentierung
  • 10.4 Beispiel: Jazzmusiker
  • 10.5 * Der Zusammenhang zwischen IDF und Entropie
  • 10.6 Jenseits des Bag-of-words-Modells
  • 10.7 Beispiel: Auswertung von Wirtschaftsnachrichten zwecks Vorhersage von Börsenkursen
  • 10.8 Zusammenfassung
  • Kapitel 11: Entscheidungsanalyse II: Analytisches Engineering
  • 11.1 Auswahl geeigneter Empfänger eines Spendenaufrufs
  • 11.2 Eine noch ausgeklügeltere Vorhersage der Kundenabwanderung
  • 11.3 Zusammenfassung
  • Kapitel 12: Weitere Verfahren und Methoden der Data Science
  • 12.1 Gleichzeitiges Auftreten und Assoziationen: Zueinander passende Objekte finden
  • 12.2 Profiling: Typisches Verhalten erkennen
  • 12.3 Verknüpfungsvorhersagen und Kontaktempfehlungen
  • 12.4 Datenreduzierung, latente Informationen und Filmempfehlungen
  • 12.5 Bias, Varianz und Ensemblemethoden
  • 12.6 Datengestützte Kausalmodelle und ein Beispiel für virales Marketing
  • 12.7 Zusammenfassung
  • Kapitel 13: Data Science und Geschäftsstrategie
  • 13.1 Datenanalytische Denkweise
  • 13.2 Durch Data Science Wettbewerbsvorteile erzielen
  • 13.3 Durch Data Science erzielte Wettbewerbsvorteile bewahren
  • 13.4 Gewinnung und Förderung von Data Scientists und ihren Teams
  • 13.5 Data-Science-Fallstudien
  • 13.6 Kreative Ideen von beliebigen Quellen übernehmen
  • 13.7 Beurteilung von Vorschlägen für Data-Science-Projekte
  • 13.8 Ausgereifte Data Science
  • Kapitel 14: Schlussfolgerungen
  • 14.1 Die fundamentalen Konzepte der Data Science
  • 14.2 Was Daten nicht leisten können: Der menschliche Faktor
  • 14.3 Privatsphäre, Ethik und Auswertung der Daten von Einzelpersonen
  • 14.4 Data Science: Steckt noch mehr dahinter?
  • 14.5 Ein letztes Beispiel: Vom Crowd-Sourcing zum Cloud-Sourcing
  • 14.6 Schlussworte
  • Anhang A: Leitfaden zur Beurteilung von Projektvorschlägen
  • A.1 Aufgaben- und Datenverständnis
  • A.2 Datenaufbereitung
  • A.3 Modellbildung
  • A.4 Beurteilung und Deployment
  • Anhang B: Ein weiteres Beispiel für einen Projektvorschlag
  • B.1 Szenario und Projektvorschlag
  • B.2 Mängel des Projektvorschlags von GGC
  • Glossar
  • Quellenverzeichnis
  • Stichwortverzeichnis

More of this series

    Related titles

      More of this author(s)