Data Science Management

Vom ersten Konzept bis zur Governance datengetriebener Organisationen

Marcel Hebing und Martin Manhembué

Diese Publikation zitieren

Marcel Hebing, Martin Manhembué, Data Science Management (2024), O'Reilly Verlag, Heidelberg, ISBN: 9783960108085

1590
Accesses
8
Quotes

Beschreibung / Abstract


Der umfassende Leitfaden für das Managen von Data-Science-Projekten für Studium und Beruf



  • Themenspektrum: Designen von Projekten, Datenverarbeitung, Analysemethoden, Rolle und Aufgaben von Data Science Manager:innen, Kommunikation mit Stakeholdern, Automatisierung, MLOps, Governance

  • Inklusive konkreter Toolsets wie z.B. Softwarepakete, Checklisten, Projekt-Canvases sowie Übersichten über bewährte Methoden

  • Die Autoren sind Professoren für Data Science bzw. Data Science Management an der Digital Business University of Applied Sciences und Startup-Gründer


Viele Data-Science-Vorhaben scheitern an organisatorischen Hürden: Oftmals ist die Rolle des Managements in diesen Projekten nicht klar definiert, zudem gibt es unterschiedliche Vorstellungen, wie gutes Projektmanagement für Data-Science-Produkte aussehen muss.


Dieser praxisorientierte Leitfaden unterstützt Sie beim erfolgreichen Management von Data-Science-Projekten jeder Größe. Sie erfahren zunächst, wie Datenanalysen durchgeführt werden und welche Tools hierfür infrage kommen. Marcel Hebing und Martin Manhembué zeigen dann Wege auf, wie Sie Projekte entlang des Data-Science-Lifecycles planen und eine datengetriebene Organisationskultur implementieren. Dabei wird die Rolle von Data-Science-Managerinnen und -Managern im Kontext eines modernen Leaderships beleuchtet und der Aufbau von Datenanalyse-Teams beschrieben. Jeder Themenbereich wird ergänzt durch Hands-on-Kapitel, die Toolsets und Checklisten für die Umsetzung in die Praxis enthalten.


Themen des Buchs:



  • Data-Science-Grundlagen: Designen von Projekten, Datenformate und Datenbanken, Datenaufbereitung, Analysemethoden aus Statistik und Machine Learning

  • Management von Data-Science-Projekten: Grundlagen des Projektmanagements, typische Fallstricke, Rolle und Aufgaben des Managements, Data-Science-Teams, Servant und Agile Leadership, Kommunikation mit Stakeholdern

  • Infrastruktur und Architektur: Automatisierung, IT-Infrastruktur, Data-Science-Architekturen, DevOps und MLOps

  • Governance und Data-driven Culture: Digitale Transformation, Implementierung von Data Science im Unternehmen, Sicherheit und Datenschutz, New Work, Recruiting


Beschreibung

Marcel Hebing ist Professor für Data Science an der Digital Business University of Applied Sciences (DBU), Gründer der Impact Distillery (mStats DS GmbH) und Assoziierter Forscher am Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG). Sein fachlicher Hintergrund in der Informatik, Soziologie und Statistik gibt ihm eine besondere Perspektive auf Fragen der Datenqualität in der Statistik, der Interpretation von Daten und der Anwendung von Machine-Learning-Methoden.Martin Manhembué ist Professor für Data Science Management an der Digital Business University of Applied Sciences (DBU) und arbeitet als Product Owner und Data Scientist bei der DB Systel GmbH. Martins Interesse gilt der Organisation und dem Management von Data Science in Unternehmen und den Menschen, die daran beteiligt sind. Er wurde mit einer Arbeit zur Modellierung von stofflichen und energetischen Gradienten an Ökosystemgrenzen an der Universität Potsdam promoviert.

Inhaltsverzeichnis

  • BEGINN
  • Impressum
  • Inhalt
  • Einleitung: Ein Handbuch zum Management von Data Science
  • Für wen ist dieses Buch besonders geeignet?
  • Was ist Data-Science-Management?
  • Warum brauchen Unternehmen Data-Science- Management?
  • Wie arbeitet man mit diesem Buch?
  • Wie alles begann oder: der Aufstieg der Digital Economy
  • Danksagung
  • TEIL I: Data-Science-Grundlagen
  • Kapitel 1: Eine Einführung in Data Science aus Projektsicht
  • Verlauf eines Data-Science-Projekts (Prozessmodell)
  • Von einfachen Analysen zur Automatisierung (Analytics Continuum)
  • Welche Kompetenzen brauchen wir in einem Data-Science-Projekt?
  • Kapitel 2: Wie wir über Daten sprechen
  • Strukturierte Daten
  • Semistrukturierte Daten
  • Unstrukturierte Daten
  • Skalenniveaus und besondere Datenformate
  • Verschiedene Aspekte der Qualität von Daten
  • Big Data und Smart Data
  • Kapitel 3: Datenbeschaffung und -aufbereitung
  • Datenquellen und Datenerhebung
  • Datenzugriff ist nicht nur eine technische Angelegenheit
  • Integration und Aufbereitung verschiedener Datenquellen
  • Trainings- und Testdaten für das Training von Machine-Learning-Algorithmen
  • Feature Engineering
  • Kapitel 4: Deskriptive Analysen
  • Univariate Basisstatistiken und Kennzahlen
  • Bivariate Darstellungen und Korrelationen
  • Visualisierung von Daten
  • Explorative Datenanalyse (EDA)
  • Kapitel 5: Modellbildung in der klassischen Statistik
  • Grundgesamtheiten und Stichproben
  • Die Regressionsanalyse als Beispiel für ein erklärendes Modell
  • Wie funktioniert eine Regressionsanalyse aus mathematischer Sicht?
  • Die Flexibilität der Regressionsanalyse
  • Spezielle Anwendungsfälle: Zeitreihenanalyse und Vorhersagen
  • Kapitel 6: Vorhersagen im Machine Learning
  • Supervised Learning
  • Datenqualität und verwandte Herausforderungen
  • Unsupervised Learning
  • Deep Learning, Reinforcement Learning und neuronale Netze
  • Predictive, Prescriptive, Automation
  • Kapitel 7: Aufbereitung der Ergebnisse für die weitere Verwendung
  • Dokumentation, Wiederverwendung und Replizierbarkeit
  • Reporting
  • Storytelling und visuelle Kommunikation mit Daten
  • Mehrwert von Daten im Unternehmen
  • Impact, Evaluation und Feedback
  • Kapitel 8: Aspekte einer Basisinfrastruktur
  • Datenformate und Datenbanken
  • Datenverarbeitung und Analyse
  • Collaboration und Arbeit in der Cloud
  • Kapitel 9: Hands-on: Beispielprojekt
  • Studiendesign
  • Datenbeschaffung und -aufbereitung
  • Analyse der Daten
  • Dokumentation und Reporting
  • Handlungsempfehlung (Impact)
  • TEIL II: Data-Science-Management
  • Kapitel 10: Fallstricke für Data-Science-Projekte
  • Fallstricke in Technologie und Infrastruktur
  • Fallstricke in der Modellierung
  • Fallstricke im Management
  • Kapitel 11: Grundlagen des Projektmanagements
  • Klassisches Anforderungsmanagement
  • Agiles Management und Lean Mindset
  • Erkenntnisse aus der agilen Praxis
  • Agiles Anforderungsmanagement
  • Zeit- und Ressourcenmanagement
  • Kontextualisierung und Kommunikation
  • Kapitel 12: Data-Science-Teams
  • Funktionen von Teams
  • Teamstrukturen
  • Rollen und deren Aufgaben in Data-Science-Teams
  • Rollen von Data Scientists
  • Herausforderungen und Konflikte in Teams
  • Kapitel 13: Data-Science-Managerinnen und -Manager
  • Aufgaben und Fähigkeiten
  • Modernes Leadership
  • Coaching und Mentoring von Data Scientists
  • Kapitel 14: Hands-on: Empfohlenes Toolkit für das Data-Science-Management
  • Scrum
  • Kanban
  • Scrum oder Kanban nutzen?
  • Team Health Checks
  • AI Project Canvas
  • Checkliste Anforderungsmanagement
  • TEIL III: Infrastruktur und Architektur
  • Kapitel 15: Automatisierung und Operationalisierung im kybernetischen Regelkreis
  • Das wissenschaftliche Vorgehen: Wissen iterativ weiterentwickeln und vertiefen
  • Proof-of-Concept-Projekte und Design Thinking
  • Operationalisierung und Evaluation von Zielen in laufenden Projekten
  • Der kybernetische Regelkreis
  • Cross Industry Standard Process for Data Mining (CRISP-DM)
  • Kapitel 16: Grundlagen der IT-Infrastruktur
  • Bausteine einer Softwareanwendung
  • Hardware: eigene Rechner vs. Cloud
  • Container und Microservices
  • Platform-as-a-Service (PaaS) und Serverless
  • Software- und Data-Science-as-a-Service (SaaS/DSaaS)
  • Kapitel 17: Data-Science-Architekturen
  • Data Lake
  • Data Warehouse (DWH)
  • Weitere Optionen wie das Analytics Lab
  • Interaktive Visualisierung, EDA und Business Intelligence
  • Data Mesh
  • Kapitel 18: DevOps und MLOps: Entwicklung und Betrieb
  • Versionierung und Versionskontrolle
  • Continuous Integration and Delivery
  • Microservices und Application Programming Interfaces (APIs)
  • Testing und Monitoring
  • Betrieb von Machine-Learning-Modellen (DevOps und MLOps)
  • Kapitel 19: Hands-on: Modellierung von Software und Infrastruktur
  • Bestandsaufnahme im Event-Storming
  • Weiterentwicklung in der Business Process Model and Notation (BPMN)
  • Modellierung einer technischen Infrastruktur
  • Modellierung einer (relationalen) Datenbank
  • Regelkonformität
  • TEIL IV: Data Science Governance und Data-driven Culture
  • Kapitel 20: Digitale Transformation der Unternehmen
  • Strategischer Einsatz von Daten
  • Wettbewerbsvorteile durch Data Science
  • As-a-Service-Modelle
  • Kapitel 21: Implementierung im Unternehmen
  • Schritt 1: Ideenfindung
  • Schritt 2: Proof-of-Concept
  • Schritt 3: Technische Implementierung
  • Schritt 4: Implementierung auf Bereichsebene
  • Schritt 5: Skalierung auf Unternehmensebene
  • Schritt 6: Verstetigung
  • Change Management
  • Datenmanagement
  • IT-Management
  • Kapitel 22: Sicherheit und Datenschutz
  • Safety
  • Security
  • Governance, Compliance und rechtliche Aspekte
  • Ethische Aspekte und Corporate Responsibility
  • Digitalpolitik
  • Kapitel 23: Digitale Kompetenzen und Data-Science-Kultur
  • New Work
  • Recruiting
  • Upskilling und Reskilling
  • Entrepreneurship, Intrapreneurship und Innovation
  • Literacy, Enablement und Citizen Data Science
  • Grundpfeiler einer kreativen Umgebung
  • Kapitel 24: Hands-on: Toolkit für Strategie und Governance
  • Business Model Canvas
  • AI Canvas
  • Datenstrategie-Designkit
  • Kapitel 25: Schlüsselfaktoren für erfolgreiches Data-Science-Management
  • Data Scientists als Individuen
  • Projekte und Teams
  • Unternehmen und Strategie
  • Index
  • Kolophon

Mehr von dieser Serie

    Ähnliche Titel

      Mehr von diesem Autor