Data Science

Von der Problemstellung und Zieldefinition über die Machine Learning Pipeline bis zu Prescriptive Analytics ermöglicht der Data Science Cycle eine businessorientierte und eine konsequent am Nutzen des Endkunden ausgerichtete Umsetzung von Data Science Fragestellungen in Unternehmen.

Data Science Cycle

Der Data Science Cycle im Detail

  • Ziele definieren
    • Erweiterung des Geschäftsmodells.
    • Added Value Service entwickeln.
    • Re-Engineering und Digitalisierung der Prozesslandschaft.
  • Data Strategy
    • Welche Daten sind vorhanden?
    • Welche Daten werden zukünftig zusätzlich benötigt bzw. nicht mehr benötigt (Komplexitätsreduktion / Pareto Prinzip).
    • Welcher betriebswirtschaftliche Nutzen kann aus den Daten gewonnen werden.
  • Explorative Datenanalyse
    • Datenqualität bewerten und Maßnahmen zur Verbesserung einleiten.
    • Muster, Strukturen und Auffälligkeiten in den Daten identifizieren
      • Impact für das Geschäftsmodell.
      • Auswahl geeigneter Data Science Modelle.
  • Machine Learning Pipeline
    • Variablen  Vorverarbeitung.
    • Variablen Auswahl (Dimensionsreduktion) aufgrund inhaltlicher und statistischer Bewertungen.
    • Konkurrierende Modelle, Bewertung und Modell Selektion.
    • Parameter Tuning.
  • Monitoring und Weiterentwicklung
    • Ausgewählte Data Science Lösung im Betrieb überwachen.
    • Gegebenenfalls konkurrierende Modelle einsetzen und bewerten.
    • Permanente Weiterentwicklung und Verbesserung  der Data Science Lösung.
  • Predictive Analytics
    • Selbstlernende Algorithmen zur Prognose geschäftsrelevanter Ereignisse.
    • Prognose seltener Ereignisse.
    • Kombination von Datenwissen und Expertenwissen und selbstlernende Algorithmen, die das Expertenwissen im Zeitverlauf in Datenwissen transformieren.
  • Prescriptive Analytics
    • Business relevante Handlungsempfehlungen auf Basis von Predictive Analytics entwickeln und umsetzen.
    • Konzeption von neuen Business relevanten Fragestellungen (z.B. Value Added Services) auf Basis der verfügbaren bzw. neuen Daten.
    • Beobachtung von sozio-ökonomischen, politischen und juristischen Entwicklungen die Impact auf die Daten- und Prozesslandschaft und somit auf die Geschäftsmodelle der Unternehmen haben. 

Beispiel: Machine Learning, Predictive Analytics und Prescriptive Analytics im Maschinen- und Anlagebau