Data Analytics oder Datenanalyse ist der Prozess, zur Extraktion von Informationen aus Daten. Die Daten entstehen entlang des betrachteten Business Prozesses und stammen aus verschiedensten Quellen. Datenquellen sind Datenbanken, CSV, XML und JSON Files, sowie Dokumente, Log Files, Webseiten und übrige Quellen.
Der Prozess der Datenanalyse zeigt die Gemeinsamkeiten von Business Intelligence, Advanced Analytics, Data Science und Machine Learning.
Data Analytics Prozess
Anhand einer für Kunden (oder „das Business“) relevanten Problemstellung erfolgt die Problemdefinition. Die Problemdefinition beschreibt implizit, welche Ressourcen für eine Lösung erforderlich sind. Das erfahrene Projektteam kann außerdem bewerten, wie effizient diese Ressourcen einzusetzen wären. Ressourcen sind die betrachteten Prozesse, angewandten Tools, erforderlichen Daten und die jeweiligen Experten für die einzelnen Teilaspekte.
Während der Datenextraktion liegt der Fokus vor allem auf der Auswahl (und Nutzung) der relevanten Daten. Die Auswahl der richtigen Daten ist die erfolgskritisch! Die genutzten Daten sollten möglichst umfassend und möglichst genau die reale Welt abbilden – also das Problem nahe an der Realität darstellen.
Die verwendeten Daten liegen regelmäßig als Rohdaten vor und müssen aufbereitet werden. Die Aufbereitung der Daten umfasst die Datenbereinigung und die Datentransformation. In dieser Phase beschäftigt man sich vor allem mit fehlenden, mehrdeutigen sowie invaliden Quelldaten und versucht die Daten (dauerhaft) lösungsorientiert zu bereinigen und zu transformieren.
Die aufbereiteten Daten werden näher betrachtet und häufig zum besseren Verständnis visualisiert. Es soll festgestellt werden, welche Methoden der Analyse die Problemstellung am besten lösen. Konkret gilt es die Bedeutung der Daten, deren Beziehungen, Muster und Verbindungen zu ermitteln.
Die Data Science & ML spezifischen Schritte der der Modellierung, des Validieren und des Testen werden an anderer Stelle im Detail behandelt.
Sind die Ergebnisse zufriedenstellend? Dann wird die Analyse operationalisiert, d.h. wir überführen die Problemlösung in den produktiven Regelbetrieb. Man spricht hier auch vom Deployment bzw. vom Produktivieren.
Theorie und Praxis der Datenanalyse
Theoretisch sollten die meisten Data Analytics Projekte, nach mehr als 10 Jahren Business Intelligence und Data Warehouse Theorie, in der Praxis keine sonderliche Herausforderung sein. IT und Fachbereich kennen Ihre internen Herausforderungen nur zu gut. Ein weiteres Problem: der Mangel an Fachkräften und KnowHow
Sie suchen Unterstützung für Ihr Projekt?
[…] Sammeln, Bereinigen und Aufbereiten der Daten wird schnell zum Showstopper bevor die Reise beginnt. Häufig sind die Daten und die Informationen […]
[…] und richtig zu interpretieren, um effizienter zu Arbeiten und bessere Entscheidungen zu treffen. Datenbasierte Entscheidungen können als permanente Iteration betrachtet werden. Im ersten Schritt ist die Frage zu formulieren bzw. die Aufgabe einzugrenzen. Daraufhin wird die […]