top of page

Voraussetzungen für ein erfolgreiches Data Analytics Projekt

Für ein erfolgreiches Data Analytics Projekt ist eine solide Datenlage von entscheidender Bedeutung. Man kann, um es in der Sprache von uns bei Datasense auszudrücken, nur einen Sinn aus den Daten machen, wenn diese vorhanden und zugreifbar sind.

Hier sind einige wichtige Aspekte der Datenlage, die als Voraussetzung für ein erfolgreiches Projekt gelten:


1. Qualität: Die Daten müssen von hoher Qualität sein, das bedeutet, sie sollten möglichst frei von Fehlern, Ungenauigkeiten und Inkonsistenzen sein. Schlechte Datenqualität kann zu falschen Ergebnissen und Entscheidungen führen.


2. Relevanz: Die Daten sollten relevant für das Problem oder die Fragestellung sein, die im Projekt behandelt werden. Irrelevante Daten könnten die Analyse unnötig komplizieren und zu ungenauen Ergebnissen führen. Es ist aber möglich, zusätzliche externe Daten bei einem gut definierten Projekt zu ergänzen. Bei unseren Projekten tun wir es oft, vor allem bei Predictive Analytics.


3. Quantität: Ausreichend viele Datenpunkte sind notwendig, um statistisch aussagekräftige Ergebnisse zu erzielen. Zu wenige Datenpunkte können zu Unsicherheit und verzerrten Ergebnissen führen. Wir mussten schon bei einem Kunden aus der Industrie ein Use Case ablehnen, weil die Datenlage nicht genug Datapoints angeboten hat. Hier ist es aus unserer Sicht besser für alle Beteiligten, ein Projekt früh genug abzubrechen, bzw. nicht zu starten, wenn die Datenquantität von Anfang an nicht ausreichend ist.


4. Verfügbarkeit und Integration: Die benötigten Daten müssen verfügbar sein, idealerweise in einem strukturierten Format, das für die Analyse geeignet ist. Probleme können auftreten, wenn wichtige Daten fehlen oder schwer zugänglich sind. Dieses Problem ist aber nicht unüberwindbar: moderne Technologien wir Cloud oder In-memory Analytics ermöglichen erfolgreiches und relativ günstiges Data Engineering, um die vorhandenen Daten (Siehe Punkte 1-3) in einem Data Mart zu konzentrieren und so für Zwecke der Analyse verfügbar zu machen.


5. Reinigung und Vorverarbeitung: Nach dem Integrieren der Daten und bevor die eigentliche Analyse beginnen kann, müssen die Daten gereinigt und vorverarbeitet werden. Dies umfasst die Beseitigung von Duplikaten, das Behandeln von fehlenden Werten und das Umwandeln von Daten in das richtige Format.


6. Datenschutz und -sicherheit: Es ist wichtig sicherzustellen, dass die Datenerhebung und -verarbeitung den geltenden Datenschutzbestimmungen entspricht. Sensible Daten sollten angemessen geschützt werden, um Verstöße zu vermeiden.


7. Klare Fragestellungen und Ziele: Es sollte eine klare Vorstellung davon geben, welche Fragen oder Ziele das Data Analytics Projekt verfolgt. Dies hilft, die Analyse zu fokussieren und aussagekräftige Ergebnisse zu erzielen. Eigentlich soll dieser Punkt am Anfang stehen: nur wenn wir uns die richtige Frage stellen, können wir mithilfe von Data Analytics nach der Antwort suchen. Der Grund, weswegen wir diesen Punkt erst am Ende anführen, ist ein anderer: in unserer Erfahrung sind die besten Projekte durch offenen Ansatz bei Datenanalyse entstanden. Die Philosophie - „ich schaue mir die Daten an und finde was sie hergeben bzw. hergeben können, dann schaue ich welche meiner Herausforderungen beim Geschäft ich damit lösen kann“ – hat sich nach unserer Erfahrung am besten bewährt.


Zusammenfassend lässt sich sagen, dass eine erfolgreiche Data Analytics Initiative eine Kombination aus qualitativ hochwertigen, relevanten, ausreichend großen und aktuellen Daten erfordert. Eine sorgfältige Vorbereitung, Vorverarbeitung und Exploration der Daten sind ebenfalls unerlässlich, um aussagekräftige und verlässliche Erkenntnisse zu gewinnen. Welche das sind, lässt sich oftmals am Anfang des Projektes nicht genau feststellen.

Comentarios


bottom of page