Für die Steuerung eines Unternehmens auf der Basis von Daten liefern in vielen Druckereien die Finanzbuchhaltung und das ERP-System die Zahlen. Die Druckindustrie hat für die Key Performance Indikatoren (KPI) vielfach Standardberichte. Will man darüber hinaus und aus den Daten zusätzlichen Wert schöpfen, dann braucht es Experten für Datenvisualisierung und Analyse. Wir haben Dilyana Bossenz und Björn Leffler von m2 gebeten, aus der Sicht von Datenexperten das Vorgehen für eine mittelständische Druckerei zu skizzieren.
In einer kleinen Serie wird die Vorgehensweise in den Projekten von m2 entlang der Daten-Wertschöpfungskette geschildert. Diese Artikelreihe besteht aus den Teilen „Datenzweck und Datenvisualisierung“, „Datentransformation und Datenanalyse“ sowie „Datensammlung“.
Am Anfang eines Datenprojekts steht häufig die Forderung nach mehr Transparenz bei Entscheidungen, die bisher vor allem auf Basis von Erfahrung und Intuition getroffen wurden. Ob es dabei um die Verarbeitung von Auflagedaten, das Monitoring von Druckprozessen oder die Analyse von Datenmengen und Ladeprozessen geht – die Prozessstruktur folgt einem wiederkehrenden Modell, für welches wir den Begriff Daten-Wertschöpfungskette (englisch: Data Value Chain) geprägt haben: Ein standardisiertes und bewährtes Framework für fast alle Projekte bei m2.

Die Daten-Wertschöpfungskette wird von rechts nach links gelesen. Entlang dieser Kette sind folgende Schritte definiert:
- Insights & Decisions
- Analytics & Reporting
- Data Hub
- Data Science
- Data Prep & Integration
- Data Sources
Beim ersten Schritt geht es um folgende Fragen: Welche Entscheidung soll getroffen werden? Welcher Prozess soll optimiert werden?
Im zweiten Schritt wollen wir herausfinden, welche Diagrammtypen diese Fragen beantworten können.
In Schritt drei, vier und fünf sollen wir herausfinden: Welches Datenmodell liegt dieser Ansicht zugrunde? Welche Datenmodellierungstechniken müssen angewendet werden?
Im letzten Schritt gehen wir auf die Frage ein, in welchen Systemen die Daten erhoben und welche Daten integriert werden müssen.
Auf der oben gezeigten Abbildung der Daten-Wertschöpfungskette sind die Fragen unter dem Diagramm aufgelistet, die in jeder Phase des Projekts gestellt werden. Die Antworten auf diese Fragen sind essenziell. Sie helfen uns dabei, die Aufgaben zu identifizieren und das Projekt zu planen.
Nachfolgend wird der Prozess der Daten-Wertschöpfungskette anhand einer fiktiven Druckerei XY mit 100 Mitarbeiterinnen und Mitarbeitern erläutert.
Insights & Decisions zur Daten-Wertschöpfungskette
Der Prozess in der Daten-Wertschöpfungskette beginnt mit den Business-Fragen. Beispielsweise: Wie viele Druckereien sind echte Mitbewerber, wie viele potenzielle Kunden gibt es, was wollen die Kunden erreichen, in welcher Menge wollen die Kunden ein Produkt erwerben, gehen die Kunden auf neue Trends ein – dieses Wissen ist Grundvoraussetzung für das Überleben der Druckerei.
Um unser Beispiel anhand der Datenwertschöpfungskette greifbar zu machen, treffen wir folgende Annahme:
Unsere Druckerei möchte einen digitalen Bericht in Form eines interaktiven Dashboards erstellen. Das Dashboard wird für das Management des Unternehmens erstellt. Dabei möchte die Druckerei folgende Frage beantworten:
In welcher Stückzahl wurden Druckprodukte wie Broschüren, Flyer oder Postkarten in den vergangenen fünf Jahren (2016 – 2021) in Deutschland produziert?
Anhand dieser Information möchte die Druckerei herausfinden, wie stark die Pandemielage die Druckauflage beeinflusst hat.
Die Antworten auf diese Fragen sind für unterschiedliche Handlungsszenarien relevant. Sie können signifikanten Einfluss auf Anpassungen der Produktionsprozesse oder der Planung von Arbeitsressourcen haben.
Bei der Analyse dieser Daten geht es nicht nur darum, die Antworten auf diese Fragen zu finden. Es geht auch darum, zu verstehen, welche Technologien bei welchem Schritt der Datenwertschöpfungskette das Unternehmen unterstützen könnten.
Analytics & Reporting – Wie visualisiere ich die Daten?
Die Anzahl der Menge von Druckprodukten über die letzten fünf Jahre kann als Liniendiagramm dargestellt werden. Möchte ich wiederum Jahre miteinander vergleichen, so ist ein Säulendiagramm besser geeignet.

Das Wissen über Diagrammtypen ist hier essenziell. Die Fragestellung spielt dabei eine wichtige Rolle. Man muss die Botschaft exakt formulieren, um den richtigen Diagrammtyp auszuwählen.
Eine gute Hilfestellung bietet das Visual Vocabulary von Financial Times https://ft-interactive.github.io/visual-vocabulary/
Das Visual Vocabulary ist eine große Hilfe bei der Diagrammwahl, wenn man sich mit dem Thema Datenvisualisierung wenig auskennt.
Wer sind meine Nutzer?
Neben der Frage des Visualisierungstyps muss ich ebenso wissen, wer das Dashboard zukünftig konsumieren wird. In unserem Beispiel ist es das Management des Unternehmens. Die Information über unseren Nutzer und Endanwender ist ausgesprochen wichtig. Basierend darauf wird der Kontext im Dashboard erstellt. Hilfetexte und Erklärungen auf dem Dashboard sollten Kennzahlen und Definitionen beinhalten, die für die Zielgruppe relevant sind.
Hätten wir die Marketing-Abteilung als Zielgruppe, müssten wir mit Marketingkennzahlen arbeiten. Jede Abteilung schaut auf Informationen aus einem unterschiedlichen Blickwinkel. Obwohl es häufig um identische Zahlen geht, werden unterschiedliche Abteilungen die Zahlen sehr unterschiedlich interpretieren.

Welche Endgeräte sind relevant?
Bei M2 haben wir uns für Tableau Software entschieden. Tableau Software ist eine weitverbreitete Software für Datenvisualisierung, Datenanalyse und Datenmanagement.
Die Dashboards werden mit Tableau Desktop erstellt. Bei der Erstellung von Dashboards in allen ersten Schritten muss man auch den Zweck des Dashboards kennen. Ein Dashboard kann vielseitig genutzt werden:
- Interaktiv auf der Webseite
- Ausgedruckt, auf dem Papier
- Als Information in einer Präsentation
- Als eingebettete Version (das heißt, das Dashboard wird in einem Blogartikel auf einer Webseite veröffentlicht)
- Interaktiv auf dem Tablet
- Interaktiv auf dem Smartphone
Kennt man diese Informationen, sollte man dementsprechend die Größe des Dashboards bei der Erstellung wählen.
Tableau bietet die Möglichkeit, Dashboards intuitiv zu bauen und diese Ergebnisse mit Kollegen zu teilen.
Wer darf auf das Dashboard zugreifen?
Unternehmen verfügen heutzutage über eine große Anzahl von Daten, die oft sehr sensibel sind. Es gibt Daten, die wir nicht teilen dürfen oder nicht teilen wollen. Die Frage ist daher: Wer darf auf mein Dashboard zugreifen? Diese Frage sollte ganz am Anfang des Erstellungsprozesses gestellt werden.
In unserem Beispiel möchte die Druckerei XY die Kennzahlen der Auflage erst einmal nur auf der Management-Ebene bekannt machen. In diesem Fall soll das Dashboard also nur für bestimmte Personen im Unternehmen zugänglich sein.
Tableau Server bietet die Möglichkeit, solche Inhalte für bestimmte Gruppen zu teilen und Zugriffsberechtigungen entsprechend zu managen.
Wie sollen Daten analysiert werden?
Datenanalyse an sich ist ein umfangreiches Feld, welches viel Wissen und Erfahrung erfordert. Nicht umsonst existiert der Beruf des Data Analysten.
Zur Veranschaulichung werden wir diesen Schritt in der Daten-Wertschöpfungskette vereinfachen. In unserem Beispiel handelt es sich um eine Kennzahl: Die Druckauflage. Diese Kennzahl brauchen wir in der aggregierten Form für die Jahre 2016 bis 2021.
Das Verständnis über Datenaggregation ist sehr wichtig. Im Alltag haben wir häufig mit aggregierten Zahlen zu tun, was dabei aber nicht jedem wirklich bewusst ist.
Datenaggregation ist eine Methode zur Datenerfassung und -zusammenfassung in einem Abrechnungsdatensatz, der ansonsten mit mehreren Datensätzen dargestellt wird. Daten können also auf unterschiedlichen Aggregationsstufen summiert und dargestellt werden.
Wenn wir die Kennzahl der Druckauflage für das Jahr 2021 betrachten, dann müssen wir wissen, wie sich diese Zahl zusammensetzt und welche Elemente addiert werden, damit wir in Summe die Stückzahl von 3,7 Millionen erhalten.
Das folgende Beispiel zeigt, wie die Rohdaten auf unterschiedlichen Aggregationsstufen zusammenaddiert werden können.

Die Datenaggregation kann in jeder Größe angewandt werden, von einfachen Tabellen bis hin zu Data Lakes. So können Informationen zusammengefasst und Schlussfolgerungen auf der Grundlage datenbasierter Erkenntnisse gezogen werden.
Bei Datenanalysen steht das Ziel im Vordergrund, interessante Trends und Muster in den Daten zu erkennen. Dabei spielen explorative Analysen und deskriptive Statistiken eine zentrale Rolle.
Bei der explorativen Datenanalyse geht es darum, die Daten zu erforschen, um deren Kontext zu verstehen. Bei diesem Schritt werden unterschiedliche Diagrammtypen erstellt, die nicht unbedingt an die Endanwender kommuniziert werden.
Deskriptive Statistik hilft, die Daten zu beschreiben. Messwerte wie Standardabweichung, arithmetische Mittel, Korrelationen oder lineare Regressionen helfen uns dabei, Daten richtig zu interpretieren und Zusammenhänge zu verstehen.
Wir sind am Ende vom zweiten Schritt angekommen: Analytics & Reporting. Im nächsten Teil wird es dann um die Themen Data Hub und Data Science gehen.
Über M2
M2 technology & project consulting GmbH, kurz benannt als M2, wurde 2009 in Berlin gegründet. Das Unternehmen spezialisiert sich auf Business-Intelligence-Lösungen der nächsten Generation. Als erster Partner von Tableau Software in Deutschland sowie langjähriger Partner von Alteryx, Amazon Web Services, Exasol und Snowflake begleitet das Unternehmen seither den Aufbau von modernen BI Plattformen und datengetriebenen Projekten entlang der gesamten Daten-Wertschöpfungskette bei DAX-Konzernen, KMUs, Unternehmen des öffentlichen Dienstes und Start-Ups.