Data Mesh – das ultimative Modell für Data-Driven-Unternehmen?

Data Mesh ist ein neues Paradigma für den Umgang mit Daten in Unternehmen und bricht mit den Modellen der Datenzentralisierung der letzten 30 Jahre. Seine Grundlagen: föderale Dezentralisierung und Umverteilung der Verantwortung zugunsten eines starken Engagements des Unternehmens.

Dieser Artikel ist der erste in einer Reihe, die wir dem Thema Data Mesh widmen werden. Das Konzept Data Mesh vereint alle notwendigen Zutaten, um die gesamte Organisation rund um die Herausforderungen der Datenoptimierung herum auszurichten.

Um dies zu demonstrieren und unsere Überzeugungen bezüglich Data Mesh zu teilen, verfassen wir diese Artikelserie, die diesem innovativen Thema gewidmet ist. Unser Ziel ist es, Ihnen zu helfen, die Auswirkungen und Vorteile von Data Mesh für Ihre eigene Transformation zu einer Data-Driven-Culture im Unternehmen fassen zu können.

Dieser Artikel erschien in einer früheren Version in englischer Sprache auf dem Data & AI Blog von Business & Decision.



Artikel 2: Data Domains: Data Mesh verleiht den Business Domains Superkräfte!
Artikel 3: Data Mesh: Daten sind das Produkt


Allen bisher populär gewordenen Datenarchitekturkonzepten ist ein hohes Maß an Zentralisierung von Kompetenzen, aber auch von Daten und deren Verarbeitung gemeinsam. Sie haben auch ein gemeinsames Ziel: die Schaffung von Werten. Die Europäische Kommission schätzt, dass der Wert der datengetriebenen Wirtschaft bis 2025 auf 829 Milliarden Euro steigen wird, gegenüber 301 Milliarden Euro im Jahr 2018.

Innerhalb weniger Jahrzehnte sind in im Feld des Datenmanagements zu unterschiedlichen Zeiten, unterschiedliche  Konzepte populär geworden, unter anderem Infozentren, Data Warehouses und vor etwa 10 Jahren Data Lakes.

Mit Data Mesh die Daten nutzen und ihnen einen unternehmensweiten Wert geben.

Die Datenoptimierung umfasst auch interne Praktiken zur Verbesserung der operativen Effizienz und zur besseren Entscheidungsfindung. Laut einer Studie von Opendatasoft sind diese beiden Anforderungen die wichtigsten Nutzen, die mit der Umsetzung eines Projekts zur Datenoptimierung angestrebt werden.

The Data Mesh goal is to involve the entire company in the challenges of optimising data as a strategic asset.

Wenn man jedoch in der Praxis die Schwierigkeiten beobachtet, mit denen Unternehmen bei der Entwicklung von Datenmanagementlösungen und -Frameworks konfrontiert sind, um den ehrgeizigen Datenansprüchen gerecht zu werden, stellt man deren Annahmen darüber in Frage, wie sie einen Mehrwert aus Daten ziehen können. Warum klafft eine solche Lücke zwischen den unternommenen Anstrengungen und den erreichten Zielen? Hierfür gibt es eine Reihe von Gründen. Dazu gehören ein Mangel an Reife/Maturität und Fähigkeiten sowie Ineffizienzen bei der Umsetzung von Datenstrategien.

In Unternehmen, in denen die Kultur und die Organisation die Skalierung von Dateninitiativen erschweren, stellt die Zentralisierung von Daten auf einer monolithischen Plattform (z. B. Data Warehouse, Data Hub oder Data Lake) und die Zentralisierung von Datenoptimierung und -verwaltung tatsächlich einen Engpass dar.

Was wäre, wenn Data Mesh diese Defizite wett machen könnte? Tatsächlich stellt es ein umfassendes Umdenken dar, da es auf einem verteilten Modell und globalen Rahmenbedingungen auf Unternehmensebene basiert.
Ein weiterer Paradigmenwechsel – Data Mesh ist keine technologische Lösung.

Data Mesh vereint Architektur, Organisation, Methodik und Governance mit demselben Ziel: das gesamte Unternehmen in die transformatorischen Anstrengungen der Optimierung von Daten als strategisches Gut einzubeziehen. Data Mesh ist daher ein perfektes Modell für das Data-Driven-Unternehmen.

Vom Chaos zum Mesh: auf dem Weg zum Data-Driven-Unternehmen

Das Aufkommen der Data Mesh-Philosophie kann als Reaktion verstanden werden. Aber worauf? Auf ein Problem, das von vielen Unternehmen geteilt wird – das Drama der Datensilos (Ja, genau das – Ein echtes Drama!). Diesem Drama verdanken wir einen Großteil der Bemühungen (und des Scheiterns), die der Data Governance und der Ausweitung der analytischen Anwendungen innerhalb des Unternehmens gewidmet sind.

Über die Entwicklung von Ansätzen zur Datenverwaltung

Unternehmen sind traditionell in Silos organisiert. So sind Management, Abteilungen und Dienste nach Funktionen, Produkten oder Vertriebskanälen strukturiert. Durch einen Spiegeleffekt führt dieses Organisationsmodell fast zwangsläufig zur Bildung von Datensilos. Diese Silos erschweren die unternehmensweite Nutzung von Daten zu Analysezwecken erheblich.

Um dem Drama der Silos und dem daraus resultierenden Datenchaos zu entkommen, bestand die Antwort bisher immer darin, Daten zu zentralisieren, beispielsweise durch Data Warehouse-, Data Lake- oder Data Hub-Lösungen.  Wie auch immer die Lösung heißen mag, das Ziel bleibt dasselbe: Daten zentralisieren und besser verarbeiten! Data Mesh stellt daher ein umfassendes Umdenken dar. Dieses Modell basiert auf dem Grundgedanken, das Drama der Silos nicht mehr zu bekämpfen, sondern sie zu nutzen und buchstäblich mit ihr zu spielen. Es ist also ein völliger Paradigmenwechsel… Und weit davon entfernt, zu dem völlig dezentralisierten Ansatz des Datenchaos zurückzukehren, schlägt Data Mesh einen föderalen Ansatz vor, um die bestmögliche Kontrolle über die Datenbestände und -verwendungen zu erhalten.

Was ist Data Mesh?

Data Mesh ist ein dezentraler soziotechnischer Ansatz, der die Datenverwaltung und den Datenzugriff in großem Maßstab zusammenführt und ein leistungsstarkes Transformationswerkzeug darstellt. Für Unternehmen ist es eine Gelegenheit, das Schicksal ihrer Daten selbst in die Hand zu nehmen.

Dezentralisieren, verteilen und föderieren. Das Konzept des Data Mesh basiert auf diesen drei Grundprinzipien. Und um dies zu erreichen, erfordert es ein hohes Maß an Agilität und Autonomie bei der Verwaltung von Daten. Wer könnte Data Mesh also besser verkörpern als ein Superheld wie Spiderman und seine Netze? – Eine Superheldin: Zhamak Dehghani. Ihr verdanken wir die Gründung von Data Mesh im Jahr 2018 in Form eines initialen Artikels. Die Konturen haben seitdem weiter Gestalt angenommen. Im April 2022 wurde das Thema in einem Buch mit dem Titel “Data Mesh: Delivering Data-Driven Value at Scale” umfassender aufbereitet.

Optimierung von Daten in großem Umfang durch Analytics

Data Mesh ist eine lebendige Angelegenheit. Seine operative Umsetzung befindet sich in der Entwicklung. Große Unternehmen versuchen daher, es iterativ einzusetzen.

Zhamak Dehghani beschreibt Data Mesh als einen dezentralen soziotechnischen Ansatz für die Verwaltung und den Zugriff auf Daten zu Analysezwecken und, was noch wichtiger ist, in großem Umfang. Hier ist jedes Wort bedeutungsvoll. Die Dezentralisierung unterstreicht den Bruch mit dem bisher praktizierten Streben nach extremer Zentralisierung.

Data Mesh ist also nicht nur ein technisches Konzept. Data Mesh ist weder die Summe der technologischen Bausteine, noch beschränkt es sich auf Architektur- und Infrastrukturfragen. Es umfasst alle Aspekte der Datenverwaltung: Organisation, Fertigkeiten, Methoden, Governance, Architektur usw.

Data Mesh zielt darauf ab, dem Unternehmen und seinen Nutzern einen Rahmen für die Verwaltung und Erstellung neuer Produkte (Daten) zu bieten. Der Gedanke des umfassenden Einsatzes von Analytics steht im Mittelpunkt des Konzepts und ist eine Antwort auf die Herausforderungen, mit denen Unternehmen konfrontiert sind. Mit seinem globalen Ansatz ist Data Mesh ein relevantes Modell für das Data-Driven Unternehmen. Data Mesh basiert auf dem Grundsatz, dass der jedes einzelne Datenprodukt einen inhärenten Wert besitzt, der sich anhand seines Interoperabilitätsgrads und des Ergebnisses seiner Korrelation mit anderen Datenprodukten bemisst. Es tendiert daher dazu, zwei Denkschulen zu vereinen: Die erste befürwortet die Zentralisierung der Daten unmittelbar unabhängig von der Identifizierung der geschäftlichen Anwendungsfälle, die zweite setzt die Verfügbarkeit aller abzudeckenden Anwendungsfälle als Voraussetzung für die Datenmodellierung voraus.

Domains, Produkte, Plattform, Governance: die 4 Säulen des Data Mesh

Als globaler Ansatz stützt sich die Umsetzung des Data Mesh auf vier Säulen:

  • Datendomänen
    Inspiriert von Domain-Driven-Design (DDD), besteht dieser Teil des Data Mesh aus einer an den Unternehmensstrukturen und -prozessen orientierten Zuordnung von Daten und Verwendungen. Die einzelnen Bereiche, welche für die Domänen zuständig sind, erlangen weitreichende Autonomie und sind für die Durchführung aller ihrer Dateninitiativen verantwortlich.
  • Daten als Produkt Mit Data Mesh werden Daten zum Produkt, ganz im Einklang mit anderen produktorientierten digitalen Bereichen.
    Data Mesh baut auf diesen Konzepten auf und geht darüber hinaus. Es obliegt jeder Datendomäne, Produkte zur Verfügung zu stellen, die ihre Nutzer, ihre wichtigsten Funktionen und einen Entwicklungsplan enthalten. Die Produkte werden in einem standardisierten Format bereitgestellt, das im gesamten Unternehmen verwendet werden kann.
  • Self-Service-Dateninfrastruktur als Plattform
    Wie der Titel schon andeutet, betrifft dieser Bereich die technische und anwendungsbezogene Infrastruktur. Data Mesh erfordert die Verfügbarkeit einer interoperablen Plattform für alle Datendomänen. Diese Bündelung soll es den verschiedenen Bereichen ermöglichen, auf Anfrage technische Ressourcen für die Gestaltung und den Betrieb ihrer Produkte bereitzustellen. Die Plattform kann auf jeder Art von technologischer Lösung beruhen und stützt sich auf standardisierte Architekturen und Austauschmodi. Das Ziel dieser Säule ist nach wie vor die Rationalisierung der Basis und der in der Organisation verwendeten Technologien.
  • Föderale Datenverwaltung Im Data-Mesh-Modell wirft die Datenverwaltung mehrere Fragen auf, darunter die Interoperabilität unterschiedlicher Domänen. Im Rahmen dieser Säule werden der Datenschutz und der Datenkatalog durch einheitliche Governance-Regeln und -standards definiert und umgesetzt. Auch hier spielen die Domänen eine entscheidende Rolle. Sie sind für die Dokumentation der Daten und Produkte verantwortlich, die auf der Grundlage der auf föderaler Ebene definierten Standards zur Verfügung gestellt werden. Die Governance wird also in einer hybriden Form mit verteilten und föderalen Zuständigkeiten betrieben.

Data Mesh verteilt die Rollen und Verantwortlichkeiten neu

Data Mesh basiert auf einer Organisation der Datenverwaltung, die sowohl verteilt als auch föderal ist. Die Umsetzung erfordert die Beteiligung der gesamten Organisation. Dies ist daher nur mit Rückendeckung der Geschäftsleitung und der Fachabteilungen (einschließlich IT) möglich. Ziel ist es, den Ausgleich zwischen strategischen Herausforderungen, funktionalen Anforderungen und der Fähigkeit zur Umsetzung zu unterstützen. Dieser Ansatz erfordert eine Neudefinition der Zuständigkeiten und damit eine Abkehr von einem Modell, das ausschließlich auf einem zentralem Team basiert, das allzu oft einen Engpass darstellt.

Data Mesh definiert die Rollen und Zuständigkeiten der Geschäftsbereiche, des Data Offices und der IT-Abteilung neu. Es verschiebt die Grenzen, um die Organisation in einen echten Wandel hin zu einem Data-Driven-Unternehmen einzubinden. 

Die wichtigste Veränderung betrifft die Geschäftsbereiche. Bei Data Mesh geht es darum, Autonomie, Agilität und Verantwortung bei der Erstellung von Datenprodukten, beim Management ihres Lebenszyklus und bei der Datenverwaltung zu erlangen. Um dies zu erreichen, sollten einige der Datenkompetenzen direkt mit verschiedenen Rollen dort verbunden werden, oder die Rolle der Data Stewards sollte geklärt und gestärkt werden. Sie gewinnen dann an Unabhängigkeit und können ihre Projekte nach ihren eigenen und den im Unternehmen geteilten Prioritäten vorantreiben. Die Fachabteilungen werden dadurch in die Lage versetzt, die Wirkmacht der Daten für sich zu aktivieren.

Die Rolle der IT-Abteilung wird sich weiterentwickeln, wobei sie jedoch eine wichtige Rolle behält. Sie entwirft und verwaltet eine modulare Plattform, die IT-Dienste auf Abruf bereitstellt und gleichzeitig einen interoperablen Rahmen gewährleistet. Diese einheitliche Plattform, die zentral verwaltet wird, gewährleistet somit die Bereitstellung gemeinsamer Ressourcen. Zu diesem Zweck sind die Cloud und die Datenvirtualisierung besonders geeignete Architekturansätze für Data Mesh. Die Rolle der IT-Abteilung konzentriert sich daher auf die Infrastruktur- und Anwendungsarchitektur. Sie sorgt für Konsistenz und technologische Rationalisierung. Die IT-Abteilung ist federführend bei der Modernisierung und Agilität der IT-Dienste sowie bei den Innovationen, die durch die Cloud entstehen.

Das Data Office schließlich, das vom Chief Data Officer geleitet wird, übernimmt die Rolle der Führung, der kulturellen Anpassungen und des Zusammenschlusses von Dateninitiativen. Es fördert die Zusammenführung von Daten, die Koordinierung von Maßnahmen, insbesondere die Governance, und verhindert die Entstehung neuer Silos. Das Data Office fungiert als Dirigent des unternehmensweiten Zusammenspiels der Daten.

Dieser Wandel wird auch durch die Unternehmensstrategie und das Change-Management unterstützt. Sie erfolgt schrittweise und beginnt oft mit den Geschäftsbereichen, die die Data-Driven-Culture vorantreiben, mit dem Ziel, den Wert aufzuzeigen und Initiativen in den anderen Funktionen des Unternehmens zu fördern. Die weniger fortgeschrittenen Bereiche werden die Grundsätze des Data Mesh schrittweise übernehmen. Darüber hinaus können sie von der Unterstützung durch zentrale Fachleute profitieren.

Data Mesh: Die (Wieder-)Ermächtigung des Unternehmens

Data Mesh ermöglicht es Organisationen, bisher scheinbar unlösbare Probleme zu lösen

So ist beispielsweise die mangelnde Datenqualität ein weit verbreitetes Problem. Es wird noch zu oft an die IT-Abteilung delegiert, die nicht über die Möglichkeiten verfügt, um es allein zu lösen. Es ist vor allem die Geschäftsbereiche und Fachabteilungen mit ihren detaillierten Kenntnissen der Managementprozesse und -regeln, die wirklich in der Lage sind, die Qualität der Daten langfristig zu verbessern. Es ist auch Aufgabe der einzelnen Bereiche, bestimmte Prozesse zu überdenken, um die Qualität der Daten zu verbessern, sobald sie erstellt werden und noch bevor sie in einer analytischen Datenbank gesammelt werden. Data Mesh bringt die Datenproblematik näher an die Geschäftsbereiche und Fachabteilungen heran und überträgt ihnen die Verantwortung für alle Datenbestände, sowohl die analytischen als auch die operativen, und kann so dieses Problem an der Wurzel packen. 

 Generell bietet Data Mesh viele Vorteile gegenüber zentralisiertenAnsätzen:

  • Autonom und mit mehr Befugnissen ausgestattet, erhalten die einzelnen Domains “natürlich” die Kontrolle über ihre Daten, ihre Ambitionen und ihre Fachleute zurück. Sie sind frei von den Beschränkungen, die ihnen von einem zentralen Datenteam auferlegt werden oder die sie selbst erfahren. Diese Freiheit, begleitet von gemeinsamen technologischen Möglichkeiten und im Selbstbedienungsmodus, kann auch dazu beitragen, die Schatten-IT zu reduzieren und gleichzeitig die Zusammenführung und Interoperabilität von Daten zu verbessern.
  • Allgemeine Verbesserung der Datenqualität, indem sowohl die Produktion als auch die Nutzung der Daten näher an die jeweiligen Bereiche herangeführt werden.  
  • Erhöhte Agilität in den Domains mit sich schnell ändernden Aktivitäten und Anforderungen. Data Mesh trägt durch seine Dezentralisierung und seine unmittelbare Nähe zu den einzelnen Bereichen zu einer größeren Reaktionsfähigkeit und damit zu einer besseren Implementierung bei.  
  • Rationalisierung der Kosten und Bündelung der Technologieplattform. Die einzelne Bereiche konsumieren in erster Linie Datendienste, unabhängig von den zugrunde liegenden Lösungen. 
  • Geringere Kosten für die Datennutzung für das Unternehmen, insbesondere durch optimiertes Management von Datenbewegungen und Modellierungsvorgängen.
  • Föderale Governance und Metadaten-Pooling. 
  • Verteilter Ansatz, um die Hoheit über die Daten an die einzelnen Bereiche weiterzugeben, und föderaler Ansatz, um die beste Steuerung über die Datenbestände und die technologische Konsistenz zu behalten.

Data Mesh ist beides – radikal und vereinheitlichend

Es besteht kein Zweifel daran, dass Data Mesh einen echten Bruch mit den Zeiten darstellt, die von datenzentrischen Dogmen beherrscht wurden, deren Grenzen in Bezug auf Wertschöpfung und Skalierung schier unüberwindbare Hindernisse für die Datentransformation von Unternehmen darstellen.

Unserer Meinung nach entwickelt sich Data Mesh zum ersten wirklich globalen Konzept im Dienste des Data-Driven Unternehmens. Im Gegensatz zu Ansätzen, die im Wesentlichen technologisch geprägt oder zu weit von der Realität entfernt sind, vereint es alle Komponenten, die für die Entwicklung und Umsetzung wirksamer Datenstrategien nützlich sind.

Darüber hinaus bietet Data Mesh Möglichkeiten und Methoden für einzelne Bereiche, die Macht und Autonomie bei der Produktion, Verwaltung und Nutzung von Daten zurückzugewinnen.

Diese Agilität bei der Erstellung von Datenprodukten und ihrer gemeinsamen Nutzung ist eine Gelegenheit für den einzelnen Bereich, die Implementierungszeiten verkürzen, um sich schneller an Marktveränderungen anzupassen, sei es in Bezug auf die Nutzung oder den Wettbewerb. 

Kurz gesagt, Data Mesh verfügt über alle erforderlichen Voraussetzungen, um Unternehmen, die Daten in den Mittelpunkt ihrer Entscheidungsfindung stellen wollen, dabei zu helfen, “Data-Driven” zu werden.

Das sollten Sie mitnehmen:

  • Ein vollständiger Ansatz (Technologie, Methodik, Architektur usw.) für Datenstrategien 
  • Verteilte Datenkompetenz
  • Autonome Geschäftsbereiche, die für die Datenverwaltung und -optimierung verantwortlich sind
  • 4 Säulen: 
    • Organisation in Datenbereichen so nah wie möglich an den Geschäftsbereichen
    • Ein Rahmen für die Erstellung von Datenprodukten 
    • Eine föderale Technologieplattform 
    • Verteilte und föderale Datenverwaltung

Über den Autor:

Mick Levy

Business Innovation Directeur
Business & Decision

Data Maniac!! 20 years of experience in enterprise data capital valorisation at Business & Decision. Engaged person, Mick advise many organisations on their Data strategy and on adoption of new digital usages.

Der ursprüngliche Artikel wurde in Zusammenarbeit mit  Christophe Auffray, die deutsche Version von Martin Lehofer erstellt.