ACA Group Blog | Inzichten over Softwareontwikkeling, UX/UI, Data & Innovatie

Governance van gegevensnetwerken - ACA Groep

Geschreven door Marnick Vanloffelt | 6-mei-2025 7:26:11

Data mesh verandert de manier waarop organisaties gegevens beheren. In tegenstelling tot traditionele gecentraliseerde modellen, maakt data mesh gebruik van een gedecentraliseerde, domeingeoriënteerde structuur. Maar hoe werkt governance in zo'n gedistribueerd systeem?

Bij ACA Group geloven we dat data mesh een antwoord is op de uitdaging van het beheren van data door zich te richten op het bouwen van een gedecentraliseerd, zelfbedienend data-ecosysteem. Het doel is om datagestuurde innovatie in te bedden in elke afdeling of elk team, waardoor iedereen in de organisatie verantwoordelijk wordt voor het creëren van herbruikbare data die nieuwe producten en diensten voor alle afdelingen voedt.

In een data mesh is niet alleen het beheer van eigendom en infrastructuur anders. De sleutel tot succes is de transformatie van data governance zelf. In plaats van een gecentraliseerd IT-team verantwoordelijk te maken voor data governance, verdeelt data mesh de verantwoordelijkheid over verschillende teams.

Deze aanpak, die bekend staat als "federated computational governance", zorgt voor actieve deelname van zowel data-producerende als data-consumerende teams bij het opstellen en goedkeuren van het governancebeleid.

Vier pijlers van data mesh en hun governance-uitdagingen

Om het belang van governance in een data mesh te begrijpen, moeten we de kernprincipes van een data mesh opsplitsen en nagaan hoe ze zich verhouden tot de uitdagingen op het vlak van data governance:

1. Decentralisatie

In een data mesh worden eigenaarschap en verantwoordelijkheid van data verdeeld over verschillende bedrijfsdomeinen of -teams. Elk domein wordt een zelfstandige eenheid die zijn eigen dataproducten beheert. Dit betekent ook dat elk dataproduct en -domein op zichzelf staat, maar wel interoperabel moet zijn met andere dataproducten en -domeinen.

2. Domeingeoriënteerde aanpak

In plaats van een monolithisch datawarehouse bestaat een data mesh uit onderling verbonden dataproducten. Dit impliceert dat elk gegevensproduct zijn eigen "lokale dialect" kan hebben. De uitdaging hier is hoe je dezelfde taal spreekt, zonder dezelfde taal te spreken.

3. Gegevens als product

Deze benadering behandelt gegevens als een product, waarbij elk domein gegevensproducten creëert en onderhoudt die vindbaar, toegankelijk en herbruikbaar zijn. Metadatabeheer wordt een belangrijk onderwerp, omdat metadata worden gebruikt om de gegevens die in een gegevensproduct zijn opgenomen te ontdekken, er toegang toe te krijgen, ermee te integreren en ze te gebruiken.

4. Zelfbedieningsplatform

Deze engine en bedieningspaneel stelt zowel dataproducenten als -consumenten in staat om zelf gegevens te produceren. Portalen voor ontwikkelaars, datacatalogi, lineage tools en samenwerkingsruimten vergemakkelijken naadloze navigatie, terwijl geautomatiseerde beleidshandhaving en regelmatige audits worden gebruikt om naleving te garanderen en de kwaliteit van dataproducten te bevorderen zonder handmatige tussenkomst. Automatisering van governance is een van de belangrijkste uitdagingen van het self-serve platform.

Nu je een beter inzicht hebt in de centrale bouwstenen en uitdagingen van data governance in een data mesh, gaan we dieper in op elk van deze uitdagingen afzonderlijk.

Gefederaliseerd bestuur

Een opvallend kenmerk van data mesh is federated governance. Maar wat betekent dat eigenlijk?

"Federated" verwijst naar het feit dat elk domein (en dataproduct binnen die domeinen) zijn eigen autonomie heeft, maar dat ze samenkomen om een paar dingen uit te werken die relevant en waardevol zijn voor iedereen. Je zou het kunnen zien als een parlementaire democratie, waar vertegenwoordigers samenkomen om gezamenlijke beslissingen te nemen, die vervolgens breed geïmplementeerd moeten worden.

Deze domeinoverschrijdende samenwerking betekent dat er heel wat teams bij betrokken zullen zijn.

Federaal bestuursteam

Dit is een groep domeinvertegenwoordigers en experts die samenwerken met verschillende business units en expertisegebieden. Ze zorgen voor datakwaliteit, compliance en afstemming op de organisatiedoelen. Ze zien toe op taken zoals:

  • Geautomatiseerde beoordelingen van gegevenskwaliteit
  • Datatoegang en privacybeheer
  • Ervoor zorgen dat dataproducten en datasets kunnen worden gedeeld en hergebruikt.

Dit team definieert een gestandaardiseerd beleid voor datagovernance en zorgt ervoor dat dataproducten en datasets kunnen worden gedeeld en hergebruikt, terwijl de algehele kwaliteit gewaarborgd blijft. Om onze eerdere vergelijking door te trekken: het Governance-team is als een "parlement" dat "wetten" bespreekt en aanneemt.

Platform-team

Dit team is essentieel voor het automatiseren en afdwingen van het door het Governance Team gedefinieerde governancebeleid op het self-serve platform. Ze zorgen ervoor dat beleidsregels kunnen worden overgenomen door Data Products op een low-effort basis, wat interoperabiliteit en samenwerking bevordert zonder onnodige overhead te introduceren.

Domeinen

Domeineams zijn afgestemd op business units en houden zich bezig met operationele data governance binnen hun eigen domein. De verantwoordelijkheden omvatten:

  • Datamapping en -documentatie
  • Datakwaliteit garanderen
  • Standaarden implementeren die zijn gedefinieerd door het federatieve governanceteam

Belangrijk is dat elk domeinteam de autonomie en de middelen heeft om de standaarden uit te voeren die zijn gedefinieerd door het federatieve governanceteam.

Samengevat

Terwijl lokale domeinen beslissingen nemen die specifiek zijn voor hun domein, zorgt federated data governance ervoor dat globale regels worden toegepast op alle dataproducten en hun interfaces. Deze regels moeten zorgen voor een gezond en interoperabel ecosysteem.

Hoe werkt federatieve data governance?

Laten we beginnen met een belangrijke opmerking: federated governance vereist een andere manier van denken dan de meer traditionele governance-aanpak.

Federated governance is gericht op het zo veel mogelijk bevorderen van autonomie en interoperabiliteit, waarbij de bemoeienis van een gecentraliseerd team tot een absoluut minimum wordt beperkt. Wil je federated data governance succesvol implementeren in je organisatie? Zorg er dan voor dat je de volgende belangrijke fundamenten legt:

  1. Cultuur van eigenaarschap
    Teams moeten zich verantwoordelijk voelen voor hun data. Dit vereist een hoge mate van volwassenheid op het gebied van datageletterdheid en de bereidheid om te investeren in training en voortdurende bijscholing op het gebied van best practices voor datamanagement en -governance.

  2. Robuuste data-infrastructuur
    Je moet bereid zijn om te investeren in een schaalbare en flexibele data-infrastructuur die decentraal datamanagement ondersteunt.

  3. Governance-raamwerk
    Je hebt een duidelijk governance framework nodig dat rollen, verantwoordelijkheden en processen definieert. Dit raamwerk moet flexibel genoeg zijn om te kunnen worden aangepast aan de behoeften van verschillende domeinen, terwijl de algehele samenhang behouden blijft.

  4. Functionele samenwerking
    Samenwerking tussen IT, dataprofessionals en bedrijfsonderdelen is essentieel.

Bedrijfsontologie: domeinspecifieke taalkloven overbruggen

Elk domein kan zijn eigen specifieke lingo hebben, waardoor er uitdagingen ontstaan als de definitie van termen verschilt tussen teams. Om de kloven tussen domeinen te overbruggen, hebben we een solide basis nodig voor "vertaling" en een gemeenschappelijk begrip van termen. Dit is waar de bedrijfsontologie om de hoek komt kijken.

Wat is een bedrijfsontologie?

Je kunt het zien als een groot, hiërarchisch gestructureerd "woordenboek" dat concepten uit verschillende domeinen aan elkaar koppelt op basis van een gemeenschappelijke noemer.

Bijvoorbeeld: een verkoopteam en een financieel team gebruiken allebei de term "klant", maar de definities voor deze term die elk team gebruikt, zijn enigszins verschillend.

  • Het verkoopteam noemt mensen die een offerte hebben ontvangen een klant.
  • Het financiële team definieert een "klant" als iemand met een ondertekend contract en factuurgegevens. Anderen worden "prospects" genoemd.

Zonder een gedeelde ontologie zou het combineren van de gegevensproducten van deze teams inconsistente resultaten opleveren, wat de behoefte aan duidelijkheid onderstreept.

Hoe een bedrijfsontologie werkt

Door domeinspecifieke termen te taggen naar een eenduidig concept (bijvoorbeeld "klant") in de ontologie, kunnen teams verschillen overbruggen en domeinoverschrijdend begrip mogelijk maken.

Om de gaten tussen domeinspecifieke termen te overbruggen:

  1. Tag termen aan een gemeenschappelijke ontologie: Termen uit elk domein worden gekoppeld aan een eenduidig concept in de bedrijfsontologie met behulp van tags. Bijvoorbeeld, "verkoopklant" en "financiële klant" kunnen beide worden gekoppeld aan een universele term "klant".
  2. Gebruik unieke identificaties: Wanneer u de ontologie raadpleegt, kunt u ontdekken dat de unieke identifier voor alle "klanten" hun e-mailadres is. Bovendien is het vinden van een unieke identifier voor termen die gekoppeld zijn aan hetzelfde concept waardevol, omdat het je in staat stelt om gegevens met betrekking tot dezelfde term te correleren over domeinen heen.

Metagegevens: Preventie, validatie en controle mogelijk maken

Metadata, vaak omschreven als "data over data", speelt een cruciale rol in Federated Data Governance binnen een data mesh. Het biedt de noodzakelijke context om gegevens begrijpelijk, toegankelijk en bruikbaar te maken voor verschillende domeinen.

Belangrijkste rollen van metadata in gefedereerde data governance

  • De vindbaarheid van gegevens verbeteren
    Met behulp van metadata kunnen gebruikers gegevens in de hele organisatie gemakkelijk vinden en begrijpen. Het bevat praktische informatie zoals de gegevensbron(nen), de aanmaakdatum, het formaat en gebruiksinstructies, maar ook informatie die specifiek gekoppeld is aan vindbaarheid, zoals welke enterprise ontologie-tags van toepassing zijn, wie de eigenaar is of geassocieerde dataproducten. Dit maakt het makkelijker voor teams om relevante dataproducten te vinden (en ermee te integreren).
  • Datakwaliteit en -vertrouwen verbeteren
    Metadata bevatten (of zouden dat moeten bevatten) metrics voor datakwaliteit en informatie over de herkomst van data, waardoor teams de nauwkeurigheid en betrouwbaarheid van data kunnen garanderen. Het stelt gebruikers in staat om gegevens terug te voeren naar hun oorsprong, inzicht te krijgen in de transformaties die ze hebben ondergaan en de kwaliteit ervan te beoordelen.
  • Compliance en beveiliging vergemakkelijken
    Metadata helpt bij het naleven van de regelgeving voor dataprivacy en -beveiliging. Het dataproductteam kan specificeren wie of welke rollen toegang hebben tot de gegevens en met welk doel, zodat verantwoording en transparantie gewaarborgd zijn. Bovendien helpt het taggen van gevoelige data-elementen bij het automatisch toepassen van beleid voor gegevensprivacy en -afscherming, waardoor naleving van de regelgeving wordt gewaarborgd.
  • Interoperabiliteit mogelijk maken
    Metadata zorgt ervoor dat gegevens uit verschillende domeinen geïntegreerd en samen gebruikt kunnen worden. Gestandaardiseerde metadata formaten en definities maken naadloze gegevensuitwisseling en interoperabiliteit mogelijk.

Best practices voor metadatabeheer in data mesh

In een datanetwerk moeten metadata zo dicht mogelijk bij de bron worden beheerd. Elk gegevensproductteam is verantwoordelijk voor het zorgvuldig schrijven en beheren van de metadata die bij hun gegevensproduct horen. Uitzonderingen, zoals de geautomatiseerde toevoeging van datakwaliteitsmetriek van het selfserviceplatform, kunnen van toepassing zijn, maar het dataproduct zelf blijft de bron van de waarheid en moet als zodanig worden beheerd. Kortom, metadata moeten decentraal beheerd worden, maar centraal gebruikt kunnen worden.

Het beheer van metadata moet zo veel als redelijkerwijs mogelijk is worden geautomatiseerd en geïntegreerd met tools voor datagovernance om nauwkeurigheid en consistentie te garanderen. De belangrijkste praktijken zijn:

  • Zorgvuldige metadata authorisatie en curatie: Gebruik tools die metadata automatisch vastleggen en bijwerken. Introduceer processen en praktijken die eigenaren van dataproducten motiveren om speciale zorg te besteden aan het maken en wijzigen van de metadata die bij hun dataproduct horen. De eigenaar van het gegevensproduct moet ervoor zorgen dat de metagegevens die aan consumenten worden gepresenteerd een waarheidsgetrouwe weergave zijn van de inhoud van het gegevensproduct, zodat deze consumenten een geïnformeerde beslissing kunnen nemen over de waarde van het product voor hun use case.
  • Standaardisatie: Implementeer gestandaardiseerde metadata formaten en definities in alle domeinen (waar van toepassing) om maximale interoperabiliteit en gebruiksgemak te garanderen.
  • Geautomatiseerde validatie: Definieer procedures en beleidsregels om metadata automatisch te valideren, om fouten en inconsistenties in een vroeg stadium op te sporen en te voorkomen dat fouten zich door het hele systeem verspreiden. Zoals altijd komen preventie en validatie op de eerste plaats, audits op de tweede.
  • Regelmatige audits: Voer regelmatig geautomatiseerde audits uit om de nauwkeurigheid van de metadata en de naleving van het governancebeleid te garanderen.

Het selfserviceplatform: governance automatiseren

Het self-serve platform belichaamt "Federated Computational Governance". Het biedt tools en infrastructuur waarmee zowel gebruikers als makers onafhankelijk toegang kunnen krijgen tot dataproducten en deze kunnen beheren zonder afhankelijk te zijn van een centraal IT-team.

Belangrijkste kenmerken van een self-serve platform

  • Domeinteams de mogelijkheid geven: Selfserviceplatforms stellen domeinteams in staat om eigenaar te worden van hun gegevens. Ze kunnen onafhankelijk dataproducten maken, beheren en gebruiken, wat een gevoel van verantwoordelijkheid stimuleert.
  • Naleving garanderen: Selfserviceplatforms integreren governancecontroles en zorgen ervoor dat het gebruik van data voldoet aan het beleid en de regelgeving van de organisatie.
  • Beheer van metadata: Door het gebruik van de juiste tooling kan het self-serve platform de zorgvuldige curatie en geautomatiseerde validatie van metadata faciliteren. Dit vergemakkelijkt zowel de integratie met het self-serve platform als het beheer van metadata binnen de afzonderlijke dataproducten.
  • Beleidsbeheer: Beleidsregels kunnen worden vertaald naar geautomatiseerde processen, die via het platform kunnen worden afgedwongen. Geautomatiseerde beleidshandhaving zorgt ervoor dat het gebruik van gegevens voldoet aan interne richtlijnen en externe regelgeving.
  • Monitoring en auditing: Mogelijkheden voor monitoring en auditing kunnen worden gebruikt om gegevensgebruik bij te houden en naleving te garanderen. Regelmatige audits helpen bij het identificeren en aanpakken van governanceproblemen. Door dataproduct- of -domeinteams te waarschuwen voor deze problemen en de gevolgen ervan, kunnen ze ze op hun eigen manier en op hun eigen tijd aanpakken.

Conclusie: de balans vinden tussen autonomie en overzicht

Het omarmen van een data mesh architectuur vereist een andere benadering van governance. Het traditionele gecentraliseerde model voor het beheren van data voldoet niet langer in een wereld waar wendbaarheid, autonomie en cross-functionele samenwerking van het grootste belang zijn.

Gefedereerde datagovernance stelt domeinteams in staat om eigenaar te zijn van hun dataproducten en tegelijkertijd te zorgen voor afstemming op wereldwijde organisatiestandaarden. Door verantwoordelijkheden te verdelen over domeinen, ondersteund door een zelfbedieningsplatform en sterke metadatamanagementpraktijken, kunnen organisaties de datakwaliteit, interoperabiliteit en compliance verbeteren zonder onnodige complexiteit toe te voegen.

Het succes van data mesh governance hangt echter af van het stimuleren van een sterke cultuur van data-eigenaarschap, het bouwen van een robuust self-service platform en het opzetten van duidelijke kaders die naadloze domeinoverstijgende samenwerking bevorderen.

Dat zijn veel modewoorden voor één zin, maar het is wel waar:

  • Data-eigendom houdt mensen verantwoordelijk voor de data die ze creëren en onderhouden, terwijl ze tegelijkertijd de volledige controle krijgen over hun dataproducten.
  • Er iseen sterke infrastructuur en een selfserviceplatform nodig om deze praktijk van eigenaarschap te faciliteren, zodat dataproductteams de autonomie krijgen die ze nodig hebben om hun product op de markt te brengen, terwijl ze ook kunnen samenwerken en delen.
  • Duidelijke raamwerken voor governance zijn nodig om vast te stellen hoe kwaliteit eruit ziet en begeleiden dataproductteams bij het implementeren van best practices met betrekking tot integratie, samenwerking en meer.

De sleutel tot succes in data mesh is een governancemodel dat de juiste balans vindt tussen autonomie en overzicht - zodat teams kunnen produceren en tegelijkertijd de integriteit en waarde van het data-ecosysteem van de organisatie kunnen waarborgen.

Klaar om data mesh te omarmen?
Neem contact met ons op voor deskundige begeleiding en oplossingen op maat!