Een cloudtransitie? Pak eerst je data governance aan
Het is een veelvoorkomend scenario: je applicatie staat in de cloud en daar ben je blij mee. Je hebt geen omkijken meer naar alle onderhoud, updates en beheer en je kunt er via het web in. Maar na een maand kom je erachter dat de automatische gegevensuitwisseling tussen applicaties niet altijd goed werkt. Terwijl dit na de migratie gewoon goed leek te gaan.
Je merkt bijvoorbeeld dat de net aangenomen personeelsleden die in het HRM-systeem staan, niet allemaal zichtbaar zijn in het nieuwe ERP-systeem. Wat gaat er mis? Waarom is er geen gebruikersaccount aangemaakt voor de nieuwe inkoper José in ’t Veld-van Kampendonk in het ERP-systeem?
Na veel uitzoekwerk blijkt de nieuwe SaaS-applicatie toch net anders om te gaan met de combinatie van voornamen, tussenvoegsels en achternamen. Er is blijkbaar geen goede koppeling gelegd tussen deze drie datavelden. Wat nu? Ga je handmatig gegevens van het ene systeem in het andere systeem overtypen? Dat kan toch niet de bedoeling zijn van digitalisering?
Pak bij een cloudtransitie eerst het data governance aan. Zo voorkom je latere problemen.
Dit praktijkvoorbeeld maakt het belang van data governance duidelijk. Het is van fundamenteel belang dat je goed nadenkt over hoe je omgaat met data, zeker wanneer je met een applicatietransformatie bezig bent en dus stapsgewijs naar de cloud migreert.
Als CTO ben ik me ervan bewust dat ook de techniek veel vragen oproept (zijn bijvoorbeeld api’s het antwoord?), maar eigenlijk is de techniek pas het laatste stukje van de puzzel. In deze blogpost leg ik uit welke strategische overwegingen je moet maken voordat je met SaaS-applicaties aan de slag gaat.
Data governance, wat is dat nou eigenlijk?
Data governance houdt in brede zin in dat je vastlegt hoe je binnen jouw organisatie omgaat met data en dat je daar regels aan verbindt. Zo zorg je dat de data in je organisatie consistent, accuraat en uniform is, en dat het altijd helder is wie de eigenaar is van welke data. Het gaat dus om het beheren en het bewaken van de datakwaliteit.
De kern van data governance is dat je data correct, consistent, optimaal toegankelijk en onderling goed uitwisselbaar is.
Hierbij zorg je voor een centraal vastgelegde opmaak van data. Zo voorkom je dat gegevens op verschillende plekken en op verschillende manieren staan opgeslagen en er inconsistenties ontstaan. Het centraliseren van data is natuurlijk een hele klus, dus ik begin met een aantal zaken die je eerst op orde moet hebben.
Wil je weten hoe je grip houdt op de totale cloudtransitie? Lees hier hoe je cloud governance toepast in 5 overzichtelijke stappen.
Eigenaarschap: wie is de eigenaar van je data?
De eerste vraag die je als organisatie moet stellen is: wie is de eigenaar van je data?
Deze vraag is tweeledig. Aan de ene kant gaat het om de eigenaar van de data per dataset. Zo wil je misschien dat het hoofd HR eigenaar is van alle personeelsgegevens en hoofd Finance van de financiële data. Dit klinkt heel simpel, maar dit betekent dat hun eigenaarschap applicatie-overstijgend is. Zo hebben de meeste organisaties gegevens op meerdere plekken staan en zijn de eigenaars dus verantwoordelijk voor al deze datasets.
Verder is het belangrijk dat de eigenaren zich bewust zijn van hun rol. Want als data-eigenaar bepaal je wie de data mag aanpassen, welke eisen je stelt aan de datakwaliteit en wie deze kwaliteit monitort. In de praktijk zal de data-eigenaar deze taken vaak op operationeel niveau beleggen bij iemand die dagelijks bezig is met de betreffende dataset. Bijvoorbeeld een hoofd administratie of een applicatiebeheerder.
Aan de andere kant is het belangrijk dat er een eigenaar is van je data governance. Wie maakt en bewaakt het overzicht van alle databronnen en weet wie de data-eigenaren zijn? Deze persoon houdt ook in de gaten of alle eigenaren zich aan de gemaakte afspraken houden. Dit zijn bijvoorbeeld afspraken over wie toegang heeft tot de data en wie het recht heeft om de gegevens te wijzigen. Ook houdt deze persoon zich bezig met wijzigingen die dataset-overstijgend zijn, zoals een wijziging in factuurnummering of de naamgeving van klanten.
Het is trouwens niet de bedoeling dat de data governance-eigenaar de data afschermt voor de rest van de organisatie, alsof alleen hij het recht heeft op die data. Het gaat er juist om dat data correct, consistent, optimaal toegankelijk en onderling goed uitwisselbaar is. Dat is de kern van data governance.
Datamodel: een goede data-uitwisseling
Hoe zorg je voor de uitwisselbaarheid van je data? Na het vastleggen van het data-eigenaarschap wil je een goede uitwisseling van die data tussen je applicaties mogelijk maken. Dit begint bij het vastleggen van de structuur of de opmaak van de data: het datamodel.
Applicaties moeten namelijk ‘dezelfde taal’ spreken, ofwel hetzelfde datamodel gebruiken, om data uit te wisselen. Wanneer applicatie A en applicatie B niet hetzelfde datamodel gebruiken en gegevens dus niet op dezelfde manier gecommuniceerd worden, zul je één van de twee modellen moeten kiezen. Wanneer je het model van applicatie A kiest, moet je een vertaalslag maken voor applicatie B, zodat applicatie A de gegeven uit applicatie B toch begrijpt.
Hiervoor gebruiken we vaak een Enterprise Service Bus (ESB). Dit is een centraal systeem dat de data ontsluit uit meerdere applicaties, via een subscription systeem. De ESB ‘vertaalt’ de data dan, zodat de aangesloten applicaties deze in een voor hen leesbaar formaat krijgen.
Welk datamodel je kiest kan een lastige overweging zijn. Binnen OGD hebben wij zelf ook voor dat soort keuzes gestaan. Daarbij hebben we gekeken wat het meest standaard en toekomstvaste datamodel was. Ook keken we met welk model de meeste van onze applicaties werkten.
Zo hebben we onder meer gekeken naar het ‘common data model’ van Microsoft. Dit dient als basis voor meerdere platformen van Microsoftproducten. Voor onze interne usecases bleek dit niet afdoende. Daarom hebben we zelf aangepaste modellen van de ERP-modules van Dynamics gebouwd, om data-uitwisseling tussen onze core applicaties te faciliteren. Uiteindelijk maakt het niet heel veel uit welk model je kiest, zolang het intern maar consistent is.
Baseer dit soort keuzes vooral op wat in de toekomst handig zal zijn. Wanneer je nu voor een gangbaar model kiest, brengt dat nog steeds veel werk met zich mee. Maar je organisatie zal daar in de toekomst van profiteren.
Lees hier hoe je maximale businesswaarde creëert met de data uit je applicatielandschap.
Datakwaliteit: neuzen dezelfde kant op
Zoals eerder gezegd zijn de data-eigenaren verantwoordelijk voor de datakwaliteit. Zij kunnen alleen niet elke data-invoer controleren. Dit betekent dat je hele organisatie op de hoogte moet zijn van de afspraken. Niet alleen dat, ze moeten gemotiveerd zijn om zich te houden aan deze afspraken.
Het moet dus voor alle werknemers duidelijk zijn waarom datakwaliteit zo belangrijk is. En dat dit geldt voor elke vorm van invoer van data: van de gespreksnotitie van de receptioniste tot de salarisverhoging die de HR-medewerker invoert.
Blijf extra kwaliteitscontroles uitvoeren, ook bij een goede data-uitwisseling. Een kleine fout kan grote gevolgen hebben.
De data-eigenaren zorgen dus voor het bewustzijn dat datakwaliteit belangrijk is. Vervolgens ligt de uitvoer van de kwaliteitscontrole bij managers en teamleiders. Die controleren de data-invoer van hun teamleden en spreken collega’s erop aan wanneer hun invoer niet aan de eisen voldoet. Natuurlijk blijft dit mensenwerk, en dat is foutgevoelig. Het is daarom belangrijk om ook automatische controles in te stellen om de kwaliteitscontroles van de managers te ondersteunen.
Datakwaliteit: kwaliteitscontroles
Ook bij een goede data-uitwisseling tussen applicaties zijn extra kwaliteitscontroles niet overbodig: een kleine fout bij de data-invoer kan grote gevolgen hebben. Bijvoorbeeld wanneer een medewerker in het ene systeem als Jan-Jaap is ingevoerd en een collega deze persoon nu in een ander systeem als Jan Jaap opvoert. Dit soort inconsistenties trekken een wissel op de automatische data-uitwisseling tussen applicaties en kunnen zelfs een heel systeem platleggen. Om dit te voorkomen is het dus zaak om controles in te bouwen, zoals geautomatiseerde checks of het correcte format wel is gebruikt bij handmatige invoer.
Maar niet alleen bij handmatige invoer kunnen er problemen optreden. Stel ook controles in bij belangrijke, automatische wijzigingen. Een voorbeeld hiervan is het inbouwen van een check wanneer je meer dan 10 personeelsleden tegelijk verwijdert uit het HRM-systeem. Dit leidt namelijk ook tot het verwijderen van de gebruikersaccounts van deze personen in een hoop andere applicaties. En wat als dit niet de bedoeling is, maar het gevolg van een update van het HRM-systeem? Door deze update is de opmaak van de personeelsnummers gewijzigd en kunnen deze worden herkend als ‘uit dienst’. Dan is het erg fijn als het systeem na een handmatige controle om een bevestiging vraagt, voordat alle accounts verwijderd worden. Het is dus belangrijk dat automatische en handmatige checks elkaar aanvullen en ondersteunen.
Benieuwd hoe deze data vervolgens meerwaarde levert? Lees hier hoe je jouw data optimaal inzet.
Is je data op orde? Lees hier hoe je met Platform as a Service (PaaS) de cloudtransitie versoepelt.
Cloudtransitie? Eerst data governance!
Bij een (geleidelijke) overstap op de cloud komt veel kijken: niet alleen technische, maar ook strategische en organisatorische vraagstukken. Om te voorkomen dat je tijdens of na een cloudtransitie met problemen te maken krijgt, pak je dus eerst de data governance aan binnen je organisatie.
Het data-eigenaarschap binnen je organisatie bepaal je daarbij als eerste. Voor een goede data-uitwisseling moet je het vervolgens eens zijn over het leidende datamodel. Bovendien moet de kwaliteit van de data die je invoert op orde zijn. Om vervolgens de datakwaliteit te waarborgen, zorg je voor zowel handmatige als automatische checks en controles. Pas wanneer al deze elementen op orde zijn, kun je zeker zijn van een goede data-uitwisseling.
Rik van Berendonk is CTO bij OGD ict-diensten. Vanuit deze rol richt hij zich op het bepalen en vormgeven van de technische strategie van OGD. Hiermee haalt hij het maximale uit ict voor OGD en haar klanten.
Misschien vind je dit leuk
Anderen hebben deze artikelen gelezen