

Data is de drijvende kracht die organisaties naar succes drijft. Het Data Team van ACA Group helpt u graag het volledige potentieel van uw data te benutten. Wij leveren niet alleen een dienst, maar bieden ook een partnerschap aan dat uw bedrijf in staat stelt om te gedijen in het datagedreven tijdperk.
Lees verder en maak kennis met ons toegewijde team van data-experts!
Maak kennis met het datateam van ACA Group
Maak kennis met het Data-team van ACA Group - waar expertise en toewijding samenkomen! Onze ervaren gegevensexperts zijn op een missie om elke uitdaging om te zetten in een overwinning met een "alles is mogelijk"-mentaliteit. Samenwerkend, toegewijd en tot op het bot bedreven, lossen we niet alleen problemen op; we transformeren gegevens in kansen voor uw bedrijf om te bloeien.
- Stijn Vandereyken , Data Lead & Expert bij ACA Group
14 data-experts, 1 team

Stijn Vandereyken
- Functie: Data Team Lead & Data Expert.
- ACA'er sinds: Juni 2019.
- Belangrijkste activiteiten: Offertes schrijven, coachen van teamleden, projectplanning, opstarten van projecten.
- Leukste aan ACA: "De tijd en ruimte die je krijgt om als team en individu je eigen richting te bepalen, terwijl je weet dat je kunt vertrouwen op de steun van de andere teams."
- Trots op: "De prestaties die we als team realiseren, zoals de adoptie van trending technologie of de visualisatie van geïntegreerde real-time informatie."
- Leuk weetje: "Mijn guilty pleasure? Mijn dagelijkse Royco Soup break om 11 uur 's ochtends."
"Onze teamspirit is echt geweldig. Iedereen is bereid om een extra stap te zetten voor elkaar. Je voelt een echte en ontspannen kameraadschap, wat zorgt voor een zeer aangename en motiverende sfeer."
- Stijn Vandereyken

Jef Suffeleers
- Functie: Data Engineer.
- ACA'er sinds: september 2021 (vlak na afstuderen).
- Belangrijkste werkzaamheden: Structureren van klantgegevens en deze uploaden naar Google Cloud Platform.
- Leukste aan ACA: "Alle collega's, ook van andere teams, zijn heel warm en gastvrij. De bedrijfscultuur van ACA is zeker een groot pluspunt."
- Trots op: "Ik ben echt trots op de manier waarop we de backend voor onze klant Amfori hebben gebouwd; heel consistent en robuust. We kregen zelfs complimenten van Google omdat we hun oplossingen implementeerden zoals ze bedoeld waren, met een sterke focus op prestaties, gebruiksvriendelijkheid en resultaten."
- Dagelijkse gewoonte: "Op maandag, woensdag en vrijdag bespreken we samen onze recente projectactiviteiten en mogelijke problemen die we zijn tegengekomen. Samen proberen we mogelijke oplossingen te bedenken. Na deze korte scrum gaan we aan de slag."
"Het Data Team is een hechte groep jonge mensen die meer zijn dan alleen collega's. Ik kan oprecht zeggen dat ik veel van mijn teamleden vrienden kan noemen. We gaan regelmatig samen wat drinken of spreken af bij iemand thuis. Ook organiseren we jaarlijks op eigen initiatief een weekend."
- Jef Suffeleers

Ellen Appermont
- Functie: Operations Manager Data & Service Delivery Manager.
- ACA'er sinds: april 2022.
- Belangrijkste activiteiten: Projectmanagement, budget & resource planning, projectadministratie.
- Leukste aan ACA: "Het voelt alsof we een grote familie zijn. Op vrijdag heeft het Data Team zijn wekelijkse teamdag, waar ik echt van geniet. We hebben de mogelijkheid om thuis te werken, maar je zult me vrijwel altijd op kantoor zien, omdat ik de sfeer daar zo prettig vind."
- Trots op: "Bij ACA krijgen we altijd dingen voor elkaar! Zelfs als de deadlines scherp zijn en de uitdaging extreem moeilijk. En als iemand met ziekteverlof is, springen andere teamleden bij en maken ze extra werkuren om er zeker van te zijn dat we leveren zoals beloofd."
- Leuk weetje: "Ik loop af en toe marathons. Ik ben ook lid van de 'ACA Runners', een groep ACA-medewerkers die regelmatig deelnemen aan hardloopevenementen onder de vlag van ACA. Het is erg leuk om je passie voor sport te delen met je collega's."
"Veel leden van het Data Team zijn momenteel bezig met het kopen en verbouwen van huizen. We proberen elkaar te helpen als dat nodig is. Een tijdje geleden hebben we met bijna het hele team een sloopdag gehouden bij een collega thuis."
- Ellen Appermont

Mathias Luyten
- Functie: Digital Product Owner.
- ACA'er sinds: Februari 2021.
- Hoofdactiviteiten: Verantwoordelijk voor het ontwerp en de ontwikkeling van dataproducten van de klant. Ophalen welke rapportagebehoeften er zijn in de business en deze vertalen naar IT en zorgen dat de dataproducten aansluiten bij de strategie en visie van de klant.
- Het beste aan ACA: "Werken in een team en je samen sterker maken. Daarnaast wordt er veel nadruk gelegd op coaching en persoonlijke ontwikkeling, wat erg waardevol is."
- Waarom ik bij ACA ben gaan werken: "Ik heb voor ACA gekozen omdat ik in een klein, startend datateam zou werken. Dit gaf mij de kans om mijn eigen stempel te drukken op de manier waarop we projecten aanpakken, terwijl er toch voldoende ondersteuning vanuit ACA zou zijn door de jarenlange ervaring van andere teams."
- Trots op: "Ik heb drie jaar als Data Analist gewerkt aan een project bij amfori. Hierdoor heb ik een zeer goede vertrouwensband opgebouwd met de klant. Door dit vertrouwen ben ik doorgegroeid tot Digital Product Owner, waardoor ik de toekomst en visie kan sturen van het dataplatform dat we samen met ACA bij amfori hebben opgezet."
- Fun fact: "Naast mijn werk geef ik al meer dan 10 jaar gitaarles op de plaatselijke muziekschool."
"Kracht bij ACA ligt in teamwork, versterkt door focus op coaching en persoonlijke groei."
- Mathias Luyten

Siebe Janssen
- Functie: Data Engineer.
- ACA'er sinds: Juni 2022.
- Belangrijkste werkzaamheden: Het extraheren, transformeren en laden (ETL) van data uit meerdere bronnen naar een centraal datawarehouse.
- Leukste aan ACA: "Het Data Team is als een hechte vriendengroep, dus werk voelt niet echt als werk. We doen veel moeite voor teamactiviteiten, wat de hele ervaring leuker maakt."
- Trots op: "Ik ben betrokken bij het dataproject voor onze klant Amfori. Gelukkig zijn we tot nu toe nog niet op grote problemen gestuit. Ons belangrijkste doel is om de functionaliteit te behouden door middel van regelmatige updates en het integreren van nieuwe functies."
- Leuk weetje: "Ik speel waterpolo, een erg fysieke en tactische sport."
"In eerste instantie werkte ik bijna 2 jaar als analist bij Deloitte. Daarna ben ik overgestapt naar het datateam van ACA omdat ik al snel merkte dat mijn interesses beter bij die rol pasten."
- Siebe Janssen

Lucas Verscheure
- Functie: Data Analist.
- ACA'er sinds: april 2023.
- Belangrijkste werkzaamheden: Het vertalen van business requirements naar dashboards.
- Leukste aan ACA: "De werkomgeving binnen ACA stimuleert leren en zelfontplooiing. Als je vragen hebt, zijn je collega's altijd bereid om te helpen."
- Projecten bij klanten: Agentschap Natuur & Bos, Aertssen en de stad Hasselt.
- Trots op: "Elke keer als ik samen met mijn collega's een project succesvol afrond, ben ik erg trots op het resultaat. Ik heb aan projecten gewerkt voor verschillende klanten zoals Agentschap Natuur en Bos, Aertssen en de stad Hasselt en elk van deze projecten had zijn eigen uitdagingen. Deze uitdagingen aangaan en het eindresultaat afleveren, voelt erg lonend. "
"Het leukste aan werken voor ACA? De teamcultuur van collegialiteit en de afwisseling tussen verschillende projecten."
- Lucas Verscheure

Joppe Weustenraad
- Functie: Data Engineer.
- ACA'er sinds: Oktober 2019.
- Belangrijkste werkzaamheden: Het oplossen van architectonische uitdagingen en het selecteren van de juiste tools van Google Cloud Platform of cloud-native voor elk project. Het opzetten van de architectuur en het uitvoeren van low-level development tijdens sprints.
- Beste aan ACA: "We krijgen veel verantwoordelijkheid en de vrijheid om te experimenteren en nieuwe ideeën uit te proberen. We krijgen uitdagingen voorgeschoteld die ons stimuleren om creatief te worden met nieuwe oplossingen en innovatieve technologie te omarmen. Dit alles vindt plaats in een familiaire maar gedreven sfeer."
- Mijn gemiddelde werkdag: "Een gewone werkdag biedt een goede mix van dingen, zoals je verdiepen in een spike door tools te onderzoeken en uit te zoeken hoe je ze moet gebruiken of instellen, collega's ondersteunen met de technische kant van hun verhalen, brainstormen over complexe datamodelleringsproblemen en werken aan ETL-taken en dashboards voor klanten."
"Ik was op zoek naar een bedrijf in Limburg met een goede vibe en een work-hard/play-hard ethos. ACA voldeed perfect aan die beschrijving. Dat werd glashelder tijdens het ACA-weekend in september 2019, waar ik kon instromen, nog voor mijn eerste officiële werkdag."
- Joppe Wuestenraad

Jordy Raeman
- Functie: Data Engineer.
- ACA'er sinds: maart 2023.
- Belangrijkste werkzaamheden: Zorgen voor de flow van klantdata naar het dataplatform en het opzetten, onderhouden en verbeteren van de benodigde architectuur.
- Waarom ik bij ACA ben gaan werken: "Het eerste wat me opviel toen ik ACA Group leerde kennen op een jobbeurs was de vriendelijke sfeer, evenals de focus op echte voordelen voor werknemers. Het bleek allemaal waar te zijn!"
- Trots op: "Ik ben trots op de opzet van het dataplatform bij Groep A is/was eigenlijk de eerste keer dat ik een dataplatform vanaf de grond moest opbouwen."
- Leuk weetje: "Ik experimenteer graag in de keuken, vooral met oosterse gerechten."
"Mijn gemiddelde dag begint meestal met een ochtend stand-up, waar we de ontwikkelingen voor een specifieke klant bespreken en de komende doelen schetsen. Hierdoor is iedereen goed op de hoogte van de projectstatus en kunnen problemen sneller worden aangepakt."
- Jordy Raeman

Stef Breuls
- Functie: Data Analist.
- ACA'er sinds: December 2021.
- Belangrijkste werkzaamheden: Zorgen dat klanten hun data effectief kunnen gebruiken. Beschikbare gegevens analyseren, samenwerken met klanten om hun behoeften te begrijpen, gegevens structureren voor gebruik in rapporten en bruikbare rapporten maken.
- Leukste aan ACA: "Ik heb de kans gehad om met verschillende klanten te werken, zoals amfori, Livlina, ANB, Febelco, Aertssen en zelfs binnen ACA. Elk project is interessant en enigszins gelijkaardig, maar brengt toch zijn eigen uitdagingen met zich mee. Het omgaan met deze verschillende omgevingen is tot nu toe een geweldige leerervaring geweest."
- Trots op: "Na een succesvolle setup en significante vooruitgang voor de klant, Livina, werden we gevraagd om twee Power BI-trainingssessies te organiseren. Het was echt de moeite waard om te zien dat onze oplossing perfect voldeed aan de behoeften van de klant en dat onze kennisdeling hen in staat stelde om er zelfstandig doorheen te navigeren."
"De teamcultuur binnen het Data Team is fantastisch. We zijn een ongelooflijk sociale groep, gekenmerkt door sterke transparantie en open communicatie. Bovendien kunnen we altijd op elkaar rekenen, zowel tijdens als buiten het werk. Er is een sterke betrokkenheid en bereidheid onder alle teamleden."
- Stef Breuls

Eva Braeckman
- Functie: Data Analist.
- ACA'er sinds: Juli 2023.
- Voornaamste activiteiten: Klanten helpen om het maximale uit hun data te halen.
- Leukste aan ACA: "Ik was op zoek naar een omgeving waarin ik mezelf continu kan ontwikkelen en dat heb ik precies gevonden bij ACA. Als je het gevoel hebt dat je je op een bepaalde manier wilt ontwikkelen, of als je wilt overstappen naar een andere rol of een ander team, dan is dat bespreekbaar."
- Trots op: "Een tijdje geleden hebben we een datalab gehost voor onze klant Amfori, waarbij potentiële extra inzichten uit hun bestaande data naar voren kwamen. Het management van Amfori was echt enthousiast en prees ons voor het genereren van nieuwe ideeën voor de toekomst."
- Leuk weetje: "In mijn vrije tijd trek ik regelmatig mijn bokshandschoenen aan. Het helpt me echt om stoom af te blazen en alle stress van me af te schudden!"
"Hoewel het Data Team relatief jong is, worden we aangemoedigd om verantwoordelijkheden op ons te nemen. Door ons veel kansen te geven en de vrijheid om te leren en te experimenteren, heb ik echt het gevoel dat ze in me geloven."
- Eva Braeckman
Marnick Vanloffelt
- Functie: Data Analyst, Data Strategy Domain Lead.
- ACA'er sinds: november 2021
- Belangrijkste activiteiten: "Als Data Analist zet ik data om in waardevolle inzichten. Als projectmanager houd ik projecten op schema en zorg ik ervoor dat iedereen op de hoogte is. Als Data Strategy & Governance Expert stimuleer ik de datamaturiteit van klanten door middel van effectieve processen, vaardige teams en de juiste technologie."
- Beste ACA: "De geweldige werksfeer en de hoge mate van autonomie en ondernemerschap zijn zeer motiverend. Elke dag brengt een nieuwe uitdaging."
- Trots op: "Ik ben trots op mijn rol als Domain Lead voor Data Strategy en de kans om bij te dragen aan het vormgeven van ons Data Framework. Dit heeft geleid tot de ontwikkeling van nieuwe diensten waarmee onze klanten snel echte waarde kunnen halen uit hun investeringen in datapraktijken. "
- Leuk weetje: "Ik ben een horlogefetisjist! Ik vind het niet alleen leuk om ze te kopen, maar ik probeer ze ook te repareren en in elkaar te zetten. "
"De vrijheid, teamspirit en ondernemende mindset binnen het DataDots team overtuigen me elke dag om het beste van mezelf te geven."
- Marnick Vanloffelt

Ruben Claus
- Functie: Data-analist.
- ACA'er sinds: september 2023.
- Belangrijkste werkzaamheden: "Na een intensief trainingsprogramma ging ik al snel aan de slag met een intern project: de migratie van het ACA-rapportageplatform van Google naar Microsoft Power BI. Mijn eerste klantproject was de review en optimalisatie van een self-service dashboard in Google Looker Studio. Ik vind het leuk om op deze manier verschillende technologieën te ontdekken."
- Leukste aan ACA: "De teamgeest is het leukste! Het Data Team is als een hechte familie - altijd bereid om een handje te helpen, en na een goed gesprek bij de koffie duiken we samen weer in het werk. In het begin werkte ik drie dagen per week thuis, maar nu ben ik bijna altijd op kantoor. Waarom? Nou, het is gewoon een hele leuke en inspirerende plek om te werken."
- Trots op: "Het project van de rapportagemigratie was een echte uitdaging. Oorspronkelijk was het idee om Google Looker te gebruiken, maar na analyse en veel interne discussies besloten we dat Microsoft Power BI op de lange termijn de beste keuze zou zijn. Hoewel het een teamprestatie was, voelt het resultaat van vandaag als een persoonlijke prestatie."
"Ondanks mijn beperkte ervaring kreeg ik het volste vertrouwen in mijn eerste interne project. Zelfs toen het moeilijk werd, bleven ze me steunen en in me geloven. Dat is heel geruststellend en motiverend."
- Ruben Claus

Vincent Mees
- Functie: Data Solutions Architect.
- ACA'er sinds: april 2022.
- Belangrijkste werkzaamheden: "Als Data & Analytics Competence Lead voor Microsoft Azure is het mijn verantwoordelijkheid dat alle Azure projecten soepel verlopen. Ik bied technische ondersteuning en stuur het Azure team aan binnen ons Data Team."
- Mijn gemiddelde werkdag: "Ik behandel een verscheidenheid aan verschillende taken en verantwoordelijkheden: van architectuurworkshops, pipeline-ontwikkeling en integratie met externe databronnen, tot coachingsessies en meer. Dat maakt elke dag uniek voor mij."
- Trots op: "Met het team zijn we erin geslaagd om een volledig nieuw dataplatformaanbod op te bouwen in Microsoft Azure. Vanaf nul beginnen was een echte uitdaging, maar daar plukken we nu de vruchten van."
- Leuk weetje: "Ik werk graag 's avonds laat aan een project, zonder afleiding overdag."
"De familiale en ondersteunende teamcultuur in combinatie met een pragmatische aanpak, maakt dat ACA zich onderscheidt als een vrij uniek bedrijf in de sector."
- Vincent Mees

Jan Eerdekens
- Functie: Data Engineer.
- ACA'er sinds: november 2005.
- Belangrijkste activiteiten: Helikopterview houden over de architectuur in klantprojecten, coachen en collega's ondersteunen.
- Leukste aan ACA: "De combinatie tussen de gezelligheid van een klein bedrijf met een platte organisatiestructuur, en de kennis en ervaring van een grote IT-speler. En de beruchte ACA weekend- en nieuwjaarsfeesten!"
- Trots op: "De afgelopen jaren ben ik een echte Liferay-expert geworden, waardoor ik de kans heb gekregen om te spreken op de Liferay Devcon."
- Leuk weetje: "Elke dag begin ik mijn werkdag met een boterham met chocoladepasta terwijl ik mijn e-mails doorneem. Het team heeft me zelfs een t-shirt gegeven met de tekst Sandwich Man ('Boterham man' in het Nederlands)."
"Als teamlid met de meeste ervaring ondersteun en coach ik graag jongere collega's. Zo hoop ik mijn ervaring te delen met anderen. Op deze manier hoop ik mijn ervaring te delen en hen in staat te stellen zelfverzekerd taken op zich te nemen, te herkennen wanneer ze ondersteuning moeten zoeken en uiteindelijk hun kennis en werkmethoden door te geven aan nieuwe collega's."
- Jan Eerdekens
Onze missie: uw gegevens omzetten in concurrentievoordeel
Een effectieve gegevensstrategie gaat niet alleen over het verzamelen van gegevens; het gaat over het transformeren van uw gegevens in een krachtig hulpmiddel dat uw organisatie een concurrentievoordeel geeft.
Het datateam van ACA Group helpt u om gegevensinitiatieven af te stemmen op uw bedrijfsdoelstellingen, waarbij gegevens worden gebruikt als hefboom om de bedrijfsefficiëntie te verbeteren. Wij bieden u de datastromen en visualisatietools die u nodig hebt om sneller meer inzichten te krijgen.
Op die manier wordt het eenvoudig om...

What others have also read


In deze technische blogpost wil ik het hebben over hoe je eenvoudige en flexibele ETL-gebaseerde anonimisering kunt opzetten. Waarom? Wel, ik had onlangs de gelegenheid om een klein proof of concept uit te voeren voor een klant. De klant wilde weten welke opties beschikbaar waren om interne gegevens te nemen, alle persoonlijk identificeerbare informatie (PII) te verwijderen of anonimiseren en deze op een eenvoudige manier en vorm beschikbaar te maken voor externe partijen. Na het verzamelen van verdere vereisten werd de context voor dit proof of concept als volgt gedefinieerd: Welke oplossing dan ook, het moet in staat zijn om gegevens te extraheren uit een on premise Oracle database . Het eindresultaat moet een set CSV-bestanden zijn in een Amazon S3-bucket . Tussen het ophalen van de Oracle-gegevens en het dumpen ervan in CSV-vorm op S3, moet er iets zijn dat PII-gegevens verwijdert/anonimiseert. Indien mogelijk moet de gekozen oplossing cloud native zijn. In deze 3-delige blogreeks leg ik uit hoe je eenvoudige en flexibele ETL-gebaseerde anonimisering opzet: Het onderzoek naar producten die gebruikt zouden kunnen worden om het probleem op te lossen. Controleer ook hoe geschikt ze zijn voor wat de proof of concept moet bereiken. Hoe het gekozen product gebruikt kan worden om een ETL pipeline te maken die aan de eisen voldoet. Daarnaast, hoe je een lokale Oracle database opzet in Docker die gebruikt kan worden als databron voor het data ingestion deel van het proof of concept (gewoon omdat dit zo'n PITA was om te doen). En of dit op een cloud native manier kan worden gedaan. Onderzoek Het onderzoeksdeel van het proof of concept bestaat uit 2 delen: Hoe haal je data uit een Oracle database, anonimiseer je het op de een of andere manier en sla je het op als een stel CSV bestanden in een S3 bucket aka het ETL gedeelte. Uitzoeken wat de beste manier is om de anonimisering uit te voeren. De gegevens extraheren, transformeren en opslaan Het probleem van de klant klonk meteen al opmerkelijk als iets dat je zou kunnen oplossen met een ETL-product: Extract Transform Load . Het onderzoeksgedeelte voor dit deel van het proof of concept zou zich dus concentreren op dit type product. Ik kreeg ook wat input van iemand in mijn team om eens te kijken naar singer.io , omdat dat iets was dat ze in het verleden met succes hadden gebruikt voor dit soort problemen. Als je naar de homepage van Singer kijkt, vallen een aantal dingen meteen op: Singer maakt gegevensextractie en -consolidatie mogelijk voor alle tools van je organisatie. De open-source standaard voor het schrijven van scripts die gegevens verplaatsen. Unix-geïnspireerd: Singer taps en targets zijn eenvoudige applicaties samengesteld met pipes. JSON-gebaseerd: Singer-toepassingen communiceren met JSON, waardoor ze eenvoudig te gebruiken en te implementeren zijn in elke programmeertaal. Singer is dus gewoon een specificatie, zij het geen officiële. Het is een eenvoudig, op JSON gebaseerd dataformaat en je kunt iets in dit formaat produceren (een tap in Singer terminologie) of het formaat consumeren (een target ). Je kunt deze taps en targets aan elkaar koppelen om gegevens van de ene locatie te halen en op een andere locatie op te slaan. Singer wordt standaard geleverd met een heleboel taps (meer dan 100) en targets (10). Deze taps en targets zijn geschreven in Python. Omdat het centrale punt van het systeem slechts een gegevensformaat is, is het vrij eenvoudig om er zelf een te schrijven of een bestaand formaat aan te passen. Bij het controleren van de taps zou de standaard Oracle-tap het Extract-gedeelte van ons proof of concept moeten dekken. Hetzelfde lijkt echter niet het geval te zijn voor het Load gedeelte als we kijken naar de standaard targets. Er is een CSV target , maar deze slaat de resultaten lokaal op, niet in een S3 bucket. Er is een optie om gewoon dit doel te gebruiken en de S3 upload zelf te doen nadat de ETL pijplijn is voltooid. Een andere optie zou zijn om het bestaande CSV target aan te passen en de bestandsopslag te veranderen naar S3. Even Googelen levert een door de gemeenschap gemaakt S3 CSV Singer doel op. Volgens de documentatie zou dit target precies moeten doen wat we willen. Oeps, Singer transformeert niet Met de Extract en Load delen gedekt, blijft alleen het Transform deel van de ETL pijplijn over om uit te zoeken... en dit is waar het een beetje vreemd wordt. Ook al is Singer geclassificeerd als een ETL tool, het lijkt geen ondersteuning te hebben voor het transformatie gedeelte? Toen ik hier verder naar keek, kwam ik deze onheilspellend getitelde post tegen: Why our ETL tool does not do transformations . Als ik dit lees, lijkt het erop dat ze hun JSON specificatie/gegevensformaat beschouwen als het transformatiegedeelte. Dus ze ondersteunen transformatie naar ruwe gegevens en het opslaan ervan, maar ondersteunen geen andere soorten transformaties. Dat deel mag je zelf doen nadat het ergens is opgeslagen door een Singer-doel. Het blijkt dus dat Singer meer lijkt op het EL deel van een ELT product dan op een "old school" ETL product . Op dit punt zou Singer in ieder geval voldoende moeten zijn om de gegevens uit een Oracle database te halen en in CSV-formaat in een S3 bucket te zetten. En omdat Singer vrij eenvoudig, open en uitbreidbaar is, laat ik het hier voorlopig bij. Laten we verder kijken naar de anonimiseringsopties die in deze Singer-context zouden kunnen passen. Gegevens anonimiseren Net als bij het ETL-gedeelte, kreeg ik ook voor dit gedeelte wat input die me wees op Microsoft Presidio . Op de homepage kunnen we het volgende lezen: Het biedt snelle identificatie- en anonimiseringsmodules voor privé-entiteiten in tekst en afbeeldingen , zoals creditcardnummers, namen en meer. Het faciliteert zowel volledig geautomatiseerde als semi-geautomatiseerde PII de-identificatiestromen op meerdere platforms. Aanpasbaarheid in PII-identificatie en -anonimisering. Er staan dus veel veelbelovende dingen in die me zouden kunnen helpen bij het oplossen van mijn anonimiseringsbehoeften. Bij nader onderzoek lijkt het erop dat ik dit product evalueer tijdens een grote transformatie (snap je? 😉 ) van V1 naar V2. V1 bevatte wat ETL-achtige dingen zoals het ophalen van gegevens uit bronnen (hoewel Oracle-ondersteuning in de roadmap nooit lijkt te zijn gerealiseerd ) en het opslaan van geanonimiseerde resultaten in een aantal vormen/locaties. V2 heeft deze aanpak echter volledig losgelaten en concentreert zich puur op het detecteren en vervangen van PII-gegevens. In de kern is Presidio V2 een op Python gebaseerd systeem dat bovenop een AI-model is gebouwd. Dit stelt het in staat om automatisch PII-gegevens te ontdekken in tekst en afbeeldingen en deze te vervangen volgens de regels die je definieert. Ik heb wat tests gedaan met behulp van hun online testtool en het werkt min of meer, maar voor onze specifieke context moet het zeker worden aangepast. Als we kijken naar de meegeleverde testgegevens, lijkt het erop dat het vooral eenvoudige en korte gegevens zijn, maar geen grote tekstblokken of afbeeldingen. Dit roept de vraag op: zelfs als we Presidio kunnen configureren om te doen wat we willen, slaan we misschien kleine spijkers met een grote hamer? Is Presidio te veel? Laten we hier nog eens over nadenken. Als we gemakkelijk kunnen weten en definiëren welke eenvoudige kolommen in welke tabellen moeten worden geanonimiseerd en wanneer gewoon nulling of hashing van de kolomwaarden voldoende is, dan hebben we het autodetectie deel van Presidio niet nodig. We hebben ook geen Presidio-ondersteuning nodig voor volledige tekst of afbeeldingen en we hebben ook geen fancy substitutie-ondersteuning nodig. Presidio zou een krachtige bibliotheek kunnen zijn om een automatische anonimiseringsstap te maken voor onze Singer-gebaseerde pijplijn. Het helpt ook dat Presidio gebaseerd is op Python. Maar mijn gevoel zegt dat ik misschien eerst moet proberen om een iets eenvoudigere oplossing te vinden. Ik begon te zoeken naar iets dat een eenvoudige PII-vervanging kan doen en dat werkt in een Singer tap/target context. Ik vond deze Github repository: pipelinewise-transform-field . In de documentatie staat "Transformatiecomponent tussen Singer taps en targets". Klinkt verdacht veel als het " T " deel dat Singer als een ETL miste! Verderop in de configuratiesectie lezen we zelfs: "Je moet definiëren welke kolommen door welke methode moeten worden getransformeerd en in welke conditie de transformatie moet worden toegepast." en de mogelijke transformatietypes zijn: SET-NULL : transformeert elke invoer naar NULL HASH : transformeert stringinvoer naar hash HASH-SKIP-FIRST-n : Transformeert stringinvoer naar hash waarbij de eerste n tekens worden overgeslagen, bijv. HASH-SKIP-FIRST-2 MASK-DATE : Vervangt de maand- en dagdelen van datumkolommen door 1 jan. MASK-NUMBER : Zet elke numerieke waarde om in nul. MASK-HIDDEN : verandert een willekeurige tekenreeks in 'verborgen'. Dit lijkt volledig te voldoen aan onze eenvoudige anonimiseringseisen! We kunnen zelfs zien hoe we het moeten gebruiken in de context van Singer: some-singer-tap | transform-field --config [config.json] | some-singer-target Standaard Conclusie We hebben nu alle stukjes van de puzzel voor het opzetten van eenvoudige en flexibele ETL-gebaseerde anonimisering. In de volgende blogpost laten we zien hoe ze in elkaar passen en of ze de resultaten opleveren die de klant zoekt.
Lees verder

We zijn als ACA Group officieel ISO 27001 compliant! Onze Information Security Manager Simon Vercruysse legt uit wat die certificatie precies inhoudt en wat de voordelen zijn voor jouw (toekomstige) project.
Lees verder

CloudBrew is altijd een hoogtepunt op onze kalender geweest, maar de editie van 2025 voelde anders. Misschien lag het aan de timing. Slechts een maand eerder, in november 2025, opende de Azure Belgium Central-regio eindelijk haar deuren. ACA opereert al altijd vanuit het hart van Europa, dus het live gaan van deze grote nationale mijlpaal net voor de conferentie zorgde voor een extra dosis enthousiasme.
Lees verderWant to dive deeper into this topic?
Get in touch with our experts today. They are happy to help!

Want to dive deeper into this topic?
Get in touch with our experts today. They are happy to help!

Want to dive deeper into this topic?
Get in touch with our experts today. They are happy to help!

Want to dive deeper into this topic?
Get in touch with our experts today. They are happy to help!


