Share this via:

Data Analytics-ingenieur

Inmon, Kimball of Linstedt? Een dimensionaal model of niet? Een keuze maken of kiezen voor een hybride oplossing? En hoe werkt dit met clouddiensten van AWS, Microsoft of Google?

Getriggerd door het lezen van deze vragen? Wil je meedenken over welke oplossing onze klanten zal helpen bij het opzetten of uitbreiden van hun dataplatform? Vind je het leuk om ruwe data om te zetten in bruikbare inzichten?

Dan ben jij de Data Analytics Engineer die wij zoeken!

Jouw rol bij ACA

Als Data Analytics Engineer maak je deel uit van ons gedreven datateam. Samen zoeken we naar nieuwe technologieën die de oplossingen voor onze klanten kunnen verbeteren. We geloven in cloudoplossingen om data te leveren, zowel in stream als batch, om nieuwe inzichten te creëren.

Ons team richt zich op groei en innovatie en we gebruiken hiervoor geen 'business-as-usual' proces. We werken in een dynamische omgeving, waarin ons datateam zelf bepaalt welke richting we op willen en hoe we dit willen bereiken. Klinkt leuk, toch? 😉

Geen zorgen, we verwachten niet dat je meteen alle hard- en soft skills vakjes aanvinkt. We zijn vooral op zoek naar nieuwe teamleden met dezelfde passie voor data en persoonlijke & professionele ontwikkeling!

Welke vaardigheden heb je nodig?

Hard skills

  • Je ontwerpt en ontwikkelt je data-integratieoplossingen en zet je data om in een datamodel dat het beste aansluit bij de behoeften van de klant.
  • Creëer en vertaal je data-inzichten die bedrijven ondersteunen bij het nemen van betere beslissingen.
  • Je maakt en ontwerpt dashboards die het beste aansluiten bij de behoeften van de klant.
  • Je werkt nauw samen met databronnenexperts en rapportageteams. Je beheert alle gegevens, zowel gestructureerde als ongestructureerde.
  • Je hebt ervaring met een cloudplatform zoals AWS, Google Cloud Platform, MS Azure. MS Fabric is een pluspunt.
  • Je bent een SQL-expert (of wilt er een worden) en kijkt ernaar uit om als consultant aan de slag te gaan.
  • Je hebt ervaring met Business Intelligence / Data Warehouse concepten, of je bent bereid dit te leren.
  • Je spreekt vloeiend Nederlands en zeer goed Engels.

Soft skills

  • Je hebt een sterke passie voor data gedreven technologieën en interessante design uitdagingen.
  • Je vindt het leuk om je te verdiepen in de behoeften van de klant en samen naar een oplossing te zoeken.
  • Je bent een gemotiveerde teamplayer die resultaatgericht werkt en je hebt een proactieve mindset.
  • Je bent leergierig en gemotiveerd.

Wat wij bieden

  • Een innovatieve werkomgeving
    Een innovatieve werkomgeving

    Je werkt met de nieuwste technologieën en tools in een omgeving die innovatie ademt, met flexibele werktijden en mogelijkheden om op afstand te werken.

  • Een salarispakket op maat
    Een salarispakket op maat

    Een aantrekkelijk salaris, een bedrijfswagen*, maaltijdcheques, onkostenvergoeding, een MacBook Pro en meer. *ACA Group zet zich in voor een duurzame toekomst. Daarom stappen we over op volledig elektrische voertuigen. Tegen 2025 willen we dat 98% van ons wagenpark elektrisch is! ⚡

  • Leren en groeien bij ACA Groep
    Leren en groeien bij ACA Group

    Bij ACA krijg je de kans om professioneel en persoonlijk te groeien via coaching en mentoring op de werkvloer. Je hebt toegang tot een persoonlijk ontwikkelingsplan, een budget voor technische en professionele opleidingen en vele mogelijkheden om je kennis uit te breiden. Het delen van kennis staat bij ons centraal, daarom hebben we de interne ACAdemy opgericht - ons interne en externe centrum voor kennisdeling.

  • We steunen je
    Wij steunen u

    We bieden een uitgebreid ziektekosten- en verzekeringsplan dat aan je behoeften voldoet. Onze prioriteit is ervoor te zorgen dat onze collega's gelukkig zijn, met een goede balans tussen werk en privé, de juiste hulpmiddelen en meer.

  • Onze unieke bedrijfscultuur
    Onze unieke bedrijfscultuur

    Je maakt deel uit van een gepassioneerd en hardwerkend team dat trots is op zijn prestaties. ACA is een plek waar teamwerk, transparantie, het delen van kennis en erkenning belangrijke waarden zijn.

  • Jij staat in het middelpunt
    Jij staat centraal

    We worden gedreven door onze teamleden, waarbij iedereen zijn steentje bijdraagt en tegelijkertijd ruimte maakt voor plezier. Een fantastisch team werkt niet alleen samen, maar geniet ook van de tijd samen. Daarom organiseren we veel activiteiten binnen en buiten onze kantoren en gaan we elk jaar op een geweldige ACA weekendtrip!

Overtuigd dat jij een match bent? Solliciteer nu.

From candidate to colleague

This is our application process in 4 steps

Employer branding
Employer branding

Why is working at ACA Group so great?

Good question! We are not only a certified Great Place To Work®, but our employees also enjoy numerous extra benefits, such as a well-equipped (electric) company car, plenty of opportunities to learn and grow, and a spot on our legendary ACA weekends.

idea
Certified Great Place to work

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed erat nibh tristique ipsum.

idea
Numerous Legal Benefits

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed erat nibh tristique ipsum.

idea
Legendary ACA Weekends

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed erat nibh tristique ipsum.

Sluit je aan bij ons team als Data Analytics-ingenieur

Vul het sollicitatieformulier in en laten we praten.

Open Application

Does this job not quite fit you?

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullam

Or check out our related vacancies

Case studies

Interesting cases for you

With over 80 successful implementations, we help organizations work faster,
better, and more efficiently.

Gebruiksvriendelijk Stadsapp voor Stad Hasselt

Stad Hasselt, een lokale overheid in de publieke sector, wilde de digitale toegang tot gemeentelijke diensten verbeteren via een mobiele applicatie, maar kampte met gebruiksvriendelijkheid en lage adoptie. ACA Group voerde een UX-audit en gebruikerstesten met inwoners uit om de interface en functionaliteit te optimaliseren. Dit resulteerde in een gebruiksvriendelijke mobiele app met hogere gebruikerstevredenheid en een eenvoudigere toegang tot digitale stadsdiensten.

Lees meer
Overview picture of the city of Hasselt made with a drone
Overview picture of the city of Hasselt made with a drone
Logo City of Hasselt
Gebruiksvriendelijk Stadsapp voor Stad Hasselt

Stad Hasselt, een lokale overheid in de publieke sector, wilde de digitale toegang tot gemeentelijke diensten verbeteren via een mobiele applicatie, maar kampte met gebruiksvriendelijkheid en lage adoptie. ACA Group voerde een UX-audit en gebruikerstesten met inwoners uit om de interface en functionaliteit te optimaliseren. Dit resulteerde in een gebruiksvriendelijke mobiele app met hogere gebruikerstevredenheid en een eenvoudigere toegang tot digitale stadsdiensten.

Lees meer
Overview picture of the city of Hasselt made with a drone
Overview picture of the city of Hasselt made with a drone
Logo City of Hasselt
Eén website voor een betere digitale ervaring: Attentia’s #OneAttentia transformatie

Attentia, een dienstverlener in de HR- en welzijnssector, wilde de klantervaring en online aanwezigheid verbeteren, maar kampte met gefragmenteerde digitale platformen. ACA Group ontwikkelde een toekomstbestendige website door meerdere systemen te consolideren in één geïntegreerd platform. Deze weboplossing versterkt de #OneAttentia-ervaring, waardoor klanten eenvoudig toegang hebben tot diensten en Attentia profiteert van hogere efficiëntie, consistente branding en meer digitale betrokkenheid.

Lees meer
hands laptop
hands laptop
attentia logo
Eén website voor een betere digitale ervaring: Attentia’s #OneAttentia transformatie

Attentia, een dienstverlener in de HR- en welzijnssector, wilde de klantervaring en online aanwezigheid verbeteren, maar kampte met gefragmenteerde digitale platformen. ACA Group ontwikkelde een toekomstbestendige website door meerdere systemen te consolideren in één geïntegreerd platform. Deze weboplossing versterkt de #OneAttentia-ervaring, waardoor klanten eenvoudig toegang hebben tot diensten en Attentia profiteert van hogere efficiëntie, consistente branding en meer digitale betrokkenheid.

Lees meer
hands laptop
hands laptop
attentia logo
Gestroomlijnde connectiviteit voor Renson's externe apps
Renson, een fabrikant in de sector van zonwering en ventilatiesystemen, wilde zijn producten digitaliseren met een gebruiksvriendelijke mobiele app voor het aansturen van terrasoverkappingen en ventilatie, maar stond voor uitdagingen rond hardware-integratie, netwerkconnectiviteit en verouderde software. ACA Group ontwikkelde een geïntegreerde IoT- en mobile app-oplossing die deze systemen centraal aanstuurt. Dit resulteerde in verbeterde gebruikerscontrole, betrouwbare connectiviteit en een consistente digitale gebruikerservaring.
Lees meer
Renson smart home app
Renson smart home app
RENSON_logo_without slogan
Gestroomlijnde connectiviteit voor Renson's externe apps
Renson, een fabrikant in de sector van zonwering en ventilatiesystemen, wilde zijn producten digitaliseren met een gebruiksvriendelijke mobiele app voor het aansturen van terrasoverkappingen en ventilatie, maar stond voor uitdagingen rond hardware-integratie, netwerkconnectiviteit en verouderde software. ACA Group ontwikkelde een geïntegreerde IoT- en mobile app-oplossing die deze systemen centraal aanstuurt. Dit resulteerde in verbeterde gebruikerscontrole, betrouwbare connectiviteit en een consistente digitale gebruikerservaring.
Lees meer
Renson smart home app
Renson smart home app
RENSON_logo_without slogan
Innovatief AI-model detecteert beschadigde pallets bij Duvel Moortgat

Duvel Moortgat, een brouwerij in de voedings- en drankenindustrie, had een betrouwbaardere methode nodig om beschadigde pallets te detecteren en zo veilig en efficiënt transport te garanderen. ACA Group implementeerde een AI-gedreven computer vision oplossing die automatisch defecten identificeert binnen logistieke processen. Deze geautomatiseerde kwaliteitscontrole verbetert productkwaliteit, verlaagt operationele kosten en verhoogt de efficiëntie van de supply chain.

Lees meer
1694073871-duvel-moortgat
1694073871-duvel-moortgat
Duvel_Logo
Innovatief AI-model detecteert beschadigde pallets bij Duvel Moortgat

Duvel Moortgat, een brouwerij in de voedings- en drankenindustrie, had een betrouwbaardere methode nodig om beschadigde pallets te detecteren en zo veilig en efficiënt transport te garanderen. ACA Group implementeerde een AI-gedreven computer vision oplossing die automatisch defecten identificeert binnen logistieke processen. Deze geautomatiseerde kwaliteitscontrole verbetert productkwaliteit, verlaagt operationele kosten en verhoogt de efficiëntie van de supply chain.

Lees meer
1694073871-duvel-moortgat
1694073871-duvel-moortgat
Duvel_Logo
Aqtor! stroomlijnt afspraken met nieuwe planningstool

Aqtor!, een aanbieder van orthopedische en mobiliteitshulpmiddelen in de zorgsector, kampte met inefficiënt afsprakenbeheer dat de operationele werking en patiëntervaring beïnvloedde. ACA Group implementeerde Planit, een digitaal plannings- en afsprakenbeheersysteem, om workflows te automatiseren en resourceplanning te optimaliseren. Deze oplossing vermindert administratieve lasten, verhoogt de zorgkwaliteit en verbetert de klanttevredenheid door snellere en efficiëntere dienstverlening.

Lees meer
Aqtor case hospital
Aqtor case hospital
aqtor
Aqtor! stroomlijnt afspraken met nieuwe planningstool

Aqtor!, een aanbieder van orthopedische en mobiliteitshulpmiddelen in de zorgsector, kampte met inefficiënt afsprakenbeheer dat de operationele werking en patiëntervaring beïnvloedde. ACA Group implementeerde Planit, een digitaal plannings- en afsprakenbeheersysteem, om workflows te automatiseren en resourceplanning te optimaliseren. Deze oplossing vermindert administratieve lasten, verhoogt de zorgkwaliteit en verbetert de klanttevredenheid door snellere en efficiëntere dienstverlening.

Lees meer
Aqtor case hospital
Aqtor case hospital
aqtor
Van mobiele laadapp naar datagedreven oplossingen: onze samenwerking met MobilityPlus
De meest waardevolle samenwerkingen zijn die waarin een leverancier actief bijdraagt aan de groei van zijn of haar klant. Dat is precies wat ACA Group al meer dan een jaar doet met MobilityPlus. Wat begon als een mobiele app voor EV laden, is uitgegroeid tot een compleet digitaal ecosysteem, met een webportaal, een Azure dataplatform en AI-gedreven oplossingen. Dankzij de expertise van ACA transformeert MobilityPlus tot een data-gedreven bedrijf dat de toekomst van duurzame mobiliteit vormgeeft.
Lees meer
ev charger
ev charger
MobilityPlus logo
Van mobiele laadapp naar datagedreven oplossingen: onze samenwerking met MobilityPlus
De meest waardevolle samenwerkingen zijn die waarin een leverancier actief bijdraagt aan de groei van zijn of haar klant. Dat is precies wat ACA Group al meer dan een jaar doet met MobilityPlus. Wat begon als een mobiele app voor EV laden, is uitgegroeid tot een compleet digitaal ecosysteem, met een webportaal, een Azure dataplatform en AI-gedreven oplossingen. Dankzij de expertise van ACA transformeert MobilityPlus tot een data-gedreven bedrijf dat de toekomst van duurzame mobiliteit vormgeeft.
Lees meer
ev charger
ev charger
MobilityPlus logo
Gebruiksvriendelijk Stadsapp voor Stad Hasselt

Stad Hasselt, een lokale overheid in de publieke sector, wilde de digitale toegang tot gemeentelijke diensten verbeteren via een mobiele applicatie, maar kampte met gebruiksvriendelijkheid en lage adoptie. ACA Group voerde een UX-audit en gebruikerstesten met inwoners uit om de interface en functionaliteit te optimaliseren. Dit resulteerde in een gebruiksvriendelijke mobiele app met hogere gebruikerstevredenheid en een eenvoudigere toegang tot digitale stadsdiensten.

Lees meer
Overview picture of the city of Hasselt made with a drone
Overview picture of the city of Hasselt made with a drone
Logo City of Hasselt
Gebruiksvriendelijk Stadsapp voor Stad Hasselt

Stad Hasselt, een lokale overheid in de publieke sector, wilde de digitale toegang tot gemeentelijke diensten verbeteren via een mobiele applicatie, maar kampte met gebruiksvriendelijkheid en lage adoptie. ACA Group voerde een UX-audit en gebruikerstesten met inwoners uit om de interface en functionaliteit te optimaliseren. Dit resulteerde in een gebruiksvriendelijke mobiele app met hogere gebruikerstevredenheid en een eenvoudigere toegang tot digitale stadsdiensten.

Lees meer
Overview picture of the city of Hasselt made with a drone
Overview picture of the city of Hasselt made with a drone
Logo City of Hasselt
Eén website voor een betere digitale ervaring: Attentia’s #OneAttentia transformatie

Attentia, een dienstverlener in de HR- en welzijnssector, wilde de klantervaring en online aanwezigheid verbeteren, maar kampte met gefragmenteerde digitale platformen. ACA Group ontwikkelde een toekomstbestendige website door meerdere systemen te consolideren in één geïntegreerd platform. Deze weboplossing versterkt de #OneAttentia-ervaring, waardoor klanten eenvoudig toegang hebben tot diensten en Attentia profiteert van hogere efficiëntie, consistente branding en meer digitale betrokkenheid.

Lees meer
hands laptop
hands laptop
attentia logo
Eén website voor een betere digitale ervaring: Attentia’s #OneAttentia transformatie

Attentia, een dienstverlener in de HR- en welzijnssector, wilde de klantervaring en online aanwezigheid verbeteren, maar kampte met gefragmenteerde digitale platformen. ACA Group ontwikkelde een toekomstbestendige website door meerdere systemen te consolideren in één geïntegreerd platform. Deze weboplossing versterkt de #OneAttentia-ervaring, waardoor klanten eenvoudig toegang hebben tot diensten en Attentia profiteert van hogere efficiëntie, consistente branding en meer digitale betrokkenheid.

Lees meer
hands laptop
hands laptop
attentia logo
Gestroomlijnde connectiviteit voor Renson's externe apps
Renson, een fabrikant in de sector van zonwering en ventilatiesystemen, wilde zijn producten digitaliseren met een gebruiksvriendelijke mobiele app voor het aansturen van terrasoverkappingen en ventilatie, maar stond voor uitdagingen rond hardware-integratie, netwerkconnectiviteit en verouderde software. ACA Group ontwikkelde een geïntegreerde IoT- en mobile app-oplossing die deze systemen centraal aanstuurt. Dit resulteerde in verbeterde gebruikerscontrole, betrouwbare connectiviteit en een consistente digitale gebruikerservaring.
Lees meer
Renson smart home app
Renson smart home app
RENSON_logo_without slogan
Gestroomlijnde connectiviteit voor Renson's externe apps
Renson, een fabrikant in de sector van zonwering en ventilatiesystemen, wilde zijn producten digitaliseren met een gebruiksvriendelijke mobiele app voor het aansturen van terrasoverkappingen en ventilatie, maar stond voor uitdagingen rond hardware-integratie, netwerkconnectiviteit en verouderde software. ACA Group ontwikkelde een geïntegreerde IoT- en mobile app-oplossing die deze systemen centraal aanstuurt. Dit resulteerde in verbeterde gebruikerscontrole, betrouwbare connectiviteit en een consistente digitale gebruikerservaring.
Lees meer
Renson smart home app
Renson smart home app
RENSON_logo_without slogan
Innovatief AI-model detecteert beschadigde pallets bij Duvel Moortgat

Duvel Moortgat, een brouwerij in de voedings- en drankenindustrie, had een betrouwbaardere methode nodig om beschadigde pallets te detecteren en zo veilig en efficiënt transport te garanderen. ACA Group implementeerde een AI-gedreven computer vision oplossing die automatisch defecten identificeert binnen logistieke processen. Deze geautomatiseerde kwaliteitscontrole verbetert productkwaliteit, verlaagt operationele kosten en verhoogt de efficiëntie van de supply chain.

Lees meer
1694073871-duvel-moortgat
1694073871-duvel-moortgat
Duvel_Logo
Innovatief AI-model detecteert beschadigde pallets bij Duvel Moortgat

Duvel Moortgat, een brouwerij in de voedings- en drankenindustrie, had een betrouwbaardere methode nodig om beschadigde pallets te detecteren en zo veilig en efficiënt transport te garanderen. ACA Group implementeerde een AI-gedreven computer vision oplossing die automatisch defecten identificeert binnen logistieke processen. Deze geautomatiseerde kwaliteitscontrole verbetert productkwaliteit, verlaagt operationele kosten en verhoogt de efficiëntie van de supply chain.

Lees meer
1694073871-duvel-moortgat
1694073871-duvel-moortgat
Duvel_Logo
Aqtor! stroomlijnt afspraken met nieuwe planningstool

Aqtor!, een aanbieder van orthopedische en mobiliteitshulpmiddelen in de zorgsector, kampte met inefficiënt afsprakenbeheer dat de operationele werking en patiëntervaring beïnvloedde. ACA Group implementeerde Planit, een digitaal plannings- en afsprakenbeheersysteem, om workflows te automatiseren en resourceplanning te optimaliseren. Deze oplossing vermindert administratieve lasten, verhoogt de zorgkwaliteit en verbetert de klanttevredenheid door snellere en efficiëntere dienstverlening.

Lees meer
Aqtor case hospital
Aqtor case hospital
aqtor
Aqtor! stroomlijnt afspraken met nieuwe planningstool

Aqtor!, een aanbieder van orthopedische en mobiliteitshulpmiddelen in de zorgsector, kampte met inefficiënt afsprakenbeheer dat de operationele werking en patiëntervaring beïnvloedde. ACA Group implementeerde Planit, een digitaal plannings- en afsprakenbeheersysteem, om workflows te automatiseren en resourceplanning te optimaliseren. Deze oplossing vermindert administratieve lasten, verhoogt de zorgkwaliteit en verbetert de klanttevredenheid door snellere en efficiëntere dienstverlening.

Lees meer
Aqtor case hospital
Aqtor case hospital
aqtor
Van mobiele laadapp naar datagedreven oplossingen: onze samenwerking met MobilityPlus
De meest waardevolle samenwerkingen zijn die waarin een leverancier actief bijdraagt aan de groei van zijn of haar klant. Dat is precies wat ACA Group al meer dan een jaar doet met MobilityPlus. Wat begon als een mobiele app voor EV laden, is uitgegroeid tot een compleet digitaal ecosysteem, met een webportaal, een Azure dataplatform en AI-gedreven oplossingen. Dankzij de expertise van ACA transformeert MobilityPlus tot een data-gedreven bedrijf dat de toekomst van duurzame mobiliteit vormgeeft.
Lees meer
ev charger
ev charger
MobilityPlus logo
Van mobiele laadapp naar datagedreven oplossingen: onze samenwerking met MobilityPlus
De meest waardevolle samenwerkingen zijn die waarin een leverancier actief bijdraagt aan de groei van zijn of haar klant. Dat is precies wat ACA Group al meer dan een jaar doet met MobilityPlus. Wat begon als een mobiele app voor EV laden, is uitgegroeid tot een compleet digitaal ecosysteem, met een webportaal, een Azure dataplatform en AI-gedreven oplossingen. Dankzij de expertise van ACA transformeert MobilityPlus tot een data-gedreven bedrijf dat de toekomst van duurzame mobiliteit vormgeeft.
Lees meer
ev charger
ev charger
MobilityPlus logo
Blogs

What others have read

Leestijd 7 min
13 MRT. 2026

In deze technische blogpost wil ik het hebben over hoe je eenvoudige en flexibele ETL-gebaseerde anonimisering kunt opzetten. Waarom? Wel, ik had onlangs de gelegenheid om een klein proof of concept uit te voeren voor een klant. De klant wilde weten welke opties beschikbaar waren om interne gegevens te nemen, alle persoonlijk identificeerbare informatie (PII) te verwijderen of anonimiseren en deze op een eenvoudige manier en vorm beschikbaar te maken voor externe partijen. Na het verzamelen van verdere vereisten werd de context voor dit proof of concept als volgt gedefinieerd: Welke oplossing dan ook, het moet in staat zijn om gegevens te extraheren uit een on premise Oracle database . Het eindresultaat moet een set CSV-bestanden zijn in een Amazon S3-bucket . Tussen het ophalen van de Oracle-gegevens en het dumpen ervan in CSV-vorm op S3, moet er iets zijn dat PII-gegevens verwijdert/anonimiseert. Indien mogelijk moet de gekozen oplossing cloud native zijn. In deze 3-delige blogreeks leg ik uit hoe je eenvoudige en flexibele ETL-gebaseerde anonimisering opzet: Het onderzoek naar producten die gebruikt zouden kunnen worden om het probleem op te lossen. Controleer ook hoe geschikt ze zijn voor wat de proof of concept moet bereiken. Hoe het gekozen product gebruikt kan worden om een ETL pipeline te maken die aan de eisen voldoet. Daarnaast, hoe je een lokale Oracle database opzet in Docker die gebruikt kan worden als databron voor het data ingestion deel van het proof of concept (gewoon omdat dit zo'n PITA was om te doen). En of dit op een cloud native manier kan worden gedaan. Onderzoek Het onderzoeksdeel van het proof of concept bestaat uit 2 delen: Hoe haal je data uit een Oracle database, anonimiseer je het op de een of andere manier en sla je het op als een stel CSV bestanden in een S3 bucket aka het ETL gedeelte. Uitzoeken wat de beste manier is om de anonimisering uit te voeren. De gegevens extraheren, transformeren en opslaan Het probleem van de klant klonk meteen al opmerkelijk als iets dat je zou kunnen oplossen met een ETL-product: Extract Transform Load . Het onderzoeksgedeelte voor dit deel van het proof of concept zou zich dus concentreren op dit type product. Ik kreeg ook wat input van iemand in mijn team om eens te kijken naar singer.io , omdat dat iets was dat ze in het verleden met succes hadden gebruikt voor dit soort problemen. Als je naar de homepage van Singer kijkt, vallen een aantal dingen meteen op: Singer maakt gegevensextractie en -consolidatie mogelijk voor alle tools van je organisatie. De open-source standaard voor het schrijven van scripts die gegevens verplaatsen. Unix-geïnspireerd: Singer taps en targets zijn eenvoudige applicaties samengesteld met pipes. JSON-gebaseerd: Singer-toepassingen communiceren met JSON, waardoor ze eenvoudig te gebruiken en te implementeren zijn in elke programmeertaal. Singer is dus gewoon een specificatie, zij het geen officiële. Het is een eenvoudig, op JSON gebaseerd dataformaat en je kunt iets in dit formaat produceren (een tap in Singer terminologie) of het formaat consumeren (een target ). Je kunt deze taps en targets aan elkaar koppelen om gegevens van de ene locatie te halen en op een andere locatie op te slaan. Singer wordt standaard geleverd met een heleboel taps (meer dan 100) en targets (10). Deze taps en targets zijn geschreven in Python. Omdat het centrale punt van het systeem slechts een gegevensformaat is, is het vrij eenvoudig om er zelf een te schrijven of een bestaand formaat aan te passen. Bij het controleren van de taps zou de standaard Oracle-tap het Extract-gedeelte van ons proof of concept moeten dekken. Hetzelfde lijkt echter niet het geval te zijn voor het Load gedeelte als we kijken naar de standaard targets. Er is een CSV target , maar deze slaat de resultaten lokaal op, niet in een S3 bucket. Er is een optie om gewoon dit doel te gebruiken en de S3 upload zelf te doen nadat de ETL pijplijn is voltooid. Een andere optie zou zijn om het bestaande CSV target aan te passen en de bestandsopslag te veranderen naar S3. Even Googelen levert een door de gemeenschap gemaakt S3 CSV Singer doel op. Volgens de documentatie zou dit target precies moeten doen wat we willen. Oeps, Singer transformeert niet Met de Extract en Load delen gedekt, blijft alleen het Transform deel van de ETL pijplijn over om uit te zoeken... en dit is waar het een beetje vreemd wordt. Ook al is Singer geclassificeerd als een ETL tool, het lijkt geen ondersteuning te hebben voor het transformatie gedeelte? Toen ik hier verder naar keek, kwam ik deze onheilspellend getitelde post tegen: Why our ETL tool does not do transformations . Als ik dit lees, lijkt het erop dat ze hun JSON specificatie/gegevensformaat beschouwen als het transformatiegedeelte. Dus ze ondersteunen transformatie naar ruwe gegevens en het opslaan ervan, maar ondersteunen geen andere soorten transformaties. Dat deel mag je zelf doen nadat het ergens is opgeslagen door een Singer-doel. Het blijkt dus dat Singer meer lijkt op het EL deel van een ELT product dan op een "old school" ETL product . Op dit punt zou Singer in ieder geval voldoende moeten zijn om de gegevens uit een Oracle database te halen en in CSV-formaat in een S3 bucket te zetten. En omdat Singer vrij eenvoudig, open en uitbreidbaar is, laat ik het hier voorlopig bij. Laten we verder kijken naar de anonimiseringsopties die in deze Singer-context zouden kunnen passen. Gegevens anonimiseren Net als bij het ETL-gedeelte, kreeg ik ook voor dit gedeelte wat input die me wees op Microsoft Presidio . Op de homepage kunnen we het volgende lezen: Het biedt snelle identificatie- en anonimiseringsmodules voor privé-entiteiten in tekst en afbeeldingen , zoals creditcardnummers, namen en meer. Het faciliteert zowel volledig geautomatiseerde als semi-geautomatiseerde PII de-identificatiestromen op meerdere platforms. Aanpasbaarheid in PII-identificatie en -anonimisering. Er staan dus veel veelbelovende dingen in die me zouden kunnen helpen bij het oplossen van mijn anonimiseringsbehoeften. Bij nader onderzoek lijkt het erop dat ik dit product evalueer tijdens een grote transformatie (snap je? 😉 ) van V1 naar V2. V1 bevatte wat ETL-achtige dingen zoals het ophalen van gegevens uit bronnen (hoewel Oracle-ondersteuning in de roadmap nooit lijkt te zijn gerealiseerd ) en het opslaan van geanonimiseerde resultaten in een aantal vormen/locaties. V2 heeft deze aanpak echter volledig losgelaten en concentreert zich puur op het detecteren en vervangen van PII-gegevens. In de kern is Presidio V2 een op Python gebaseerd systeem dat bovenop een AI-model is gebouwd. Dit stelt het in staat om automatisch PII-gegevens te ontdekken in tekst en afbeeldingen en deze te vervangen volgens de regels die je definieert. Ik heb wat tests gedaan met behulp van hun online testtool en het werkt min of meer, maar voor onze specifieke context moet het zeker worden aangepast. Als we kijken naar de meegeleverde testgegevens, lijkt het erop dat het vooral eenvoudige en korte gegevens zijn, maar geen grote tekstblokken of afbeeldingen. Dit roept de vraag op: zelfs als we Presidio kunnen configureren om te doen wat we willen, slaan we misschien kleine spijkers met een grote hamer? Is Presidio te veel? Laten we hier nog eens over nadenken. Als we gemakkelijk kunnen weten en definiëren welke eenvoudige kolommen in welke tabellen moeten worden geanonimiseerd en wanneer gewoon nulling of hashing van de kolomwaarden voldoende is, dan hebben we het autodetectie deel van Presidio niet nodig. We hebben ook geen Presidio-ondersteuning nodig voor volledige tekst of afbeeldingen en we hebben ook geen fancy substitutie-ondersteuning nodig. Presidio zou een krachtige bibliotheek kunnen zijn om een automatische anonimiseringsstap te maken voor onze Singer-gebaseerde pijplijn. Het helpt ook dat Presidio gebaseerd is op Python. Maar mijn gevoel zegt dat ik misschien eerst moet proberen om een iets eenvoudigere oplossing te vinden. Ik begon te zoeken naar iets dat een eenvoudige PII-vervanging kan doen en dat werkt in een Singer tap/target context. Ik vond deze Github repository: pipelinewise-transform-field . In de documentatie staat "Transformatiecomponent tussen Singer taps en targets". Klinkt verdacht veel als het " T " deel dat Singer als een ETL miste! Verderop in de configuratiesectie lezen we zelfs: "Je moet definiëren welke kolommen door welke methode moeten worden getransformeerd en in welke conditie de transformatie moet worden toegepast." en de mogelijke transformatietypes zijn: SET-NULL : transformeert elke invoer naar NULL HASH : transformeert stringinvoer naar hash HASH-SKIP-FIRST-n : Transformeert stringinvoer naar hash waarbij de eerste n tekens worden overgeslagen, bijv. HASH-SKIP-FIRST-2 MASK-DATE : Vervangt de maand- en dagdelen van datumkolommen door 1 jan. MASK-NUMBER : Zet elke numerieke waarde om in nul. MASK-HIDDEN : verandert een willekeurige tekenreeks in 'verborgen'. Dit lijkt volledig te voldoen aan onze eenvoudige anonimiseringseisen! We kunnen zelfs zien hoe we het moeten gebruiken in de context van Singer: some-singer-tap | transform-field --config [config.json] | some-singer-target Standaard Conclusie We hebben nu alle stukjes van de puzzel voor het opzetten van eenvoudige en flexibele ETL-gebaseerde anonimisering. In de volgende blogpost laten we zien hoe ze in elkaar passen en of ze de resultaten opleveren die de klant zoekt.

Lees verder
Leestijd 6 min
18 DEC. 2025

CloudBrew is altijd een hoogtepunt op onze kalender geweest, maar de editie van 2025 voelde anders. Misschien lag het aan de timing. Slechts een maand eerder, in november 2025, opende de Azure Belgium Central-regio eindelijk haar deuren. ACA opereert al altijd vanuit het hart van Europa, dus het live gaan van deze grote nationale mijlpaal net voor de conferentie zorgde voor een extra dosis enthousiasme.

Lees verder