ACA Group Blog | Inzichten over Softwareontwikkeling, UX/UI, Data & Innovatie

Bouwen op de schouder van reuzen met behulp van AWS-modellen voor machine learning - ACA Group

Geschreven door Stijn Van den Enden | 8-mei-2025 9:39:15

In mijn vorige blogpost benadrukte ik het belang van het verzamelen van gegevens. In sommige gevallen heb je echter geen geschikte gegevens beschikbaar. Misschien heb je wel ruwe gegevens, maar zijn deze niet gelabeld en niet geschikt voor machine learning. Als je niet over de financiële middelen beschikt om deze gegevens te labelen, of je hebt geen product zoals reCAPTCHA om dit gratis te doen, dan is er nog een andere optie.

Sinds Amazon meer dan tien jaar geledenzijn Amazon Web Services cloud platformlanceerde als een nevenactiviteit, is het in een enorm tempo gegroeid. AWS biedt nu meer dan 165 services, waardoor iedereen, van startups tot multinationals, toegang heeft tot een betrouwbare en schaalbare technische infrastructuur. Sommige van deze services bieden wat we noemen voorgetrainde modellen voor machinaal leren.

Amazons voorgetrainde modellen voor machinaal leren kunnen afbeeldingen of objecten herkennen, tekst verwerken, aanbevelingen doen en nog veel meer. Het mooiste van dit alles is dat je diensten gebaseerd op Deep Learningkunt gebruiken zonder dat je ook maar iets hoeft te weten over machine learning. Deze diensten worden getraind door Amazon, met behulp van gegevens van zijn websites, zijn enorme productcatalogus en zijn magazijnen.

De informatie op de AWS websites kan in het begin een beetje overweldigend zijn. Daarom wil ik in deze blogpost een overzicht geven van een paar diensten die gebruik maken van Amazon's machine learning modellen, waarvan ik denk dat ze gemakkelijk in je applicaties kunnen worden geïntroduceerd.

Computer vision met Rekognition

Amazon Rekognition is een dienst die afbeeldingen en video's analyseert. Je kunt deze dienst gebruiken om gezichten van mensen, alledaagse voorwerpen of zelfs verschillende beroemdheden te identificeren. Praktische toepassingen zijn het toevoegen van labels aan video's, bijvoorbeeld het volgen van de bal tijdens een voetbalwedstrijd, of het uitzoeken van beroemdheden in een publiek.

Omdat Rekognition ook een API heeft om overeenkomsten tussen personen in meerdere afbeeldingen te vergelijken, kun je het gebruiken om iemands identiteit te verifiëren of automatisch vrienden te taggen op sociale media. Over sociale media gesproken: afhankelijk van de context van een platform kunnen sommige bijdragen van gebruikers niet acceptabel worden geacht. Met behulp van Rekognition kan een sociaal mediaplatform semi-automatisch suggestieve of expliciete inhoud controleren, waarbij de mogelijkheid wordt geboden om geüploade media te vervagen of te weigeren wanneer er bepaalde labels aan worden gekoppeld.

Digitaliseer archieven met Textract

Met Amazon Textract kun je tekst uit een gescand document halen. Het gebruikt optische tekenherkenning (OCR) en gaat een stap verder door rekening te houden met de context.

Als je bedrijf veel geprinte formulieren ontvangt in plaats van hun digitale tegenhanger, heb je misschien een paar duizend papieren die je handmatig moet digitaliseren. Met gewone OCR is het een uitdaging om te detecteren waar een formulierlabel eindigt en een formulierveld begint. Op dezelfde manier zou het moeilijk zijn voor OCR om kranten te lezen, wanneer tekst in twee of meer kolommen is geplaatst. Textract is in staat om te identificeren welke groep woorden bij elkaar hoort, of het nu gaat om een alinea, een formulierveld of een gegevenstabel, waardoor u de tijd en moeite die nodig zijn om deze archieven te digitaliseren kunt beperken.

Tekst analyseren met Comprehend

Amazon Comprehend is een NLP-service (Natural Language Processing). Het helpt je om het onderwerp van een document, sleutelzinnen, belangrijke locaties, genoemde personen en meer te ontdekken.

Een van de functies is het analyseren van het sentiment in een tekst. Dit kan je snel inzicht geven in interacties met klanten: zijn ze blij, boos, tevreden? Amazon Comprehend kan zelfs gelijkaardige frustraties rond een bepaald onderwerp uitlichten. Als reviews over een bepaald product automatisch overwegend positief blijken te zijn, kun je dit gemakkelijk verwerken in een promotiecampagne. Ook als de reviews overwegend negatief zijn, kan dat iets zijn om door te sturen naar de fabrikant.

Een subservice van Comprehend, Comprehend Medical genaamd, wordt gebruikt om patiëntendossiers te doorzoeken en patiëntgegevens en behandelingsinformatie te extraheren. Het doel is om zorgverleners te helpen snel een overzicht te krijgen van eerdere interacties met een patiënt. Door het identificeren van belangrijke informatie uit medische notities en er structuur aan toe te voegen, helpt Comprehend Medical medische klanten om een ton aan documenten in een korte tijd te verwerken.

Maak notities met Transcribe

Amazon Transcribe is een algemene dienst om spraak om te zetten naar tekst, met ondersteuning voor 14 talen. Het voegt automatisch interpunctie en opmaak toe, waardoor de tekst makkelijker te lezen en te doorzoeken is.

Een geweldige toepassing hiervoor is het maken van een transcript van een audiobestand en dit naar Comprehend sturen voor verdere analyse. Een callcenter zou real-time streaming transcriptie kunnen gebruiken om de naam van een klant te detecteren en zijn informatie aan de operator te presenteren. Ook kan het callcenter gesprekken labelen met trefwoorden om te analyseren welke problemen zich vaak voordoen.

Een van de functies van Transcribe is het identificeren van meerdere sprekers. Dit is handig voor het transcriberen van interviews of het maken van notulen van vergaderingen zonder dat een van de deelnemers aan de vergadering extra tijd moet besteden aan het noteren van alles.

Meertalig met Translate

Wanneer je reacties krijgt van klanten op je producten, kun je deze vertalen naar de taal van je voorkeur, zodat je subtiele implicaties van bepaalde woorden kunt begrijpen. Of je kunt je bereik vergroten door je social media posts te vertalen. Je kunt zelfs Transcribe en Translate combineren om automatisch ondertitels te genereren voor live evenementen in meerdere talen.

Druk jezelf uit met Polly

De Polly dienst kan worden beschouwd als het omgekeerde van Transcribe. Met Polly kun je tekst omzetten naar spraak, waardoor de stem zo natuurlijk mogelijk klinkt. Met ondersteuning voor meer dan 30 talen en nog veel meer levensechte stemmen, staat niets je meer in de weg om je applicaties tegen je te laten praten.

Polly heeft ondersteuning voor Speech Synthesis Markup Language (SSML), waarmee je meer controle hebt over hoe bepaalde delen van de tekst worden uitgesproken. Naast het toevoegen van pauzes, kun je nadruk leggen op woorden, acroniemen uitwisselen met hun afgekorte vorm en zelfs ademhalingsgeluiden toevoegen. Deze hoeveelheid aanpassingsmogelijkheden maakt het mogelijk om stemvoorbeelden te synthetiseren die heel natuurlijk klinken.

Het genereren van realistische spraak is een belangrijke factor geweest voor het succes van apps als Duolingo, waar uitspraak van groot belang is. Je kunt meer lezen over deze specifieke use case in deze blogpost. Bonus: als je geen zin hebt om te lezen, kun je het laten voorlezen door Polly!

Doe suggesties met Personalize

Als je een product zoekt op de website van Amazon, krijg je meteen suggesties voor vergelijkbare producten of producten die andere klanten in combinatie hebben gekocht. Het is verbazingwekkend dat je uit de miljoenen items die Amazon aanbiedt een nauwkeurige lijst met gerelateerde producten krijgt op het moment dat de pagina wordt geladen. Dit krachtige hulpmiddel is beschikbaar via Amazon Personalize. Je moet een iteminventaris aanleveren (producten, documenten, video's, ...), wat demografische informatie over je gebruikers en Personalize combineert dit met een activiteitenstroom uit je applicatie om aanbevelingen te genereren, in real-time of in bulk.

Dit kan eenvoudig worden toegepast op een groot aantal applicaties. Je kunt klanten van een webshop een lijst met vergelijkbare artikelen laten zien. Een cursusaanbieder zou cursussen kunnen voorstellen die vergelijkbaar zijn met een interessant onderwerp. Heb je een restaurant gevonden dat je leuk vond? Hier is een lijst met vergelijkbare restaurants bij jou in de buurt. Als jij de gegevens kunt leveren, kan Personalize de aanbevelingen doen.

Creëer conversaties met Lex

Amazon Lex is een dienst die conversationele AI biedt. Het gebruikt dezelfde Natural Language Understanding-technologie als Amazons virtuele assistent Alexa. Gebruikers kunnen met je applicatie chatten in plaats van er doorheen te klikken. Alles begint met een intentie. Dit definieert de intentie van de gebruiker, het doel dat we willen bereiken voor onze gebruiker. Het kan zo simpel zijn als het plannen van een afspraak, het geven van een routebeschrijving naar een locatie of het verkrijgen van een recept dat overeenkomt met een ingrediëntenlijst. Intenties worden getriggerd door uitingen. Een uiting is iets dat je zegt en dat een betekenis heeft. "Ik wil een afspraak met Dr. Smith", "Wanneer kan ik Dr. Smith zien?", "Is Dr. Smith volgende week woensdag beschikbaar?" zijn allemaal uitingen met dezelfde bedoeling: een afspraak maken. Lex is krachtig genoeg om deze uitingen te generaliseren zodat kleine variaties ook de juiste intentie kunnen oproepen. Ten slotte, in het geval van het registreren van een afspraak, moet je een paar "slots" specificeren , stukjes data die de gebruiker moet opgeven om aan de intentie te voldoen. In het geval van het bovenstaande voorbeeld, de naam van de persoon die u wilt zien, de tijdsperiode en misschien de reden van uw bezoek.

Hoewel de vereisten vrij eenvoudig zijn, hangt alles af van de kwaliteit van de uitingen en de aaneenschakeling van intenties. Als je niet genoeg voorbeeldzinnen hebt of de conversatie informatie blijft vragen die de gebruiker al heeft gegeven, zal je gebruiker gefrustreerd en overweldigd raken.

Voorspel de vraag met Forecast

Een vrij nieuwe dienst van AWS heet Forecast. Deze dienst is ook voortgekomen uit Amazons eigen noodzaak om de vraag naar hun immense productvoorraad in te schatten. Met Forecast kun je inzicht krijgen in historische tijdreeksgegevens. Je kunt bijvoorbeeld het energieverbruik van een regio analyseren om het te projecteren op de nabije toekomst. Dit geeft je een waarschijnlijkheid van wat de vraag naar elektriciteit morgen zou zijn. Op dezelfde manier kun je misschien voorspellen dat een onderdeel van je productiefaciliteit onderhoud nodig heeft voordat het versleten raakt.

Voorspellingen kunnen gebruik maken van Automated Machine Learning (AutoML) om de optimale leerparameters te vinden voor jouw use case. De kwaliteit van deze service hangt af van de hoeveelheid en kwaliteit van de gegevens die je kunt leveren.

Deze service was tot voor kort alleen beschikbaar voor een selecte groep, maar is nu beschikbaar voor iedereen. Jekunt je hieraanmelden voor Forecast.

Meenemen

Als je machine learning naar je klanten wilt brengen, maar je wordt tegengehouden door een gebrek aan inzicht, dan biedt Amazon kant-en-klare diensten om intelligentie toe te voegen aan je applicaties. Deze diensten, getraind en gebruikt door Amazon, kunnen je bedrijf helpen groeien en je klanten een persoonlijke ervaring geven, zonder enige voorkennis over machine learning.