Delftse wetenschapper ontvangt Vici-beurs voor innovatief AI-onderzoek

De Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) heeft aan vier Delftse wetenschappers een Vici-financiering toegekend van maximaal 1,5 miljoen euro. Met deze prestigieuze beurs kunnen zij gedurende vijf jaar een vernieuwende onderzoekslijn ontwikkelen en hun eigen onderzoeksgroep verder uitbreiden. Een van de ontvangers is Dr. Jan van Gemert van de faculteit Elektrotechniek, Wiskunde en Informatica van de TU Delft. Presentator Frans van Rijnswou spreekt met Van Gemert in het radioprogramma Delft Centraal.

Dr. Jan van Gemert (links) in de radiostudio met Frans van Rijnswou | Foto: Redactie Omroep Delft

Van Gemert's onderzoek richt zich op het efficiënter trainen van kunstmatige intelligentie (AI) met minder data.  Van Gemert legt uit dat AI wordt getraind met enorme hoeveelheden data, zowel tekst als beeld. "Ze verzamelen gigantische hoeveelheden tekst- en beelddata en laten daar stukjes van weg. Vervolgens moet de AI voorspellen wat er in die lege ruimtes hoort te staan," legt hij uit. Dit proces, bekend als foundation models, vormt de basis van AI-systemen. Grote bedrijven zoals OpenAI, Meta en Google gebruiken dit principe met honderden miljoenen beelden en volledige internetdatasets. Vervolgens wordt dit basismodel fine-tuned voor specifieke taken, zoals chatbot-interacties of beeldherkenning. 

Toen ChatGPT voor het eerst werd gelanceerd, was zijn faculteit onder de indruk. "Inmiddels is het een technologie dat overal en door iedereen wordt gebruikt," aldus Gemert. 
 
Een nieuwe aanpak: AI met minder data 
Met de Vici-beurs wil Van Gemert een alternatieve methode ontwikkelen die AI minder afhankelijk maakt van gigantische datasets en de grote techbedrijven die deze beheren. "Het probleem is dat alleen grote bedrijven de rekenkracht en de data hebben om deze AI-modellen te trainen. Dat maakt ons afhankelijk van hen." 
 
Een bijkomend probleem is dat we vaak niet weten waar deze data vandaan komt of hoe betrouwbaar ze is. "Data kan bevooroordeeld zijn, privacygevoelige informatie bevatten of simpelweg onjuist zijn. Door met minder data te werken, kunnen we beter controleren wat erin zit en AI democratischer maken," stelt Van Gemert. 
 
Zijn doel is om AI te trainen met tien tot honderd keer minder data, en mogelijk zelfs duizend keer minder. "Meer data leidt waarschijnlijk tot betere prestaties, maar ik hoop dat we met minder data toch vergelijkbare resultaten kunnen behalen." 
 
Ethische vraagstukken 
Naast de technische kant van AI, ziet Van Gemert ook ethische uitdagingen. Hij wijst op het feit dat AI-modellen vaak getraind worden met data die zonder expliciete toestemming is verzameld. "Bijvoorbeeld, Facebook en OpenAI delen niet waar hun data precies vandaan komt. Dat maakt het moeilijk om te controleren of er sprake is van privacy-inbreuken." 
 
Ook de vraag of AI echt intelligentie bezit, blijft een punt van discussie. Van Gemert citeert de Nederlandse wiskundige Edsger Dijkstra: "Een computer die kan denken is eigenlijk hetzelfde als een onderzeeër die kan zwemmen." AI kan menselijke intelligentie simuleren, maar dat betekent niet dat het echt denkt zoals een mens. 
 
AI en CAPTCHA: wie wint de strijd? 
Interessant genoeg wordt AI ook gebruikt om zichzelf te verbeteren via systemen zoals CAPTCHA. Dit laatste wordt gebruikt door websites om gebruikers te vragen afbeeldingen van fietsen bijvoorbeeld te selecteren om te bewijzen dat ze geen robot zijn. "Wat veel mensen niet weten, is dat AI deze menselijke input ook gebruikt om te leren. Als negen van de tien antwoorden kloppen, gebruikt de AI de tiende afbeelding om beter te begrijpen wat een fiets is", legt Van Gemert uit. 
 
De impact van de Vici-beurs 
Met de Vici-financiering kan Van Gemert vier onderzoekers aannemen: drie PhD-kandidaten en een postdoc. "Zij zullen werken aan verschillende onderdelen van het project, die onafhankelijk van elkaar functioneren maar elkaar ook kunnen versterken." 
 
Daarnaast is er een groeiende vraag naar transparante en onafhankelijke AI-modellen. "De nieuwe AI-wet van de Europese Unie vraagt al om meer openheid over trainingsdata. Momenteel geven bedrijven alleen de gewichten van hun modellen vrij, maar niet de gebruikte datasets. Dit onderzoek kan bijdragen aan een toekomst waarin AI minder afhankelijk is van gesloten systemen." 
 
Uitdagingen
AI wordt steeds vaker ingezet voor dagelijkse taken, zoals het schrijven van teksten of het genereren van sollicitatiebrieven. Dit brengt uitdagingen met zich mee voor onderwijsinstellingen. "Op de universiteit merken we dat studenten AI gebruiken. We moeten nadenken over hoe we dit kunnen toetsen. Uiteindelijk blijft de student verantwoordelijk voor wat hij inlevert", zegt Van Gemert. 
 
Ondanks de uitdagingen kijkt Van Gemert optimistisch naar de toekomst. "Deze Vici-beurs geeft ons de kans om AI minder afhankelijk te maken van Big Tech en transparanter te maken. Hopelijk draagt ons onderzoek bij aan een eerlijker en beter controleerbare AI."