VUB-onderzoek: hoe je met AI verschillende doelen kunt optimaliseren
Hoe modellen die draaien op Artificiële Intelligentie soms een keuze zijn tussen de pest en de cholera
In zijn doctoraat Thinking in Trade-Offs: Training Agents to Balance Conflicting Objectives under Uncertainty ontwikkelt Röpke nieuwe methoden om kunstmatige intelligentie beter te laten omgaan met complexe keuzes waarin meerdere, vaak tegenstrijdige doelstellingen samenkomen. Elke dag moeten mensen afwegingen maken: wegen extra kosten zwaarder door dan extra kwaliteit? Is veiligheid belangrijk, of toch eerder snelheid? Is Individueel voordeel te verkiezen boven maatschappelijk belang…? Volgens Röpke schieten huidige AI-systemen op dat vlak nog tekort. “De meeste AI-methoden zijn ontworpen om één doel tegelijk te optimaliseren”, zegt hij. “Maar echte beslissingen draaien bijna altijd om het vinden van een evenwicht tussen meerdere doelen.”
Het doctoraatsonderzoek van Röpke situeert zich binnen reinforcement learning, een tak van artificiële intelligentie waarin autonome agenten leren door interactie met hun omgeving. Röpke specifieke interessegebied is multi-objective reinforcement learning, waarbij agenten leren omgaan met meerdere doelstellingen tegelijk en tot evenwichtige beslissingen komen. “We willen systemen bouwen die niet alleen efficiënt zijn, maar ook transparant kunnen afwegen welke compromissen ze maken”, legt hij uit.
Het onderzoek bestaat uit drie belangrijke delen. Eerst toont Röpke hoe bestaande AI-technieken, die normaal één doel tegelijk nastreven, kunnen worden aangepast zodat ze leren omgaan met meerdere doelen en verschillende mogelijke evenwichtige oplossingen kunnen vinden, waarbij de doelen zo goed mogelijk worden gehaald. Daarna ontwikkelt hij nieuwe manieren om beter rekening te houden met de voorkeuren van gebruikers, en bewijst hij dat die aanpak zowel theoretisch sterk is, als praktisch bruikbaar. In het laatste deel onderzoekt hij hoe meerdere AI-systemen samen beslissingen nemen en stelt hij een nieuwe methode voor om complexe problemen te vereenvoudigen, zodat krachtige bestaande algoritmen ook daar kunnen worden ingezet.
Volgens Röpke is de brug tussen onderzoeksvelden essentieel voor de toekomst van AI. “Door de kloof tussen single- en multidoelen-benaderingen te dichten, kunnen doorbraken in het ene domein sneller impact hebben in het andere. Dat versnelt de ontwikkeling van robuuste en verantwoorde AI-systemen.”
De resultaten dragen bij aan de ontwikkeling van technologie die rekening kan houden met verschillende stakeholders en conflicterende doelstellingen op een transparante manier kan afwegen. “Uiteindelijk willen we AI-systemen die veilig en verantwoord kunnen functioneren in de echte wereld, vooral in toepassingen waar de gevolgen van beslissingen groot zijn,” aldus Röpke.
Over de onderzoeker:
Willem Röpke vervoegde in 2021 het AI Lab van de Vrije Universiteit Brussel met een FWO-beurs. Tijdens zijn doctoraat publiceerde hij in toonaangevende tijdschriften en conferenties, droeg hij bij aan open-sourceprojecten en was hij gastonderzoeker aan de Universiteit van Oxford en de Universiteit van Galway. Daarnaast was hij onderwijsassistent voor machine learning en organiseerde hij internationale workshops, waaronder MODeM 2024 en EWRL 2023. Met dit doctoraat levert hij een belangrijke bijdrage aan de volgende generatie AI-systemen die complexe beslissingen kunnen nemen in een wereld vol trade-offs.
Meer info
Willem.ropke@vub.be