AI-standaardisering in biomedisch onderzoek
Nature Methods publiceert kwaliteitsrichtlijnen voor voorspellende algoritmen
Professor Tom Lenaerts, lid van de ELIXIR Machine Learning Focus Group en huidig directeur van IB², het Interuniversitair Instituut voor Bio-informatica van de Université libre de Bruxelles en de Vrije Universiteit Brussel: "De populariteit van machine learning en deep learning wekt tegenwoordig de indruk dat nieuwe AI-instrumenten snel kunnen worden ontworpen zonder veel na te denken over de gegevens en de eigenlijke doelstellingen. Dat is niet het geval. Onnauwkeurigheid wordt gemakkelijk bereikt wanneer men geen volledig inzicht heeft in de aard van de gegevens en de kenmerken die in een voorspellingsmethode worden gebruikt. Op medisch en biologisch gebied zou eigenlijk meer dan de helft van de tijd moeten worden besteed aan het ontwerpen van een dataset van hoge kwaliteit en het vinden van de juiste set kenmerken om de methode te trainen."
Het artikel in Nature Methods biedt daarom een checklist aan met aanbevelingen voor wie een supervised classificatiemethode voor de biologische en medische wetenschappen wil bouwen of publiceren. Deze richtlijnen over wat moet worden gerapporteerd in wetenschappelijke papers maken dat de vorm en de kwaliteit van een nieuwe methode grondig kan worden beoordeeld en dat wordt voldaan aan reproduceerbaarheidsgaranties. Toptijdschriften die verslag uitbrengen over nieuwe voorspellende AI-methoden worden dan ook geadviseerd om deze DOME-richtlijnen over te nemen. Hierdoor zorgen ook zij er mee voor dat de vooruitgang op het gebied van biomedische AI aan de hoogste normen voldoet, net zoals voor elk ander biomedisch hulpmiddel.
Lenaerts: "Ondanks de voordelen die nieuwe voorspellende AI-methoden kunnen opleveren voor het begrip van moleculen of ziektes en mogelijk ook voor de patiëntenzorg, hebben ze vaak te lijden onder reproduceerbaarheid en duidelijkheid, en in het ergste geval aan problemen in het ontwerp van het algoritme zelf of een bias in de gegevens en methodes. Ontoereikende uitleg over de belangrijkste onderdelen van deze methodes leidt niet alleen tot wantrouwen, maar blokkeert ook de transfer naar klinieken en dus de patiëntenzorg. Door de richtlijnen te hanteren en toe te voegen aan het onderzoek wordt het mogelijk om het kaf van het koren te scheiden en de normen voor machine learning in biomedisch onderzoek naar een hoger niveau te tillen. Door de DOME-aanbevelingen op te volgen, zullen mensen de AI-oplossingen relevant en nuttig vinden, en wordt voorkomen dat heel interessante ontwikkelingen in ML en AI verloren gaan door een gebrek aan kwaliteit."
Tom Lenaerts is directeur van IB², het Interuniversitair Instituut voor Bio-informatica van de Université libre de Bruxelles en de Vrije Universiteit Brussel, co-hoofd van de ULB Machine Learning Group (MLG) en gedeeltelijk verbonden met het Artificial Intelligence lab van de Vrije Universiteit Brussel. Zowel MLG als het AI lab zijn lid van het Europese AI netwerk CLAIRE en het nieuwe AI Institute for the Common Good, FARI, in Brussel. Tom Lenaerts maakt deel uit van de ELIXIR Machine Learning Focus Group en wordt als dusdanig vermeld in het artikel. Affiliaties met ULB en VUB en IB² worden in het artikel vermeld.
ELIXIR
ELIXIR is een intergouvernementele organisatie die biowetenschappelijke hulpbronnen uit heel Europa samenbrengt. Deze hulpbronnen omvatten databanken, software-instrumenten, opleidingsmateriaal, cloud-opslag en supercomputers. Het doel van ELIXIR is om deze middelen te coördineren zodat ze één enkele infrastructuur vormen. Het Belgische knooppunt van ELIXIR, ELIXIR Belgium, is gevestigd in Gent. ULB, VUB en IB2 werken samen met het knooppunt, delen de toegang tot middelen en werken waar mogelijk mee aan door ELIXIR georganiseerde projecten en evenementen.
Artikel
Ian Walsh, Dmytro Fishman, Dario Garcia-Gasulla, Tiina Titma, Gianluca Pollastri, ELIXIR Machine Learning Focus Group, Jennifer Harrow, Fotis E. Psomopoulos & Silvio C. E. Tosatto DOME: recommendations for supervised machine learning validation in biology. Nat Methods (2021). https://doi.org/10.1038/s41592-021-01205-4
Contact:
Tom Lenaerts
0486 931 996