De reis van laboratoriumhypothese naar apotheekschap is een van de meest slopende marathons in de moderne industrie, die doorgaans 10 tot 15 jaar en miljarden dollars aan investeringen vergt.
Vooruitgang wordt vaak niet alleen belemmerd door het inherente mysterie van de biologie, maar ook door ‘gefragmenteerde en moeilijk op te schalen’ workflows die onderzoekers dwingen handmatig te schakelen tussen experimentele ontwerptools, software en daadwerkelijke databases.
Maar OpenAI heeft een nieuw aangepast model uitgebracht GPT-Rosalind specifiek om dit proces te versnellen en efficiënter, gemakkelijker en idealiter productiever te maken. Vernoemd naar de baanbrekende scheikundige Rosalind Franklin, wiens werk cruciaal was bij de ontdekking van de structuur van DNA (en vaak over het hoofd werd gezien door haar mannelijke collega’s, James Watson en Francis Crick), werd dit nieuwe grensverleggende redeneringsmodel speciaal gecreëerd om te fungeren als een speciale intelligentielaag voor onderzoek in de levenswetenschappen.
Door de rol van AI te verschuiven van algemeen assistent naar domeinspecifieke ‘redeneringspartner’, signaleert OpenAI een langetermijnengagement voor biologische en chemische ontdekkingen.
Wat GPT-Rosalind biedt
GPT-Rosalind gaat niet alleen over het sneller genereren van tekst; het is ontworpen om bewijsmateriaal te synthetiseren, biologische hypothesen te genereren en experimenten te plannen – taken die doorgaans jaren van menselijke synthese vergen.
In de kern is GPT-Rosalind de eerste in een reeks nieuwe modellen die zijn geoptimaliseerd voor wetenschappelijke workflows. Terwijl eerdere versies van GPT uitblonken in algemene taaltaken, is dit model op maat gemaakt voor een dieper begrip van genomica, eiwittechnologie en chemie.
Om de mogelijkheden ervan te valideren, heeft OpenAI het model getest aan de hand van verschillende branchebenchmarks. In BixBench, een maatstaf voor bio-informatica en data-analyse uit de echte wereld, behaalde GPT-Rosalind leidende prestaties onder de modellen waarvan de scores worden gepubliceerd.
Bij meer gedetailleerde testen via LABBench2 presteerde het model beter dan GPT-5.4 op zes van de elf taken, waarbij de meest significante verbetering te zien was op CloningQA – een taak die een grondig reagensontwerp vereist voor protocollen voor moleculair klonen.
Het meest opvallende prestatiesignaal van het model komt voort uit een samenwerking met Dyno Therapeutics. In een evaluatie waarbij gebruik werd gemaakt van niet-gepubliceerde ‘niet-verontreinigde’ RNA-sequenties, kreeg GPT-Rosalind de taak om sequentie-naar-functie te voorspellen en te genereren.
Wanneer de modelinzendingen rechtstreeks in de Codex-omgeving werden geëvalueerd, scoorden ze boven het 95e percentiel van menselijke experts op het gebied van voorspellingstaken en bereikten ze het 84e percentiel voor het genereren van sequenties.
Dit expertiseniveau suggereert dat het model kan functioneren als een samenwerkingspartner op hoog niveau die in staat is ‘expert-relevante patronen’ te identificeren die vaak over het hoofd worden gezien door generalistische modellen.
Nieuwe laboratoriumworkflow
OpenAI brengt niet alleen modellen uit; ze lanceerden een ecosysteem dat was ontworpen om te integreren met de tools die wetenschappers al gebruiken. De essentie hiervan is nieuwigheid Life Sciences-onderzoeksplug-in voor Codex, beschikbaar op GitHub.
Wetenschappelijk onderzoek is notoir geheimzinnig. Voor één enkel project kan een onderzoeker nodig zijn om een database met eiwitstructuren te raadplegen, twintig jaar klinische literatuur te doorzoeken en vervolgens afzonderlijke hulpmiddelen te gebruiken voor sequentiemanipulatie. Deze nieuwe plug-in fungeert als een ‘orkestratielaag’ en biedt een uniform startpunt voor deze uit meerdere stappen bestaande zoekopdrachten.
-
Vaardigheid: Dit pakket omvat modulaire vaardigheden voor biochemie, menselijke genetica, functionele genomica en klinisch bewijs.
-
Connectiviteit: Dit verbindt het model met meer 50 openbare multi-omics-databases en literaire bronnen.
-
Efficiëntie: Deze aanpak richt zich op ‘langdurige, gereedschapsrijke wetenschappelijke workflows’, waardoor onderzoekers herhaalbare taken kunnen automatiseren, zoals het zoeken naar eiwitstructuren en het zoeken naar sequenties.
De toegang is beperkt en veilig
Gezien de potentiële kracht van modellen die biologische structuren opnieuw kunnen ontwerpen, vermijdt OpenAI ‘open source’ of brede publieke releases ten gunste van Trusted Access-programma’s.
Dit model werd exclusief gelanceerd als onderzoekspreview voor in aanmerking komende Enterprise-klanten in de Verenigde Staten. Deze beperkte implementatie is gebaseerd op drie kernprincipes: nuttig gebruik, sterk bestuur en gecontroleerde toegang.
Organisaties die om toegang verzoeken, moeten kwalificatie- en veiligheidsbeoordelingen ondergaan om ervoor te zorgen dat ze legitiem onderzoek uitvoeren met een duidelijk algemeen voordeel.
In tegenstelling tot modellen voor algemeen gebruik is GPT-Rosalind ontwikkeld met verbeterde beveiligingscontroles op bedrijfsniveau. Voor eindgebruikers betekent dit:
-
Beperkte toegang: Gebruik is beperkt tot goedgekeurde gebruikers in een veilige en goed beheerde omgeving.
-
Bestuur: Deelnemende organisaties moeten strikte controles op de preventie van misbruik handhaven en akkoord gaan met bepaalde vereisten voor previews van onderzoek op het gebied van de levenswetenschappen.
-
Kosten: Tijdens de preview-fase zal het model geen gebruik maken van bestaande credits of tokens, zodat onderzoekers kunnen experimenteren zonder directe budgetbeperkingen (die kunnen worden misbruikt).
Warm welkom van initiële industriële partners
Deze aankondiging kreeg aanzienlijke steun van OpenAI’s partners in de farmaceutische en technologische sectoren.
Sean Bruich, SVP AI en Data bij Amgen, merkte op dat deze samenwerking de bedrijven in staat stelt geavanceerde tools toe te passen op een manier die “de manier kan versnellen waarop we medicijnen aan patiënten afleveren.” De impact is ook voelbaar op de specifieke technologische infrastructuur die laboratoria ondersteunt:
-
NVIDIA: Kimberly Powell, vice-president van Health Services en Life Sciences, beschrijft de convergentie van domeinredenering en versneld computergebruik als een manier om “jaren van traditioneel onderzoek en ontwikkeling te combineren tot onmiddellijke, bruikbare wetenschappelijke inzichten.”
-
Modern: CEO Stéphane Bancel benadrukte het vermogen van het model om “te redeneren op basis van complex biologisch bewijs” om teams te helpen inzichten te vertalen naar experimentele workflows.
-
Allen Instituut: CTO Andy Hickl benadrukte dat GPT-Rosalind opvalt omdat het handmatige stappen (zoals het vinden en afstemmen van gegevens) “consistenter en herhaalbaarder maakt in de workflows van agenten.”
Dit is gebaseerd op echte resultaten die OpenAI in het veld heeft gezien, zoals de samenwerking met Ginkgo Bioworks, waar AI-modellen hebben bijgedragen aan een verlaging van de eiwitproductiekosten met 40%.
Wat is de toekomst voor Rosalind en OpenAI in de levenswetenschappen?
De missie van OpenAI met GPT-Rosalind is om de kloof te verkleinen tussen ‘veelbelovende wetenschappelijke ideeën’ en het daadwerkelijke ‘bewijs, experimenten en beslissingen’ die nodig zijn voor medische vooruitgang.
Door samen te werken met instellingen als het Los Alamos National Laboratory om AI-gestuurd katalysatorontwerp en modificatie van biologische structuren te onderzoeken, positioneert het bedrijf GPT-Rosalind als meer dan alleen een hulpmiddel: het is bedoeld als een ‘capabele partner in ontdekking’.
Nu het vakgebied van de levenswetenschappen steeds data-intensiever wordt, kan een verschuiving naar gespecialiseerde ‘redeneermodellen’ zoals die van Rosalind de standaard worden voor het navigeren door de ‘enorme zoekruimte’ in de biologie en scheikunde.



