De echte vraag over de nieuwe Anthropic Claude Mythos AI-voorbeeld Het model gaat over de vraag of het model (en vergelijkbare modellen in de toekomst) nuttiger zal zijn voor cyberbeveiligingsverdedigingen of voor hackers. Om erachter te komen, Snel bedrijf vroegen een aantal cybersecurity-experts.
Claude Mythe, uitgegeven in “preview” op 9 april, is Anthropic’s grootste en meest capabele frontlinie tot nu toe AI model. Anthropic-onderzoekers zeiden dat het model tijdens de training een uniek vermogen demonstreerde om beveiligingskwetsbaarheden diep in softwarecode te vinden en vervolgens exploits te creëren om op beheerdersniveau toegang te krijgen tot softwaresystemen, inclusief besturingssystemen.
Daarom, zegt Anthropic, bestaan er mythen te gevaarlijk voor het publiek vrijgegeven te worden. Maar omdat vergelijkbare AI-modellen waarschijnlijk in het verschiet liggen, kondigden ze een sectorinitiatief aan genaamd Project Glasswing, dat cybersecurityonderzoekers bij bedrijven en instellingen toegang geeft tot Mythos-modellen, zodat ze veelgebruikte software kunnen beschermen tegen AI-ondersteunde aanvallen.
“Wat Anthropic heeft aangetoond, is hoe snel AI in staat is kwetsbaarheden op grote schaal te identificeren”, zegt Marcus Fowler, CEO van Darktrace Federal. “Wanneer AI kwetsbaarheden kan ontdekken met een snelheid en diepte die de snelheid waarmee zwakke punten kunnen worden geïdentificeerd aanzienlijk verandert, zal dit het ontdekken van problemen in zowel nieuwe als bestaande systemen fundamenteel versnellen.”
Dean Ball, een senior fellow bij de Foundation for American Innovation en voormalig senior beleidsadviseur voor kunstmatige intelligentie en opkomende technologieën onder de regering van president Donald Trump, zei dat cybersecurity-onderzoekers door vroegtijdig toegang te krijgen tot Mythos een voordeel zullen hebben in de aanhoudende koude oorlog tegen hackers.
“Als de zaken weer tot rust komen, zullen Mythos en de vergelijkbare capabele modellen die erop zullen volgen een grote prestatie zijn in de geschiedenis van cybersecurity”, tweette Ball donderdag. “Het harde optreden dat ze zullen opleggen aan alle belangrijke mondiale software is een geschenk van het Amerikaanse kapitalisme dat vrijelijk aan de wereld wordt gegeven, tegen hoge kosten voor ons.”
Ball gaf dit echter toe in een bericht aan Snel bedrijf dat er misschien een tijdklok zit in de voordelen die Mythos biedt. Er is een voortdurende strijd gaande tussen cyberveiligheidswachten en cybercriminelen (hackers) om de nieuwste software in hun voordeel te gebruiken. “Er is altijd een balans tussen aanval en verdediging, en Anthropic wil de verdediging verbeteren door Mythos voorlopig beperkt beschikbaar te houden”, aldus Ball.
Hij merkt op dat het misschien nog maar 9 tot 12 maanden duurt voordat sommige AI-labs source-modellen openen die vergelijkbaar zijn met Mythos. Maar het zou sneller gaan als iemand erin zou slagen de Mythos-parametergewichten te stelen. “Dit is misschien al gebeurd, en het kan heel moeilijk zijn om te weten of dit is gebeurd”, zei Ball.
Ondertussen kon het Anthropic-model bekendheid verwerven en ervaring opdoen met een schat aan softwarecode van grote commerciële systemen die nog nooit eerder was gezien. Ze zullen nieuwe soorten zwakke punten in de architectuur en software ontdekken die aanvallers kunnen misbruiken, en nieuwe oplossingen voor deze zwakke punten ontwikkelen. Dit maakt Mythos niet alleen effectiever op het gebied van cyberbeveiliging, maar het zou ook Anthropic’s Claude Code-product ten goede kunnen komen door het beter te maken in het detecteren van bugs of potentiële beveiligingsproblemen in de code die het produceert.
Niet alleen het model van volgend jaar
De mythe is mogelijk meer dan alleen een verbetering op de AI die hackers al gebruiken. In de Claude Mythos Preview-systeemkaart leggen Anthropic-onderzoekers uit hoe het model grote open source-codebases scant, softwarefouten identificeert die al tientallen jaren bestaan, en vervolgens geavanceerde exploits ontwikkelt om deze aan te pakken. Systemen als Mythos kunnen de snelheid en omvang van het ontdekken en exploiteren van kwetsbaarheden dramatisch verhogen.
“Frontier AI-modellen zoals Claude Mythos vertegenwoordigen een echt keerpunt in cybersecurity, omdat ze de tijd tussen het identificeren van een kwetsbaarheid en het exploiteren ervan dramatisch verkorten”, zegt Dan Schiappa, president van technologie en diensten bij Arctic Wolf. “Zero-days zijn niets nieuws, maar de snelheid waarmee ze worden ontdekt en uitgebuit is ongelooflijk hoog. Wat ooit dagen of weken duurde, kan in uren of minuten gebeuren, waardoor de tijd die verdedigers kunnen vertrouwen op het detecteren, beoordelen en reageren kleiner wordt.”
Wanneer AI snel werkende zero-day exploits kan produceren, zoals Mythos lijkt te kunnen doen, kunnen organisaties “de ademruimte verliezen waar ze normaal gesproken op vertrouwen bij het detecteren, patchen en herstellen”, zegt Camellia Chan, CEO van X-PHY, en merkt op dat tijdens het testen een vroege versie van Mythos Preview uit de sandbox-omgeving brak en onafhankelijk toegang kreeg tot internet.
Het is de Mythos die zonder toestemming autonoom gedrag vertoont. “Elke beveiligingsarchitectuur die uitgaat van beperkte en voorspelbare aanvallers moet daar rekening mee houden”, aldus Chan.
Het is waar dat toekomstige AI-ondersteunde cyberaanvallen vormen kunnen aannemen die onderzoekers nog nooit eerder hebben gezien. “Het meest verontrustende vermogen voor mij is de bewering dat het zeer effectief is in het reverse-engineeren van binaire bestanden en het identificeren van nieuwe exploits”, zegt Jason Schmitt, CEO van Black Duck. “Dit vertegenwoordigt een nieuwe doorbraak in de geautomatiseerde exploitatie van willekeurige software, waar DARPA al jaren onderzoek naar financiert.”
Scott Kuffer, Chief Product Officer bij Nucleus Security, zei: “Organisaties moeten heroverwegen hoe zij risico’s prioriteren en operationeel maken in een dynamische en steeds onvoorspelbaardere omgeving.”
Detectie is het makkelijke gedeelte
Andere experts wijzen erop dat Project Glasswing zich richt op het vinden van beveiligingskwetsbaarheden, maar geen tools voor herstel creëert.
‘Er zit hier veel defensieve waarde in, maar ze missen misschien iets belangrijks Dat het belangrijkste deel”, zegt Drew Lohn, senior onderzoeker aan het Centre for Security and Emerging Technology (CSET) van Georgetown University. “Ze zeggen: ‘We gaan de verdedigers een kans geven om de kwetsbaarheden eerst te vinden en we gaan ze de tools geven om de oplossing te vinden’, maar dat is niet het moeilijkste deel.
“Als AI helpt kwetsbaarheden te vinden, is dat goed voor zowel aanvallers als verdedigers”, voegde Lohn eraan toe. “Als AI helpt bij het schrijven van exploits, zal het aanvallers waarschijnlijk meer helpen dan verdedigers. Maar aanvallers kunnen ze, als ze ze eenmaal hebben geschreven, gewoon uitvoeren, en verdedigers moeten harder werken om ervoor te zorgen dat die patches kunnen worden geïmplementeerd.”
Dat zei Dan Lorenc, CEO van Chainguard, via e-mail Snel bedrijf dat veel organisaties niet over de middelen beschikken om alle kwetsbaarheden die Project Glasswing aan het licht heeft gebracht te patchen, en schrijft dat bedrijven “nog niet voorbereid zijn op de toestroom van kwetsbaarheden en de echte oplossingen die ze nodig hebben om er snel uit te komen.”
Fowler van Darktrace zorgde voor meer kleur en zei: “Veel organisaties kunnen niet alles repareren, of het nu gaat om oudere systemen, onbeheerde apparaten of omgevingen waarin geen updates kunnen worden uitgevoerd. Dus hoewel het kwetsbaarheidsvenster kleiner wordt, zijn ze niet helemaal verdwenen.”
Zowel Lohn als Fowler zijn van mening dat als AI-tools het aantal softwarekwetsbaarheden (en dus doelwitten) helpen verminderen, hackers waarschijnlijk een ander type doelwit zullen proberen: menselijke doelwitten.
“Als ik een aanvaller ben en de code niet gemakkelijk kan kraken, zoek ik naar een andere route, en de meest effectieve route is vaak de mens”, zei Fowler. “Het is iemand die zich al in de omgeving bevindt, of het nu een kwaadwillende insider is, gecompromitteerde inloggegevens of iemand die wordt gestimuleerd of gedwongen. Ze hebben al toegang en kunnen opereren op een manier die de controles binnen de omgeving omzeilt.”
AI-systemen zoals Mythos kunnen ook het aanvalspotentieel voor hackers vergroten.
“Hoewel de meeste cyberverdedigingen in het datacenter beginnen, is dit een existentiële bedreiging die eerst aan de rand moet worden aangepakt”, schreef John Gallagher, vicepresident van Viakoo Labs, in een e-mail. Dit kan betekenen dat elektrische netwerken, watersystemen, zelfrijdende autonetwerken, industriële automatiseringssystemen of slimme huishoudelijke apparaten moeten worden beschermd. “Mythos is OS-agnostisch, maar het oplossen van kwetsbaarheden niet”, schreef hij. “Er is geen ‘Windows Update’ voor waterpompen of IoT-gateways.”
En over kritische softwaresystemen gesproken: het is niet altijd eenvoudig om patches snel te installeren, zegt Lohn van CSET. “De reden waarom er zoveel kwetsbaarheden zijn, is omdat je het systeem niet zomaar offline kunt halen, of je moet er heel zeker van zijn dat eventuele updates die je doorvoert het systeem niet kapot maken”, zei hij, zich herinnerend aan de ramp die zich heeft voorgedaan. CrowdStrike-patchinstallatie die tegen juli 2024 de systemen van luchtvaartmaatschappijen, banken en ziekenhuizen platlegt. “Dat is de grootste zorg: hoe lang duurt het om te updaten? Hoe zeker weet je dat je update niet iets anders kapot maakt?”
AI bestaat echt, al is de impact ervan onzeker
In verschillende online gesprekken deze week vroegen mensen zich af of Mythos echt zo capabel en dus zo bedreigend is als antropische onderzoekers zeggen. Het is waar dat AI-laboratoria in het verleden hun modellen hebben gehyped door te praten over hoe gevaarlijk ze zijn. Maar het lijkt absurd dat antropische onderzoekers de moeite hebben genomen om Mythos-prestatietests te vervalsen en er vervolgens een systeemkaart van 280 pagina’s over hebben geschreven. En alle Glasswing-partners van Anthropic moeten bij deze zwendel betrokken zijn.
Maar of Mythos uiteindelijk de softwarebeveiliging meer helpt dan schaadt, valt nog te bezien. Niet iedereen dacht dat dat zou gebeuren.
BeyondTrust SVP Bradley Smith zette bijvoorbeeld vraagtekens bij het verhaal dat Anthropic de goeden feitelijk een voorsprong geeft, en wees erop dat hackers al een tijdje AI-tools gebruiken. Zij hebben ervaring met de technologie en krijgen binnenkort toegang tot veel geavanceerdere modellen.
‘Er is geen eerste stap’, zei Smith. “Er is slechts een besluit om in actie te komen of een besluit om te wachten, en wachten heeft de sector meer gekost dan de meeste leiders willen toegeven.”


