OpenAI heeft een benchmarkframework onthuld dat bedoeld is om te meten hoe effectief AI-agents beveiligingskwetsbaarheden in crypto smart contracts kunnen detecteren, beperken en zelfs exploiteren. Het project, getiteld "EVMbench: Evaluating AI Agents on Smart Contract Security," werd uitgebracht in samenwerking met Paradigm en OtterSec, twee organisaties met diepgaande expertise op het gebied van blockchainbeveiliging en investeringen. De studie beoordeelt AI-agents aan de hand van een samengestelde set van 120 potentiële zwakke punten uit 40 smart contract-audits, met als doel niet alleen detectie- en patchmogelijkheden te kwantificeren, maar ook het theoretische exploitatiepotentieel van deze agents in een gecontroleerde omgeving.
Detectiebeloningen voor AI-agents worden gedetailleerd beschreven in de OpenAI PDF die bij de studie hoort, waarin ook de evaluatiemethodologie en de scenario's worden beschreven die worden gebruikt om real-world smart contract-risico's te simuleren. De auteurs benadrukken dat hoewel AI-agents zijn geëvolueerd om een breed scala aan routinetaken te automatiseren, het beoordelen van hun prestaties in "economisch betekenisvolle omgevingen" essentieel is om te begrijpen hoe ze onder druk in productiesystemen zullen presteren.
OpenAI merkt op dat het verwacht dat agentische technologieën de reikwijdte van betalingen en afwikkeling zullen verbreden, inclusief stablecoins die worden gebruikt in geautomatiseerde workflows. De discussie rond AI-enabled betalingen strekt zich uit tot voorbij beveiligingstests tot de bredere vraag hoe autonome systemen zullen deelnemen aan dagelijkse financiële activiteiten. De eigen projecties van het bedrijf suggereren dat agentische betalingen gebruikelijker kunnen worden, waarbij AI-capaciteiten worden verankerd in praktische gebruikssituaties die alledaagse consententransacties raken.
Samen met de benchmarkresultaten heeft Circle CEO Jeremy Allaire publiekelijk voorspeld dat miljarden AI-agents binnen de komende vijf jaar met stablecoins zouden kunnen transacteren voor dagelijkse betalingen. Die visie snijdt een terugkerend thema in cryptokringen: het potentieel voor crypto om de native valuta van AI-agents te worden, een verhaal dat aanzienlijke aandacht heeft gekregen van brancheleiders en investeerders. Hoewel dergelijke voorspellingen speculatief blijven, is de onderliggende trend duidelijk—AI-automatisering beweegt van het lab naar de transactielaag, waar het zou kunnen hervormen hoe waarde over netwerken beweegt.
De studie komt op een moment waarop cryptobeveiliging een aanzienlijke risicofactor blijft voor investeerders. Het gegevenspunt over de aanval op cryptofondsen in 2025—waar aanvallers ongeveer $3,4 miljard buitmaakten—benadrukt de urgentie van verbeterde tooling en snellere, betrouwbaardere patchmechanismen. Het EVMbench-framework is deels gepositioneerd als een manier om te meten of AI-agents op schaal zinvol kunnen bijdragen aan defensieve capaciteiten, waarbij exploitatiemogelijkheden worden verminderd en dreigingsbeperking wordt versneld.
Om de benchmark te bouwen, maakten onderzoekers gebruik van 120 samengestelde kwetsbaarheden over 40 smart contract-audits, waarbij veel zwakke punten terug te voeren zijn op open-source audit-uitdagingen. OpenAI stelt dat de benchmark zal helpen de AI-vooruitgang bij te houden bij het herkennen en beperken van zwakke punten op contractniveau op schaal, en biedt een gestandaardiseerde manier om toekomstige AI-modellen te vergelijken naarmate ze evolueren. De studie biedt ook inzicht in hoe AI kan worden toegepast om risicobeoordeling te normaliseren over een breed scala aan smart contract-architecturen, in plaats van alleen te focussen op geïsoleerde gevallen.
In een gelijktijdige thread op X beweerde Haseeb Qureshi, partner bij Dragonfly, dat crypto's belofte om eigendomsrechten en traditionele contracten te vervangen nooit is uitgekomen, niet omdat de technologie faalde, maar omdat het nooit is ontworpen met menselijke intuïtie in gedachten. Hij heeft de aanhoudende angst benadrukt die gepaard gaat met het ondertekenen van grote transacties in een omgeving waar drainer wallets en andere aanvalsvectoren een constante bedreiging blijven, in schril contrast met de relatief soepelere ervaring van traditionele bankoverschrijvingen.
Qureshi stelt dat de volgende fase van cryptotransacties mogelijk kan worden gemaakt door AI-gemedieerde, zelfrijdende wallets. Dergelijke wallets zouden risico's monitoren, complexe operaties beheren en autonoom reageren op bedreigingen namens gebruikers, waardoor mogelijk de wrijving en angst worden verminderd die grote overdrachten vandaag kenmerken.
De bredere conclusie uit deze thread is dat AI-agents een cruciale rol kunnen spelen bij het transformeren van hoe mensen omgaan met crypto—door te verschuiven van handmatige, foutgevoelige transacties naar geautomatiseerde, risicobewuste processen die kunnen schalen met adoptie. Naarmate AI-agents meer competentie beginnen te tonen bij het omgaan met beveiligingszorgen, kunnen gebruikers verbeterde betrouwbaarheid en veerkracht zien in gedecentraliseerde financiële workflows, zelfs terwijl de onderliggende technologieën blijven rijpen.
De EVMbench-studie toont aan dat large language models en gerelateerde AI-agents zinvol beveiligingswerk beginnen uit te voeren in de smart contract-ruimte, met duidelijk kwantificeerbare verschillen tussen modellen. Claude Opus 4.6's voorsprong in gemiddelde detectiebeloningen geeft aan dat bepaalde architecturen beter in staat kunnen zijn kwetsbaarheden binnen complexe contractlogica te detecteren en te beperken, terwijl anderen achterblijven, wat een spectrum aan capaciteiten biedt dat onderzoekers waarschijnlijk willen verfijnen. De opname van meerdere branchepartnerships in het project onderstreept de groeiende consensus dat AI-enabled beveiliging en geautomatiseerd risicobeheer essentieel kunnen worden om te schalen in gedecentraliseerde omgevingen.
Naarmate het veld evolueert, zullen waarnemers kijken naar hoe snel AI-agents kunnen overschakelen van detectie naar herstel, en of deze agents betrouwbaar kunnen werken in live systemen zonder nieuwe risico's te introduceren. Het gesprek over AI-gestuurde wallets en autonome betalingen raakt aan een bredere reeks vragen rond beveiligingsgovernance, gebruikerstoestemming en regelgevende afstemming. Als het traject dat OpenAI en zijn partners suggereren doorzet, kunnen AI-ondersteunde tools een kerncomponent worden van toekomstige crypto-infrastructuur, die zowel de risicocalculatie als de gebruikerservaring op betekenisvolle manieren verandert. De volgende ronde benchmarks, samen met real-world implementaties, zal helpen bepalen hoe snel deze visie zich materialiseert en welke waarborgen het moeten vergezellen.
Dit artikel werd oorspronkelijk gepubliceerd als OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts op Crypto Breaking News – uw vertrouwde bron voor crypto news, Bitcoin news en blockchain updates.


