A OpenAI revelou uma estrutura de benchmarking destinada a medir com que eficácia os agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em criptomoedasA OpenAI revelou uma estrutura de benchmarking destinada a medir com que eficácia os agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em criptomoedas

OpenAI coloca agentes de IA uns contra os outros para testar contratos inteligentes em modo adversarial

2026/02/19 09:26
Leu 8 min
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

A OpenAI revelou uma estrutura de benchmarking destinada a medir a eficácia com que os Agentes de IA conseguem detetar, mitigar e até explorar vulnerabilidades de segurança em contratos inteligentes cripto. O projeto, intitulado "EVMbench: Evaluating AI Agents on Smart Contract Security", foi lançado em colaboração com a Paradigm e a OtterSec, duas organizações com profunda exposição à segurança e investimento em blockchain. O estudo avalia Agentes de IA contra um conjunto selecionado de 120 potenciais fraquezas extraídas de 40 auditorias de contrato inteligente, procurando quantificar não apenas as capacidades de deteção e correção, mas também o potencial de exploração teórico destes agentes num ambiente controlado.

Principais conclusões

  • O EVMbench testa Agentes de IA contra 120 vulnerabilidades recolhidas de 40 auditorias de contrato inteligente, enfatizando vulnerabilidades provenientes de competições de auditoria de código aberto.
  • Entre os modelos testados, o Claude Opus 4.6 da Anthropic liderou com uma recompensa média de deteção de $37.824, seguido pelo OC-GPT-5.2 da OpenAI com $31.623 e o Gemini 3 Pro do Google com $25.112.
  • A OpenAI enquadra o benchmark como um passo para medir o desempenho da IA em "ambientes economicamente significativos", não apenas tarefas simuladas, destacando as implicações do mundo real para atacantes e defensores no panorama da segurança cripto.
  • Os investigadores observam que os contratos inteligentes protegem milhares de milhões de dólares em ativos, sublinhando o valor estratégico das ferramentas habilitadas por IA para atividades tanto ofensivas como defensivas.
  • Observadores da indústria associaram estes desenvolvimentos a discussões mais amplas sobre pagamentos impulsionados por IA e o papel das stablecoins nas transações quotidianas, com grandes executivos a prever um uso agêntico crescente nos próximos anos.
  • O contexto para tal trabalho é sublinhado pelos dados de incidentes de segurança cripto de 2025, que mostram um fluxo contínuo de fundos através de vulnerabilidades e ataques, reforçando a procura por mecanismos robustos de auditoria e defesa habilitados por IA.

As recompensas de deteção para Agentes de IA são detalhadas no PDF da OpenAI que acompanha o estudo, que também descreve a metodologia de avaliação e os cenários usados para simular o risco de contrato inteligente do mundo real. Os autores enfatizam que, embora os Agentes de IA tenham evoluído para automatizar uma ampla gama de tarefas de rotina, avaliar o seu desempenho em "ambientes economicamente significativos" é essencial para compreender como irão funcionar sob pressão em sistemas de produção.

A OpenAI observa que espera que as tecnologias agênticas ampliem o âmbito dos pagamentos e liquidação, incluindo stablecoins usadas em fluxos de trabalho automatizados. A discussão em torno dos pagamentos habilitados por IA estende-se para além dos testes de segurança à questão mais ampla de como os sistemas autónomos irão participar na atividade financeira diária. As próprias projeções da empresa sugerem que os pagamentos agênticos poderão tornar-se mais comuns, fundamentando as capacidades da IA em casos de uso práticos que tocam as transações quotidianas dos consumidores.

Em conjunto com os resultados do benchmark, o CEO da Circle, Jeremy Allaire, previu publicamente que milhares de milhões de Agentes de IA poderão estar a transacionar com stablecoins para pagamentos quotidianos nos próximos cinco anos. Essa visão cruza-se com um tema recorrente nos círculos cripto: o potencial das criptomoedas para se tornarem a moeda nativa dos Agentes de IA, uma narrativa que ganhou atenção notável de líderes da indústria e investidores. Embora tais previsões permaneçam especulativas, a tendência subjacente é clara — a automação de IA está a mover-se do laboratório para a camada de transação, onde poderá remodelar a forma como o valor se move através das redes.

O estudo surge num momento em que a segurança cripto continua a ser um fator de risco significativo para os investidores. O dado sobre o ataque aos fundos cripto de 2025 — onde os atacantes retiraram aproximadamente $3,4 mil milhões — destaca a urgência de ferramentas melhoradas e mecanismos de correção mais rápidos e fiáveis. A estrutura EVMbench está posicionada, em parte, como uma forma de medir se os Agentes de IA podem contribuir significativamente para as capacidades defensivas em escala, reduzindo oportunidades de exploração e acelerando a mitigação de ameaças.

Para construir o benchmark, os investigadores basearam-se em 120 vulnerabilidades selecionadas abrangendo 40 auditorias de contrato inteligente, com muitas fraquezas rastreadas até desafios de auditoria de código aberto. A OpenAI argumenta que o benchmark ajudará a acompanhar o progresso da IA no reconhecimento e mitigação de fraquezas ao nível do contrato em escala, oferecendo uma forma padronizada de comparar futuros modelos de IA à medida que evoluem. O estudo também fornece uma perspetiva sobre como a IA pode ser aplicada à normalização da avaliação de risco através de uma ampla gama de arquiteturas de contrato inteligente, em vez de se concentrar apenas em casos isolados.

Os contratos inteligentes não foram construídos para humanos: Dragonfly

Numa sequência contemporânea no X, Haseeb Qureshi, um parceiro da Dragonfly, argumentou que a promessa da cripto de substituir direitos de propriedade e contratos tradicionais nunca se materializou, não porque a tecnologia falhou, mas porque nunca foi concebida com a intuição humana em mente. Ele destacou o medo persistente associado à assinatura de grandes transações num ambiente onde carteiras de drenagem e outros vetores de ataque permanecem uma ameaça constante, em forte contraste com a experiência comparativamente mais suave das transferências bancárias tradicionais.

Qureshi defende que a próxima fase das transações cripto poderá ser habilitada por carteiras auto-conduzidas intermediadas por IA. Tais carteiras monitorizariam o risco, geririam operações complexas e responderiam autonomamente a ameaças em nome dos utilizadores, potencialmente reduzindo a fricção e o medo que caracterizam grandes transferências hoje.

A conclusão mais ampla desta sequência é que os Agentes de IA podem desempenhar um papel crítico na transformação da forma como as pessoas interagem com cripto — mudando de transações manuais propensas a erros para processos automatizados e conscientes do risco que podem escalar com a adoção. À medida que os Agentes de IA começam a demonstrar mais competência no tratamento de questões de segurança, os utilizadores poderão ver fiabilidade e resiliência melhoradas em fluxos de trabalho de finanças descentralizadas, mesmo enquanto as tecnologias subjacentes continuam a amadurecer.

O que observar a seguir

  • Publicação e replicação independente do conjunto completo de dados EVMbench através de modelos e arquiteturas de IA adicionais.
  • Adoção mais ampla de fluxos de trabalho de auditoria assistida por IA por auditores, exchanges e projetos DeFi que procuram reforçar posturas de segurança.
  • Explorações em carteiras agênticas e fluxos de pagamento autónomos, incluindo considerações regulamentares e de conformidade para ativos geridos por IA.
  • Benchmarks de acompanhamento comparando mais sistemas de IA à medida que novas versões são lançadas, acompanhando melhorias na precisão de deteção e velocidade de correção.

Fontes e verificação

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Perdas de segurança cripto em 2025 (cobertura de relatórios): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi sobre IA e UX cripto (publicação no X): https://x.com/hosseeb/status/2024136762424185208
  • Liderança da IA da China e implicações cripto (análise): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw e desenvolvimentos de bot de IA na cobertura Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Números-chave e próximos passos

O estudo EVMbench demonstra que grandes modelos de linguagem e Agentes de IA relacionados estão a começar a realizar trabalho de segurança significativo no espaço de contratos inteligentes, com diferenças claramente quantificáveis entre modelos. A liderança do Claude Opus 4.6 nas recompensas médias de deteção sinaliza que certas arquiteturas podem ser mais hábeis em detetar e mitigar vulnerabilidades dentro da lógica de contrato complexa, enquanto outras ficam para trás, oferecendo um espectro de capacidades que os investigadores provavelmente desejarão refinar. A inclusão de múltiplas parcerias da indústria no projeto sublinha o consenso crescente de que a segurança habilitada por IA e o gerenciamento de risco automatizado poderão tornar-se essenciais para escalar em ambientes descentralizados.

À medida que o campo evolui, os observadores estarão a observar a rapidez com que os Agentes de IA podem fazer a transição da deteção para a remediação, e se estes agentes podem operar de forma fiável em sistemas ao vivo sem introduzir novos riscos. A conversa sobre carteiras impulsionadas por IA e pagamentos autónomos toca num conjunto mais amplo de questões em torno da governança de segurança, consentimento do utilizador e alinhamento regulamentar. Se a trajetória sugerida pela OpenAI e seus parceiros continuar, as ferramentas assistidas por IA poderão tornar-se um componente central da futura infraestrutura cripto, alterando tanto o cálculo de risco como a experiência do utilizador de formas significativas. A próxima ronda de benchmarks, juntamente com implementações do mundo real, ajudará a determinar a rapidez com que esta visão se materializa e que salvaguardas devem acompanhá-la.

Este artigo foi originalmente publicado como OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts no Crypto Breaking News – a sua fonte de confiança para notícias cripto, notícias Bitcoin e atualizações blockchain.

Oportunidade de mercado
Logo de Smart Blockchain
Cotação Smart Blockchain (SMART)
$0.004386
$0.004386$0.004386
-2.16%
USD
Gráfico de preço em tempo real de Smart Blockchain (SMART)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail [email protected] para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.