PANews 于1月5日报道,随着2026年的到来,人工智能安全领域迎来了首个重大基准测试。LISABench 今日宣布推出其2026年第一季度评估,旨在通过实际测试确定在Web3智能合约漏洞检测方面表现最佳的尖端人工智能模型。此外,LISABench 同时推出社区投票预测奖励计划。
此次评估阵容令人瞩目,汇集了全球七大顶尖尖端模型——KIMI K2(月之暗面)、DeepSeek V3.2、QWen 3 30b-a3b(阿里云)、GLM 4.6(智谱AI)、GPT-5.2(OpenAI)、Gemini-3-pro-preview(Google)和Claude 4.5 Sonnet(Anthropic)——同台竞技。
目前,第一季度获胜者的预测投票已经开放。同时,LISABench 基准代码库已在GitHub上开源,供开发者审查和重现。


