PANews a raportat pe 5 ianuarie că, odată cu venirea anului 2026, domeniul securității AI primește primul său test de referință major. LISABench a anunțat astăzi lansarea evaluării sale pentru T1 2026, având ca scop determinarea celui mai performant model AI de vârf în detectarea vulnerabilităților contractelor inteligente Web3 prin testare în condiții reale. În plus, LISABench lansează simultan un program de recompense pentru predicțiile votului comunității.
Această evaluare se mândrește cu un line-up impresionant, reunind șapte dintre cele mai avansate modele de vârf din lume—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) și Claude 4.5 Sonnet (Anthropic)—pentru a concura pe aceeași scenă.
În prezent, votul pentru predicțiile câștigătorului T1 este deschis. Între timp, baza de cod benchmark LISABench a fost open-source pe GitHub pentru ca dezvoltatorii să o revizuiască și să o reproducă.


