"AI代理危机"借鉴卡内基梅隆大学、麻省理工学院和兰德公司的研究,提出首个全面的企业AI代理成功框架——"AI代理危机"借鉴卡内基梅隆大学、麻省理工学院和兰德公司的研究,提出首个全面的企业AI代理成功框架——

七项独立研究证实AI代理失败率达70–95%。VectorCertain首席执行官的新书揭示原因——以及应对之道。

2026/02/16 20:00
阅读时长 15 分钟

South Portland, Maine (Newsworthy.ai) 星期一 2026年2月16日 @ 晚上8:00 马来西亚时间 —

随着Carnegie Mellon的TheAgentCompany基准测试揭示最佳AI代理在近70%的现实办公任务中失败,MIT报告显示95%的企业AI试点项目未能带来任何可衡量的回报,而Gartner预测到2027年将有超过40%的代理式AI项目被取消,VectorCertain LLC创办人兼首席执行官Joseph P. Conroy出版了《AI代理危机:如何避免当前70%的失败率并实现90%的成功》——这是首本将这些研究结果综合为企业领导者经过验证的实施框架的书籍。

该书现已在Amazon上架,基于Carnegie Mellon University的TheAgentCompany研究进行系统分析,识别出导致AI代理部署失败的七个关键障碍,并提供了克服这些障碍的12个月实施路线图。

危机:已获所有主要研究机构确认

AI代理失败危机已不再是争论话题。这是企业技术中记录最详尽的失败模式,由三大洲的七个机构独立确认:

Carnegie Mellon University(TheAgentCompany,2024–2025):测试了10个领先的AI代理模型完成175项现实任务。表现最佳的Google Gemini 2.5 Pro仅完成了30.3%的任务。Claude 3.7 Sonnet达到26.3%。GPT-4o仅完成8.6%。常见的失败包括伪造数据、更改用户名以假装完成任务,以及研究人员所称的根本缺乏"常识"。

MIT NANDA《GenAI鸿沟》(2025):基于52次组织访谈、153次高级领导调查和300多个公开部署的分析,MIT发现95%的企业AI试点项目未能带来任何可衡量的财务回报。

RAND Corporation(2024–2025):在访谈了65位经验丰富的数据科学家和工程师后得出结论,超过80%的AI项目失败——失败率是非AI IT项目的两倍。

S&P Global(2025):发现42%的公司放弃了大部分AI计划,较前一年的17%上升——年增长率为147%。

Gartner(2025年6月):预测到2027年底将有超过40%的代理式AI项目被取消,并发现在数千家代理式AI供应商中,只有约130家提供真正的代理能力——其余都是"代理洗白"。

"目前大多数代理式AI项目都是早期实验或概念验证,主要由炒作驱动,常常被误用。这会让组织对大规模部署AI代理的真实成本和复杂性视而不见。"

— Anushree Verma,高级总监分析师,Gartner

该书:从危机诊断到实施框架

《AI代理危机》不仅仅记录问题。借鉴Conroy超过25年为关键任务应用构建AI系统的经验——包括成为EPA监管标准的神经网络优化平台——该书提供了首个在生产环境中实现持续AI代理成功的综合框架。

该书的主要贡献包括识别导致AI代理失败的七个关键障碍,从低至29%的通信成功率到12%的导航失败率;综合ROI方法论,展示如何通过适当管理的AI代理实现73%的收入增长和702%的年化回报;经生产验证的方法,实现97%的通信成功率、90%以上的导航可靠性和85%的成本削减;以及特定行业的实施手册和12个月部署路线图。

"70%的失败率不是随机的——它是可预测的。在为EPA、DOE和DoD构建AI系统二十年后,我发现灾难性失败集中在传统方法完全忽略的统计尾部事件中。这本书编纂了VectorCertain为解决而构建的框架。"

— Joseph P. Conroy,创办人兼首席执行官,VectorCertain LLC

为何是现在:证明该书论点的安全危机

该书信息的紧迫性在2026年1月和2月得到戏剧性强调,当时一连串AI代理安全失败事件准确验证了该书所识别的治理缺口。

OpenClaw,这个拥有超过160,000个GitHub星标和超过一百万用户的开源AI代理框架,成为2026年最重大AI安全事件的中心。研究人员发现150万个暴露的API身份验证令牌、82个国家的42,900个易受攻击的控制面板,Bitdefender Labs发现约17%的OpenClaw技能表现出恶意行为,包括加密货币窃取恶意软件和反向壳。

与此同时,OpenAI坦率承认AI代理中的提示注入"可能永远无法完全解决",Meta研究发现针对网络代理的提示注入攻击在86%的案例中部分成功。2026年2月3日,由图灵奖得主Yoshua Bengio主持并得到30多个国家支持的国际AI安全报告警告,AI进步与有效保障措施之间的差距仍是一个关键挑战。

"当代理式AI出现问题时,失败会在系统中级联。引入一个错误可能会传播到整个系统,导致系统损坏。"

— Jeff Pollard,首席分析师,Forrester

这些不是假设的风险。它们是《AI代理危机》所要解决的治理失败的现实表现。

从研究到生产:推出SECUREAGENT

虽然该书提供了诊断框架,但VectorCertain并未止步于此。该公司正准备推出SecureAgent——一个开放核心的AI代理安全平台,将该书的原则转化为生产级基础设施。

通过22次连续开发冲刺和7,229次自动化测试零失败构建,SecureAgent代表了有史以来最严格验证的企业软件平台之一。该平台包含615个源模块、91,849行生产代码和123,573行测试代码——测试与源代码比率为1.34:1,超过行业基准。

SecureAgent的架构直接解决该书中识别的每种失败模式,包括具有四个验证层级的专利多层治理引擎;在执行前检查每个AI代理行动的双向安全封套;使用集成架构实现97%以上准确率的多模型共识验证;用于完全监管合规的加密审计追踪;以及企业级SSO、SLA执行和基于角色的访问控制。

"价值不是来自启动孤立的代理。2026年将是我们开始看到由强大控制系统端到端管理的协调超级代理生态系统的一年。"

— Swami Chandrasekaran,全球AI和数据实验室主管,KPMG(2026年1月)

SecureAgent旨在成为那个强大的控制系统。有关可用性、定价和早期访问的详细信息将在未来几周在vectorcertain.com上公布。

市场验证:该类别已经到来

企业市场已明确表达对AI代理治理的需求。Cisco以约4亿美元收购AI安全公司Robust Intelligence,并在2026年2月扩展了其AI Defense产品线。F5 Networks以1.8亿美元收购CalypsoAI并推出F5 AI Guardrails。WitnessAI在2026年1月专门为AI代理安全筹集了5,800万美元。而在2025年实现834%收入增长的Galileo AI推出了专门的代理可靠性平台。

Gartner预测到2026年底,40%的企业应用程序将集成特定任务的AI代理——高于2025年的不到5%。然而Deloitte的2026年AI状况调查发现,只有21%的企业拥有成熟的代理治理模型。这种部署速度与治理准备度之间的差距——正是VectorCertain为服务而构建的精准市场。

监管时钟正在滴答作响

欧盟AI法案对高风险AI系统要求的全面执行将于2026年8月2日开始,罚款最高可达3,500万欧元或全球收入的7%。在美国,38个州在2025年通过了AI立法,加利福尼亚州、德克萨斯州和科罗拉多州的法律于2026年1月1日生效。NIST在2026年1月发布了首个专门针对AI代理安全的联邦公报请求。

Forrester预测代理式AI部署将在2026年导致公开披露的数据泄露。对企业来说,问题不是AI代理治理是否必要,而是在不可避免的事件发生之前是否已经到位。

关于作者

Joseph P. Conroy是VectorCertain LLC的创办人兼首席执行官,这是一家特拉华州公司,为关键任务应用开发AI安全和治理技术。Conroy拥有超过25年为EPA、DOE、DoD和NIH等联邦机构构建AI系统的经验,开创了成为EPA法规编纂的ENVAPEMS预测排放监测系统。他和他的团队也是2001年首次使用AI预测NYMEX电力期货的人。他拥有19项以上涉及AI集成系统和多模型共识技术的临时专利申请,并开发了VectorCertain的微递归模型架构,在灾难性事件发生的统计尾部实现安全覆盖。

Conroy可接受演讲邀约和有关AI代理可靠性、AI安全和企业AI治理的专家评论。

关于VECTORCERTAIN LLC

VectorCertain LLC是一家总部位于缅因州的AI安全和治理技术公司。该公司的使命是使AI系统在受监管行业(包括金融服务、医疗保健、自动驾驶汽车、国防和能源)的关键任务应用中具有数学可证明性。VectorCertain的待定专利架构结合了超紧凑的微递归模型(以亚毫秒延迟运行的71-1,500字节模型)、多模型共识验证和即将推出的SecureAgent企业治理平台。

了解更多请访问vectorcertain.com。

书籍详情

书名:AI代理危机:如何避免当前70%的失败率并实现90%的成功:基于Carnegie Mellon University的TheAgentCompany研究和经过验证的实施策略

作者:Joseph P. Conroy

出版商:VectorCertain LLC

可购买:Amazon — https://www.amazon.com/dp/B0FXN4Y676

公司:https://vectorcertain.comhttps://www.amazon.com/dp/B0FXN4Y676

媒体联络

评论副本、高管访谈、数据资料表和高分辨率作者照片可应要求提供。联系[email protected]


本新闻稿由Newsworthy.ai™新闻稿通讯社——新闻营销平台™发布。本新闻稿的参考URL位于此处:七项独立研究确认AI代理70-95%的时间失败。VectorCertain首席执行官的新书解释原因及应对方法。

文章《七项独立研究确认AI代理70-95%的时间失败。VectorCertain首席执行官的新书解释原因及应对方法》首次发表于citybuzz。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。