深潮 TechFlow 消息,人工智能公司 Sahara AI 宣布与微软合作,为微软提供高精度标注数据,共同推出开源基准 MATHVISTA。该基准专为测试 GPT-4V、Claude、Gemini 等模型在真实场景下的推理与决策能力,目前历史下载量已超 27 万次。这类高质量标注数据正是 AI Agent 能有可靠深潮 TechFlow 消息,人工智能公司 Sahara AI 宣布与微软合作,为微软提供高精度标注数据,共同推出开源基准 MATHVISTA。该基准专为测试 GPT-4V、Claude、Gemini 等模型在真实场景下的推理与决策能力,目前历史下载量已超 27 万次。这类高质量标注数据正是 AI Agent 能有可靠

Sahara AI 与微软联合推出 AI 推理评测基准 MATHVISTA

2026/03/18 13:34
阅读时长 1 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

深潮 TechFlow 消息,人工智能公司 Sahara AI 宣布与微软合作,为微软提供高精度标注数据,共同推出开源基准 MATHVISTA。

该基准专为测试 GPT-4V、Claude、Gemini 等模型在真实场景下的推理与决策能力,目前历史下载量已超 27 万次。这类高质量标注数据正是 AI Agent 能有可靠推理与决策能力的基础,直接影响数百万用户每日使用的agent表现。

目前微软、亚马逊、Snap 及麻省理工学院(MIT)等机构均已采用 Sahara AI 的数据服务与 Agentic AI 解决方案。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。