文章作者、来源:火星财经 2026 年 9 月,OpenAI 计划推出首个“AI研究实习生”。 这是 OpenAI 首席科学家 Jakub Pachocki 在最新访谈中给出的时间表。距离现在,只剩5 个月。 在他看来,AI 的定位已经从单纯的工具转向“人类员工”:能独立运行多久、能否应对模糊的任务、需要多少人工干预,文章作者、来源:火星财经 2026 年 9 月,OpenAI 计划推出首个“AI研究实习生”。 这是 OpenAI 首席科学家 Jakub Pachocki 在最新访谈中给出的时间表。距离现在,只剩5 个月。 在他看来,AI 的定位已经从单纯的工具转向“人类员工”:能独立运行多久、能否应对模糊的任务、需要多少人工干预,

OpenAI首席科学家:AI实习生,离我们不远了

2026/04/14 08:48
阅读时长 13 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 [email protected] 联系我们。

文章作者、来源:火星财经

2026 年 9 月,OpenAI 计划推出首个“AI研究实习生”。

这是 OpenAI 首席科学家 Jakub Pachocki 在最新访谈中给出的时间表。距离现在,只剩5 个月。

在他看来,AI 的定位已经从单纯的工具转向“人类员工”:能独立运行多久、能否应对模糊的任务、需要多少人工干预,这些成为了衡量模型的新标准。

这意味着,AI 的角色开始从日常助手变成完成任务的智能体。

当这一转变发生时,被重塑的不仅只是 AI 的形态,更是人类的工作方式。

第一节|能力演进:从编程到科学研究

这一轮的 AI 技术浪潮,很容易被外界狭隘地理解为“编程工具变强了”。

但在 OpenAI 内部,变化早已不止于写代码,而是开始向更完整的工作流推进。

Jakub Pachocki透露,他们已经把Codex用在大量实际的编程工作中。真正的改变不在于代码写得更快,而是很多原本需要人类一步步操作的流程,现在可以直接交由模型去执行。你不再需要亲自敲下每一行代码,只需下达目标,让它完成一整段任务,人只负责最后的检查和微调。

除了工作效率的提升,过去几个月里,模型在数学和科学领域能力也出现极大提升。

AI 现在开始能够处理更复杂的问题,它不只是给出最终答案,还能提供中间的推理过程,甚至提出有价值的解题思路。在一些测试中,它已经能够接近甚至达到国际数学竞赛难度。更重要的是,在“首创性证明(first proof)”这种研究型挑战中,模型在极短时间内,就跑通了本该需要人类花上数天甚至更久才能摸索出的解题路径。

这说明什么?说明AI不仅能执行指令,还开始具备了探索未知的能力。

编程之所以成为突破口,是因为它天然有着清晰的反馈机制,对或错极易验证。数学也是同样的逻辑。正因为在这些领域能够精准评判结果的好坏,模型才有机会不断修正自己的过程,逐渐将能力向高难度推进。当这种能力稳定下来后,它便开始向更复杂、更贴近现实的问题迁移,比如科学研究中的假设验证、实验设计,甚至是新的思路生成。

Jakub 在访谈中强调:他们越来越关注的,不再是模型在某个基准测试上的跑分,而是它在真实世界中能否真正帮人解决问题。无论是研究、工程,还是其他具有实际商业价值的工作,衡量标准正在从“答对多少题”,转向“能否把一项任务推进到底”。

从写代码到做研究,表面上看行业跨度极大,其实底层有一条极其清晰的演进路径:先在可被验证的领域建立基础能力,再把这种能力延伸到更复杂的现实场景,最终深度介入那些原本需要人类长期投入的高级工作之中。

第二节|两个差距和一个时间表

将当下的 AI 精确定位为“实习生”,是 Jakub Pachocki 经过深思熟虑的结论。

因为“实习生”与“独立研究员”之间,存在两个最本质的差距。

第一,是独立工作的持续时间。

如果你把任务交给一位经验丰富的人类研究员,你只需指明一个大方向,比如“把模型能力再提升一截”。对方就能自主拆解问题、寻找路径、不断试错,甚至持续数周或数月推进工作。但目前的 AI 还做不到这一点。尽管它的连续运行时间在变长,也能完成一段完整的任务,但依然需要人类在关键节点给出明确的指引和纠偏。

第二,是处理模糊问题的能力。

现实世界里的绝大多数工作,起初并没有标准答案。往往只有一个粗略的方向、一个初步的想法,甚至只是一个模糊的目标,需要在推进的过程中不断去澄清和定义。人类研究员的不可替代性恰恰在于此:他们不仅是执行者,更是探路者,能决定“下一步该做什么”。

现阶段的 AI,更擅长处理那些“已经被定义清楚”的任务。比如,验证一个具体的思路、用新方法跑一次实验,或者对已知结果进行数据分析,在这些明确的边界内,它做得越来越好,效率甚至超越了人类。可一旦让它自己去定义问题、选择探索方向,其能力表现还不稳定。

这就是它被称为“AI实习生”的原因。

Jakub 给出了极其明确的时间表:在2026 年 9 月前,实现“研究实习生”级别的AI系统;在2028年3月前,将其推进到具备更高自主性的“AI研究员”。

按他的原话,实现这一跨越的大部分技术要素已经具备,现在的核心工作就是将它们有效整合。

我们已经站在了变革的前夜。

第三节|执行外包,决策留给人

当 AI 跨越了单纯“回答问题”的边界,开始能够闭环完成一段任务时,这场变化就不再停留在工具升级的层面,而是触及了更底层的命题:人类究竟该如何做事。

在访谈中,Jakub Pachocki 指出,模型短期能力的跃升,正在直接改变研究推进的速度。这意味着,许多原本需要人力一点点啃下来的冗长工作,现在正被加速,甚至被完全重置。

过去,推进一项复杂研究或项目的标准节奏往往是:人类提出想法 → 亲自动手验证 → 不断试错调整 → 缓慢向前推进。大量的时间被消耗在繁琐的执行细节中,真正用于决定方向的时刻反而寥寥无几。

但随着 AI 能够接手大部分执行工作时,人不再需要亲自完成每一步,可以把更多精力放在三件事上:确定方向、拆解任务、评估结果。“执行”本身,正逐渐被外包给工具。

当一个人不再被具体的操作占满时间,他的核心价值就不再是“做得有多快”,而是“决定做什么”以及“如何统筹”。面对同样的工具,有人只能用来加快手头的计件工作,有人却能以此为杠杆,极大地拓展业务边界,这中间的差距将变得越来越大。

这种工作流的重组,在顶尖实验室中已经成为现实。Jakub 坦言,他们团队如今越来越需要将精力放在“哪些方向值得投入”的取舍上,而不是像过去那样平均分配资源。原因是:当执行的成本大幅下降时,真正稀缺的就不再是人手,而是正确的选择。

类似的变化也在影响更多工作场景。

比如写代码、做分析、写方案,这些原本需要完整经验积累的事情,门槛正在下降。一个人不需要掌握所有细节,也可以完成相当一部分工作。但与此同时,对整体把控的要求反而更高了。你需要知道目标是什么,哪些结果是有效的,哪些只是表面看起来不错。

所以,如果将“AI实习生”放回现实世界,它带来的震撼,绝不仅仅是为我们添了一个得力助手。它是在强迫人类的工作方式发生转向:从“亲自把事做完”,转向“设计并管理 AI 去把事做完”。

这时候,每个白领问题变成了:你能不能决定什么值得做,以及怎么把这件事交给 AI 做好。

结语|只剩一件事

“AI 实习生”不是关于未来的设想,是正在发生的现实。

AI 能力边界,正在从“帮你做一点”,走向“替你完成一段”。

我们需要适应的,是职业角色的彻底转变:当 AI 接管了越来越多的执行工作,人类最终剩下的,只剩一件事:

决定什么值得做。

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

USD1 Genesis:0 费率 + 12% APR

USD1 Genesis:0 费率 + 12% APRUSD1 Genesis:0 费率 + 12% APR

新用户:质押最高享 600% APR。限时福利!