DeepSeek V4 传闻在长上下文编码方面表现优于 ChatGPT 和 Claude

据传DeepSeek V4在长上下文编码方面表现优于ChatGPT和Claude,针对精英级编码任务。内部人士声称,如果内部测试暗示其在2月中旬推出后的预期表现,硅谷的人工智能格局应该感到担忧。

据报道,总部位于中国的人工智能初创公司DeepSeek计划于2月17日发布其最新大型语言模型DeepSeek V4。知情人士声称,该模型在处理长上下文代码提示和任务时,将给现有的大型语言模型(如OpenAI的ChatGPT和Anthropic的Claude)蒙上阴影。

开发者对DeepSeek V4的发布表达深切期待

截至撰写本文时,这家中国公司尚未公开披露有关即将发布的任何信息,也未证实这些传闻。不同社交网络上的开发者对此次发布表达了深切期待。人工智能开发者兼Hyperbolic Labs联合创始人Yuchen Jin 在X上写道"据传DeepSeek V4即将推出,编码能力强于Claude和GPT。"

Subreddit r/DeepSeek也热闹起来,一位用户解释说,他们对DeepSeek即将推出的V4模型的痴迷程度并不正常。该用户表示,他们经常"查看新闻、可能的传闻,我甚至会去阅读DS网站上的文档,寻找任何表明更新的变化或迹象。"

DeepSeek之前的发布对全球市场产生了重大影响。这家中国人工智能初创公司于2025年1月发布了其R1推理模型,导致了万亿美元的抛售。该版本在数学和推理基准测试中与OpenAI的01模型相匹配,尽管成本远低于这家美国人工智能初创公司在其01模型上的支出。

据报道,这家中国公司仅花费了600万美元发布该模型。与此同时,全球竞争对手为同样的产出花费了近70倍的资金。其V3模型在MATH-500基准测试中也获得了90.2%的分数,而Claude为78.3%。DeepSeek最近的V3升级版(V3.2 Speciale)进一步提高了其生产力。

其V4模型的卖点已从V3对纯推理、形式证明和逻辑数学的强调演变而来。新版本预计将是一个混合模型,结合推理和非推理任务。该模型旨在通过填补现有空白来占领开发者市场,满足对高准确性和长上下文代码生成的需求。

Claude Opus 4.5目前在SWE基准测试中占据主导地位,准确率达到80.9%。V4需要击败这一成绩才能推翻Claude Opus 4.5。根据以往的成功经验,即将推出的模型可能会超越这一门槛,并在基准测试中占据主导地位。

DeepSeek开创mHC用于训练大型语言模型

DeepSeek的成功让许多人感到深深的专业怀疑。这样一家小公司怎么能取得如此里程碑式的成就?秘密可能深深植根于其 1月1日发表的研究论文中。该公司确定了一种新的训练方法,使开发者能够轻松扩展大型语言模型。DeepSeek创始人兼首席执行官梁文锋在研究中写道,该公司正在使用流形约束超连接(mHC)来训练其人工智能模型。

这位高管提议使用mHC来解决开发者在训练大型语言模型时遇到的问题。据文锋称,mHC是超连接(HC)的升级版,HC是其他人工智能开发者用来训练其大型语言模型的框架。他解释说,HC和其他传统人工智能架构强制所有数据通过单一狭窄通道。与此同时,mHC将该路径扩展为多个通道,促进数据和信息的传输,而不会导致训练崩溃。

Omdia首席分析师Lian Jye Su称赞首席执行官文锋发表了他们的研究。Su强调,DeepSeek发布其训练方法的决定表明了对中国人工智能行业的重新信心。DeepSeek已主导了发展中国家。微软周四发布的一份报告显示,DeepSeek占据中国人工智能市场89%的份额,并在发展中国家获得了发展势头。

想让您的项目呈现在加密货币领域顶尖人物面前?将其展示在我们的下一份行业报告中,数据与影响力相遇的地方。

来源: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/