NVIDIA 刚刚推出其最新的 GB300 NVL72 系统。与旧款 Hopper 平台相比,它们每兆瓦电力可以处理 50 倍的工作量。这意味着每处理一条信息的成本降低了 35 倍。
Signal65 对 GB200 NVL72 进行了单独测试,发现它每瓦处理的信息量超过 10 倍,将成本降至原来的十分之一。
改进持续不断。仅 NVIDIA 的 TensorRT-LLM 库升级就让 GB200 在短短四个月内针对需要即时响应的任务获得了五倍的性能提升。从事 Dynamo、Mooncake 和 SGLang 工具开发的团队正在将效率推向更高水平。
如果存在延迟或无法记住足够的上下文,这些人工智能工具就会崩溃。企业需要它们在实际商业环境中真正发挥作用,而不仅仅是演示。
编写代码和充当数字助手的人工智能工具现在占所有人工智能相关搜索的近一半,而一年前仅为 11%。
这些数据来自 OpenRouter 的推理状态报告,显示了这个领域变化的速度有多快。
这种突然的增长让企业争相构建能够跟上需求的硬件。这些人工智能助手需要立即响应并记住整个软件项目的上下文,这对计算能力提出了严格要求。
市场爆发推动科技巨头争夺主导地位
涉及的资金规模巨大。人工智能代理市场在 2024 年价值 49.2 亿美元。预计 2025 年将达到 60.16 亿美元,然后到 2035 年膨胀至 449.7 亿美元。这意味着未来十年每年增长 22.28%。银行、医院、商店和工厂是早期采用者。
企业正在将这些代理整合到客户管理系统、规划工具和安全设置中,以节省资金并提高效率。曾经是可选技术的东西正在成为基础设施。
据 Cryptopolitan 报道,阿里巴巴刚刚推出了面向中国市场的 Qwen3.5,声称处理成本比以前降低了 60%。该模型可以查看屏幕并在手机和电脑上执行任务。它正在与字节跳动的豆包应用正面交锋,而且 DeepSeek 也即将推出更新。
OpenAI 在 15 日聘请了 Peter Steinberger。他开发了 OpenClaw,一个开源人工智能代理。首席执行官 Sam Altman 表示,Steinberger 将领导下一代个人代理的工作,并称他是天才,对能够完成有用工作的智能助手有很好的想法。
无人能解决的人才危机
94% 的企业领导者表示他们缺乏人工智能技能。到 2028 年,44% 的企业预计仍将有 20% 至 40% 的短缺。Workera 表示,这些差距可能导致全球经济在 2026 年因产品延迟、质量问题和销售损失而损失 5.5 万亿美元。
目前,全球人工智能人才需求与供应的比例为 3.2 比 1。人工智能工作的薪酬比普通软件职位高 67%。然而,85% 的办公室员工在业余时间学习这些东西,83% 的人表示他们主要是自学而不是接受正式培训。
当企业从专业供应商那里购买人工智能工具时,成功率为 67%。内部开发的成功率只有三分之一左右。
Salesforce 在 2025 年初看到代理增长 119%,这些产品的经常性收入超过 5 亿美元。他们在三个月内增加了 6,000 家企业客户。
企业可能会购买解决方案而不是自己构建。这表明市场将集中在少数几个能够提供真正有效产品的大型企业周围。
来源: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


