文章作者、来源:0x9999in1,ME News

2026年5月19日,OpenAI官宣了一个决定。
不是新模型发布,不是融资消息,不是又把谁挖走了。
是接入Google的SynthID技术,然后推出了一个AI图片检测工具。
听起来很平淡对吧?
一家做生成的公司,主动给自己的产品贴标签,告诉全世界:"我生成的东西,你可以查。"
这事往小了说,是产品功能更新。
往大了说——这是整个AI行业第一次正式承认:如果没有识别手段,生成能力本身就是一种威胁。
OpenAI选择和Google合作,而不是自己搞一套,这本身就说明问题。这不是一家公司的事。这是基础设施级别的事。
先说技术。
Google DeepMind在2023年8月发布SynthID,最初只用于Google自家的Imagen模型。核心原理不复杂:在图片生成的过程中,直接在像素层面嵌入人眼不可见的水印信号。
注意,不是事后贴上去的。是在生成的那一刻,就已经"写进"了图片的DNA。
这意味着什么?
你裁剪,水印还在。你加滤镜,水印还在。你截图再上传,水印大概率还在。你把分辨率压到很低,水印可能还在。
Google公布的数据显示,SynthID在经历JPEG压缩(质量因子低至25%)、裁剪(去除30%画面)、亮度调整等常见操作后,检测准确率仍然保持在高水平。2024年的技术更新中,SynthID进一步扩展到了文本和音频领域。
到2025年初,Google已经将SynthID应用于其所有主要生成式AI产品,包括Gemini系列模型生成的图片。
现在OpenAI也接入了。
这意味着全球两大AI图片生成源头,都被纳入了同一套水印体系。
简单算一笔账:根据Everypixel Journal的统计,2024年全球AI生成图片数量已超过150亿张。DALL·E和Imagen系列产品贡献了其中相当大的比例。如果这两家都打上SynthID水印,覆盖面会非常可观。
但——
够吗?
我们先跳出技术,看看现实。
2024年1月,美国新罕布什尔州初选期间,一通AI生成的"拜登"语音电话被大规模拨出,劝选民不要去投票。成本?据调查,制作这段深度伪造音频的花费不到1美元。
2024年2月,香港一家跨国公司的财务人员,在一场视频会议中被AI换脸的"CFO"指示转账2亿港元。所有参会人员的脸和声音,全部是AI实时生成的。
2025年3月,一批AI生成的"战区照片"在社交媒体上被大量转发,后经核实全部为虚假内容,但在被辟谣之前已获得超过4000万次浏览。
造假成本在断崖式下降。
Stability AI、Midjourney、各种开源模型——今天任何一个普通人,花10分钟就能生成一张以假乱真的图片。花30分钟就能做一段换脸视频。花1小时就能克隆一个人的声音。
但识别呢?
一个专业事实核查团队验证一张图片的真伪,平均需要4到6小时。如果涉及视频,时间翻倍。
这就是不对称性。
生产一百万张假图的成本,可能低于识别其中一张的成本。
当造假成本趋近于零,而识别成本居高不下的时候,会发生什么?
信任崩塌。
不是慢慢腐蚀的那种崩塌。是"我看到任何东西都不敢相信"的那种崩塌。
学术界有个说法叫"骗子红利"(Liar's Dividend):当深度伪造技术足够普及,真实的内容反而会被质疑——"这是不是也是AI做的?"真相和谎言一起贬值。
这才是最可怕的。
回到"如何识别AI"这个核心问题。
当前行业里有三条主要路径在同时推进。每一条都有它的逻辑,也都有它的天花板。
逻辑很清晰:从源头管控。
你生成的时候就打上标记,下游无论怎么流转,都能追溯回来。
优势明显:
但问题也明显:
第一,开源模型管不住。Stable Diffusion的开源版本、各种本地部署的模型,不会主动加水印。而开源生态贡献了AI图片生成量的相当一部分。
第二,水印可以被主动攻击。2024年马里兰大学的研究论文就展示过,通过对抗性扰动可以在不显著降低图片质量的情况下破坏多种水印方案。
第三,它只能标记"合规生产者"的产出。恶意使用者本来就不会用你的API。
C2PA(Coalition for Content Provenance and Authenticity)是由Adobe、微软、Intel、BBC等联合发起的内容溯源标准。
它的做法不是在像素里藏水印,而是给每一个内容文件附带一份"出生证明"——包括创建时间、使用工具、编辑历史等元数据,用加密签名保证不可篡改。
2024年,C2PA标准被正式纳入了多款主流相机(如索尼、尼康、徕卡的部分型号)和软件(Photoshop、Lightroom)。到2025年,主要社交媒体平台也开始部分支持C2PA元数据的显示。
它的优势在于通用性——不只管AI生成的内容,也管真实拍摄的内容。相当于给"真实"做认证,而不是只标记"虚假"。
但天花板也明显:
元数据可以被剥离。你在微信里转发一张图,元数据大概率就没了。你截个图,元数据也没了。大量平台在上传过程中会压缩和转码,元数据自然丢失。
所以C2PA更适合"专业链路"——新闻机构、版权交易、司法取证。在大众传播层面,它目前还是个漏筛子。
这是最"暴力"的方式:不管你有没有加水印,不管你有没有元数据,我直接用另一个AI来判断"这张图是不是AI生成的"。
原理上类似于GAN中的判别器思路——通过训练模型学习AI生成图片的统计特征(频域异常、纹理模式、边缘处理方式等),来做二分类判断。
OpenAI在2024年发布的AI图片分类器,在内部测试中对DALL·E 3生成的图片识别率约为98%。但对其他模型生成的图片,识别率有明显下降。
更关键的问题是:这是一场猫鼠游戏。
检测器今天能识别的特征,明天的生成模型就可以针对性地消除。每一次生成模型升级,检测器就得重新训练。
Hive Moderation在2025年Q1的报告中指出,对最新一代扩散模型生成的图片,市面上公开可用的AI检测工具的平均准确率已经从2023年的约85%降至约72%。
这条路不是不能走,但它永远是滞后的。是"亡羊补牢",不是"防患于未然"。
三条路径,单独拿出任何一条都不够。
水印管不住开源生态和恶意攻击。 元数据在传播链路中会丢失。 被动检测永远在追赶生成能力。
真正的答案只能是:三者叠加,形成纵深防线。
从流程上看:
这像什么?
像食品安全体系。
生产端有配料表(水印),流通端有质检抽查(平台检测),消费端有315热线(公开工具)。
任何一环缺位,体系都不成立。
技术方案讲完了,但我一直回避一个问题。
谁来强制执行?
SynthID是好东西。但如果我用开源模型在本地生成了一张没有任何水印的假图,上传到一个不做检测的平台——然后呢?
这就是为什么,光有技术不够,必须有监管配合。
欧盟AI Act在2024年正式通过,2025年起分阶段实施。其中明确要求:所有AI生成的内容必须以机器可读的方式进行标注,违规者面临最高3500万欧元或全球营收7%的罚款。
这是全球第一个把"AI内容标识"写进法律的硬性框架。
美国这边相对分散。加州在2024年通过了SB 942法案,要求大型AI服务商在生成内容中嵌入水印。但联邦层面尚无统一立法。
中国的《生成式人工智能服务管理暂行办法》在2023年8月已经施行,要求"对利用生成式人工智能技术生成的内容进行标识"。2025年进一步发布的细则中,明确了图片和视频的水印技术规范。
监管的趋势已经很清楚了。
但执行呢?
你能管住OpenAI、Google、百度、字节。你管得住GitHub上几千个开源模型吗?管得住Telegram群里流通的定制模型吗?
这让我想到一个类比:版权保护。
DRM搞了几十年,盗版消失了吗?没有。但它被压缩到了一个"多数人选择合规"的状态。Netflix、Spotify的成功不是因为消灭了盗版,是因为合规体验足够好,盗版的边际收益不值得大多数人折腾。
AI内容标识可能也会走这条路。
不追求100%覆盖,而是让"不标识"成为一件有成本的事。让"可验证"成为内容的溢价属性。
我判断接下来会发生几件事:
第一,水印标准会收敛。
SynthID目前领跑,但它是Google的技术。行业需要一个开放标准。C2PA联盟很可能会把SynthID或类似技术纳入其规范框架,形成"水印+元数据"的统一标准。
第二,平台侧检测会成为标配。
Meta在2025年初已经宣布对其平台上所有AI生成图片进行标注。X(原Twitter)和YouTube也在跟进。到2026年底,主流社交平台不做AI内容标注的,将成为异类。
第三,"内容真实性"会成为新的产品卖点。
我已经看到趋势——部分新闻机构和内容平台开始打出"100%人类创作"的标签,作为差异化定位。未来"可验证的真实"本身就是价值。
第四,检测技术会向多模态演进。
单纯识别图片不够。视频、音频、文本——甚至是多模态组合内容(比如一段AI生成的视频配上AI生成的字幕和AI克隆的旁白),都需要整体检测方案。SynthID已经在扩展覆盖面,但行业整体还有很大缺口。
我不觉得AI造假这件事能被彻底"解决"。
就像网络安全不会被彻底"解决"一样。它会变成一场持续的博弈,一个动态的均衡。
但有一件事是确定的:如果我们不在现在建立识别体系,等到虚假信息的洪水冲过来,再想筑堤就来不及了。
OpenAI接入SynthID这件事本身不大。但它代表的方向——行业巨头放下竞争关系,在"内容可信"这件事上达成最低限度的共识——这件事的意义很大。
因为对抗虚假,从来不是一家公司的事。
是基础设施。是公共品。是信任的底座。
造假成本趋近于零这件事已经发生了,不可逆。
那么剩下的问题只有一个:我们愿意为"识别真实"付出多少成本?
这个问题的答案,会定义接下来十年的信息环境。


