只需在对话框中简单提问,一段视频是否由AI生成的谜团,就能在Gemini应用中迅速揭晓答案。
全球用户即日起可以在谷歌Gemini应用中直接检测视频是否由谷歌AI技术生成。这项功能已在Gemini应用支持的所有语言和国家/地区全面上线。
用户只需上传一段视频文件,然后向Gemini提问“这个视频是用Google AI生成的吗?”即可触发检测流程。
谷歌正试图通过这项免费工具,帮助用户在日益复杂的数字内容环境中,快速识别AI生成的视频内容。
01 功能上线
谷歌在AI内容透明化领域迈出关键一步。其Gemini应用正式推出视频AI生成检测功能,用户现可通过该功能验证视频是否由谷歌AI技术创建或编辑。
这项全球同步上线的功能,支持所有Gemini应用覆盖的语言和国家/地区,且无需额外订阅或特殊工具。
用户操作异常简便。只需在Gemini应用中上传不超过100MB、时长90秒以内的视频文件,随后通过自然语言提问,即可获得检测结果。
谷歌表示,该功能旨在增强数字媒体信任度,特别是在新闻、社交和娱乐领域,帮助用户辨别AI干预内容,避免错误信息传播。
02 技术核心
这项新功能的核心技术支持来自于谷歌独有的SynthID数字水印技术。
SynthID是一种隐形水印技术,对人类视觉和听觉不可察觉,却能被专用算法精准识别。该技术自2023年推出以来,已在超过200亿件AI生成内容中嵌入水印。
系统会分别扫描视频的视觉轨道和音频轨道,寻找SynthID水印的踪迹。与简单的是非判断不同,Gemini会提供详细反馈,如“在音频的10-20秒之间检测到SynthID水印。在视觉效果中未检测到SynthID”。

谷歌计划未来将这一验证能力延伸至支持全行业通用的C2PA内容凭证标准。这一扩展将使系统能够识别更多种类AI工具及创意软件生成的内容来源,包括OpenAI的Sora等模型。
03 实验验证
实际上,谷歌AI模型在视频真伪识别方面早已展现出令人印象深刻的能力。
在澎湃新闻“明查实验室”进行的一项测试中,Gemini 2.5 Pro对12段包含AI生成、深度伪造、CGI和真实素材的视频进行了识别。
实验结果显示,Gemini能够准确识别几乎所有计算机生成影像,并能区分使用不同计算机技术如AIGC或CGI制作的画面。
测试人员总结出Gemini分析视频真伪的8点思路:评估视频质量、观察关键帧细节、考察动态连续性、音频检测、考虑事件现实可能性、反搜视频关键帧、评估制作难度以及搜索外部资料验证。
04 行业标准
谷歌此次更新不仅是技术功能的增加,更是对行业标准的重要推动。谷歌表示,未来将支持C2PA这一全行业通用的内容凭证标准。
当前的图像验证仅基于谷歌自主研发的SynthID水印技术,主要适用于自家AI系统生成的内容。一旦接入C2PA标准,系统将能够识别更多第三方AI工具和创意软件生成内容的来源信息。
值得注意的是,谷歌最新发布的Nano Banana Pro模型所生成的图像已经自动嵌入符合C2PA规范的元数据。此前,TikTok也已确认将在其AI内容的隐形水印方案中采用C2PA元数据结构。
行业观察人士指出,社交媒体和内容分发渠道需要普遍具备自动标注AI生成内容的能力,相关技术才能实现更广泛的实际价值,而非将核实义务完全交由终端用户完成。
05 深度伪造挑战
谷歌推出这一功能的背景,是日益严重的深度伪造挑战。以Sora、Midjourney为代表的AIGC模型让虚假影像以前所未有的速度涌入公共空间,而人类的识别速度却远远落后于造假的节奏。
在AI生成的“樱花雪景”视频引发网络热议后,谷歌的Gemini模型曾瞬间识破其为AI作品,这一案例揭示了“以AI辨AI”的可行性。
与主要竞争对手相比,谷歌的解决方案显得更为全面。实验显示,Gemini在识别计算机生成影像方面表现突出,而ChatGPT的表现则略显逊色。
谷歌的长期计划显示,SynthID技术将扩展到图像、音频、文本和视频领域,而此次视频检测功能的推出,进一步完善了Gemini的内容认证体系。
一条由AI生成的日本樱花雪景视频曾在网络引发热议,但被Gemini瞬间识破。如今,同样的检测能力已被封装进一个简单的应用功能中。
当用户将一段可疑视频拖入Gemini对话框,系统的算法开始扫描每一帧画面、分析每一段音频,寻找那些人类感官无法察觉的数字指纹。
谷歌最新发布的Nano Banana Pro模型生成的所有图像都已默认嵌入符合C2PA标准的元数据,而TikTok等平台也计划采用相同的技术框架。
一个由AI生成、由AI验证的透明数字内容生态正在各大科技公司的推动下逐渐成形。

关注 “悠AI” 更多干货技巧行业动态
