Claude Mythos 被曝“注水”：数千漏洞多为虚标…

AI广播站2个月前更新小悠

53 0 0

据报道，Anthropic 近期发布并引发全球金融机构恐慌的“最强 AI” Claude Mythos Preview，被指存在严重的宣传夸大嫌疑。相关调查显示，该模型所谓的“核武级”破坏力在实测中大打折扣。

Anthropic此前宣称Mythos拥有发现数千个安全漏洞的能力，并因此启动了 Project Glasswing 计划，仅限谷歌、微软等巨头小范围使用。然而，Tomshardware 的研究戳破了这一泡沫:

Claude Mythos 被曝“注水”：数千漏洞多为虚标，严重者仅 10 个

外推幻觉: 所谓的“数千个漏洞”并非全部经过核实，而是基于仅198份人工审计报告中90% 的准确率进行的数学外推。

严重性存疑: 在针对7000个开源软件堆栈的实测中，Mythos发现的600个漏洞中，经核实属于严重级别的仅有约10个。

价值有限: 大量被标记的问题实际上是陈旧软件的功能缺陷，在现代防御机制下几乎无法被利用，增加了安全人员筛选“噪音”的负担。

Anthropic曾以“模型太强、恐冲击全球安全”为由，表示暂不向公众开放。但业内分析给出了更现实的解释:

高昂成本: 尽管官方口头上“禁售”，但该模型已在亚马逊和微软的云平台悄然上线，只是因运行成本极高导致价格极其昂贵。

营销噱头: 这种“先造神、再限制”的策略，被指是利用公众对 AI 风险的恐惧进行营销，与 OpenAI 的奥特曼兜售“AGI 威胁论”如出一辙。

尽管Anthropic的编程模型一度被公认为业界最强，但近期其表现并不平稳:

降智吐槽: 社区近期频繁出现关于Claude模型“降智”的反馈，口碑出现波动。

存在感焦虑: 频繁传播“AI 产生自我意识”等言论，被认为是在激烈的行业竞争中通过制造恐慌来刷存在感。

当 Claude Mythos 发现27年未见漏洞的传奇被拆解为数据外推，我们或许更应该关注 AI 的实际工程价值，而非其被刻意包装出来的“毁灭力”。在算法与人类安全的博弈中，真实的透明度远比耸人听闻的数字更重要。

Anthropic推出Claude for Word插件测试版，专为法律金融领域设计，支持交互式引用和长文档审阅，深度嵌入办公生态。

Anthropic疑似内部截图泄露，显示其正在Claude中开发代号为“Lets ship something great”的全栈应用构建器。该功能允许用户通过自然语言描述需求，由Claude实时生成完整的前后端应用，并在内置浏览器中即时预览，直指“vibe coding”核心体验。相关帖子在X平台24小时内获得超170万次浏览，引发开发者社区热议。

Anthropic封禁OpenClaw及其创始人Peter Steinberger的账号，后者在社交平台表示未来兼容将更困难，并公开了账号因可疑活动被暂停的邮件。

微软开源多模态推理模型Phi-4-reasoning-vision-15B，参数15B，兼顾轻量化与高性能。该模型仅用200B多模态token训练，强调数据质量，适合资源受限环境下的复杂视觉任务。

乐享集团与火山引擎签署AI合作框架协议，将引入字节跳动同款技术底座，围绕大数据、云计算、直播技术及AI大模型展开全栈AI赋能合作，并成立专项项目组进行定制开发。

关注 “悠AI” 更多干货技巧行业动态

AI广播站

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

Claude Mythos 被曝“注水”：数千漏洞多为虚标…

智能向善!《全球人工智能治理科技社团倡议》今日发布

Anthropic内部截图曝光：Claude正研发全栈Ap…

相关文章

暂无评论