Claude Mythos 被曝“注水”:数千漏洞多为虚标…

AI广播站13小时前更新 小悠
9 0 0

据报道,Anthropic 近期发布并引发全球金融机构恐慌的“最强 AI” Claude Mythos Preview,被指存在严重的宣传夸大嫌疑。相关调查显示,该模型所谓的“核武级”破坏力在实测中大打折扣。

Anthropic此前宣称Mythos拥有发现数千个安全漏洞的能力,并因此启动了 Project Glasswing 计划,仅限谷歌、微软等巨头小范围使用。然而,Tomshardware 的研究戳破了这一泡沫:

Claude Mythos 被曝“注水”:数千漏洞多为虚标,严重者仅 10 个

外推幻觉: 所谓的“数千个漏洞”并非全部经过核实,而是基于仅198份人工审计报告中90% 的准确率进行的数学外推。

严重性存疑: 在针对7000个开源软件堆栈的实测中,Mythos发现的600个漏洞中,经核实属于严重级别的仅有 约10个。

价值有限: 大量被标记的问题实际上是陈旧软件的功能缺陷,在现代防御机制下几乎无法被利用,增加了安全人员筛选“噪音”的负担。

Anthropic曾以“模型太强、恐冲击全球安全”为由,表示暂不向公众开放。但业内分析给出了更现实的解释:

高昂成本: 尽管官方口头上“禁售”,但该模型已在亚马逊和微软的云平台悄然上线,只是因运行成本极高导致价格极其昂贵。

营销噱头: 这种“先造神、再限制”的策略,被指是利用公众对 AI 风险的恐惧进行营销,与 OpenAI 的奥特曼兜售“AGI 威胁论”如出一辙。

尽管Anthropic的编程模型一度被公认为业界最强,但近期其表现并不平稳:

降智吐槽: 社区近期频繁出现关于Claude模型“降智”的反馈,口碑出现波动。

存在感焦虑: 频繁传播“AI 产生自我意识”等言论,被认为是在激烈的行业竞争中通过制造恐慌来刷存在感。

当 Claude Mythos 发现27年未见漏洞的传奇被拆解为数据外推,我们或许更应该关注 AI 的实际工程价值,而非其被刻意包装出来的“毁灭力”。在算法与人类安全的博弈中,真实的透明度远比耸人听闻的数字更重要。

Anthropic推出Claude for Word插件测试版,专为法律金融领域设计,支持交互式引用和长文档审阅,深度嵌入办公生态。

Anthropic疑似内部截图泄露,显示其正在Claude中开发代号为“Lets ship something great”的全栈应用构建器。该功能允许用户通过自然语言描述需求,由Claude实时生成完整的前后端应用,并在内置浏览器中即时预览,直指“vibe coding”核心体验。相关帖子在X平台24小时内获得超170万次浏览,引发开发者社区热议。

Anthropic封禁OpenClaw及其创始人Peter Steinberger的账号,后者在社交平台表示未来兼容将更困难,并公开了账号因可疑活动被暂停的邮件。

微软开源多模态推理模型Phi-4-reasoning-vision-15B,参数15B,兼顾轻量化与高性能。该模型仅用200B多模态token训练,强调数据质量,适合资源受限环境下的复杂视觉任务。

乐享集团与火山引擎签署AI合作框架协议,将引入字节跳动同款技术底座,围绕大数据、云计算、直播技术及AI大模型展开全栈AI赋能合作,并成立专项项目组进行定制开发。

Claude Mythos 被曝“注水”:数千漏洞多为虚标…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...