号称“危险”的AI扫描17. 6 万行代码后，仅揪出一个低…

近日，Anthropic公司备受瞩目的AI安全分析模型Mythos，在开源界遭遇了一场意料之外的“滑铁卢”。尽管官方曾大肆宣传该模型在发现源代码漏洞方面能力过于强悍，甚至为此推迟了公开发布，但在对全球知名开源工具curl的实测中，Mythos交出的答卷却显得有些苍白：在多达17. 6 万行代码的严密扫描下，最终仅确认了一个低危漏洞。

这场测试的推动者是curl项目的创始人Daniel Stenberg。他通过相关项目获得了Mythos的有限测试权限，试图给这个拥有 200 亿次安装量的网络传输利器做一次深度“体检”。curl的代码库一向以极高的安全工程标准著称，不仅经过了数百位贡献者的精心打磨，更长期接受各类自动化扫描及高昂的专业审计。

号称“危险”的AI扫描17. 6 万行代码后，仅揪出一个低危漏洞

测试过程起初看起来硕果累累。Mythos的初始报告宣称发现了“ 5 个已确认的安全漏洞”，但经过curl安全团队数小时的人工复核，这些结果迅速缩水：其中 3 个被判定为误报，仅是符合文档描述的正常行为； 1 个被定性为普通bug，不具备安全威胁。最终，仅剩下 1 个严重程度被评为“低”的漏洞。

对于这样的结果，Stenberg直言不讳地指出，Anthropic所谓的“危险级能力”更像是一场成功的市场营销。他表示，早在Mythos之前，curl团队就已经利用多款AI安全工具修复了数百个bug，而第一批工具往往更容易捡到“低垂的果实”。随着代码库的日益完善，AI想要挖掘出深层的新型漏洞已变得难上加难。

不过，Stenberg并未全盘否定AI的价值。他承认，相比于传统的静态分析器，像Mythos这样的AI工具在理解协议规范、识别注释与代码不符、以及模拟复杂环境下的配置检查方面具有显著优势。它们更像是一个博学且擅长总结的助手，尽管给出的修复方案并不总是百分之百正确。

此次实测给业界敲响了警钟：AI虽然在代码审计领域带来了效率的质变，但目前依然只能发现“已知类型”的错误实例，而非创造全新的漏洞检测逻辑。在保障核心安全方面，严谨的安全工程实践——如防御性基础设施的构建和严格的数值上限限制，依然是比AI工具更可靠的“银弹”。

OpenAI宣布向欧盟开放其最先进的网络安全大模型GPT-5.5-Cyber，面向企业、政府机构、网络安全专家及欧盟AI办公室等关键部门。此举被视为加强全球网络防御合作的关键一步，也引发对科技巨头安全监管与合规进度的关注。

快手科技宣布董事会正评估可灵AI资产重组方案，或引入外部融资。可灵是快手自研的视频生成大模型，预计2024年6月上线。今年1月31日发布的可灵3.0系列，包括图片、视频及Omni版本，经技术升级后，提供更丰富内容。

OpenAI在经历2023年“政变”风波后，通过修改公司章程大幅提升CEO萨姆·奥特曼的职位安全性。新规则将解雇门槛从简单多数票提高，使外部干预或内部罢免更难实现。这些变动在公司向营利性转型期间悄然完成，由马斯克起诉案的专家证人披露。

快手科技5月12日公告确认，正评估重组可灵AI业务，计划引入外部融资并推动独立上市。市场消息称，快手已启动Pre-IPO融资洽谈，拟融资20亿美元，目标估值200亿美元。此举旨在加速该大模型业务的独立扩张，利用外部资源提升竞争力。可灵AI作为国产视频生成模型，分拆后有望获得更快发展。

上海人工智能实验室联合多家科研单位，利用“书生”科学大模型与自动化平台，成功攻克高端KrF光刻胶树脂稳定制备难题，实现芯片核心材料领域重大突破。该技术突破传统人工试错模式，显著提升研发效率，相关产业关键指标均达预期。

关注 “悠AI” 更多干货技巧行业动态

AI广播站

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

号称“危险”的AI扫描17. 6 万行代码后，仅揪出一个低…

麦芽 AI 入选省级优秀典型案例！湖南元数科技领跑未来产业…

现实版“权力的游戏”？Ilya法庭作证：奥特曼曾用谎言编织…

相关文章

暂无评论