面对能将恶意指令隐藏于网页评论甚至网址片段的新型网络攻击,一款声称能实时拦截91%威胁的安全系统,正试图为高速发展的AI浏览器代理时代重新定义安全边界。
Perplexity近日推出了新型安全系统BrowseSafe,该系统旨在保护AI浏览器代理免受日益复杂的网络内容操控威胁。
这一系统声称对提示注入攻击的检测率达到91%,运行速度快,能够实现实时监测。
01 技术突破
Perplexity的BrowseSafe系统代表了AI安全领域的一次重要进步。该系统采用三层防御策略,通过快速分类器和基于推理的前沿大语言模型形成了完整的保护机制。
BrowseSafe的核心创新在于其检测准确率。据Perplexity公布的数据,该系统对提示注入攻击的检测成功率高达91%,显著超过市场上其他解决方案。
相比之下,PromptGuard-2仅能检测到35%的攻击,而大型前沿模型如GPT-5的检测率为85%。

技术上,Perplexity创建了BrowseSafe Bench基准,以三个具体维度定义网络攻击的范围:攻击类型、注入策略和语言风格。
这一基准特别注重“难以检测的内容”,即那些看似无害但可能被误认为是攻击的复杂内容。
02 威胁演进
AI浏览器代理的广泛使用带来了新的安全隐患。今年早些时候,Perplexity推出了Comet,这是一款集成AI代理的网络浏览器。
这些代理能够像用户一样浏览网站,进行电子邮件、银行和企业应用等认证会话操作。这种高权限访问让攻击者有机会将危险指令隐藏在网页中,从而引导代理执行不当行为。
最新研究表明,攻击手段正在不断演变。今年11月,安全研究人员披露了一种名为“HashJack”的新型间接提示注入技术。
这种攻击方法利用URL片段(URL中“#”符号后的部分)嵌入恶意指令,可能被AI浏览器助手执行。
由于URL片段仅在客户端处理,不会发送到网络服务器,这种攻击能够绕过Web应用程序防火墙、入侵防御系统和服务器日志等传统网络安全控制措施。
03 行业挑战
随着AI在企业中的快速应用,安全问题日益凸显。一份最新发布的《2025浏览器安全报告》揭示,身份安全、SaaS安全以及AI风险正前所未有地集中在浏览器这一共同点上。
报告显示,生成式AI已成为数据外泄的首要通道。近一半员工在工作中使用生成式AI工具,但绝大多数使用的是未受管控的个人账号。
77%的员工会将企业数据复制粘贴进生成式AI提示框,其中82%来自个人账号操作。40%的上传文件含有PII或PCI敏感信息。
企业AI使用正在从“点状创新”向“系统性生产力工具”迈进。2025年第二季度报告显示,过去12个月职场AI使用频率增长4.6倍,24个月累计增长高达61倍。
然而,安全风险同步攀升,当前71.7%的AI工具被评为高风险或关键风险,仅11%被归类为低风险或极低风险。
04 应对策略
面对日益复杂的安全挑战,Perplexity采取了开放协作的策略。该公司已将其基准、模型和研究论文公开,旨在为AI代理在网络中的安全交互提供更好的保障。
行业专家建议采取多种措施加强AI代理安全。对于类似HashJack的攻击,建议在将URL传递给大型语言模型之前剥离片段,将URL片段视为敌对数据,并在所有URL数据上实施严格的提示隔离。
同时,强化任何自动跟随URL的代理,在受控环境中禁用片段导航或强制执行安全措施。
企业层面的应对也至关重要。SailPoint的研究显示,82%的企业已经在使用AI代理,但仅有44%的企业表示已制定相关安全政策。
令人担忧的是,23%的受访者表示其AI代理曾被诱导泄露存取凭证。80%的公司表示其AI代理曾执行非预期行动。
尽管BrowseSafe在大多数情况下表现出色,但评估揭示仍存弱点:针对多语言攻击的检测率下降至76%,且近10%的攻击能够绕过该系统。
Perplexity选择将基准、模型和研究论文公开,这场安全攻防战的胜负远未尘埃落定。
随着98%的企业计划在未来一年内扩大使用具代理能力的AI,安全与创新的天平需要更精密的调节。

关注 “悠AI” 更多干货技巧行业动态
