当地时间2月25日,AI领域的“军备竞赛”骤然升级。继去年年底收购编码引擎Bun之后,人工智能顶尖独角兽Anthropic火速出击,于今日凌晨宣布完成对西雅图AI初创公司Vercept的收购。这一被业内称为“给Claude装上眼睛”的战略举措,直指AI智能体最核心的视觉感知短板,旨在让其王牌模型Claude在操控电脑时,真正拥有“一目十行”且“明察秋毫”的数字化双眼 。
此次收购的技术含金量在业界引发了巨大震动。Vercept是一家脱胎于艾伦人工智能研究所(AI2)的明星初创,其核心产品Vy采用激进的“视觉优先”(Vision first)方案。不同于依赖API或代码的传统自动化工具,Vy通过高精度视觉模型直接理解屏幕上的每一个像素级按钮,再模拟人类操作鼠标键盘。这意味着一套系统就能通吃所有软件,无需任何定制开发。在关键的UI元素识别基准ScreenSpot v1测试中,Vercept自研模型的准确率高达惊人的92%,这一数据直接将OpenAI同类模型的18.3% 远远甩在身后,形成了技术上的“降维打击” 。

这笔交易不仅是技术上的强强联合,更是对智能体赛道主导权的宣示。就在本月,OpenAI刚刚通过“人才引入”方式吸纳了知名开源项目OpenClaw的创始人,意图补齐其在个人端AI Agent的落地能力 。而Anthropic此次的收购动作更为直接——直接将一整支顶配团队收入囊中。Vercept的创始阵容堪称豪华,包括计算机视觉先驱Ross Girshick、具身智能专家Kiana Ehsani等。有趣的是,这笔收购引发了一场人才“暗战”的涟漪:Vercept的另一位联合创始人Matt Deitke此前已被Meta以天价薪酬挖角,并未随团队加入Anthropic 。
随着Vercept团队的加盟,Anthropic的智能体战略变得愈发清晰。依托最新发布的Claude Sonnet 4.6模型,其在OSWorld评估中的任务准确率已从去年底的不足15%飙升至72.5%,在跨标签页表单填写、复杂表格处理等场景上已接近人类水平 。这笔收购将直接把Claude在真实软件环境中的“手眼协调”能力推向新高度。目前,Vercept的云端产品Vy将在30天内关闭,团队正式并入Anthropic,这也标志着AI智能体正从“能理解文字”的思考者,进化为“能看见并操作世界”的全能执行者 。

关注 “悠AI” 更多干货技巧行业动态