在人工智能进化的道路上,Anthropic公司再次投下了一枚重磅炸弹。在近日举办的开发者大会上,Anthropic为其旗下的智能体平台Claude引入了一项名为“Dreaming”(梦境)的突破性功能。这项技术的核心理念极具科幻色彩:让AI在任务间隙进入一种类似人类“睡眠”的状态,通过模拟快速眼动(REM)周期来整理和优化其记忆库。
长期以来,AI代理在处理长周期、复杂任务时常面临“记忆过载”的困扰。信息往往以碎片化形式堆积,随着交流深入,重复、过时甚至相互矛盾的数据会导致AI运行效率下降。而“Dreaming”功能的出现,相当于为AI提供了一个异步处理的“大脑后台”。它能同时调取多达 100 个历史会话的完整记录,通过合并重复项、更新陈旧信息、提炼宏观规律,将短期琐碎的记忆转化为长期、高价值的知识库。

为了确保这一进化过程的安全性与可控性,Anthropic并未让AI“盲目”更新。Dreaming生成的优化版记忆库不会直接覆盖原始数据,开发者拥有一票否决权,可以在审查优化结果后再决定是否应用。同时,平台还配套推出了实时监控系统和自定义指令功能,让开发者能够像观察实验标本一样,清晰地看到AI整理记忆的每一个步骤,并引导其聚焦于特定主题。
此外,为了解决AI输出质量波动的痛点,Outcomes自动评分系统也同步上线。该系统通过独立的评估器对AI生成的成果进行精准打分,一旦发现缺陷,会立即指示AI重新优化,直到满足预设标准。
技术的优劣最终要靠数据说话。内部测试结果显示,Dreaming功能在多个应用场景中表现出色,文档生成任务的成功率普遍提升了8%至10%。在法律科技领域,合作伙伴Harvey的实践更是令人瞩目:应用该技术组合后,其任务完成率竟然飙升了约 6 倍。
在更复杂的协作场景中,多智能体编排系统展现了强大的协同能力。通过将宏大任务拆解为多个专业子任务并行处理,并在共享文件系统中汇总成果,系统的可靠性得到了质的飞跃。在月球采矿无人机着陆的模拟实验中,这套系统将安全评分从不及格的67%直接拉升至100%的完美标准。
如此高强度的记忆整理与模拟运算,背后离不开庞大算力的支撑。Anthropic宣布已与SpaceX达成深度战略合作,全量租赁了位于得克萨斯州的Colossus1 数据中心。凭借 22 万张高性能GPU的算力支持,Claude不仅能够轻松应对“梦境”产生的数据洪流,也让普通用户获得了实打实的福利:Claude Code使用限额翻倍,Pro/MAX版本的访问限制大幅放宽,API调用速度也得到了显著优化。
AI学会“睡眠”,或许正是其走向更高程度智能化的重要里程碑。
OpenAI 发布官方命令行工具 openai-cli,开发者无需编写 SDK 代码即可在终端直接调用 API,提升本地开发与部署效率。项目以 Apache 2.0 协议开源,支持 Homebrew 或 Go 安装,采用资源化命令结构,操作直观清晰。
Google DeepMind收购《EVE Online》开发商CCP Games少数股权,将其虚拟世界纳入AI测试体系。CCP Games以1.2亿美元从韩国Pearl Abyss回购自身并更名为Fenris Creations,交易价格较2018年估值大幅缩水。此次合作旨在为通用人工智能(AGI)提供沙箱环境。
OpenAI推出三款实时语音模型:GPT‑Realtime‑2具备GPT‑5级推理能力,支持复杂请求和自然对话;GPT‑Realtime‑Translate专注实时翻译;GPT‑Realtime‑Whisper侧重语音识别。这些模型为开发者提供不同场景的语音应用解决方案。
谷歌发布Chrome 148版本,新增AI功能,用户可在地址栏或新标签页直接向AI智能体提问,获取自然语言回答并支持追问。同时,AI自动填充工具获改进,可在用户同意下协助填写信用卡和地址信息。
初创团队Genesis AI发布首个机器人基础模型GENE-26.5,标志着通用机器人在高难度非结构化任务上取得突破。演示中,机器人展现惊人灵活性与自主性,能完成单手打蛋、解魔方等精细任务,提升了对力度、逻辑、空间感知及节奏精准度的控制能力。

关注 “悠AI” 更多干货技巧行业动态