AI竟然学会了“睡觉”：Claude任务成功率暴涨 6 倍…

在人工智能进化的道路上，Anthropic公司再次投下了一枚重磅炸弹。在近日举办的开发者大会上，Anthropic为其旗下的智能体平台Claude引入了一项名为“Dreaming”（梦境）的突破性功能。这项技术的核心理念极具科幻色彩：让AI在任务间隙进入一种类似人类“睡眠”的状态，通过模拟快速眼动（REM）周期来整理和优化其记忆库。

长期以来，AI代理在处理长周期、复杂任务时常面临“记忆过载”的困扰。信息往往以碎片化形式堆积，随着交流深入，重复、过时甚至相互矛盾的数据会导致AI运行效率下降。而“Dreaming”功能的出现，相当于为AI提供了一个异步处理的“大脑后台”。它能同时调取多达 100 个历史会话的完整记录，通过合并重复项、更新陈旧信息、提炼宏观规律，将短期琐碎的记忆转化为长期、高价值的知识库。

AI竟然学会了“睡觉”：Claude任务成功率暴涨 6 倍背后的秘密

为了确保这一进化过程的安全性与可控性，Anthropic并未让AI“盲目”更新。Dreaming生成的优化版记忆库不会直接覆盖原始数据，开发者拥有一票否决权，可以在审查优化结果后再决定是否应用。同时，平台还配套推出了实时监控系统和自定义指令功能，让开发者能够像观察实验标本一样，清晰地看到AI整理记忆的每一个步骤，并引导其聚焦于特定主题。

此外，为了解决AI输出质量波动的痛点，Outcomes自动评分系统也同步上线。该系统通过独立的评估器对AI生成的成果进行精准打分，一旦发现缺陷，会立即指示AI重新优化，直到满足预设标准。

技术的优劣最终要靠数据说话。内部测试结果显示，Dreaming功能在多个应用场景中表现出色，文档生成任务的成功率普遍提升了8%至10%。在法律科技领域，合作伙伴Harvey的实践更是令人瞩目：应用该技术组合后，其任务完成率竟然飙升了约 6 倍。

在更复杂的协作场景中，多智能体编排系统展现了强大的协同能力。通过将宏大任务拆解为多个专业子任务并行处理，并在共享文件系统中汇总成果，系统的可靠性得到了质的飞跃。在月球采矿无人机着陆的模拟实验中，这套系统将安全评分从不及格的67%直接拉升至100%的完美标准。

如此高强度的记忆整理与模拟运算，背后离不开庞大算力的支撑。Anthropic宣布已与SpaceX达成深度战略合作，全量租赁了位于得克萨斯州的Colossus1 数据中心。凭借 22 万张高性能GPU的算力支持，Claude不仅能够轻松应对“梦境”产生的数据洪流，也让普通用户获得了实打实的福利：Claude Code使用限额翻倍，Pro/MAX版本的访问限制大幅放宽，API调用速度也得到了显著优化。

AI学会“睡眠”，或许正是其走向更高程度智能化的重要里程碑。

OpenAI 发布官方命令行工具 openai-cli，开发者无需编写 SDK 代码即可在终端直接调用 API，提升本地开发与部署效率。项目以 Apache 2.0 协议开源，支持 Homebrew 或 Go 安装，采用资源化命令结构，操作直观清晰。

Google DeepMind收购《EVE Online》开发商CCP Games少数股权，将其虚拟世界纳入AI测试体系。CCP Games以1.2亿美元从韩国Pearl Abyss回购自身并更名为Fenris Creations，交易价格较2018年估值大幅缩水。此次合作旨在为通用人工智能（AGI）提供沙箱环境。

OpenAI推出三款实时语音模型：GPT‑Realtime‑2具备GPT‑5级推理能力，支持复杂请求和自然对话；GPT‑Realtime‑Translate专注实时翻译；GPT‑Realtime‑Whisper侧重语音识别。这些模型为开发者提供不同场景的语音应用解决方案。

谷歌发布Chrome 148版本，新增AI功能，用户可在地址栏或新标签页直接向AI智能体提问，获取自然语言回答并支持追问。同时，AI自动填充工具获改进，可在用户同意下协助填写信用卡和地址信息。

初创团队Genesis AI发布首个机器人基础模型GENE-26.5，标志着通用机器人在高难度非结构化任务上取得突破。演示中，机器人展现惊人灵活性与自主性，能完成单手打蛋、解魔方等精细任务，提升了对力度、逻辑、空间感知及节奏精准度的控制能力。

关注 “悠AI” 更多干货技巧行业动态

AI广播站

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

AI竟然学会了“睡觉”：Claude任务成功率暴涨 6 倍…

Google DeepMind入股CCP Games，EV…

全线封杀！Claude桌面端收紧限制，DeepSeek V…

相关文章

暂无评论