小悠-第95页-悠智AI导航

让AI学会收发邮件：深度测评两款必知的MCP Agent Mail项目

本文深度测评两款名为MCP Agent Mail的开源项目，它们分别解决AI代理间通信和真实邮件自动化两大场景。mcp-agent-mail让AI智能体像同事一样互发邮件、协调任务、避免文件冲突；Ma...

MCP专区

3个月前

01240

深度探秘Qwen Deep Research：一款颠覆性AI研究智能体的全方位测评

本文对阿里云Qwen Deep Research 2511进行全面测评，从模型理解、生成能力、知识检索、性能指标、安全保护、成本效益等十个维度深入分析。作为一款自主研究智能体，它在多轮对话、深度信息检...

AI模型测评库

3个月前

0840

Opik测评：给LLM应用装上“显微镜”与“自动驾驶仪”——开源AI可观测性平台深度解析

Opik是Comet.ml开源的LLM可观测性平台，被誉为AI应用的“显微镜”与“自动驾驶仪”。它能全链路追踪智能体工作流、通过LLM-as-a-Judge自动评估质量、在CI/CD中拦截劣质版本，甚...

MCP专区

3个月前

0940

抢夺AGI方向盘：Anthropic成立“未来部”，在AI颠覆世界前埋下伏笔

面对即将到来的AGI时代，Anthropic公司于2026年3月成立The Anthropic Institute智库，整合前沿研究与社会影响团队，旨在提前布局AI引发的就业、安全与伦理问题。这家“未...

AI广播站

3个月前

0760

阿里云携“JVS Claw”入场，手机“云端养殖”大战一触即发

阿里云正式上线手机版OpenClaw应用JVS Claw，加入AI智能体“云端养殖”大战。该应用依托无影技术，支持用户在云端执行复杂任务，实现“一句话让AI干活”。随着小米、华为、腾讯近期密集入局，手...

AI广播站

3个月前

01420

叫板GPT-5.1？xAI发布Grok4.20：“诚实”率高达78%，大模型进入“不忽悠”时代

xAI于3月12日发布Grok4.20大模型，其“非幻觉率”高达78%创行业纪录，标志着大模型从追求智商转向追求诚实。该模型通过四智能体集群系统实现高可靠性，并大幅降低API成本，主打金融、法律等对事...

AI广播站

3个月前

0960

百度健康推“DoctorClaw”AI医生助手：医学检索与办公辅助先行，开启医生数字员工时代

百度健康内测AI医生助手“DoctorClaw”，短期聚焦学术检索与办公辅助，旨在为医生打造24小时待命的“数字秘书”。基于OpenClaw框架实现主动任务处理，配备独立沙箱保障数据安全。此举有望重塑...

AI广播站

3个月前

0660

深度测评：Qianfan-VL-70B —— 国产多模态旗舰的“场景化”实战能力全景评估

本文全面测评百度千帆最新开源的Qianfan-VL-70B多模态大模型。从理解能力、生成质量到本地化部署，深度解析这款700亿参数国产旗舰在文档识别、数学推理等场景的真实表现，并提供Windows/L...

AI模型测评库

3个月前

01080

OpenAPI Proxy深度测评：AI时代的API万能转接头，让Claude直接调用你的REST服务

本文深度测评OpenAPI Proxy系列工具，详解如何让AI代理（如Claude）无缝调用传统REST API。涵盖openapi-mcp-proxy（OpenAPI转MCP）和mcpo（MCP转O...

MCP专区

3个月前

02210

昆仑芯上的多模明珠：百度 Qianfan VL 8B 大模型深度测评与本地化部署实战

本文深度测评百度千帆Qianfan VL 8B多模态大模型，全面解析其在理解能力、生成能力、知识检索及智能助手等十大维度的表现。文章重点展示了模型在中文场景下的卓越性能，并提供Windows、macO...

AI模型测评库

3个月前

02530