小悠

帅气的我简直无法用语言描述!

Gemini 2.5 Flash Preview (推理版) 深度测评:谷歌新一代轻量化推理大模型

随着大模型技术的高速发展,谷歌近期发布了 Gemini 2.5 Flash Preview(推理版),作为Gemini系列的最新成员,它主打轻量化、低延迟、高效推理,旨在平衡性能与成本,适用于实时交互...
7个月前
05231

Claude 3.7 Sonnet 深度测评:Anthropic 新一代平衡型大模型

Anthropic 最新发布的 Claude 3.7 Sonnet 作为 Claude 3.5 系列的重要升级版本,在保持高效推理能力的同时,显著提升了长文本处理和复杂任务理解能力。本文将从核心架构...
7个月前
05201

OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资,估值突破100亿美元

2025年7月,由OpenAI前CTO格雷格·布罗克曼创立的AI研究实验室Thinking Machines Lab宣布完成20亿美元B轮融资,估值突破100亿美元。本轮融资由a16z领投,红杉资本等...
7个月前
01120

​Claude 即将发布Claude Neptune v3模型,数学能力超强

nthropic 公司正全力推进代号为 “Claude Neptune v3” 的新一代 AI 模型测试工作。这一动态迅速在全球 AI 社区掀起讨论热潮,业内专家普遍猜测,该模型可能是 Claude ...
7个月前
11000

通义千问Qwen Chat桌面客户端发布 支持一键唤起调用MCP

近日,人工智能领域迎来重要进展。通义千问团队正式推出其标志性产品——通义千问大语言模型(LLM)的官方桌面客户端:Qwen Chat 桌面版。此次发布的客户端不仅为用户提供了更便捷、更稳定的对话式A...
7个月前
06220

谷歌DeepMind开源GenAI Processors:实时AI工作流构建迈入”一键时代”

工智能基础设施领域迎来重大突破。谷歌旗下DeepMind实验室于今日宣布开源GenAI Processors项目,该框架将彻底改变开发者在生产环境中构建实时生成式AI工作流的模式。其核心创新在于通过标...
7个月前
21850

Kimi-2登顶LiveBench全球榜首:中国开源模型首超GPT-4.1,AI权力格局重构

AI领域迎来历史性时刻。月之暗面(Moonshot AI)研发的Kimi-2大模型在实时动态评测平台LiveBench AI最新榜单中以综合得分83.7超越OpenAI GPT-4.1(81.2分...
7个月前
11770

Scale AI裁员14%终止500名承包商,数据标注行业面临技术性失业潮

全球最大AI数据标注平台Scale AI近日向美国证监会提交文件,宣布启动结构性调整:裁员14%(约180名正式员工)并终止与500名承包商的合作。此次收缩波及全球8个运营中心,标志着依赖人工标注的A...
7个月前
01200

ChatGPT录音模式震撼上线:实时转录会议+智能生成计划,办公效率革命降临

人工智能交互迎来里程碑式升级。OpenAI今日正式为ChatGPT全平台(网页/App)推出录音模式(Voice Recording),用户只需一键开启麦克风,即可实现实时语音转写→内容分析→任务生成...
7个月前
0860

Le Chat全方面对标ChatGPT,欧洲AI新贵穷追不舍

欧洲人工智能领域迎来重磅消息,法国AI初创公司Mistral AI正式推出其最新大语言模型Le Chat,该产品在性能、功能及多语言支持上全面对标OpenAI的ChatGPT,成为欧洲首个具备全球竞争...
7个月前
0740