美团开源LongCat-Video,突破AI长视频生成瓶颈 美团正式开源LongCat-Video视频生成模型,突破AI长视频生成技术瓶颈。该模型基于统一架构支持文生、图生视频及视频续写任务,可稳定生成5分钟高清连贯视频,显著提升时序一致性与运动合理性。这一技... AI广播站 4个月前0550
Crusoe获百亿估值,AI基础设施竞赛迎来新王炸 AI数据中心运营商Crusoe完成13.8亿美元股权融资,估值突破100亿美元,获英伟达等顶级投资机构押注。这家从比特币挖矿转型的公司现为OpenAI建设超大规模数据中心,成为AI基础设施领域的新贵。 AI广播站 5个月前0540
0.9B参数横扫全球榜单,百度PaddleOCR-VL重塑OCR技术格局 百度飞桨推出的PaddleOCR-VL模型以0.9B参数在OmniDocBench评测中斩获92.56分,登顶全球OCR榜首。该模型支持109种语言,在文本识别、公式解析和表格理解方面表现卓越,并连续... AI广播站 5个月前0900
蚂蚁集团推出“灵光”应用,AGI相机开启视觉识别新体验 蚂蚁集团最新推出多模态AI应用“灵光”,目前已开启内测。该应用具备AGI相机功能,可通过AI能力识别和理解世界,还支持快速研究整理文档要点,标志着蚂蚁集团在AI应用落地方面迈出重要一步。 AI广播站 5个月前01670
AI视频创作迎来“角色客串”时代,Sora安卓版上线在即 OpenAI宣布Sora路线图重大更新,推出“角色客串”功能与基础视频编辑工具,让宠物、玩偶等均可参与视频创作。Android版本即将上线,同时优化社交体验与性能,推动AI视频创作迈向更开放、多元的新... AI广播站 5个月前0470
AI视频生成迎来新王者,Hailuo 2.3以极致逼真度挑战业界标杆 AI视频生成领域迎来重大突破!MiniMax正式发布Hailuo 2.3新一代AI视频模型,在真实感、精准度与风格多样性方面实现显著提升。该模型支持最长10秒原生1080p视频输出,在动作捕捉、面部表... AI广播站 5个月前0830
特斯拉驶向AI未来:Cybercab明年量产,人形机器人即将亮相 特斯拉宣布重大AI战略转型,Cybercab自动驾驶出租车将于2026年二季度投产,这款无方向盘车辆将彻底改变出行方式。同时,第三代Optimus人形机器人将于明年亮相,其逼真程度接近人类。马斯克表示... AI广播站 5个月前0480
医疗AI迎来“循证”突破!百川智能推出临床诊疗大模型 百川智能发布循证增强医疗大模型Baichuan-M2 Plus,该模型通过六源循证推理范式大幅降低医疗幻觉率,在多项医学考试中表现优异,标志着医疗AI正式迈入临床可信可用新阶段。 AI广播站 5个月前0480
AI正在重构职场!诺贝尔奖得主警告:学历加速贬值 诺贝尔化学奖得主迈克尔·莱维特表示,AI正让学历越来越不重要。未来,没有大学文凭但会用AI的年轻人,可能比传统“名校毕业生”更具竞争力。这一观点获哈佛大学对6200万人研究及诺贝尔经济学奖理论佐证,揭... AI广播站 5个月前0440
三星入局智能眼镜,联合谷歌、时尚巨头打造Gemini驱动新物种 三星联合谷歌、Gentle Monster与Warby Parker宣布进军AI智能眼镜领域,将推出由Gemini人工智能驱动的下一代智能穿戴设备。这款融合尖端科技与时尚设计的产品,预计将重新定义人机... AI广播站 5个月前0490
一键启航,智慧无界:全球AI聚合网关崛起 一个密钥即可调用全球AI算力。全球AI聚合网关通过整合分布式推理、智能网关硬件与统一通信协议,正突破成本与地域的限制,为企业提供低延迟、高效率的智能服务。从家庭到工业,一个无缝连接的智能世界正在成为现... AI广播站 5个月前0470
多模态大模型学会“反思”,上交大联手上海AI Lab突破AI决策瓶颈 上海交通大学与上海AI Lab联合突破多模态大模型反思能力瓶颈,推出MM-HELIX基准测试框架。研究显示,具备反思能力的模型在复杂任务中准确率提升18.6%,推动AI从知识容器向真正的问题解决者转型... AI广播站 5个月前0510
10秒克隆真人语音,Fish Audio新一代模型实现情感自然交互 Fish Audio发布升级版S1语音克隆模型,仅需10秒语音样本即可高精度复刻真人声音,完整保留口音、语调和情感特征。相比国际同类产品价格低约六倍,首帧延迟低于500毫秒,可广泛应用于虚拟人、内容创... AI广播站 5个月前0640
中国生成式AI用户爆发式增长,国产大模型赢得九成用户青睐 中国生成式AI用户规模半年激增2.66亿,达5.15亿人,增长率高达106.6%。最新报告显示,超九成用户优先选择国产大模型,人工智能应用已从尝鲜阶段步入常用阶段,正在深刻改变工作与生活方式。 AI广播站 5个月前0410
库克现身上海,苹果AI加速入华 苹果CEO库克在2025上海苏河湾大会上宣布,正积极推进Apple Intelligence进入中国市场。面对中国区业绩下滑,苹果计划通过与阿里巴巴、百度合作,在年底前通过系统更新引入AI功能,实现在... AI广播站 5个月前0380
开源多模态模型迎来新突破,LLaVA-OneVision-1.5性能超越业界标杆 开源多模态模型LLaVA-OneVision-1.5近日发布,在多项基准测试中超越Qwen2.5-VL。该模型采用创新视觉编码器和三阶段训练流程,仅用4天训练时间和1.6万美元成本就实现突破,为AI社... AI广播站 5个月前0470
创作者福音!Lovart限时免费解锁Sora2,高质量AI视频触手可及 设计AI平台Lovart宣布限时免费集成OpenAI Sora2模型,用户每日可享5次普通生成和1次Pro生成,全部输出无水印视频。这一举措大幅降低高质量AI视频创作门槛,推动技术普及,被业内视为AI... AI广播站 5个月前01610
诺奖得主阿吉翁:AI如何重塑经济增长新范式 人工智能正在重塑全球经济增长范式。诺贝尔经济学奖得主阿吉翁指出,AI通过"创造性破坏"机制推动经济发展,既带来效率提升也伴随转型挑战。在1509个中国大模型引领全球创新的背景下,政策制定需平衡创新激励... AI广播站 5个月前0510
AI大模型锁定抗癌新靶点,谷歌耶鲁联手将“冷”肿瘤变“热” 谷歌DeepMind与耶鲁大学联合推出270亿参数AI模型C2S-Scale,该模型成功筛选出能将"冷肿瘤"转化为"热肿瘤"的关键药物,并在实验室验证中显著增强抗原呈递。这项突破证明AI不仅能分析数据... AI广播站 5个月前0500
具身智能迎来“ImageNet时刻”:全球首个真机基准测试平台RoboChallenge正式开放 RoboChallenge作为全球首个真实物理环境多任务机器人基准测试平台正式发布。这一突破性项目解决了算法从仿真到现实的评估难题,通过远程API控制真实机器人执行30项复杂任务,为全球研究者提供公平... AI广播站 5个月前0810
AI重构标准化工作!国内首个标准大模型“同道”上线 国内首个标准大模型“同道”互联网版正式发布,标志着我国标准化工作迈入AI驱动新阶段。该模型具备智能问答、文稿编写、深度解读与辅助认证四大核心功能,旨在彻底改变传统“人找标准”的低效模式,为用户提供覆盖... AI广播站 5个月前01000
OpenAI激进押注基础设施,萨姆·奥特曼构建AI帝国蓝图 在最新a16z访谈中,OpenAI CEO山姆·奥特曼宣布公司正进行"激进的基础设施押注",从芯片合作到能源布局全面垂直整合。他透露AI科学家将成为改变游戏规则的关键,并分享了对Sora商业模式、能源... AI广播站 5个月前0480
EVM十字路口:以太坊架构变革下的生态繁荣与未来挑战 以太坊虚拟机(EVM)正面临技术转折点。在核心开发者考虑用RISC-V架构替代EVM的同时,Base、BNB等EVM兼容链生态却呈现爆发式增长,周活跃地址超千万。本文探讨EVM在架构革新与生态繁荣十字... AI广播站 5个月前0350
小模型挑战AI巨兽:抖音联手LV-NUS推出超高效SAIL-VL2 抖音SAIL团队与新加坡国立大学LV-NUS实验室联合推出SAIL-VL2多模态模型。这款仅2B/8B参数的中小规模模型在106个数据集中表现出色,在复杂推理任务上媲美GPT-4o。通过三大技术创新... AI广播站 5个月前0690
人工智能里程碑:DeepSeek跻身2025全球十大工程成就榜 世界工程组织联合会公布2025年度全球十大工程成就,中国DeepSeek开源大语言模型与抗体偶联药物、英伟达Blackwell架构等重大突破共同入选。这一权威评选展示了近五年全球工程科技最重大创新成果... AI广播站 5个月前0390
AI难解“高级废话”:曼彻斯特大学研究揭示大语言模型幽默感缺失 曼彻斯特大学研究团队创建“Drivelology”新领域,专门测试AI对高深废话的理解能力。研究显示,大语言模型在识别含讽刺、悖论与隐喻的“废话文学”时表现不佳,最佳模型准确率仅81.67%,揭示AI... AI广播站 5个月前0540
阿里Qoder上新“一键增强提示词”,开发者与AI对话门槛再降 Qoder推出"一键增强提示词"功能,通过智能优化开发者输入的提示词,显著提升AI代码生成的准确性和效率。该功能进一步降低了开发者使用AI编程工具的门槛,让模糊需求也能快速转化为精准代码,助力开发者在... AI广播站 5个月前0870
企业AI预算飙升75%,从“创新试水”转向“核心投资” a16z最新《企业如何采购AI》报告揭示,2025年企业AI预算预计增长75%,永久性IT预算占比从28%升至39%。报告显示AI支出正从“创新试水”转向“核心投资”,37%企业使用五种以上模型,Op... AI广播站 5个月前0480
一键部署,分钟级开发!谷歌Gemini CLI联手FastMCP重构AI开发效率 谷歌Gemini CLI与FastMCP深度整合,实现MCP服务器一键部署。开发者只需一条终端指令,即可完成安装配置全流程,将传统部署效率提升98.6%。这项革命性技术通过智能协议适配和动态命名空间管... AI广播站 5个月前0390
微软推出UserLM-8b对话模型,AI训练迎来专业“陪练” 微软最新推出UserLM-8b专业对话模型,专门模拟真实用户对话行为,为AI助手提供高度逼真的多轮对话训练环境。该模型能生成渐进式对话内容,自主判断对话终点,显著提升AI助手在复杂交互场景中的表现和可... AI广播站 5个月前01080