全球上线!Gemini应用推出AI视频“验真”功能,一键识别虚假内容 谷歌Gemini应用推出全新视频检测功能,可快速验证视频是否由其AI技术生成。该功能基于SynthID数字水印技术,支持全球用户免费使用,并计划未来兼容C2PA行业标准,旨在应对日益严重的深度伪造挑战... AI广播站 3个月前0620
苹果发布“三合一”AI视觉模型,UniGen 1.5实现理解、生成与编辑三位一体 苹果公司发布新一代多模态AI模型UniGen 1.5,成功将图像理解、生成与编辑三大核心功能整合于单一系统。该模型在多项基准测试中表现优异,其创新的“编辑指令对齐”技术能精准理解并执行复杂修改指令,标... AI广播站 3个月前0210
Meta战略转向:大幅削减元宇宙预算,全力押注Mango等新一代AI模型 Meta宣布战略重心转向人工智能,计划于2026年上半年发布代号为“Mango”的新一代图像视频AI模型及文本模型“Avocado”。为实现此目标,公司计划大幅削减元宇宙部门预算,并加速自研AI芯片... AI广播站 3个月前0140
用户协议三度修改,腾讯元宝“割地赔款”背后:数据主权的攻防战 腾讯AI助手“元宝”因用户协议中的版权条款引发争议,赋予公司对用户内容广泛且永久的授权。面对质疑,腾讯在五天内三度修改协议,最终确立“体验优化计划”开关默认关闭,将数据控制权交还用户。事件折射出AI时... AI广播站 3个月前01350
Adobe被控窃书养AI:作家集体诉讼揭训练数据版权黑箱 软件巨头Adobe近日在加州联邦法院遭遇作家集体诉讼,被指控在训练其SlimLM人工智能模型时非法使用了包含约19.1万本盗版书籍的“Books3”数据集。此案揭露了AI行业训练数据来源的版权“黑箱... AI广播站 3个月前0180
开源AI新突破:艾伦研究所推出能“看懂”视频的Molmo 2模型,性能比肩科技巨头 艾伦人工智能研究所近日发布了新一代开源视频语言模型Molmo 2。该模型不仅能“看懂”视频内容,精准追踪物体和事件,还在性能上超越了其前身及部分更大规模的模型。Molmo 2的推出,标志着开源AI在视... AI广播站 3个月前01020
前英国财相挂帅,OpenAI“星际舰队”开启全球主权AI扩张 OpenAI任命英国前财政大臣乔治·奥斯本领导其“OpenAI for Countries”全球战略。该计划旨在与约50个国家洽谈合作,协助各国发展“主权人工智能”,是价值5000亿美元“星际之门”项... AI广播站 3个月前0170
AI浏览器浪潮中的“逆行”者:Firefox以用户主权开启智能新篇 本文报道了Mozilla公司新任CEO宣布将Firefox转型为“现代AI浏览器”的最新战略。与主流AI浏览器不同,Firefox强调用户主权与选择权,其AI功能均可关闭且允许用户自选模型。文章分析了... AI广播站 3个月前0130
从聊天框开始的美食革命:DoorDash用AI社交应用重塑餐厅发现体验 美国外卖巨头DoorDash正式推出独立AI社交应用Zesty,旨在通过对话式AI聊天帮助用户个性化发现本地餐厅。目前该应用已在旧金山和纽约开始测试,标志着DoorDash从外卖配送向本地生活发现与社... AI广播站 3个月前0190
阿联酋科技巨头破冰语言壁垒:开源大模型NANDA 87B为6亿印地语使用者打开AI大门 阿联酋科技巨头G42发布开源双语大模型NANDA 87B,拥有87亿参数,专为6亿印地语使用者优化。基于Llama-3.1架构,它旨在打破语言壁垒,提供文化适配的AI能力,并完全开源以推动全球创新。 AI广播站 3个月前0140
校园“千问”热:功能全免费,学生惊呼省出一台iPad 阿里千问App以完全免费的功能在校园迅速走红,覆盖论文写作、作业批改、资料整理等学习全流程。学生计算发现,一年可节省近2000元订阅费,相当于一台iPad的价格。期末季使用量激增,AI学习工具正悄然改... AI广播站 3个月前0130
全球人工智能国家实力盘点:美国领跑,中国追赶,格局生变 最新全球人工智能竞争力评估显示,美国以显著优势位居榜首,中国凭借规模优势和独特路径紧随其后。本文深入分析中美两国在AI研究、投资、算力及产业应用等关键维度的表现,揭示全球人工智能多极化竞争格局与未来集... AI广播站 3个月前01490
AI凝视历史:Karpathy实验警示,十年网络言论已成未来智能体“审判”素材 OpenAI创始成员Andrej Karpathy进行了一项前瞻性实验:用今日的AI系统,对十年前Hacker News上的近千条用户评论进行重审和评分。这项实验不仅揭示了历史言论在智能时代的“可验证... AI广播站 3个月前090
阿里“百聆”升级:仅需3秒录音,AI语音可自由切换9种语言与情感 阿里巴巴通义大模型团队近日推出升级版“通义百聆”语音模型,仅需用户3秒以上录音即可高精度克隆音色,实现9种通用语言、18种方言的语音合成与情感控制。该模型已开源,支持本地部署,将应用于会议转写、多语言... AI广播站 3个月前0900
商汤发布Seko 2.0:AI视频智能体突破长剧连贯性瓶颈,动画制作迈入“奶茶价”时代 商汤科技发布Seko 2.0 AI视频智能体,实现一句话生成百集人物一致、剧情连贯的动画。该技术将动画制作门槛降至“奶茶价”,并已开始与专业影视公司合作,标志着AI视频生成迈入支撑专业长叙事的新阶段。 AI广播站 3个月前03020
魔法与代码共舞:迪士尼如何用AI“熔炉”重铸创意未来 迪士尼正将人工智能提升至战略核心,从幕后制作的AI工具到面向未来的“贾维斯”式创意助手,系统化构建智能创意生态系统。这不仅极大提升了内容生产效率,更在探索人机协同创作的新模式,旨在重塑造梦工厂的创意未... AI广播站 3个月前0250
Figma AI赋能设计革命:图像编辑迈入“一站式”智能时代 Figma重磅发布原生AI图像编辑功能,集一键消除、智能抠图、画布扩展于一体,将高级修图能力无缝集成到设计流程中。这彻底改变了设计师在多个软件间切换的繁琐,标志着“一站式”智能设计时代的到来,为全球设... AI广播站 3个月前090
AI工具链再进化:阿里Qwen Code v0.3.0发布,双语界面与流式JSON重塑开发者体验 阿里通义千问推出Qwen Code v0.3.0,为开发者带来Stream JSON模式与双语界面等核心升级。新版本通过流式结构化输入输出优化自动化与CI/CD体验,并内置中英文界面支持全球化协作。此... AI广播站 3个月前0250
Meta AI战略急转:闭源之路靠阿里Qwen铺就,扎克伯格亲督“超级智能”攻坚 本文披露了Meta公司人工智能战略的重大转向。其原计划开源的“牛油果”前沿模型被推迟,并可能转为闭源发布,标志着其开源路线逆转。文章揭示了该模型训练中借用了包括阿里Qwen在内的外部技术,并分析了伴随... AI广播站 3个月前0290
NotebookLM Ultra会员权限大幅扩容,AI笔记领域高端化竞争开启 谷歌对旗下AI笔记工具NotebookLM进行重大升级,其高端Ultra会员的生成限额提升至免费版的50倍,并解锁顶级Gemini模型与无水印PPT生成等专业功能。此举标志着AI生产力工具正加速向企业... AI广播站 3个月前0130
谷歌以“操作系统级”研究智能体反击,开放API争夺开发者心智 谷歌于OpenAI发布GPT-5.2同日,强势推出新版深度研究智能体Gemini Deep Research并首次开放Interactions API。此举将顶尖研究能力赋予开发者,旨在争夺下一代AI... AI广播站 3个月前090
从声音克隆到角色永存:AI双雄同日亮剑,开启生成式AI新战局 2025年12月8日,阿里巴巴推出Qwen3-TTS语音模型,实现了多语言、多音色的高品质语音合成;与此同时,快手的可灵AI上线“主体库”功能,为视频模型赋予了角色长期记忆。两项技术的同日发布,从听觉... AI广播站 3个月前0100
AI算法“炼金术”:谷歌DeepMind发布AlphaEvolve,自主进化代码攻克数世纪难题 谷歌DeepMind重磅推出进化式编程智能体AlphaEvolve。这一AI驱动的“算法设计师”不仅能攻克困扰人类数百年的数学难题(如改进“接吻数问题”),更能自主优化谷歌数据中心的调度系统与TPU芯... AI广播站 3个月前0130
五角大楼全面押注AI:新平台GenAI.mil将谷歌技术送抵300万军职人员手中 美国国防部正式推出专属AI平台GenAI.mil,并整合谷歌“政府版双子座”系统。该平台将面向300万军事及文职人员,旨在提升从行政后勤到作战规划的全面效率,标志着五角大楼在“新半人马”人机协同作战模... AI广播站 3个月前02520
可灵Avatar 2.0引爆创作革命:情感数字人登场,五分钟打造专属MV 快手旗下KlingAI正式发布Avatar 2.0,该技术实现了AI数字人从“面瘫”到情感化表演的飞跃。用户仅凭一张照片和一段音频,即可5分钟内生成表情生动、肢体动作自然的唱跳视频。这不仅将重塑短视频... AI广播站 3个月前0520
革命性一步:Claude Code进驻Slack,编程工作流在聊天界面中“一键闭环” Anthropic宣布其AI编程助手Claude Code深度集成至Slack平台。开发者现可在日常沟通的聊天环境中,通过标记@Claude,委托并完成从需求理解到代码提交的全流程编程任务。这标志着A... AI广播站 3个月前0150
AI助手“灵光”上线网页版:从“陪聊”到“造工具”,开启多端生态新战场 蚂蚁集团全模态AI助手“灵光”正式上线网页版,完成多端生态布局。该产品以“30秒生成可交互应用”为核心,上线初期用户增长迅猛,通过三大功能模块与“1+N”技术架构,正推动AI从“对话”到“造物”的范式... AI广播站 3个月前01440
迈向通用智能的关键一步:DeepMind掌门人勾勒2026年AI三大变革 谷歌DeepMind首席执行官德米斯·哈萨比斯预测,2026年AI将迎来三大关键变革:多模态模型实现深度理解、世界模型创造可互动的虚拟空间,以及AI代理接近自主处理复杂任务。这些进展标志着我们正稳步迈... AI广播站 3个月前0270
苹果颠覆视频生成游戏规则:STARFlow-V模型开启“归一化流”新纪元 苹果公司近日开源了颠覆性的视频生成模型STARFlow-V。它摒弃了行业主流的扩散模型技术,采用了创新的“归一化流”架构,旨在解决长视频生成中的连贯性难题。该模型能原生执行文本生成视频、图像生成视频等... AI广播站 3个月前0150
筑牢AI浏览安全防线:Perplexity开源BrowseSafe,直面新型网络攻击 Perplexity开源推出BrowseSafe安全系统,旨在为AI浏览器代理抵御日益复杂的网络内容操控与提示注入攻击。该系统采用三层防御架构,声称检测率高达91%,并公开基准以促进行业协作。本文深入... AI广播站 3个月前090