苹果颠覆视频生成游戏规则:STARFlow-V模型开启“归一化流”新纪元 苹果公司近日开源了颠覆性的视频生成模型STARFlow-V。它摒弃了行业主流的扩散模型技术,采用了创新的“归一化流”架构,旨在解决长视频生成中的连贯性难题。该模型能原生执行文本生成视频、图像生成视频等... AI广播站 5个月前0300
筑牢AI浏览安全防线:Perplexity开源BrowseSafe,直面新型网络攻击 Perplexity开源推出BrowseSafe安全系统,旨在为AI浏览器代理抵御日益复杂的网络内容操控与提示注入攻击。该系统采用三层防御架构,声称检测率高达91%,并公开基准以促进行业协作。本文深入... AI广播站 5个月前0260
高德“AI停车雷达”上线,破解“最后一百米”停车难题 高德地图近日在北京率先上线“AI停车雷达”功能,利用AI技术对全市数万个道路车位的空闲状态进行分钟级预测与实时显示,直接解决用户寻找路边车位的核心痛点。该功能标志着出行服务从引路到找位的闭环形成,为智... AI广播站 5个月前0710
以小博大!英伟达8亿参数“指挥家”模型登场,开启AI智能体新范式 英伟达与港大联合发布仅80亿参数的Orchestrator模型及ToolOrchestra框架。该模型作为智能“指挥家”,能高效协调调用各类专业工具与大模型解决复杂问题。测试显示,其性能超越传统方法... AI广播站 5个月前0390
OpenAI发布“永动机”编程模型:AI程序员可24小时不眠不休,成本骤降三成 OpenAI正式发布新一代智能体编程模型GPT-5.1-Codex-Max。它凭借革命性的“上下文压缩”技术,能连续工作超过24小时,处理数百万token的复杂任务,将编程效率推向新高度。该模型在多项... AI广播站 5个月前0370
安卓进化史翻开新篇章:一年双更时代开启,AI让通知变“智能管家” 谷歌正式打破17年传统,为Pixel设备推送Android 16第二波更新,开启“一年双更”时代。本次更新核心是AI驱动的智能通知管理:可自动摘要冗长消息、静音归档低优先级通知。同时增强家长控制与个性... AI广播站 3个月前0220
硅谷“浓汤攻防战”:一勺汤里的万亿级人才争夺战 硅谷AI人才争夺战出现新奇一幕:Meta为挖角OpenAI核心研究员,竟深夜送汤上门;OpenAI则以自制“浓汤”回礼留才。这场“浓汤攻防战”背后,是Meta开出“四年三亿美元”天价薪酬的猛烈攻势,与... AI广播站 5个月前0320
AI视频上演“大卫战歌利亚”,百人团队新模型逆袭科技巨头 Runway公司全新发布的Gen-4.5视频生成模型在权威独立评测Video Arena中力压谷歌、OpenAI等科技巨头,荣登榜首。这款专注于短视频场景的AI工具在物理世界模拟和视觉一致性上实现突破... AI广播站 5个月前0370
一句话当导演:国产AI视频大模型实现叙事与音画同步直出 爱诗科技发布国内首个“导演级”AI视频大模型PixVerse V5.5(拍我AI V5.5),实现从单一镜头到完整多镜头叙事的技术跃迁。新模型支持音画同步一键生成,具备自动分镜与运镜能力,将专业视频制... AI广播站 5个月前0950
“动口”造App:全民零代码革命,两周催生330万AI应用 蚂蚁集团旗下AI助手“灵光”App上线两周,用户通过自然语言对话创造了超过330万个“闪应用”,覆盖健身、育儿、娱乐等多个生活场景。这标志着AI技术正从专业开发走向全民零代码创造,掀起了一场软件开发的... AI广播站 5个月前0380
Meta AI发布Matrix框架,多智能体合成数据生成吞吐量飙升15倍 Meta AI最新推出Matrix框架,通过去中心化架构彻底革新多智能体合成数据生成。该框架采用分布式队列和消息传递机制,突破传统中心调度器瓶颈,在相同硬件资源下实现2-15倍的吞吐量提升,为大型语言... AI广播站 5个月前0370
GPT-5破解数学界三十年谜题,AI协作者时代已至 GPT-5在数学研究领域取得突破性进展,不仅通过严格的"哥德尔测试",破解多项数学猜想,更在47秒内识别出潜藏30年的理论漏洞。这项技术正重塑科研范式,数学家陶哲轩将其比作"指导一名平庸但并非完全无能... AI广播站 5个月前0360
家用机器人F1亮相:能收纳能陪学,明年初售价不到两万 国产家庭机器人F1即将上市,采用独特轮式双机械臂设计,专为中国家庭空间优化。具备收纳、清洁、教育陪伴等多项功能,单臂负载5公斤,续航超8小时。明年初售价不到两万元,致力于成为家庭多功能智能助手。 AI广播站 5个月前01210
当审稿人也用上AI:一场席卷顶会ICLR的学术诚信风暴 全球顶尖AI会议ICLR 2026陷入风波。数据显示,超1.5万份审稿意见及部分投稿由AI代写,引发学术界对评审质量与诚信的担忧。会议组织者紧急出台政策,严禁滥用AI并追究责任,揭示了AI繁荣背后同行... AI广播站 3个月前0410
AI需求暴增,谷歌悄然收紧免费Gemini服务 本文报道了谷歌因需求激增与产能瓶颈,悄然收紧Gemini 3 Pro及Nano Banana Pro免费用户使用限制的事件。文章分析了这一调整的具体内容及其背后的行业背景,指出全球AI大模型正面临从疯... AI广播站 5个月前0410
昆仑万维双模齐发:Mureka V7.6与O2开启AI音乐创作新纪元 昆仑万维正式发布Mureka V7.6与O2两款AI音乐模型,在音乐性、编曲能力及音质上实现全面突破。新模型通过优化推理架构,提供了更轻量、流畅的实时生成体验,标志着AI音乐创作正式进入“专业品质×实... AI广播站 5个月前0680
AI浪潮席卷职场,MIT研究揭示千万岗位已达技术替代临界点 麻省理工学院最新研究利用“冰山指数”揭示,人工智能已触及美国11.7%劳动力的替代临界点,影响范围远超科技行业,深入内陆各州。同时,年轻劳动者首当其冲,就业率显著下降。此研究为政策制定者提供了精准地图... AI广播站 5个月前0890
AI编程新纪元:Trae中国版推SOLO模式,开发者变身“指挥官” Trae SOLO中国版正式上线,推出Plan模式、Sub Agent等五大新功能,通过"先规划后执行"的智能体协同模式,彻底改变AI编程工作流程。该工具完全免费,支持多任务并行和上下文压缩,有效解决... AI广播站 5个月前0730
AI赛道现新局:OpenAI加速迭代,小米开源“具身”模型,国产应用“灵光”闪耀 本文报道了AI领域的最新动态:OpenAI宣布将终止GPT-4o的API服务,推动开发者向GPT-5.1迁移;小米则开源其创新的跨域具身大模型MiMo-Embodied;同时,国产应用“灵光”上线6天... AI广播站 5个月前0600
阿尔巴尼亚任命全球首位AI“部长”,算法能否根除腐败? 阿尔巴尼亚任命全球首位AI虚拟人物“迪埃拉”为部长,旨在根治公共采购领域的腐败顽疾。这一大胆的政治实验引发了关于算法决策合法性、技术风险与责任归属的全球性讨论,挑战了传统治理模式的边界。 AI广播站 5个月前0420
字节跳动发布TRAE SOLO中国版,AI编程进入“全流程自动化”时代 字节跳动正式发布TRAE SOLO中国版,并向开发者免费开放。其核心的SOLO Coder智能体实现了从需求到代码的全流程自动化开发,支持多任务并行与上下文压缩,有效解决了复杂项目迭代与AI模型失焦问... AI广播站 3个月前0960
全模态AI实现突破,昆仑元Blaze-Omni-14b模型重塑人机交互界限 昆仑元AI在世界计算大会推出全模态融合模型BaiZe-Omni-14b-a2b,突破性实现文本、音频、图像和视频的理解与生成。该模型采用创新架构,在多项核心指标超越行业主流模型,将为智能客服、内容创作... AI广播站 5个月前0600
AI芯片格局生变,AMD平台成功训练大型MoE模型 全球首个完全基于AMD计算平台训练的大型混合专家模型ZAYA1正式发布。该模型在1024块AMD Instinct MI300X GPU上完成训练,采用创新的CCA注意力机制和线性路由技术,在数学推理... AI广播站 5个月前0430
智能客服迎来革新!美团WOWService突破大模型落地困境 美团LongCat团队推出WOWService大模型交互系统,通过多智能体协同、强化学习等技术创新,解决了大模型在本地生活服务领域的落地难题。该系统已覆盖美团数十个业务场景,显著提升了智能客服的响应速... AI广播站 5个月前0720
重塑创作边界:ElevenLabs打造首个多模态AI内容生产生态 ElevenLabs推出革命性多模态AI内容生成平台,整合图像、视频、语音和音乐生成功能。这一创新解决方案彻底改变了传统内容创作流程,为创作者提供一站式工作平台,大幅降低技术门槛,开启AI辅助创作新时... AI广播站 5个月前0760
三行代码开启智能未来!OceanBase开源AI数据库seekdb,实现百亿级多模数据混合搜索 OceanBase正式发布并开源首款AI数据库seekdb,支持向量、全文、标量及空间地理数据的统一混合搜索。开发者仅需三行代码即可构建百亿级AI应用,实现从“业务支撑系统”向“AI原生数据入口”的范... AI广播站 5个月前0520
谷歌DeepMind发布SIMA 2,智能体学会自主思考征战虚拟世界 谷歌DeepMind推出SIMA 2预览版,这款全新通用智能体在3D虚拟环境中展现出突破性能力。它不仅能够理解复杂指令并自主推理,还能适应未知环境,通过自生成数据循环实现持续进化。这一技术进步为未来机... AI广播站 5个月前0670
三图融合,秒生创意视频:谷歌Gemini Veo 3.1开启AI视频新纪元 谷歌Gemini Veo 3.1推出革命性“多图参考”功能,用户可同时输入人物、场景、风格三张图片,AI即可快速合成一段角色一致、光影连贯的8秒高清视频。此举攻克了AI视频生成的跨帧一致性难题,大幅降... AI广播站 5个月前0560
谷歌NotebookLM重磅升级:图像秒变知识库,板书手写体无所不识 谷歌NotebookLM最新升级支持图像导入功能,通过OCR和语义理解技术将板书、手写笔记等图像内容转化为可检索知识库。该更新还新增深度研究功能和文件格式扩展,未来将集成AR眼镜实时拍摄接口,重塑人与... AI广播站 5个月前0770
上线一个月吸引50万用户,AI Agent市场MuleRun 2.0引爆全球热潮 全球首个AI Agent交易市场MuleRun 2.0上线30天用户突破50万,美国用户占比最高达27.43%。该平台创新推出"Agent团队"模式,为用户提供电商设计、数据分析、内容创作等多元化AI... AI广播站 5个月前0830