开源多模态模型迎来新突破,LLaVA-OneVision-1.5性能超越业界标杆 开源多模态模型LLaVA-OneVision-1.5近日发布,在多项基准测试中超越Qwen2.5-VL。该模型采用创新视觉编码器和三阶段训练流程,仅用4天训练时间和1.6万美元成本就实现突破,为AI社... AI广播站 6个月前0710
诺奖得主阿吉翁:AI如何重塑经济增长新范式 人工智能正在重塑全球经济增长范式。诺贝尔经济学奖得主阿吉翁指出,AI通过"创造性破坏"机制推动经济发展,既带来效率提升也伴随转型挑战。在1509个中国大模型引领全球创新的背景下,政策制定需平衡创新激励... AI广播站 6个月前0850
创作者福音!Lovart限时免费解锁Sora2,高质量AI视频触手可及 设计AI平台Lovart宣布限时免费集成OpenAI Sora2模型,用户每日可享5次普通生成和1次Pro生成,全部输出无水印视频。这一举措大幅降低高质量AI视频创作门槛,推动技术普及,被业内视为AI... AI广播站 6个月前01960
AI大模型锁定抗癌新靶点,谷歌耶鲁联手将“冷”肿瘤变“热” 谷歌DeepMind与耶鲁大学联合推出270亿参数AI模型C2S-Scale,该模型成功筛选出能将"冷肿瘤"转化为"热肿瘤"的关键药物,并在实验室验证中显著增强抗原呈递。这项突破证明AI不仅能分析数据... AI广播站 6个月前0810
具身智能迎来“ImageNet时刻”:全球首个真机基准测试平台RoboChallenge正式开放 RoboChallenge作为全球首个真实物理环境多任务机器人基准测试平台正式发布。这一突破性项目解决了算法从仿真到现实的评估难题,通过远程API控制真实机器人执行30项复杂任务,为全球研究者提供公平... AI广播站 6个月前01080
AI重构标准化工作!国内首个标准大模型“同道”上线 国内首个标准大模型“同道”互联网版正式发布,标志着我国标准化工作迈入AI驱动新阶段。该模型具备智能问答、文稿编写、深度解读与辅助认证四大核心功能,旨在彻底改变传统“人找标准”的低效模式,为用户提供覆盖... AI广播站 6个月前01860
OpenAI激进押注基础设施,萨姆·奥特曼构建AI帝国蓝图 在最新a16z访谈中,OpenAI CEO山姆·奥特曼宣布公司正进行"激进的基础设施押注",从芯片合作到能源布局全面垂直整合。他透露AI科学家将成为改变游戏规则的关键,并分享了对Sora商业模式、能源... AI广播站 7个月前0720
EVM十字路口:以太坊架构变革下的生态繁荣与未来挑战 以太坊虚拟机(EVM)正面临技术转折点。在核心开发者考虑用RISC-V架构替代EVM的同时,Base、BNB等EVM兼容链生态却呈现爆发式增长,周活跃地址超千万。本文探讨EVM在架构革新与生态繁荣十字... AI广播站 7个月前0570
小模型挑战AI巨兽:抖音联手LV-NUS推出超高效SAIL-VL2 抖音SAIL团队与新加坡国立大学LV-NUS实验室联合推出SAIL-VL2多模态模型。这款仅2B/8B参数的中小规模模型在106个数据集中表现出色,在复杂推理任务上媲美GPT-4o。通过三大技术创新... AI广播站 7个月前0920
人工智能里程碑:DeepSeek跻身2025全球十大工程成就榜 世界工程组织联合会公布2025年度全球十大工程成就,中国DeepSeek开源大语言模型与抗体偶联药物、英伟达Blackwell架构等重大突破共同入选。这一权威评选展示了近五年全球工程科技最重大创新成果... AI广播站 7个月前0600
AI难解“高级废话”:曼彻斯特大学研究揭示大语言模型幽默感缺失 曼彻斯特大学研究团队创建“Drivelology”新领域,专门测试AI对高深废话的理解能力。研究显示,大语言模型在识别含讽刺、悖论与隐喻的“废话文学”时表现不佳,最佳模型准确率仅81.67%,揭示AI... AI广播站 7个月前0930
阿里Qoder上新“一键增强提示词”,开发者与AI对话门槛再降 Qoder推出"一键增强提示词"功能,通过智能优化开发者输入的提示词,显著提升AI代码生成的准确性和效率。该功能进一步降低了开发者使用AI编程工具的门槛,让模糊需求也能快速转化为精准代码,助力开发者在... AI广播站 7个月前01140
企业AI预算飙升75%,从“创新试水”转向“核心投资” a16z最新《企业如何采购AI》报告揭示,2025年企业AI预算预计增长75%,永久性IT预算占比从28%升至39%。报告显示AI支出正从“创新试水”转向“核心投资”,37%企业使用五种以上模型,Op... AI广播站 7个月前0830
一键部署,分钟级开发!谷歌Gemini CLI联手FastMCP重构AI开发效率 谷歌Gemini CLI与FastMCP深度整合,实现MCP服务器一键部署。开发者只需一条终端指令,即可完成安装配置全流程,将传统部署效率提升98.6%。这项革命性技术通过智能协议适配和动态命名空间管... AI广播站 7个月前0700
微软推出UserLM-8b对话模型,AI训练迎来专业“陪练” 微软最新推出UserLM-8b专业对话模型,专门模拟真实用户对话行为,为AI助手提供高度逼真的多轮对话训练环境。该模型能生成渐进式对话内容,自主判断对话终点,显著提升AI助手在复杂交互场景中的表现和可... AI广播站 7个月前01410
生活助手而非工作伙伴:最新研究揭示GPT真实用户画像 最新研究报告显示,ChatGPT已深入日常生活,非工作用途使用量占比高达73%,同比增长38%。全球月活用户突破7亿,覆盖全球成年人口10%。消费者主要将AI用于日常咨询、任务协助和个人表达,其中亚洲... AI广播站 7个月前0630
卡帕西揭秘AI未来:软件3.0时代与“半自主”智能体崛起 在最新闭门演讲中,AI领域权威专家卡帕西指出AGI实现需直面三大现实挑战:软件3.0时代的范式变革、大模型存在的认知缺陷,以及构建实用半自主系统的必要性。他强调未来的关键在于人机协作,而非追求完全自主... AI广播站 7个月前0630
叙事革命!Veo 3.1突破AI视频创作壁垒,实现角色一致性与多场景连贯生成 谷歌Veo 3.1于2025年10月重磅升级,首次解决生成式视频中角色形象断裂、场景逻辑跳跃等核心痛点。新模型支持最长1分钟1080P视频生成,结合多镜头提示与自动音画同步,可一键生成电影级多场景叙事... AI广播站 7个月前01790
万亿参数模型新标杆!蚂蚁Ling-1T以“高效推理”破局 蚂蚁集团发布万亿参数大模型Ling-1T,以高效推理能力突破行业瓶颈。该模型基于MoE架构,在多项基准测试中表现卓越,仅用更少计算资源实现70.42%的数学推理准确率。通过FP8训练与创新对齐算法,L... AI广播站 7个月前0890
迷你模型突破设备限制,Jamba Reasoning 3B重塑边缘AI未来 AI21实验室发布开源小模型Jamba Reasoning 3B,这款仅30亿参数的迷你语言模型突破设备限制,可在手机和笔记本电脑上运行,却拥有处理100万token的超长上下文能力,性能超越多个知名... AI广播站 7个月前0720
OpenAI双线出击:打造纯AI版抖音,ChatGPT变身购物助手 OpenAI正从技术提供商向应用平台加速转型,同时推出由Sora 2驱动的独立短视频应用和在ChatGPT中集成即时购物功能。这一双线布局标志着AI巨头正直接面向消费者市场,但其版权策略已引发争议。 AI广播站 7个月前0720
微软开启智能办公新时代,AI助手能否重塑工作未来? 微软正式推出“氛围办公”理念,通过代理模式和Office代理将AI深度融入Office套件,实现工作方式革命性变革。然而效率提升背后,准确率局限与数据隐私风险亦不容忽视。 AI广播站 7个月前0660
财务团队解放!40%工作时间因AI智能代理重获 两位前微软高管创立的Maximor公司宣布获得900万美元种子轮融资,推出AI财务智能代理平台,帮助财务团队减少对Excel的依赖,将结账时间缩短一半,释放40%团队能力投入战略性工作,重塑财务管理的... AI广播站 7个月前01030
特斯拉按下“擎天柱”量产加速键,马斯克预言其价值占比将超八成 特斯拉正加速推进人形机器人"擎天柱"的量产进程,马斯克称其未来将贡献公司80%价值。根据最新计划,特斯拉将在2025年生产5000台第三代Optimus,2026年提升至5万台。目前特斯拉正在构建完整... AI广播站 7个月前02580
苹果内部测试“Veritas”聊天机器人,加速Siri变革进程 苹果正秘密测试内部聊天机器人“Veritas”,旨在推动Siri全面升级。该工具支持多轮对话与个性化任务测试,但暂不向公众开放。面对技术挑战与团队重组,苹果计划于2026年推出新一代Siri,试图在A... AI广播站 7个月前0710
腾讯混元图像3.0全面开源!800亿参数多模态模型重塑AIGC生态 2025年9月28日,腾讯混元正式推出并开源原生多模态图像生成模型"混元图像3.0"。这款参数规模高达800亿的模型是首个工业级开源多模态生图模型,支持千字级复杂语义解析与长文本生成,效果对标业界头部... AI广播站 7个月前03170
粗糙几何体秒变逼真3D视频!VideoFrom3D技术颠覆传统图形设计流程 VideoFrom3D技术正在重塑3D图形设计的工作流程。这项突破性技术仅需输入粗糙几何体、相机轨迹和参考图像,就能生成高度逼真且风格一致的3D场景视频,大幅降低了3D内容创作门槛,为设计师和创作者带... AI广播站 7个月前01300
参数仅激活20亿,视觉语言模型Moondream 3预览版性能比肩GPT-5 Moondream 3以仅20亿激活参数的轻量化设计,在多项基准测试中媲美GPT-5等顶级模型。这款开源视觉语言模型采用混合专家架构,为边缘计算和实时视觉应用开辟了新路径,标志着AI模型从追求参数规模... AI广播站 7个月前01450
DeepSeek V3.1终极版震撼发布:关键漏洞全面修复,V4架构升级引业界期待 DeepSeek V3.1终极版正式发布,全面修复语言一致性漏洞,显著提升Agent能力。新版本在多项基准测试中表现卓越,性能提升高达36.48%,为V4新架构铺平道路。这款6710亿参数模型以更具竞... AI广播站 7个月前0940
AI闯入专业领域:GPT-5在工作质量上逼近人类专家 AI技术正以前所未有的速度逼近人类专业水平。OpenAI最新测试显示,GPT-5在医疗、金融等九大行业的40.6%任务中表现媲美人类专家,标志着人机协作新时代的来临。 AI广播站 7个月前0880