卡帕西揭秘AI未来:软件3.0时代与“半自主”智能体崛起
在最新闭门演讲中,AI领域权威专家卡帕西指出AGI实现需直面三大现实挑战:软件3.0时代的范式变革、大模型存在的认知缺陷,以及构建实用半自主系统的必要性。...
叙事革命!Veo 3.1突破AI视频创作壁垒,实现角色一致性与多场景连贯生成
谷歌Veo 3.1于2025年10月重磅升级,首次解决生成式视频中角色形象断裂、场景逻辑跳跃等核心痛点。新模型支持最长1分钟1080P视频生成,结合多镜头提示与自动音...
万亿参数模型新标杆!蚂蚁Ling-1T以“高效推理”破局
蚂蚁集团发布万亿参数大模型Ling-1T,以高效推理能力突破行业瓶颈。该模型基于MoE架构,在多项基准测试中表现卓越,仅用更少计算资源实现70.42%的数学推理准...
迷你模型突破设备限制,Jamba Reasoning 3B重塑边缘AI未来
AI21实验室发布开源小模型Jamba Reasoning 3B,这款仅30亿参数的迷你语言模型突破设备限制,可在手机和笔记本电脑上运行,却拥有处理100万token的超长上下文...
OpenAI双线出击:打造纯AI版抖音,ChatGPT变身购物助手
OpenAI正从技术提供商向应用平台加速转型,同时推出由Sora 2驱动的独立短视频应用和在ChatGPT中集成即时购物功能。这一双线布局标志着AI巨头正直接面向消费者...
微软开启智能办公新时代,AI助手能否重塑工作未来?
微软正式推出“氛围办公”理念,通过代理模式和Office代理将AI深度融入Office套件,实现工作方式革命性变革。然而效率提升背后,准确率局限与数据隐私风险亦不...
财务团队解放!40%工作时间因AI智能代理重获
两位前微软高管创立的Maximor公司宣布获得900万美元种子轮融资,推出AI财务智能代理平台,帮助财务团队减少对Excel的依赖,将结账时间缩短一半,释放40%团队...
特斯拉按下“擎天柱”量产加速键,马斯克预言其价值占比将超八成
特斯拉正加速推进人形机器人'擎天柱'的量产进程,马斯克称其未来将贡献公司80%价值。根据最新计划,特斯拉将在2025年生产5000台第三代Optimus,2026年提升至5...
苹果内部测试“Veritas”聊天机器人,加速Siri变革进程
苹果正秘密测试内部聊天机器人“Veritas”,旨在推动Siri全面升级。该工具支持多轮对话与个性化任务测试,但暂不向公众开放。面对技术挑战与团队重组,苹果计划...
腾讯混元图像3.0全面开源!800亿参数多模态模型重塑AIGC生态
2025年9月28日,腾讯混元正式推出并开源原生多模态图像生成模型'混元图像3.0'。这款参数规模高达800亿的模型是首个工业级开源多模态生图模型,支持千字级复杂...
粗糙几何体秒变逼真3D视频!VideoFrom3D技术颠覆传统图形设计流程
VideoFrom3D技术正在重塑3D图形设计的工作流程。这项突破性技术仅需输入粗糙几何体、相机轨迹和参考图像,就能生成高度逼真且风格一致的3D场景视频,大幅降低...
参数仅激活20亿,视觉语言模型Moondream 3预览版性能比肩GPT-5
Moondream 3以仅20亿激活参数的轻量化设计,在多项基准测试中媲美GPT-5等顶级模型。这款开源视觉语言模型采用混合专家架构,为边缘计算和实时视觉应用开辟了...
DeepSeek V3.1终极版震撼发布:关键漏洞全面修复,V4架构升级引业界期待
DeepSeek V3.1终极版正式发布,全面修复语言一致性漏洞,显著提升Agent能力。新版本在多项基准测试中表现卓越,性能提升高达36.48%,为V4新架构铺平道路。这...
AI闯入专业领域:GPT-5在工作质量上逼近人类专家
AI技术正以前所未有的速度逼近人类专业水平。OpenAI最新测试显示,GPT-5在医疗、金融等九大行业的40.6%任务中表现媲美人类专家,标志着人机协作新时代的来临。
通话换现金:Neon应用爆红背后的隐私危机,数万用户通话数据泄露后紧急下架
一款名为Neon Mobile的应用凭借'通话换现金'模式迅速冲上美区App Store社交榜第二,却被曝光存在严重安全漏洞,导致用户通话录音、转录文本和电话号码等敏感...
AI主导影视创作成真?爱奇艺宣布国内首个AI剧场,龚宇预言行业颠覆在即
爱奇艺CEO龚宇在2025 iJOY秋季悦享会上预言,AI技术将在2025年底至2026年间颠覆长短视频行业。平台宣布启动国内首个AI剧场,计划推出15分钟以上AI叙事影片,...
突破静态测试局限!Meta开源Gaia2挑战AI智能体真实环境适应性
Meta推出突破性Gaia2评估平台,通过1120个真实场景测试AI智能体在动态环境中的适应能力。该开源框架模拟手机操作、突发故障等复杂情况,揭示主流模型在七维指...
全球首发ViLLA架构,智元机器人开源GO-1大模型引爆具身智能革命
智元机器人正式开源其突破性的GO-1通用具身基座大模型。该模型采用创新的ViLLA架构,首次实现视觉-语言-动作的深度融合,能精准理解复杂指令并生成相应动作。...
腾讯云智能体开发平台3.0发布,企业级AI应用构建门槛大幅降低
腾讯云发布智能体开发平台3.0,实现RAG技术重大突破与企业级功能全面升级。新平台支持多智能体协同工作,大幅降低AI应用开发门槛,已在政务、酒店、营销等多...
小红书推出智能办公新作“hi”,AI助手赋能现代企业协同
小红书正式推出全新AI办公应用'hi',将内部办公系统升级为市场化产品。该应用集成智能助手hibo,具备信息总结、联网搜索等AI功能,支持多格式文档预览与无缝...
智慧赋能传播:新加坡媒体巨头AI战略引领新闻业变革
新加坡媒体机构正通过AI技术重塑新闻传播生态。从智能内容生成到精准分发热点分析,人工智能正在彻底改变传统新闻工作流程。各大通讯社通过保证线上报道机制...
视频生成赛道再现巨量融资!生数科技斩获数亿元加持多模态AI商业化
简介100个字 生数科技是一家专注于多模态大模型研发的人工智能企业,核心产品Vidu支持AI视频、图像与音频生成。公司近期完成数亿元A轮融资,8个月内实现年度...
马斯克AI团队核心骨干集体离职,管理风格引发内部危机
xAI是特斯拉CEO埃隆・马斯克创立的人工智能企业,专注于通用人工智能(AGI)研发。公司于2023年7月正式成立,核心团队来自DeepMind、OpenAI等顶尖机构,主要...
阿里开源全球最强动作生成模型,Wan2.2-Animate引爆数字创作革命
阿里巴巴通义万相团队开源全新动作生成模型Wan2.2-Animate,该模型可将静态图片转化为流畅动态视频,支持真实人物、动漫形象和动物照片。在性能评测中超越多...
阿里通义推出全球首个开源研究Agent模型,30B参数激活3B性能媲美顶级产品
人工智能正从“能聊天”向“会研究”跃迁,阿里通义开源的DeepResearch模型让复杂任务处理变得像搜索一样简单。 2025年9月17日,阿里巴巴通义实验室宣布开源其深...
阿里资本入局哈啰自动驾驶,出行产业智能化联盟加速扩张
阿里巴巴战略投资哈啰出行旗下Robotaxi业务,双方将深化智驾大模型、算力平台及自动驾驶出租车领域合作。此次合作依托阿里云技术和哈啰出行场景优势,加速L4...
语音AI迎来ImageNet时刻:逻辑智能开源LLaSO框架打破技术壁垒
逻辑智能发布全球首个开源语音大模型框架LLaSO,包含1200万语音文本对齐数据与1350万指令样本,覆盖20项语音任务。该框架突破语音AI技术壁垒,提供完整训练数...
谷歌突破性AI应用登陆移动端:离线畅享图像语音对话全能盛宴
谷歌AI Edge Gallery正式登陆Google Play,带来革命性离线AI体验。这款应用支持图像识别、语音合成和智能对话功能,所有处理均在设备端完成,无需网络连接,...
会议冲突有解了!腾讯会议AI托管重磅上线,支持多会议并行记录
当前文章的简介100个字 腾讯会议正式推出AI托管功能,通过腾讯元宝实现智能会议记录与多会议并行参与。该功能解决职场人会议时间冲突、迟到缺会等痛点,提供...
人类数据红利枯竭!图灵奖得主萨顿:AI正迈向自主学习的“经验时代”
人工智能正面临重大转折点!图灵奖得主理查德·萨顿在外滩大会上指出,人类数据红利即将枯竭,AI即将从依赖人类知识的时代,迈向通过与环境交互获得经验的'经...