Mistral AI发布OCR4 模型:支持 170 种语…

AI广播站2小时前更新 小悠
3 0 0

法国人工智能初创企业Mistral AI于本月 23 日正式推出最新文档内容识别模型OCR 4,在光学字符识别领域投下一枚重磅炸弹。这款小型聚焦模型支持横跨 10 个语族的多达 170 种语言,在权威基准测试OmniDocBench中斩获93. 07 分,输出质量相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受人类评审青睐。

OCR4 的定位并非追求参数规模,而是一个专精于文档识别的高效模型。它在输出识别文本的同时还能提供边框定位、区域分类及置信度评分,可广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载。

Mistral AI发布OCR4 模型:支持 170 种语言,输出质量超越GPT与Gemini

定价方面,OCR4 基础API调用为每千页 4 美元,若采用批处理方式可享受50%的折扣;而文档人工智能定价则为每千页 5 美元。

Mistral AI作为欧洲AI领域最具代表性的初创公司之一,此前已凭借开源与闭源并行的模型策略在全球市场崭露头角。此次推出OCR 4,将公司能力从通用大语言模型进一步延伸至文档智能处理这一垂直赛道,直接与OpenAI、Google等巨头在基础工具层展开竞争。

爱立信高管在达沃斯论坛指出,AI应用重心正从数字化大脑转向物理形态,物理AI被视为智能终极形态,现有投资集中于芯片与数据中心等基础算力,未来将实现AI从屏幕语言模型向物理世界的跨越。

谷歌要求新闻出版商授权使用其内容训练AI模型,用于谷歌新闻和Gemini摘要,若不同意则终止合作,出版商将失去展示机会。

AI代理日益自主化,执行多步任务时的稳定性成为关键。Patronus AI完成5000万美元B轮融资,总融资达7000万,由Meta前研究员创立,专注构建高仿真数字测试环境,确保AI智能体在现实中安全可靠运行。

OpenAI迫于美国政府监管压力,调整GPT-5.6发布策略,将采取分阶段模式,先面向经筛选的可靠合作方测试,反映出AI军备竞赛正引发新一轮政策干预。

美国信用卡分析机构Indagari数据显示,覆盖2800万名消费者的样本中,Anthropic旗下Claude产品付费笔数自2025年起持续攀升,消费金额较今年1月增长约75%,增速显著高于整体AI市场。拥有2000万用户的DataCamp平台数据也印证了这一热度飙升趋势。

Mistral AI发布OCR4 模型:支持 170 种语…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...