发布时间:2025-09-13 11:00:04 作者:zrcs 点击:9 【 字体:大中小 】
就在刚刚,欧洲那个曾经开源了首个 MoE 模型的发布欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。
Mistral 团队发布了一个号称“全世界最好的全世 OCR”的产品 —— Mistral OCR,旨在将一些 AI 难以直接识别的界最粗糙且复杂的文件进行整理,便于 AI 操作识别。友蹲
帖子一经发出,评论区瞬间充满了各种夸夸言论,开源但在一众赞美声中,欧洲也不乏一些真正用过产品的发布网友的理智发言。
就比如有网友对 Mistral OCR 的全世产品能力表示认同,但却有点接受不了它的界最产品定价,觉得有点太贵,友蹲并且期待中国 AI 公司早点发布一个类似的蹲中赵某网红翻车合集开源版本,把价格打下来。免费
同时也有网友亲自上手,上传扫描了手写板的内容,但最后识别出的文字结果正确率并不是很高。
除此之外,还有被 Mistral 所宣传的“可以识别超多种语言”噱头吸引过来的网友,但使用后却失望的发现它无法识别自己所用语言。
尽管 Mistral OCR 目前还存在着一定的局限性,但它的出现确实是一次从字符识别到场景智能的跨越。
与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。
从 Mistral AI 团队放出的 Demo 视频可以看出,Mistral OCR 能够将图文混排的 PDF 文件转换成结构清晰的 Markdown 格式文件。
例如表格+数字的 PDF 组合。
PDF 图片中数学公式的转换。
PDF 宣传图片中的印地语。
拍得并不方正的论文照片。
甚至带有水印的文字也可以轻松识别。
除了直观的 Demo 外,Mistral AI 团队还列举了 6 点 Mistral OCR 的绝对优势:
卓越的复杂文档解析能力:Mistral OCR 在理解复杂文档结构方面表现出色,能够精准解析交错的图像、数学公式、表格以及 LaTeX 等高级排版格式。这使其在处理包含图表、图形、公式和插图的科学论文等富文本文档时更具优势。
原生支持多语言与多模态:Mistral OCR 自带多语言和多模态处理能力,能够灵活应对不同语言以及多种类型的内容,无需额外适配。
行业领先的基准测试表现:在多项行业基准测试中,Mistral OCR 均取得优异成绩,充分展示了其强劲的性能和高准确度。
同类产品中处理速度最快:Mistral OCR 采用轻量化架构,处理速度远超同类产品,单节点每分钟可解析高达 2000 页文档。无论在高负载环境还是大规模数据处理中,它都能保持高效运行,确保稳定性能。
创新性的“文档即提示”结构化输出:Mistral OCR 率先引入“文档即提示”概念,使用户能够直接使用文档作为指令,以获取更加精准和定制化的结果。它还能输出 JSON 等结构化格式,便于与后续任务或自动化流程衔接,实现更智能的内容提取。
可选的自托管部署方案:针对数据隐私要求严格的企业或机构,Mistral OCR 提供自托管部署选项,确保敏感信息始终存储在本地基础设施内,满足合规性与安全性需求。
团队还将 Mistral OCR 将 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的产品性能进行对比。
最终的结果表明,Mistral OCR 在总体准确率、数学公式识别等方面表现优异,特别是在 2503 版本中,各项指标均大幅提升,达到了新的高度。
在多语言处理方面,得出的数据更是远远优于 Google Document AI 和 Azure OCR。
Mistral AI 是一家位于法国的初创公司,凭借其 AI 助手 Le Chat 和多个基础模型,已被官方视为法国最具前途的科技公司之一,并被认为是唯一有潜力与 OpenAI 竞争的欧洲企业。
Mistral AI 的三位创始人都拥有在全球顶级科技公司中积累的丰富 AI 研究经验。首席执行官 Arthur Mensch 曾在谷歌 DeepMind 部门工作,首席技术官 Timothée Lacroix 和首席科学家 Guillaume Lample 则曾是 Meta 的核心成员。凭借着强大的技术背景,Mistral AI 的创始团队带领公司迅速发展。
值得一提的是,雷峰网(公众号:雷峰网)得知自 2023 年成立以来,Mistral AI 在筹集资金方面取得了显著成绩,目标是将前沿 AI 技术普及给每个人,虽然这一目标并未直接挑战 OpenAI,但它强调了公司对于 AI 开放性的坚定支持。
作为 ChatGPT 的替代品,Mistral AI 推出了聊天助手 Le Chat,并在 iOS 和 Android 上成功上线。在发布后仅两周,Le Chat 的下载量便突破了 100 万次,并一度在 iOS App Store 中登顶法国免费下载榜单。
除此之外,截至 2025 年 2 月,Mistral AI 已筹集了约 10 亿欧元(约 10.4 亿美元)的资金,其中包括几轮股权融资和部分债务融资。尤其值得注意的是,在 2023 年 6 月公司发布首批模型之前,Mistral AI 就成功完成了创纪录的 1.12 亿美元种子轮融资,成为欧洲历史上最大的一轮种子融资,当时公司估值达 2.6 亿美元。
参考链接:
https://mistral.ai/fr/news/mistral-ocr
https://x.com/MistralAI/status/1897694143180112096
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
前京东 AI 掌门人周伯文也入局 ChatGPT,衔远科技正在招募合伙人
图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史
Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”
Viggle 获 a16z 领投 1900 万美元;华为启动 AI 百校计划,解决高校算力问题;字节成立大模型研究院丨AI情报局
南方电网发布首个「电力大模型」,百度智能云助力「智能电网」
OpenAI 又一位联创离职,公司动荡仍在持续?
百川智能完成 50 亿元 A 轮融资,北上深国资入局;OpenAI 挑战谷歌,发布 AI 搜索 SearchGPT丨AI情报局
OpenAI 终于发布 GPT
群核科技发布空间大模型,或解决视频生成时空一致性难题
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用
考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
视频生成赛道再添“猛将”,智谱清影正式上线
AI 大模型开源之困:垄断、围墙与算力之殇
可灵AI还是火到了马斯克那!
“知乎AI先行者沙龙”深圳站:探航大模型应用新风口
门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事
山海大模型发布:11年的积累,云知声如何翻越“山海”
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
AI 图像生成平台 LiblibAI 融资总额达数亿元;Meta 曝训练 Llama 3 每 3 小时「罢工」一次丨AI情报局
AI 搜索向左,搜索 OG 向右
亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局
100天后,阶跃星辰交出了第二份答卷
考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局
100天后,阶跃星辰交出了第二份答卷
GPT诸神之战,小巨头如何做大模型?
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
Soul创新多模态互动体验,携「异世界回响」亮相WAIC2024
图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史
首发丨原阿里 VP 司罗加入 Salesforce
图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史
苹果大模型最新论文:AFM 模型多维度评测「出炉」
清华系人形机器人公司「加速进化」获亿元融资;AI 数字人赛道最大笔投资披露;GPT