Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

该 API 的定价为每千页 1 美元,单节点每分钟可处理 2000 页。Mistral OCR 模型已被用于历史文化遗产保护等场景。
感谢Mistral AI 当地时间 6 日宣布推出 Mistral OCR API,并宣称该 API 在 OCR 光学字符识别领域具有最佳表现。

Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

▲ 左为原文件,右为识别结果

Mistral AI 表示这一 API 具备优秀的多模态文档处理能力,能从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂文档元素中提取文本内容,所得结果将以 Markdown 文件的形式清晰呈现。

Mistral OCR 模型可解析、理解和转录数千种脚本、字体和语言。根据 Mistral AI 给出的数据,该模型现有版本在识别中的表现优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等一系列竞争者。

Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

▲ 左为原文件,右为识别结果

Mistral AI 已将 Mistral OCR 作为其 Le Chat 聊天机器人的默认文档理解模型,该 API 的定价为每千页 1 美元(AI在线备注:当前约 7.2 元人民币),单节点每分钟可处理 2000 页,这一模型已被用于历史文化遗产保护等场景。

相关资讯

千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。 一出手就是号称「世界上最好的 OCR 模型」! 新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。

号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

在AI模型竞争的浪潮中,法国初创公司Mistral另辟蹊径,亮出了一款名为Mistral OCR的光学字符识别(OCR)API,旨在赋予企业更高级的文档理解能力。 这款新工具承诺将杂乱无章的PDF和图像文件中的内容——无论是潦草的手写笔记,清晰的打印文本,还是复杂的图片、表格和公式——都精准地提取出来,并整理成结构化的数据呈现。 对于那些被海量非结构化数据困扰的企业来说,这无疑是一场及时雨。

小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文

小模型,正在成为 AI 巨头的新战场。今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-3.5,作为免费模型在 ChatGPT 上提供。其 API 价格也非常美丽,每百万输入 token 仅为 15 美分,每百万输出 token 60 美分, 比之前的 SOTA 模型便宜一个数量级,比 OpenAI 此前最便宜的 GPT-3.5 Turbo 还要便宜 60% 以上。OpenAI CEO 山姆・奥特曼对此的形容是:通往智能的成本已经「too che