​Cohere发布全新多模态AI模型Aya Vision,提供32B和8B两个版本

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。 该实验室声称,该模型在行业内处于领先地位。 Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。

人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称,该模型在行业内处于领先地位。

QQ_1741243943019.png

Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。Cohere 表示,他们通过 WhatsApp 免费提供 Aya Vision,希望能让世界各地的研究人员更方便地获取技术突破。

QQ_1741243964274.png

Cohere 在其博客中指出,尽管人工智能已经取得了显著进展,但在不同语言之间的模型表现仍存在很大差距,尤其是在涉及文本和图像的多模态任务中。“Aya Vision 的目标就是帮助缩小这一差距。”

Aya Vision 有两个版本:Aya Vision32B 和 Aya Vision8B。更为先进的 Aya Vision32B 被称为 “新边界”,在某些视觉理解基准测试中表现超越了体量为其两倍的模型,包括 Meta 的 Llama-3.290B Vision。同时,Aya Vision8B 在某些评估中表现也优于一些体量为其十倍的模型。

QQ_1741243979235.png

这两个模型在 AI 开发平台 Hugging Face 上以 Creative Commons4.0许可证的形式提供,用户需遵循 Cohere 的可接受使用附录,且不可用于商业应用。

Cohere 表示,Aya Vision 的训练采用了一种 “多样化的” 英语数据集,实验室将这些数据集翻译后,使用合成标注进行训练。合成标注是指由 AI 生成的标注,有助于模型在训练过程中理解和解释数据。尽管合成数据存在潜在缺点,但像 OpenAI 等竞争对手也在越来越多地使用合成数据来训练模型。

Cohere 指出,使用合成标注训练 Aya Vision 使得他们能够减少资源的使用,同时仍能取得竞争力的表现。“这展示了我们对效率的重视,利用更少的计算资源实现更多成果。”

为了进一步支持研究界,Cohere 还发布了一套新的基准评估工具 ——AyaVisionBench,旨在考察模型在视觉与语言结合任务中的能力,如识别两张图像的差异和将屏幕截图转换为代码。

当前,人工智能行业正面临所谓的 “评估危机”,这主要源于流行基准的广泛使用,这些基准的总分与大多数 AI 用户关心的任务的能力相关性较差。Cohere 声称,AyaVisionBench 为评估模型的跨语言和多模态理解提供了一个 “广泛且具有挑战性” 的框架。

官方博客:https://cohere.com/blog/aya-vision

划重点:  

🌟 Aya Vision 模型被 Cohere 称为行业最佳,能够执行多种语言和视觉任务。  

💡 Aya Vision 有两个版本,分别为32B 和8B,表现超越体量更大的竞争模型。  

🔍 Cohere 还发布了新的基准评估工具 AyaVisionBench,旨在改善 AI 模型评估问题。  

相关资讯

​多家知名出版商起诉AI初创公司Cohere涉嫌侵犯版权

近日,包括康泰纳仕(Condé Nast)、《大西洋月刊》(The Atlantic)和《福布斯》(Forbes)在内的14家出版商联合起诉 AI 初创公司 Cohere,指控其存在 “系统性” 的版权侵犯行为。 根据投诉,出版商们指责 Cohere 在训练其 AI 模型时使用了至少4,000部受版权保护的作品,并且在向用户展示时显示了大量文章的片段,甚至是整篇文章,严重影响了出版商的引流流量。 此外,诉状还指出 Cohere 通过 “虚构” 的内容侵犯了出版商的商标,这些内容并非实际由这些出版物发布。

15岁开公司,22岁再创业公司估值超20亿美金,Cohere CEO自述开挂人生

机器之能报道编辑:SiaAidan Gomez 是明星生成式 AI 创业公司 Cohere 的联合创始人兼 CEO,曾入选 2023 年《时代》杂志 100/AI AI 领域最具影响力人物名单。前段时间,这家位于加拿大多伦多的创业公司完成 C 轮融资,支持者包括英伟达、Salesforce、甲骨文等,估值超 21 亿美元。公司天使轮投资人包括李飞飞、Geoffrey Hinton、Pieter Abbeel 等大腕儿。作为 OpenAI 最大竞争对手之一,与非常注重 2C 部署的 ChatGPT 不同,Cohere

350亿参数、开放权重,Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。今天,由 Transformer 作者之一 Aidan Gomez 参与创立的人工智能初创公司 Cohere 迎来了自家大模型的发布。Cohere 推出的模型名为「Command-R」,参数量为 35B,它是一个针对大规模生产工作负载的全新大语言模型研究版本。该模型属于「可扩展」模型类别,能够平衡高效率和高精度, 使企业用户超越概念验证,