Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

Snowflake 公司近日发布新闻稿,宣布在 Apache 2.0 许可下,推出开源 Arctic embed 系列模型。根据 MTEB(衡量文本嵌入模型的评估指标合集)的检索(Retrieval)排行榜,Arctic embed 系列最大模型参数只有 3.34 亿个,是唯一一个平均检索功能超过 55.9 的模型。感兴趣的用户目前可以会见 Hugging Face 使用 Arctic embed 系列模型,后续也可以会见 Snowflake 的 Cortex 嵌入功能(目前处于私人预览阶段)中使用。Arctic

Snowflake 公司近日发布新闻稿,宣布在 Apache 2.0 许可下,推出开源 Arctic embed 系列模型。

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

根据 MTEB(衡量文本嵌入模型的评估指标合集)的检索(Retrieval)排行榜,Arctic embed 系列最大模型参数只有 3.34 亿个,是唯一一个平均检索功能超过 55.9 的模型。

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

Snowflake 开源 Arctic embed,号称全球最实用的检索文本嵌入 AI 模型

感兴趣的用户目前可以会见 Hugging Face 使用 Arctic embed 系列模型,后续也可以会见 Snowflake 的 Cortex 嵌入功能(目前处于私人预览阶段)中使用。

Arctic embed 系列模型的主要亮点

同类最佳检索:由五个 Arctic 嵌入模型组成的套件可在各种规模的数据中提供最先进的检索结果,在 MTEB 检索基准上的表现优于其他开源模型。

功能和效率:Snowflake 的大型 (l) 型号比封闭源型号的参数高出 4 倍,以更小的占地面积提供更卓越的功能。

长文档支持:中型(m)模式包括一个长文本版本,可无缝处理扩展文档(最多 8192 个标记)。

为企业优化:与同类产品相比,Arctic 嵌入式机型具有更低的延迟和更低的总拥有成本(TCO)。

IT之家附上参考地址

Snowflake’s Arctic-embed-m

Snowflake Launches the World’s Best Practical Text-Embedding Model for Retrieval use Cases

给TA打赏
共{{data.count}}人
人已打赏
AI

Linux 发行版 Gentoo 宣布禁止供应 AI 自然语言技术协助下创建的实质

2024-4-17 9:48:18

AI

AI“刘强东”直播带货首秀,旁观量超 2000 万

2024-4-17 10:34:15

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索