AI在线 AI在线

乐天发布首款日本大语言模型Rakuten AI 2.0

作者:AI在线
2025-02-13 02:38
乐天集团宣布推出其首个日本大语言模型(LLM)和小语言模型(SLM),命名为Rakuten AI2.0和Rakuten AI2.0mini。 这两款模型的发布旨在推动日本的人工智能(AI)发展。 Rakuten  AI2.0基于混合专家(MoE)架构,是一款8x7B 的模型,由八个各自拥有70亿参数的模型组成,每个模型充当一个专家。

乐天集团宣布推出其首个日本大语言模型(LLM)和小语言模型(SLM),命名为Rakuten AI2.0和Rakuten AI2.0mini。

这两款模型的发布旨在推动日本的人工智能(AI)发展。Rakuten  AI2.0基于混合专家(MoE)架构,是一款8x7B 的模型,由八个各自拥有70亿参数的模型组成,每个模型充当一个专家。每当处理输入的 token 时,系统会将其发送给最相关的两个专家,由路由器负责选择。这些专家和路由器不断通过大量的高质量日英双语数据进行联合训练。

image.png

Rakuten  AI2.0mini 则是一款全新的、参数量为15亿的稠密模型,专为成本效益高的边缘设备部署而设计,适合特定应用场景。它同样在日英混合数据上进行训练,目的是提供便捷的解决方案。两款模型均经过指令微调和偏好优化,发布了基础模型和指令模型,以支持企业和专业人士开发 AI 应用。

image.png

所有模型均采用 Apache2.0许可协议,用户可在乐天集团的 Hugging Face 官方库中获取,商业用途包括文本生成、内容摘要、问答、文本理解及对话系统构建等。此外,这些模型也可作为其他模型的基础,便于进一步的开发和应用。

乐天集团的首席 AI 与数据官蔡婷表示:“我为我们的团队如何将数据、工程和科学结合起来,推出Rakuten  AI2.0感到无比自豪。我们的新 AI 模型提供了强大且具成本效益的解决方案,帮助企业做出智能决策,加快价值实现,并开启新的可能性。通过开放模型,我们希望加速日本的 AI 发展,鼓励所有日本企业进行构建、实验和成长,推动一个协作共赢的社区。”

官方博客:https://global.rakuten.com/corp/news/press/2025/0212_02.html

划重点:

🌟 乐天集团推出首个日本大语言模型(LLM)和小语言模型(SLM),名为Rakuten  AI2.0和Rakuten  AI2.0mini。

📊Rakuten  AI2.0基于混合专家架构,拥有八个70亿参数的专家模型,致力于高效处理日英双语数据。

🛠️ 所有模型均可在乐天 Hugging Face 官方库获取,适用于多种文本生成任务,并可作为其他模型的基础。

相关资讯

树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型

越南开发者 Binh Pham 最近尝试使用树莓派 Zero(Raspberry Pi Zero)进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器,使其能够在本地运行 LLM,无需任何额外设备。
2/18/2025 7:48:52 AM
远洋

衡水家长怒批双休是胡搞时,美国正用AI挽救崩溃少年

AI好好用报道编辑:Sia这些少年们或许正在经历数字时代最温柔的守夜。 要不说,还得是衡水的中学。 每上一次热搜,都有点「语不惊人死不休」的气势。
3/3/2025 9:49:00 PM
AI好好用

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。 这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。 此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。
4/15/2025 10:01:27 AM
AI在线
  • 1