乐天发布首款日本大语言模型Rakuten AI 2.0

2025-02-13 02:38

乐天集团宣布推出其首个日本大语言模型（LLM）和小语言模型(SLM)，命名为Rakuten AI2.0和Rakuten AI2.0mini。这两款模型的发布旨在推动日本的人工智能（AI）发展。 Rakuten AI2.0基于混合专家(MoE)架构，是一款8x7B 的模型，由八个各自拥有70亿参数的模型组成，每个模型充当一个专家。

乐天集团宣布推出其首个日本大语言模型（LLM）和小语言模型(SLM)，命名为Rakuten AI2.0和Rakuten AI2.0mini。

这两款模型的发布旨在推动日本的人工智能（AI）发展。Rakuten AI2.0基于混合专家(MoE)架构，是一款8x7B 的模型，由八个各自拥有70亿参数的模型组成，每个模型充当一个专家。每当处理输入的 token 时，系统会将其发送给最相关的两个专家，由路由器负责选择。这些专家和路由器不断通过大量的高质量日英双语数据进行联合训练。

Rakuten AI2.0mini 则是一款全新的、参数量为15亿的稠密模型，专为成本效益高的边缘设备部署而设计，适合特定应用场景。它同样在日英混合数据上进行训练，目的是提供便捷的解决方案。两款模型均经过指令微调和偏好优化，发布了基础模型和指令模型，以支持企业和专业人士开发 AI 应用。

所有模型均采用 Apache2.0许可协议，用户可在乐天集团的 Hugging Face 官方库中获取，商业用途包括文本生成、内容摘要、问答、文本理解及对话系统构建等。此外，这些模型也可作为其他模型的基础，便于进一步的开发和应用。

乐天集团的首席 AI 与数据官蔡婷表示:“我为我们的团队如何将数据、工程和科学结合起来，推出Rakuten AI2.0感到无比自豪。我们的新 AI 模型提供了强大且具成本效益的解决方案，帮助企业做出智能决策，加快价值实现，并开启新的可能性。通过开放模型，我们希望加速日本的 AI 发展，鼓励所有日本企业进行构建、实验和成长，推动一个协作共赢的社区。”

官方博客:https://global.rakuten.com/corp/news/press/2025/0212_02.html

划重点:
🌟 乐天集团推出首个日本大语言模型（LLM）和小语言模型(SLM)，名为Rakuten AI2.0和Rakuten AI2.0mini。
📊Rakuten AI2.0基于混合专家架构，拥有八个70亿参数的专家模型，致力于高效处理日英双语数据。
🛠️ 所有模型均可在乐天 Hugging Face 官方库获取，适用于多种文本生成任务，并可作为其他模型的基础。

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

越南开发者 Binh Pham 最近尝试使用树莓派 Zero（Raspberry Pi Zero）进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器，使其能够在本地运行 LLM，无需任何额外设备。

2/18/2025 7:48:52 AM

远洋

衡水家长怒批双休是胡搞时，美国正用AI挽救崩溃少年

AI好好用报道编辑：Sia这些少年们或许正在经历数字时代最温柔的守夜。要不说，还得是衡水的中学。每上一次热搜，都有点「语不惊人死不休」的气势。

3/3/2025 9:49:00 PM

AI好好用

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM（General Language Model）模型，并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型，均遵循宽松的 MIT 许可协议，为开发者提供了极大的使用和开发自由度，可免费用于商业用途和自由分发。此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数，利用15T 高质量数据进行预训练，特别纳入了丰富的推理类合成数据。

4/15/2025 10:01:27 AM

AI在线

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流纳米AI发布MCP万能工具箱，简化AI工具集成与调用 AI视频资讯早读！7个产品更新+8个案例精选小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini 小米首个推理大模型Xiaomi MiMo开源

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景人形机器人预测百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索驾驶具身智能神器推荐文本 Copilot LLaMA 算力安全视觉视频生成训练干货合集应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉

顶部

乐天发布首款日本大语言模型Rakuten AI 2.0

相关资讯

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

衡水家长怒批双休是胡搞时，美国正用AI挽救崩溃少年

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型