字节跳动推出 AIBrix:全新开源推理系统专为大语言模型设计

字节跳动近日宣布开源其最新研发的 AIBrix 推理系统。 这一系统特别为 vLLM 推理引擎打造,目标是提供一个可扩展且高性价比的推理控制面,满足企业日益增长的 AI 需求。 AIBrix 的推出标志着一个新阶段的开始,项目团队希望通过这一开源项目为构建可扩展的推理基础设施奠定基础。

字节跳动近日宣布开源其最新研发的 AIBrix 推理系统。这一系统特别为 vLLM 推理引擎打造,目标是提供一个可扩展且高性价比的推理控制面,满足企业日益增长的 AI 需求。

AIBrix 的推出标志着一个新阶段的开始,项目团队希望通过这一开源项目为构建可扩展的推理基础设施奠定基础。该系统提供了一整套云原生解决方案,致力于优化大语言模型的部署、管理和扩展能力。特别是它对企业级需求进行了深度适配,确保用户在使用时能够享受到更高效的服务。

image.png

在功能方面,首版 AIBrix 聚焦于几个核心特点。首先是高密度的 LoRA(低秩适应)管理,这一功能旨在简化轻量级模型的适配支持,使得用户可以更便捷地管理模型。其次,AIBrix 提供了 LLM 网关和路由功能,能够高效管理和分配多个模型和副本的流量,从而确保请求能够迅速而准确地到达目标模型。此外,针对 LLM 应用的自动扩展器也能够根据实时需求动态调整推理资源,提高系统的灵活性和响应速度。

字节跳动的 AIBrix 团队表示,他们计划通过扩展分布式 KV 缓存、引入传统资源管理原则、以及基于性能分析提升计算效率等手段,继续推进系统的演进和优化。

相关资讯

经典手游“汤姆猫”实体化,旗下 AI 儿童陪伴机器人已开展工业设计、嵌入式系统开发工作

汤姆猫今日在电话交流会中透露,公司海外研发团队正进一步丰富首款 AI 手游《Talking Ben AI》的玩法与该产品的个性化交互能力,并在测试中持续进行数据搜集,用于优化数据库、模型能力。此外,该公司机器人研发团队已就汤姆猫 AI 儿童陪伴机器人开展工业设计与嵌入式系统的开发,后续将在产品主要功能完善后推进打样及测试工作。今年 3 月,汤姆猫还透露,公司 AI 硬件团队正研发一款基于生成式人工智能技术的 AI 语音交互陪伴机器人,预计将为公司业务带来全新增长空间。此前一款全新适配 MR / VR 硬件的产品原型

摩尔线程开源 OpenCV-MUSA:支持绝大部分 cv::cuda 命名空间下数据结构及 API

感谢摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配,并正式发布 OpenCV-MUSA 开源项目。OpenCV 作为计算机视觉领域最重要的开源库之一,为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。在现有 OpenCV 代码的基础上,摩尔线程新增了 MUSA 设备后端,并为多个算法模块提供了 MUSA 加速支持,同时对编译脚本也进行了适配。目前 OpenCV-MUS

数据更多更好还是质量更高更好?这项研究能帮你做出选择

当计算预算低时,重复使用高质量数据更好;当不差钱时,使用大量数据更有利。对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练,简单来说就是「规模扩展」。虽然直接扩展模型规模看起来简单粗暴,但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法,所谓量变引起质变,这种观点也被称为神经扩展律(neural scaling laws)。近段时间,又有不少人认为「数据」才是那些当前最佳的闭源模型的关键,不管是 LLM、VLM 还是扩散模型。随着数据质量的重要性得到认可,已