B站亮相 2024 世界人工智能大会,首次展出自研大语言模型

在 2024 世界人工智能大会(WAIC 2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的 AI 技术成果和 AIGC 多元创意,包括最新定制的 AI 语音声库、自研音视频大模型必剪 Studio 以及自研 AI 动态漫技术等。此外,B站自研的大语言模型系列也在此次 WAIC 2024 大会上首次展出,包括开源的 Index-1.9B chat 和 Index-1.9B character 两个模型。IT之家查询 GitHub 获悉,Index-1.9B 系列模型于 6 月开源,包含基座模型、对照组、

在 2024 世界人工智能大会(WAIC 2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的 AI 技术成果和 AIGC 多元创意,包括最新定制的 AI 语音声库、自研音视频大模型必剪 Studio 以及自研 AI 动态漫技术等。

B站亮相 2024 世界人工智能大会,首次展出自研大语言模型

此外,B站自研的大语言模型系列也在此次 WAIC 2024 大会上首次展出,包括开源的 Index-1.9B chat 和 Index-1.9B character 两个模型。

IT之家查询 GitHub 获悉,Index-1.9B 系列模型于 6 月开源,包含基座模型、对照组、对话模型、角色扮演模型:

Index-1.9B base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先

Index-1.9B pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响

Index-1.9B chat : 基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型

Index-1.9B character : 在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制

在B站 15 周年演讲上,B站董事长兼 CEO 陈睿表示,2023 年,B站 AI 相关内容的日均视频播放量同比增长超过 80%,爆款内容涵盖科普资讯、AI 技术应用、数字人和创意应用等领域。

根据B站透露的数据,当前超过 8000 万用户每月在B站观看 AI 相关的视频,其中 6 成为 00 后。

Index-1.9B 系列模型开源地址:

https://github.com/bilibili/Index-1.9B

相关资讯

B站开源轻量级 Index-1.9B 系列模型:2.8T 训练数据,支持角色扮演

B站昨日开源了轻量级 Index-1.9B 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。IT之家附官方简介:Index-1.9B base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。Index-1.9B pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响。Index-1.9B chat :基于 i

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。访问地址:,人工智能的发展正以惊人的速度向前推进,开发人员每月都在制造出越来越强大、越来越复杂的模型。然而,尽管发展速度加快,人工智能行业在解决人们对人工智能可解释性的担忧以及对其对人们生活影响的日益紧张方面却进展甚微。在今年的报告中,斯坦福 HAI 研究所增加了有关负责任人工智能的扩展章节,有关科学和医学领域人工智能的新章节,以

钉钉将对所有 AI 大模型厂商开放,首批 7 家接入

在今日的 MAKE 2024 钉钉生态大会上,钉钉总裁叶军宣布,钉钉将对所有大模型厂商开放,构建“国内最开放 AI 生态”。其中,MiniMax、月之暗面、智谱 AI、猎户星空、零一万物和百川智能,六家千亿级大模型厂商已宣布接入钉钉,成为继通义千问后首批接入钉钉的大模型。未来,用户可在钉钉上直接使用通义等七家大模型产品。同时,这些大模型厂商将联合钉钉一起,共同探索 AI 在行业内的应用。钉钉官方透露,截至 2024 年 3 月底,超过 220 万企业在钉钉上使用 AI,市面上绝大多数 AI 生态已与钉钉达成合作。I