字节跳动清华AIR成立联合研究中心 推动大模型产学研合作

10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ”  在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术在互联网以及更多场景、更复杂任务中表现能力。 清华AIR院长张亚勤院士,清华大学科研院院长刘奕群,清华AIR首席科学家马维英教授,AIR执行院长刘洋教授,字节跳动豆包大模型大语言模型团队负责人乔木,SIA Lab主任、清华AIR 周浩副教授,字节跳动科研战略与学术合作负责人金小伟,SIA Lab联合主任、字节跳动豆包大模型大语言资深研究员王明轩等嘉宾出席中心成立仪式。

10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ”  在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术在互联网以及更多场景、更复杂任务中表现能力。 

清华AIR院长张亚勤院士,清华大学科研院院长刘奕群,清华AIR首席科学家马维英教授,AIR执行院长刘洋教授,字节跳动豆包大模型大语言模型团队负责人乔木,SIA Lab主任、清华AIR 周浩副教授,字节跳动科研战略与学术合作负责人金小伟,SIA Lab联合主任、字节跳动豆包大模型大语言资深研究员王明轩等嘉宾出席中心成立仪式。

字节跳动清华AIR成立联合研究中心 推动大模型产学研合作

近年来人工智能呈爆发式发展,预训练大语言模型(Pre-trained Language Model)已经成为迈向通用智能的重要发展路线之一。全球科技公司与研究机构正在投入大量资源研究预训练大语言模型,字节跳动组建豆包大模型团队,在相关领域持续研究与投入,致力于开发业界先进的 AI 大模型技术,成为世界一流的研究团队。双方联合成立的SIA Lab 旨在通过有效的产学研合作,实现大模型底层技术突破与产业应用构建。

清华AIR院长张亚勤院士,对双方合作寄予厚望:“AIR与字节跳动联合研究团队有深厚的信任与对人工智能发展的共同信仰。 我们期待能够发挥双方的优势,AIR研究团队在底层技术、前沿技术方向锐意探索,结合字节跳动用户场景、数据、算力、工程的产业优势,与豆包大模型研究团队一道,协同推动AI大模型技术的发展。“

清华大学科研院院长刘奕群对联合中心的成立表示了祝贺:“感谢字节跳动公司对产学研合作的大力支持,期待联合中心团队携手将前沿智能技术集成到产业解决方案中,展现智能技术的社会效益。同时,我们也期待通过产学研的深度合作,培养出具有创新思维和实践能力的人才,使其成为未来智能技术发展浪潮中的引领者与中坚力量。”    

字节跳动豆包大模型大语言模型团队负责人乔木也强调了此次合作的重要性:“大语言模型技术几年来得到了很快发展,但不论是进一步推动当前范式下的Scaling Law,还是模型逻辑推理能力的强化,或是模型学习、记忆能力的进一步提高,仍然有非常多的工作亟待我们去深入研究。希望双方能充分发挥各自优势,在同样梦想的引领下,一起努力做有价值、有意义的长期研究。”

在签约仪式后,双方进行了深入的技术交流,并探讨了未来合作的多种可能性。SIA Lab 将务实地聚焦于基础技术研究,配合沙龙、研讨会等方式,促进国内学术界与产业界的更多交流,推动人工智能领域的开放研究合作,助力相关技术的持续进步。

相关资讯

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

今日,字节跳动豆包大模型正式发布,宣布大模型价格进入“厘时代”。字节跳动火山引擎总裁谭待介绍称:经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。”▲ 火山引擎总裁谭待公布豆包大模型定价,图源:字节跳动I

消息称字节将于 7 月 19 日首次大范围公布文生图 / 视频等 AI 模型进展

钛媒体 AGI 报道称,字节跳动团队将会在 7 月 19 日(本周五)首次大范围公布文生图、类 sora 新视频等全新人工智能(AI)模型技术进展,尤其在长视频、高动态方向上具备创新技术,或将直接对标 Sora 效果。消息人士表示,字节跳动内部将 AI 大模型设为集团 P0 最高级别的方向。此外抖音、剪映等内部多个团队也在研发 AI 视频模型应用,预计将在近期公布。字节跳动将在新加坡举办关于世界模型(World Models)探索的 AI 技术菁英论坛(ByteDance AI Luminary Talks)活动,

消息称字节跳动计划使用华为芯片训练新的 AI 模型

北京时间今天下午,据路透社援引三名知情人士消息称,字节跳动计划为 TikTok 开发一种新的 AI 模型,主要使用来自华为的芯片进行训练。报道称,字节跳动现已将目光转向中国国内 AI 芯片供应商,同时也加快自主研发的步伐。在这场 AI 竞赛中,字节跳动的下一步动作是使用华为昇腾 910B 芯片来训练 AI 大模型。第四位知情人士也称,字节跳动计划建设一个新的 AI 模型,但“不能透露”是否会使用华为芯片。前述三位知情人士表示,字节跳动已经开始使用昇腾 910B 芯片,主要用于计算密集度较低的推理任务,即利用预先训练