独家 | 字节或成立大模型研究院,疯狂氪金 AI 人才

AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。 知情人士称,已有外部 AI 大牛加入大模型研究院。 但另一知情人士表示,字节有加强大模型相关研究的长期计划,但并未决定建立独立的机构。

AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。

知情人士称,已有外部 AI 大牛加入大模型研究院。但另一知情人士表示,字节有加强大模型相关研究的长期计划,但并未决定建立独立的机构。

此外,原序智科技创始人秦禹嘉、原零一万物核心成员黄文灏已加入字节,后者负责技术项目管理和规划,汇报给朱文佳。

从去年开始,字节才陆续对外公布关于大模型的相关工作进展。2023 年 8 月,字节自研的底层大模型「云雀」上线,随即推出 AI 对话产品「豆包」。

2023 年 11 月, Flow 在字节内部成立,专注于 AI 应用层面的研究和开发,由技术副总裁洪定坤和字节大模型团队负责人朱文佳主导该项目。

12 月底,除豆包之外的又一产品 Coze 在海外上线,其核心服务是为用户提供一个快速开发 AI 应用的平台,支持30秒无代码生成 AI Bot,并且集成了插件工具集,满足了个性化的使用需求。2024 年初,Coze 相应的国内版的产品“扣子”也正式上线,海外版和国内版整体产品形态和功能定位基本差不多,都是能够快速创建、调试和优化AI聊天机器人的应用程序。

过去,字节大模型团队的人才更多来自字节内部业务线,包括搜索、抖音、西瓜、TikTok 等,这与众多明星人才云集的大模型初创公司十分不同,很少出现从公司外部新招一号位的情况。

而今,大模型研究院的人才方法论则不同于以往,花费大手笔从外部招揽人才。

上周,零一万物联创黄文灏离职,加入字节。

独家 | 字节或成立大模型研究院,疯狂氪金 AI 人才

黄文灏

黄文灏博士就读于北京大学计算机专业,读博期间恰遇 Deep Learning 兴起,于是 All in Deep Learning 研究,是国内最早做 Deep Learning 的一批人。

毕业之后,黄文灏加入微软亚洲研究院,做 Agent 相关研究,聚焦在可以完成任务的聊天机器人(Task Completion Chatbot)。之后,也做了 AI 技术落地的一些尝试,包括金融量化、AI for Science 等。

从微软亚洲研究院离职后,黄文灏来到智源研究院,担任健康计算研究中心技术负责人、创新应用实验室负责人,重点研究 AI for Life Science 方向 ,在基础层面上探索「AI+大健康」的研究课题、方法路径、外部合作以及人才储备等。其中,他的主要研究集中在两方面:一个是基于生物识别的自然语言处理研究;另一个是探索自然语言处理方法与结构研究的有机结合。

随后,他以联创的身份加入零一万物,担任算法副总裁,负责零一万物大模型 Yi-Large,包括 Yi-34B 在内的多个开源模型的训练和发布,在 LMSYS,huggingface llm leaderboard 上取得成绩。

相关资讯

知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”

11月15日,知乎于北京举办了一场别开生面的学术酒吧活动—AI上头俱乐部。 零一万物 CEO、创新工场董事长李开复,清华大学副教授刘知远,上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩等数十位AI领域领军人物,共同探讨了人工智能的最新发展和未来趋势。 此外,知乎直答产品负责人马奎及多位知乎答主登上现场开放麦,在轻松的氛围中交流AI行业背后的故事。

零一万物以“Infra+模型+应用”三体布局 ToB:以数字人、AI Infra 解决方案智赋企业数智化增长

11 月 6 日,继 10 月中旬发布全球 SOTA 的新旗舰模型 Yi-Lightning 之后,零一万物首度对外披露了基于 Yi 模型构建的一整套大模型 ToB 解决方案。 基于“Infra 大模型 应用”三位一体战略,零一万物在模型训练、AI Infra 以及应用开发等多个领域积累了成熟的能力,并在自身实践中得到了验证。 依托这些能力,零一万物已经为政企客户打造了一整套解决方案,涵盖从 AI Infra 到模型,再到应用落地的全过程。

李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜

李开复表示,「零一万物要跻身全球大模型第一梯队。」开源大模型宇宙又有了新的重量级成员,这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉,零一万物在今年 3 月底官宣成立,六七月开始运营,李开复博士为创始人兼 CEO。11 月 6 日,零一万物正式发布「Yi」系列预训练开源大模型,包括了 Yi-6B 和 Yi-34B 两个版本,给了开源大模型社区「一点小小的震撼」。根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单,Yi-34B 预训练模