AI 科技评论独家获悉,字节跳动正在秘密筹备成立大模型研究院,并积极招揽人才。
知情人士称,已有外部 AI 大牛加入大模型研究院。但另一知情人士表示,字节有加强大模型相关研究的长期计划,但并未决定建立独立的机构。
此外,原序智科技创始人秦禹嘉、原零一万物核心成员黄文灏已加入字节,后者负责技术项目管理和规划,汇报给朱文佳。
从去年开始,字节才陆续对外公布关于大模型的相关工作进展。2023 年 8 月,字节自研的底层大模型「云雀」上线,随即推出 AI 对话产品「豆包」。
2023 年 11 月, Flow 在字节内部成立,专注于 AI 应用层面的研究和开发,由技术副总裁洪定坤和字节大模型团队负责人朱文佳主导该项目。
12 月底,除豆包之外的又一产品 Coze 在海外上线,其核心服务是为用户提供一个快速开发 AI 应用的平台,支持30秒无代码生成 AI Bot,并且集成了插件工具集,满足了个性化的使用需求。2024 年初,Coze 相应的国内版的产品“扣子”也正式上线,海外版和国内版整体产品形态和功能定位基本差不多,都是能够快速创建、调试和优化AI聊天机器人的应用程序。
过去,字节大模型团队的人才更多来自字节内部业务线,包括搜索、抖音、西瓜、TikTok 等,这与众多明星人才云集的大模型初创公司十分不同,很少出现从公司外部新招一号位的情况。
而今,大模型研究院的人才方法论则不同于以往,花费大手笔从外部招揽人才。
上周,零一万物联创黄文灏离职,加入字节。
黄文灏
黄文灏博士就读于北京大学计算机专业,读博期间恰遇 Deep Learning 兴起,于是 All in Deep Learning 研究,是国内最早做 Deep Learning 的一批人。
毕业之后,黄文灏加入微软亚洲研究院,做 Agent 相关研究,聚焦在可以完成任务的聊天机器人(Task Completion Chatbot)。之后,也做了 AI 技术落地的一些尝试,包括金融量化、AI for Science 等。
从微软亚洲研究院离职后,黄文灏来到智源研究院,担任健康计算研究中心技术负责人、创新应用实验室负责人,重点研究 AI for Life Science 方向 ,在基础层面上探索「AI+大健康」的研究课题、方法路径、外部合作以及人才储备等。其中,他的主要研究集中在两方面:一个是基于生物识别的自然语言处理研究;另一个是探索自然语言处理方法与结构研究的有机结合。
随后,他以联创的身份加入零一万物,担任算法副总裁,负责零一万物大模型 Yi-Large,包括 Yi-34B 在内的多个开源模型的训练和发布,在 LMSYS,huggingface llm leaderboard 上取得成绩。