未来几年,微软将继续增加投资 ChatGPT 背后的公司 OpenAI 100 亿美金,而 Google 也于近日投资了另外一个同类公司 Anthropic 将近 4 亿美金,在硅谷科技圈和资本市场成为了 2023 年最令人兴奋的科技进展。微软联合创始人比尔盖茨判断,ChatGPT 的历史意义重大,不亚于 PC 或互联网诞生。
海内在这次 AI 变革的浪潮中同样反应热烈,其中就有海内通用人工智能初创公司元语智能,推出海内首个鉴于大模型的功用型对话产品 ChatYuan。
ChatYuan 产品样例
(建议先扫码体验 ChatYuan 小程序再继续阅读)
PromptCLUE 全华文义务零样本进修模型
在正式介绍元语智能的功用型对话大模型 ChatYuan 之前,我们先了解一下大规模多义务 Prompt 预训练华文开源模型——PromptCLUE,它实现了华文上的三大统一:统一模型框架、统一义务形式和统一应用方式。
PromptCLUE 在千亿华文 token 上大规模预训练,累计进修 1.5 万亿华文 token,在亿级华文义务数据上完成训练,并训练数百种义务集。它具有更好的懂得、生成和抽取本领,并且反对文本改写、纠错、知识图谱问答等。
PromptCLUE 反对几十个不同类型的义务,具有较好的零样本进修本领和少样本进修本领。针对懂得类义务,如分类、情感分析、抽取等,可以自定义标签体系;针对生成义务,可以进行采样自由生成。
技术亮点
首个全华文义务反对的零样本进修的开源模型;
自动化高质量数据处理算法,产出海量高质量无监督和有监督数据用于训练;
鉴于高质量数据构建更加符合华文习惯的字典并从零训练华文大模型,模型性能效果更有保证;
融合多种训练策略训练大模型,具备在华文上强大的泛化、迁移和生成本领。
ChatYuan 功用对话开源大模型
就其功用而言,ChatYuan 可以用于问答、结合上下文做对话、做各种生成义务(包括创意性写作),也能回答一些像法律、医疗等领域问题。ChatYuan 线上服务是鉴于百亿参数大模型,目前已开源了 7.7 亿的参数模型,显存 6G 左右,一张民用显卡即可加载使用。后续会陆续开源更多、更大参数量的版本。
ChatYuan 鉴于 PromptCLUE 结合数亿条功用对话多轮对话数据进一步训练得到,它去掉了文本懂得、信息抽取类义务,加强了问答、对话和各种生成式义务的进修和训练;针对多轮对话容易受到上下文的干扰,加入了抗干扰数据使得模型可以在必要时忽略无关的上下文;加入了用户反馈数据的进修,对齐人类意图,使得模型不仅具有一定的通用语言懂得本领、特定义务上的生成本领,也能更好地响应用户的意图。
技术亮点
鉴于从零训练的全华文义务反对零样本进修模型 PromptCLUE 进一步迭代获取。
在华文领域首创了功用对话形式反对全华文义务,反对自由输入。
结合人类反馈的方法进行进修,对齐人类意图。
文本创作本领
上下文关联本领
元语智能认为目前公司颁布的大模型中还有很多可以优化的方向,比如在某些场景下效果不稳定;在对齐人类意图、复杂推理和代码生成上还需要持续优化。
在未来,元语智能将在多个方向上持续精进,比如模型 size 上将推出千亿级别参数模型、在对齐人类意图层面实现关键突破,并且提升至少 50% 模型的覆盖场景,并且今年在海内实现行业通用人工智能的落地应用。
通用人工智能(AGI)的坚定信仰者 — 中国 “Yuan”
元语智能是一家致力于提供通用人工智能技术(AGI)的初创公司,坚定通用人工智能信仰,持续不断在全球范围内,为实现可靠、有效、无害的通用人工智能贡献中国力量,让人类受益。目前元语智能已经提供了反对功用型对话的开源华文大模型免费下载及 API 服务,以及鉴于网页、小程序的类「ChatGPT」的机器人交互产品等。
元语智能认为,通用人工智能(AGI)是下一代计算机基础设施,代表了人类未来主要人机交互和生活方式,并在不久的将来会使大部分行业广泛受益。
元语智能核心成员来自于华文 NLP 开源社区「CLUE」及阿里达摩院、百度等互联网企业,在这里不得不介绍下「神秘」的 CLUE 开源社区。
CLUE 开源社区
2019 年,随着预训练模型成为主流的趋势,海内陆续产生了一些预训练模型。可是海内没有一个可以衡量大模型效果的综合性华文基准,而国外已经有了 GLUE 这样的通用预训练模型基准。所以 CLUE 的发起人联合海内外 30 多个产业界青年学者,一起共建了华文语言懂得标准评价系统(CLUE)。CLUE 的定位是要更好的服务华文语言懂得义务,作为通用语言模型测评的补充,通过搜集整理颁布华文义务及标准化测评等方式完善基础设施,最终促进华文 NLP 和认知领域的进步和突破。
CLUE 是一组评估机器能够像人类一样懂得和响应华文文本的义务,上线于 3 年前,也是第一个大规模的华文语言评估基准。在 CLUE 的官网上,有语料库、排行榜、预训练模型和代表性的数据集等资料可供选择,包括文本相似度、分类、上下文推理、阅读懂得、少样本进修和知识图谱等在内的 17 项测评义务。自颁布以来,获得了人工智能行业的广泛认可,同时将成果颁布在顶会论文。众多头部公司包括阿里、华为、百度、字节跳动、美团、网易、OPPO、招商银行等都使用了 CLUE 基准。
因此脱胎于 CLUE 社区的元语智能,在多方面具备大模型的先天优势,积累了包括大量高质量数据、具备丰富的处理数据的算法和经验、沉淀了强大的大模型研发本领,并且非常重要的是,积累了十分活跃的开发者开源社区。
CLUE 核心组织成员在 2022 年看到了大模型和生成模型的潜力,以及鉴于对通用人工智能(AGI)未来的坚定判断,进行了近一年的技术孵化,之后创立元语智能。并且在 ChatGPT 颁布半年之前就已经在多义务大模型进行深入探索和研发,积累了大量经验。
团队进展
截止目前,元语智能主要在以下方面取得了有效进展:
2022 年 10 月 1 日颁布 PromptCLUE1.0 模型 & API — 首个华文反对的零样本开源模型。目前全平台下载量:4.4W+,API 调用量:10w+/ 天。
2022 年 11 月颁布 PromptCLUE1.5 模型 & API — 反对更多义务的零样本开源模型。
2022 年 12 月 20 日颁布 ChatYuan— 海内首个鉴于百亿参数大模型的功用对话产品,反对小程序和网页。
2023 年 1 月 12 日颁布 ChatYuan 大模型 — 首个功用对话开源模型供免费下载,全平台已有数万下载量。
2023 年 2 月 3 日颁布 ChatYuan API— 可供 API 调用的功用对话模型。
海内 AGI 困境
其实包括元语智能在内,海内无论是大型科技公司还是创业公司,目前都面临着各式各样的挑战,很难有像 OpenAI 的资源和人才密度。海内创业公司或许在一段时间内可以专心技术研发,但很快就会受到盈利压力的挑战,而不断调整战略方向。大型科技公司虽然看起来资源充足,但是很少能在未有落地成效的情况下,坚定信念进行长期持续投入基础设施建设。
在元语智能看来,海内目前主要有以下多方面的问题:
人力、算力方面的资源瓶颈。海内行业内相对来说更缺乏耐心,在未见到明确收益前持续投入不足,资本也同时缺乏耐心。
华文高质量的数据积累不足,海内开源开放的生态相对薄弱。
对 AI 未来趋势的前瞻性判断不足,缺少具有坚定信仰的引领者。
行业对 AGI 创业公司信心不足,对于 AGI 价值的共识不够。
未来愿景
因此,元语智能作为海内第一个勇敢前行的初创公司,并坚定通用人工智能(AGI)将普惠人类的信仰,给了海内通用人工智能行业从业者非常大的信心。
同时,元语智能强烈呼吁:海内从事人工智能研究的同行、长期关注科技行业的资本以及各行各业对 AGI 感兴趣的朋友,要共同有耐心、有信心的坚持下去。他山之石,可以攻玉,但我山之石将会持之以恒。
欢迎扫码体验元语 ChatYuan
也可登录 www.clueai.cn/chat 网页版体验