商汤 CEO 徐立内部信曝光,确定“三位一体”新 AI 战略

10 月 22 日上午消息,新浪科技独家获悉,商汤科技十周年之际,商汤科技董事长兼首席执行官徐立于近日发内部信,首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略,同时宣布将围绕战略和核心资源,将构建更加集中和高效的组织架构,加快组织和管理的轻盈化进程。新浪科技了解到,在内部信中,徐立还阐述了自己对于传统 AI 1.0 和生成式大模型 AI 2.0 的理解。他指出,“AI 1.0 被看作是专用智能,专注于单任务和信息处理;而 AI 2.0 被视为通用智能,强调多任务和内容生成。

10 月 22 日上午消息,新浪科技独家获悉,商汤科技十周年之际,商汤科技董事长兼首席执行官徐立于近日发内部信,首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略,同时宣布将围绕战略和核心资源,将构建更加集中和高效的组织架构,加快组织和管理的轻盈化进程。

新浪科技了解到,在内部信中,徐立还阐述了自己对于传统 AI 1.0 和生成式大模型 AI 2.0 的理解。他指出,“AI 1.0 被看作是专用智能,专注于单任务和信息处理;而 AI 2.0 被视为通用智能,强调多任务和内容生成。”在他看来,“这样的描述虽然简单易懂,却并非完全准确,因为通用与专用之间并无明确界限,而且 AI 的落地应用终究要场景化,比如生成式大模型在垂直领域的应用。”

“在我们看来,AI 1.0 和 AI 2.0 的一个重要区别在于 AI 成本结构的变化。”徐立表示。

在传统的 AI 1.0 时代,模型生产的主要成本在于研发人员的投入。而在生成式大模型 AI 2.0 时代,模型生产的成本主要在于算力资源的投入。…… 生成式大模型 AI 的普及和商业化,需致力于降低大模型的生产和使用成本,这势必要结合大模型来迭代和优化算力,同时也需要根据算力资源的特点来迭代大模型设计和应用。

徐立指出,在生成式大模型 AI 领域,商汤的核心战略是实现算力大装置、大模型和应用的无缝集成,以应用驱动模型,以模型带动算力的优化。我们确立了“大装置-大模型-应用”的三位一体战略,旨在通过数量级级别的优化,提升算力资源的使用效率,服务好我们的客户。我们致力于成为最懂算力的大模型服务商,和最懂大模型的算力服务商。

附全员信全文:

《商汤十周年再出发:专注聚焦、知行合一》

各位商汤同学:

大家好!商汤在本月迎来了它的十周岁生日。与此同时,人工智能界也迎来了一个重大里程碑:诺贝尔物理学奖表彰了“用物理学推动人工智能”的工作,而诺贝尔化学奖则表彰了“用人工智能推动蛋白质结构预测”的成就。这标志着人工智能与科学之间的相互作用,互为研究目的也是研究工具,预示着一系列学科领域的新范式即将开启。新版五十英镑钞票上阿兰・图灵的肖像下印着一句话:“这不过是将来之事的前奏,也是将来之事的缩影”,- “This is only a foretaste of what is to come,and only the shadow of what is going to be.” - 这或许是对我们这个时代最佳注释。

我们相信并期待通用人工智能时代的到来。务实来讲,我们已迈出了两步:即常说的传统 AI 1.0 和生成式大模型 AI 2.0。通常,AI 1.0 被看作是专用智能,专注于单任务和信息处理;而 AI 2.0 被视为通用智能,强调多任务和内容生成。但这样的描述虽然简单易懂,却并非完全准确,因为通用与专用之间并无明确界限,而且 AI 的落地应用终究要场景化,比如生成式大模型在垂直领域的应用。在我们看来,AI 1.0 和 AI 2.0 的一个重要区别在于 AI 成本结构的变化。

在传统的 AI 1.0 时代,模型生产的主要成本在于研发人员的投入。而在生成式大模型 AI 2.0 时代,模型生产的成本主要在于算力资源的投入。随着尺度定律在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型 AI 的普及和商业化,需致力于降低大模型的生产和使用成本,这势必要结合大模型来迭代和优化算力,同时也需根据算力资源的特点来迭代大模型设计和应用。

因此,在生成式大模型 AI 领域,商汤的核心战略是实现算力大装置(SCO)、大模型和应用(CNI)的无缝集成,以应用驱动模型,以模型带动算力的优化。我们确立了“大装置-大模型-应用”的三位一体战略,旨在通过数量级级别的优化,提升算力资源的使用效率,服务好我们的客户。我们致力于成为最懂算力的大模型服务商,和最懂大模型的算力服务商。

在传统 AI 领域,我们将充分利用我们的视觉感知和多模态模型的核心能力,集中资源,明确方向,并通过一套研发投入,同时服务国内和国际市场。

在组织层面,围绕战略和核心资源,我们将构建更加集中和高效的组织架构,推动资源的集中和集约化投入,加快组织和管理的年轻化进程。在商汤十周年和通用人工智能时代即将来临之际,让我们一起重拾创业初心。

感谢过去十年每一位商汤人的付出和努力。希望我们继续保持过去的坚韧、勇敢与乐观,主动拥抱变化,坚定不移地探索“科技原创和产业价值闭环”的道路,在接下来十年的征程中努力奔跑,共同定义与开创通用人工智能时代!

相关资讯

工信部:我国生成式人工智能服务大模型的注册用户已超 6 亿

据央视新闻报道,工业和信息化部昨日表示,目前我国生成式人工智能服务大模型的注册用户数量已突破 6 亿。图源 Pixabay据工业和信息化部总工程师赵志国介绍,我国人工智能核心产业的规模在不断提升,企业数量超过了 4500 家。完成备案并上线为公众提供服务的生成式人工智能服务大模型近 200 个,注册用户超过 6 亿。

清华电子系明星公司亮相:发布国产AI算力平台,公测免费送百亿Token

3月31日,由清华大学电子系主任汪玉作为发起人的AI infra公司无问芯穹在上海召开第一次产品发布会。机器之心此前独家介绍过,无问芯穹团队的目标是利用自己加速计算的核心产品优势,降低算力成本,与算力中心合作,整合算力资源,为算力市场提供增量,最终向B 端和 C 端开发者提供可以直接调度的低成本算力。在这次发布上,无问芯穹团队正式发布“无穹Infini-AI”大模型开发与服务平台,并宣布自3月31日起正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。开发者可以在这个平台上体验、对比各种模

消息称软银计划到 2025 年投资 1500 亿日元,加速 AI 大模型开发

据《日本经济新闻》报道,软银计划到 2025 年投资 1500 亿日元(IT之家备注:当前约 70.2 亿元人民币),加速 AI 大模型的开发工作。软银 2023 年就在生成式 AI 算力基础设施上进行了 200 亿日元(当前约 9.36 亿元人民币)的投资,此次追加投资后整体投资规模将创下日本企业历史第一。据悉,软银目标在年内完成 390B 参数模型的开发,并在明年开始研发万亿参数级别的日语大模型。报道指出,日本企业中 NTT 和 NEC 等已跟进 AI 模型开发热潮,但这些企业的模型产品参数规模停留在数 B 至