存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

5月10日,后摩智能正式发布首款存算一体智驾芯片——鸿途™H30,最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力 AI 芯片的公司。 在人工智能技术飞速发展的今天,高效的 AI 计算能力成为智能驾驶普及应用的重要基石。后摩智能以底层技术创新为驱动力,采用存算一体架构突破芯片算力和功耗的瓶颈,实现了芯片能效比的阶跃,为快速发展的智能汽车产业带来了全新的解决方案。本次产品发布会汇聚了来自政府、产业界、学术界、投资界多位嘉宾,包括江苏省工业和信息化厅副厅长池宇,中国电动汽车百人会副理事长兼

5月10日,后摩智能正式发布首款存算一体智驾芯片——鸿途™H30,最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力 AI 芯片的公司。 存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

在人工智能技术飞速发展的今天,高效的 AI 计算能力成为智能驾驶普及应用的重要基石。后摩智能以底层技术创新为驱动力,采用存算一体架构突破芯片算力和功耗的瓶颈,实现了芯片能效比的阶跃,为快速发展的智能汽车产业带来了全新的解决方案。

本次产品发布会汇聚了来自政府、产业界、学术界、投资界多位嘉宾,包括江苏省工业和信息化厅副厅长池宇,中国电动汽车百人会副理事长兼秘书长张永伟,清华大学教授、长江学者、著名存算一体技术专家刘勇攀,启明创投合伙人周志峰,阳氢集团董事长、原上汽集团副总裁、总工程师程惊雷等。同时,众多客户、生态合作伙伴以及媒体朋友也应邀出席。

通过底层架构创新,实现 AI 计算效率的极致突破

一直以来,计算效率的提升都是科技发展和变革的底层驱动力。如今,一部小小的智能手机,计算能力和效率已经比2000年代的个人PC提高了至少 1000倍。这种计算能力的提升,为人们带来了丰富多彩的生活和便捷体验。从大型机到 PC 再到手机,技术发展与应用变革的趋势也表明,每 1000倍效率提升将会创造一个新的计算时代,并改变人们的生活方式。伴随着AI技术的跃进,未来万物智能时代的计算系统,和今天的芯片相比,在计算能力和效率上至少要再有 1000倍以上的提升。

后摩智能创始人兼 CEO 吴强表示:“2年前,后摩智能成立,我们坚定地选择以存算一体的底层架构创新,来实现 AI 计算效率的极致突破。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。随着 GPT 等大模型的出现,存算一体芯片越来越受到行业关注,我们很高兴看到更多创业公司加入进来,与我们一起推动硬科技的创新与应用。”

存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

后摩智能创始人兼CEO吴强

发布会上,中国电动汽车百人会副理事长兼秘书长张永伟指出,智能驾驶市场规模庞大,仍处于加速渗透的阶段,为新技术和新企业提供了创新发展的巨大机遇。存算一体作为一种创新技术,对工艺制程依赖度低,具有极高的竞争力,为智能驾驶芯片提供了更具前瞻性的技术路径选择。采用多种技术路径实现芯片国产化布局,将有利于解决汽车芯片供应链中存在的同质化竞争问题,助力提升产业链的韧性和供应链的安全性。

存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

中国电动汽车百人会副理事长兼秘书长张永伟

存算一体,为智能驾驶打造高效计算引擎

后摩智能联合创始人兼研发副总裁陈亮表示,鸿途™H30 以存算一体创新架构实现了六大技术突破,即大算力、全精度、低功耗、车规级、可量产、通用性。鸿途™H30 基于 SRAM 存储介质,采用数字存算一体架构,拥有极低的访存功耗和超高的计算密度,在 Int8 数据精度条件下,其 AI 核心IPU 能效比高达 15Tops/W,是传统架构芯片的7 倍以上。为了更好地实现车规级,后摩智能基于鸿途™H30 自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。

为了充分发挥存算一体带来的高计算效率,后摩智能面向智能驾驶场景打造了专用 IPU(处理器架构)——天枢架构,采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的完美均衡,AI 计算可以在核内完成端到端处理,保证通用性。天枢架构的设计理念源自于庭院式的中国传统住宅,以大布局设计保障计算资源利用效率的同时,再进一步结合现代住宅多层/高层的设计优势,以多核/多硬件线程的方式灵活扩展算力。得益于灵活、高效的硬件架构设计,鸿途™H30 实现了性能 2 倍提升的同时,还降低了 50% 功耗。

存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

后摩智能联合创始人兼研发副总裁陈亮

据陈亮介绍,天枢架构是后摩智能自主研发的第一代 IPU(处理器架构),第二代天璇架构已经在研发中,将采用Mesh 互联结构,可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、大模型等场景。第三代天玑架构已经开始规划,将为万物智能打造。

颠覆式技术赋能智能驾驶,鸿途™H30再创性能新高

发布会上,后摩智能联合创始人兼产品副总裁信晓旭对鸿途™H30 的产品性能与优势做了详细介绍。得益于存算一体的架构优势,鸿途™H30 基于 12nm 工艺制程,在 Int8 数据精度下实现高达 256TOPS 的物理算力,所需功耗不超过 35W,整个 SoC 能效比达到 7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。在实际性能测试中,鸿途™H30 基于Resnet 50 模型的 Benchmark,在 Batch Size 等于1 和 8 的条件下分别达到了 8700 帧/秒和 10300 帧/秒的性能。

存算一体大算力芯片赋能智能驾驶,后摩智能发布鸿途™H30

后摩智能联合创始人兼产品副总裁信晓旭

目前,基于鸿途™H30 已成功运行常用的经典 CV 网络和多种自动驾驶先进网络,包括当前业内最受关注的 BEV 网络模型以及广泛应用于高阶辅助驾驶领域的 Pointpillar 网络模型。以鸿途™H30 打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署,这是业界第一次基于存算一体架构的芯片成功运行端到端的智能驾驶技术栈。

本次发布会,后摩智能同步推出了基于鸿途™H30 芯片打造的智能驾驶硬件平台——力驭®。有赖于鸿途™H30极高的计算效率和计算密度,力驭®平台 CPU 算力高达200 Kdmips,AI 算力高 256Tops,支持多传感器输入,能够为智能驾驶提供更充沛的算力支持,进一步提升了系统的可靠性。力驭®平台功耗仅为 85W,可采用更加灵活的散热方式,实现更低成本的便捷部署,有利于推动大算力智能驾驶场景的普及应用。

为了让客户拥有更好的产品使用体验,后摩智能还基于鸿途™H30 芯片自主研发了一款软件开发工具链——后摩大道™,支持 PyTorch、TensorFlow 、ONNX 等主流开源框架,编程兼容 CUDA 前端语法,同时支持 SIMD 和 SIMT 两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途™H30 的高效、易用。

信晓旭透露,鸿途™H30 将于6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途™H50 已经在全力研发中,将于2024年推出,支持客户 2025年的量产车型。

鸿途™H30 的发布,开启了存算一体大算力芯片商用落地的新阶段。后摩智能将坚定不移地专注于底层技术创新,打造极致效率的计算芯片,与生态链上的合作伙伴密切合作,共同推进万物智能的实现。

相关资讯

ARM最新回应:新架构Armv9不受美国出口管理条例约束,华为可获授权

对于Armv9架构,ARM首席执行官西蒙·塞加斯表示,「v9架构将提升安全性和信任度,并为未来十年的计算机技术奠定基础。」与此同时,v9架构不受美国出口管理条例约束也为华为带来了利好消息。

CVPR 2021 | Facebook提出FP-NAS:搜索速度更快、分类精度更高、性能更好

来自 Facebook AI 的严志程团队发表一种新的神经架构的快速搜索算法。该算法采用自适应架构概率分布熵的架构采样,能够减少采样样本达 60%,加速搜索快 1.8 倍。此外,该算法还包括一种新的基于分解概率分布的由粗到细的搜索策略,进一步加速搜索快达 1.2 倍。该算法搜索性能优于 BigNAS、EfficientNet 和 FBNetV2 等算法。就职于 Facebook AI 的严志程博士和他的同事最近在 CVPR 2021 发表了关于加速概率性神经架构搜索的最新工作。该工作提出了一种新的自适应架构分布熵的

融合趋势下基于 Flink Kylin Hudi 湖仓一体的大数据生态体系

本文由 T3 出行大数据平台负责人杨华和资深大数据平台开发工程师王祥虎介绍 Flink、Kylin 和 Hudi 湖仓一体的大数据生态体系以及在 T3 的相关应用场景,内容包括: 湖仓一体的架构 Flink/Hudi/Kylin 介绍与融合 T3 出行结合湖仓一体的实践