阿里大模型产品“通义听悟”升级：超长视频自由问，还会做思维导图

作者：远洋

2024-03-19 02:47

感谢今日阿里大模型产品“通义听悟”发布多项新功能，上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型，融合了十多项 AI 功能，包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等，并支持标重点、记笔记。通义听悟本次升级上新了六大功能点，其中最重磅的是音视频问答助手“小悟”，关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法，在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答，支持内容问

感谢今日阿里大模型产品“通义听悟”发布多项新功能，上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。

通义听悟接入通义千问大模型，融合了十多项 AI 功能，包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等，并支持标重点、记笔记。

通义听悟本次升级上新了六大功能点，其中最重磅的是音视频问答助手“小悟”，关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法，在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答，支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟，对最高 6 小时、6G 大小的音视频提问任何相关话题，或直接小悟要求整理金句、梳理结论、写会议纪要；更可在首页针对用户所有记录提问，支持一次性扫描理解上百条音视频内容；也可花式对英文视频用中文提问，小悟将直接给出中文回答，省去翻译。作为一个“懂你”的 AI，小悟还会智能推荐问题。

IT之家注意到，针对用户需求，通义听悟还上线了一键 AI 改写、思维导图生成等新能力。例如，一键 AI 改写，将口语转为书面表达，尤其适合整理采访；思维导图自动生成，最多支持五级 xmind 脑图，适合播客摘要。

阿里大模型产品“通义听悟”升级：超长视频自由问，还会做思维导图