感谢今日阿里大模型产物“通义听悟”发布多项新功效,上线音视频问答帮忙“小悟”、一键 AI 改写、思想导图生成等六大功效。
通义听悟接入通义千问大模型,融合了十多项 AI 功效,包孕转写、翻译、角色分离、全文择要、章节速览、发言总结、PPT 提取等,并支撑标重点、记笔记。
通义听悟本次晋级上新了六大功效点,其中最重磅的是音视频问答帮忙“小悟”,关键信息间接“问”出来。小悟通过多说话 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记载、跨记载、多说话自由问答,支撑内容问答的音视频时长和文件数均突破业界上限。
用户不仅可在单一记载页呼唤小悟,对最高 6 小时、6G 大小的音视频发问任何相关话题,或间接小悟要求收拾整顿金句、梳理结论、写会议纪要;更可在首页针对用户所有记载发问,支撑一次性扫描理解上百条音视频内容;也可花式对英文视频用华文发问,小悟将间接给出华文回答,省去翻译。作为一个“懂你”的 AI,小悟还会智能推荐问题。
IT之家注意到,针对用户需求,通义听悟还上线了一键 AI 改写、思想导图生成等新能力。例如,一键 AI 改写,将口语转为书面表达,尤其合适收拾整顿采访;思想导图自动生成,最多支撑五级 xmind 脑图,合适播客择要。
▲ 通义听悟思想导图示例
产物细节体验也进一步晋级,包孕笔记支撑一键插入视频时间戳及截图、音视频文件语种自动识别等。
此外,通义听悟推出“高校公益计划”,所有中国大陆高校师生通过后缀 edu.cn 的教育邮箱进行认证后,均可间接获赠 500 小时转写时长,存储空间从 20G 拓展至 200G。
据官方介绍,作为国内首个开放公测的大模型产物,去年 6 月发布以来,通义听悟累计已有上百万用户,包孕学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频 3 次以上,平台每天处理字符数约 20 亿字。