音视频

阿里大模型产品“通义听悟”升级：超长视频自由问，还会做思维导图

感谢今日阿里大模型产品“通义听悟”发布多项新功能，上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型，融合了十多项 AI 功能，包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等，并支持标重点、记笔记。通义听悟本次升级上新了六大功能点，其中最重磅的是音视频问答助手“小悟”，关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法，在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答，支持内容问

3/19/2024 2:47:37 PM

远洋

腾讯QQ黑科技亮相2021谷歌开发者大会官网，基于TFlite部署AI语音降噪

当6亿用户习惯每天通过QQ发送语音和进行视频通话，或者在群里与网友语音接龙完成一场Pia戏，又或是与好友一起派对语音答题的时候，大家可曾想过，在不同场景下始终清晰、流畅的QQ音视频体验背后，到底是什么黑科技在支撑这些场景中“声”与“话”的美好？今年11月16日召开的谷歌2021开发者大会期间，大会官网更新了一则案例——《TensorFlow助力：AI语音降噪打造QQ音视频通话新体验》，作者正是QQ音视频通话技术团队。作为谷歌TensorFlow的优秀应用案例，腾讯QQ团队在该文中详细揭秘了语音增强技术在QQ音视频功

11/16/2021 1:08:00 PM

新闻助手

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度 Ollama 支持全线的 Qwen 3 模型纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 AI视频资讯早读！7个产品更新+8个案例精选 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊 DeepMind 特斯拉智能体