问答

智谱 AI 开源视频理解模型 CogVLM2-Video，可回答时间相关问题

感谢智谱 AI 宣布，训练了一种新的视频理解模型 CogVLM2-Video，并将其开源。据介绍，当前大多数的视频理解模型使用帧平均和视频标记压缩方法，导致时间信息的丢失，无法准确回答与时间相关的问题。一些专注于时间问答数据集的模型过于局限于特定格式和适用领域，使得模型失去了更广泛的问答能力。▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法，生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据，引入了多帧视频图像和时间戳作为编码器输入，训练出 CogVLM2

7/12/2024 2:18:03 PM

沛霖（实习）

讯飞星火 Lite API 能力免费开放：在线联网搜索、低算力推理场景

感谢科大讯飞今日官宣，旗下讯飞星火 Lite API 永久免费开放，支持在线联网搜索、适用于低算力推理与模型精调等定制化场景。IT之家注：讯飞星火 Pro / Max API 价格为：0.21 元 / 万 tokens。据介绍，1token 相当于 1.5 个中文汉字，用户付费 0.21 元即可调用“讯飞星火 3.5 Max”生成一部“余华《活着》”的内容量。讯飞星火大模型 V3.5 发布于今年 1 月，该模型带来七大能力提升：文本生成提升 7.3%，语言理解提升 7.6%，知识问答提升 4.7%，逻辑推理提升 9

5/22/2024 10:39:07 AM

归泷（实习）

知识图谱构建下的自动问答KBQA系统实战

目前工程落地实现问答的技术路线基本分为基于知识图谱的问答（KBQA）、基于阅读理解的问答(MRC)和常见问题问答（FAQ）三种模式

12/20/2022 3:29:00 PM

达观数据

百分点认知智能实验室：智能对话技术应用和实践

编者按智能对话系统因其巨大的潜力和商业价值受到越来越多研究者和从业者的关注，对话的主要种类包括闲聊型、知识型、任务型、阅读理解型等，目前已经广泛应用在智能客服、智能音箱、智能车载等众多场景。近年来，智能对话还出现了新的应用场景，例如可以将自然语言转换为各种程序性语言，如SQL，从数据库中找到相应的答案，让用户和数据库的交互变得更加直接和方便。为此，Datafun发布了百分点首席算法科学家苏海波署名文章，文中主要介绍了智能问答中的问题语义等价模型、知识图谱问答模型、NL2SQL模型，以及百分点在智能问答领域的实践案例

3/10/2021 5:05:00 PM

百分点科技

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练