对话
Sesame发布超真实的AI语音产品:几乎没有AI味
语音助手逐渐成为我们生活中不可或缺的一部分,而现有的数字语音助手在与用户互动时,往往显得平淡无奇,缺乏情感和人性化的元素。 对此,Sesame 团队正在努力解决这一问题,致力于实现一种全新的 “语音存在” 概念,使得数字助手能够在交流中更真实、被理解和重视。 Sesame 的核心目标是创造一种数字伴侣,不仅仅是处理请求的工具,而是能够进行真实对话的伙伴。
3/3/2025 9:37:00 AM
AI在线
豆包App更新实时语音通话功能,中文对话断崖式领先,人机难辨!
1月20日,豆包APP更新实时语音通话功能,面向所有用户开放。 该功能基于最新豆包实时语音大模型(Doubao Realtime Voice Model)。 更新后,豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果,可以模仿不同声线,并且在“逻辑思考”和“情绪感知”上有明显提升。
1/21/2025 9:16:00 AM
新闻助手
马斯克前女友看好的AI玩具生意,在国内卷起来了
AI好好用报道编辑:杨文700元买一个AI毛绒玩具,这钱花得值吗? AI 圈刮起了玩偶风。 特斯拉卖个人形机器人玩具,一上线就被抢光。
11/23/2024 8:58:00 PM
AI好好用
AI 帮你总结群聊、记录事项,韩即时通信巨头 Kakao 推出生成式 AI 助理 Kanana
据韩联社报道,当地的即时通信巨头 Kakao 发布了其最新的生成式 AI 助理“Kanana”,其侧重点在于为用户提供便捷易用的 AI 服务。据 Kakao 公司 CEO 郑新雅(音译)介绍,Kanana 不仅仅是传统 AI 助手,它的定位是“AI 伴侣”,能够在对话中记住关键信息,并根据上下文为用户提供回应。其具备理解群组对话的能力,并能提供相应的智能回应。
10/22/2024 12:13:20 PM
清源
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊
OpenAI 上线高级语音模式:翻开 AI 语音聊天新篇章,能用中文等 50 多种语言说“抱歉我迟到了”
感谢OpenAI 公司今天(9 月 25 日)发布博文,宣布面向所有 Plus 和 Team 订阅用户,推出高级语音模式(Advanced Voice Mode,简称 AVM),标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试,OpenAI 希望通过语音,提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下:改善对话体验:AVM 可实现更流畅、反应更迅速的对话,让用户能够打断人工智能,并对话题的变化做出即时反应。新的声音:新增 Arbor、Maple、Sol、Spruce 和 V
9/25/2024 11:36:21 AM
故渊
安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊
科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎
9/13/2024 8:33:38 AM
故渊
我国研发具备共情能力导诊大模型:有望用于术前谈话,减少医患冲突
据《北京日报》14 日报道,中国医学科学院基础医学研究所团队研发的导诊大模型 ——“特定场景提示增强对话机器人”,近日通过临床试验。该模型兼具专业性和共情能力,不仅能够应用于导诊工作,未来也有望用于患者健康教育、术前谈话等更多复杂场景。图源 Pixabay据悉,该大模型的构建以不同医学场景全方位采集的真实导诊对话为基础,以提取对话信息形成的知识库作为训练数据,能够解决不同医学场景中出现的各种特定问题。研究团队为采集原始医患对话记录,成立了“真实医学对话语料联盟”,建立了语音采集 自动文字转化 人工校对的标准化流
8/15/2024 11:58:27 AM
清源
快手推出“飞船”App:基于“快意”AI 模型,主打虚拟陪伴
快手在发布可灵图生视频模型之后,最新推出了“飞船”(Kraft)AI 对话助手,提供个性化的对话体验。官方介绍称,飞船(Kraft)智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色
8/14/2024 9:01:01 AM
故渊
谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用
8/14/2024 3:02:04 AM
故渊
字节豆包大模型已支持实时语音通话
IT 之家 8 月 9 日消息,字节跳动旗下火山引擎今日宣布推出对话式 AI 实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎 RTC 实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮助应用实现用户和云端大模型的实时语音通话。▲ 对话式 AI 实时交互服务方案架构字节跳动介绍称,对话式 AI 实时交互解决方案支持开箱即用快速搭建,只需调用标准的 OpenAPI 接口即可配置所需的语音识别(ASR
8/9/2024 2:27:22 PM
汪淼
macOS 版 ChatGPT 被指以纯文本存储 AI 对话,OpenAI 紧急更新修复
IT之家 7 月 4 日消息,开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态,表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话,OpenAI 公司今天回应称已更新其应用,对存储在 Mac 设备上的聊天记录进行了加密处理。IT之家 6 月 26 日报道,OpenAI 公司发布了适用于苹果 macOS 系统的 ChatGPT 聊天机器人应用程序。OpenAI 称,macOS 版 ChatGPT 将无缝集成用户日常操作,原生支持 Mac 系统,并提供方便的快捷键 (Opt
7/4/2024 7:29:10 AM
故渊
macOS 版 ChatGPT 被指以纯文本存储 AI 对话,OpenAI 紧急更新修复
IT之家 7 月 4 日消息,开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态,表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话,OpenAI 公司今天回应称已更新其应用,对存储在 Mac 设备上的聊天记录进行了加密处理。IT之家 6 月 26 日报道,OpenAI 公司发布了适用于苹果 macOS 系统的 ChatGPT 聊天机器人应用程序。OpenAI 称,macOS 版 ChatGPT 将无缝集成用户日常操作,原生支持 Mac 系统,并提供方便的快捷键 (Opt
7/4/2024 7:29:10 AM
故渊
能在后台对话!iOS 版 ChatGPT App 1.2024.150 更新带来多任务交互体验
距离苹果与 OpenAI 达成官方合作、将类似 ChatGPT 的智能功能引入 iOS 18 仅剩几天时间。图源 Pexels在这一重磅消息揭晓前夕,ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与 ChatGPT 进行对话。这将为 iPhone 用户带来媲美桌面端的强大交互体验。IT之家注意到,ChatGPT 的这项全新多任务功能默认处于关闭状态,需要手动开启。以下为详细步骤:更新 ChatGPT 应用至最新版本。点击侧边栏底部的用户名,打开应用设置。
6/6/2024 7:47:56 AM
远洋
ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜
【新智元导读】LLM 有记忆能力吗?有,也没有。虽然 ChatGPT 聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章,核心观点是 —— 虽然很多 LLM 看起来有记忆,但本质上是无状态函数。文章地址: 和 FireFox 的联合创始人、JavaScript 发明者 Brendan Eich 也在推特上称赞这篇博客。似乎有记忆的 LLM从计算机科学
6/1/2024 2:47:56 PM
清源
学而思学习机智能助手“小思”升级:新增作业模式、圈圈学、AI 口语分级练
IT之家从学而思智能官方公众号获悉,学而思学习机内置智能助手“小思”升级至 2.0 版本,新增了作业模式、圈圈学、AI 口语分级练、小思对话等 AI 功能。小思作业模式有多种作业布置方式,可以自己拍照添加,也可以通过家长端添加;写作业时,会有任务计时、轻音乐背景;完成作业后,可以拍照提交作业,同步到家长端。写作业时遇到问题,可以呼唤“小思小思”,不认识的字和单词小思可以给出提示,对于数学题小思会给出思路引导并进行主动提问。新增“小思圈圈学”功能,遇到问题将其圈起来,可实现数学题目思路指引、英语翻译、生字讲解等。“A
5/31/2024 5:34:06 PM
沛霖(实习)
用户吐槽微软 Copilot Pro 有偏执倾向,会单方面结束对话
微软昨日宣布,在全球 222 个国家和地区推出 Copilot Pro,并提供 1 个月免费试用,后续每月费用为 20 美元。不过根据网友的反馈,Copilot Pro 的表现无法令其满意,存在偏执、多疑等倾向。根据网友晒出的图片,Copilot Pro 在经历几段对话之后,语气会变得比较强硬,然后会单方面中断对话。IT之家附上截图如下:另一位 Reddit 用户也表达了自己的失望:我现在非常恼火。我本来表现得非常得体和友好,但它却关闭了我的对话,如果这有什么关系的话,我用的是手机,总之,我试着跟它解释为什么关闭对
3/16/2024 9:11:35 AM
故渊
在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型
编辑 | 白菜叶医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(se
1/16/2024 6:44:00 PM
ScienceAI
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
本地部署DeepSeek+DiFy平台构建智能体应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练