对话

豆包App更新实时语音通话功能,中文对话断崖式领先,人机难辨!

1月20日,豆包APP更新实时语音通话功能,面向所有用户开放。 该功能基于最新豆包实时语音大模型(Doubao Realtime Voice Model)。 更新后,豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果,可以模仿不同声线,并且在“逻辑思考”和“情绪感知”上有明显提升。

马斯克前女友看好的AI玩具生意,在国内卷起来了

AI好好用报道编辑:杨文700元买一个AI毛绒玩具,这钱花得值吗? AI 圈刮起了玩偶风。 特斯拉卖个人形机器人玩具,一上线就被抢光。

AI 帮你总结群聊、记录事项,韩即时通信巨头 Kakao 推出生成式 AI 助理 Kanana

据韩联社报道,当地的即时通信巨头 Kakao 发布了其最新的生成式 AI 助理“Kanana”,其侧重点在于为用户提供便捷易用的 AI 服务。据 Kakao 公司 CEO 郑新雅(音译)介绍,Kanana 不仅仅是传统 AI 助手,它的定位是“AI 伴侣”,能够在对话中记住关键信息,并根据上下文为用户提供回应。其具备理解群组对话的能力,并能提供相应的智能回应。

安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代

谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅

OpenAI 上线高级语音模式:翻开 AI 语音聊天新篇章,能用中文等 50 多种语言说“抱歉我迟到了”

感谢OpenAI 公司今天(9 月 25 日)发布博文,宣布面向所有 Plus 和 Team 订阅用户,推出高级语音模式(Advanced Voice Mode,简称 AVM),标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试,OpenAI 希望通过语音,提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下:改善对话体验:AVM 可实现更流畅、反应更迅速的对话,让用户能够打断人工智能,并对话题的变化做出即时反应。新的声音:新增 Arbor、Maple、Sol、Spruce 和 V

安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎

我国研发具备共情能力导诊大模型:有望用于术前谈话,减少医患冲突

据《北京日报》14 日报道,中国医学科学院基础医学研究所团队研发的导诊大模型 ——“特定场景提示增强对话机器人”,近日通过临床试验。该模型兼具专业性和共情能力,不仅能够应用于导诊工作,未来也有望用于患者健康教育、术前谈话等更多复杂场景。图源 Pixabay据悉,该大模型的构建以不同医学场景全方位采集的真实导诊对话为基础,以提取对话信息形成的知识库作为训练数据,能够解决不同医学场景中出现的各种特定问题。研究团队为采集原始医患对话记录,成立了“真实医学对话语料联盟”,建立了语音采集 自动文字转化 人工校对的标准化流

快手推出“飞船”App:基于“快意”AI 模型,主打虚拟陪伴

快手在发布可灵图生视频模型之后,最新推出了“飞船”(Kraft)AI 对话助手,提供个性化的对话体验。官方介绍称,飞船(Kraft)智能助手 App 是一款基于先进 AI 技术的互动软件,旨在提升用户的生活质量和工作效率。用户可以通过文字或语音与 AI 助手进行交流,解答疑问、获得娱乐、进行创作和角色定制等。用户在飞船平台上扮演“船长”角色,名为快快的 AI 少女领航员引导用户体验,飞船基于快手自研大模型“快意”,更侧重于虚拟陪伴,拥有快速的回复速度和逼真的语音体验。用户可以在该应用中创建和定制专属 AI 虚拟角色

谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

字节豆包大模型已支持实时语音通话

IT 之家 8 月 9 日消息,字节跳动旗下火山引擎今日宣布推出对话式 AI 实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎 RTC 实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮助应用实现用户和云端大模型的实时语音通话。▲ 对话式 AI 实时交互服务方案架构字节跳动介绍称,对话式 AI 实时交互解决方案支持开箱即用快速搭建,只需调用标准的 OpenAPI 接口即可配置所需的语音识别(ASR

macOS 版 ChatGPT 被指以纯文本存储 AI 对话,OpenAI 紧急更新修复

IT之家 7 月 4 日消息,开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态,表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话,OpenAI 公司今天回应称已更新其应用,对存储在 Mac 设备上的聊天记录进行了加密处理。IT之家 6 月 26 日报道,OpenAI 公司发布了适用于苹果 macOS 系统的 ChatGPT 聊天机器人应用程序。OpenAI 称,macOS 版 ChatGPT 将无缝集成用户日常操作,原生支持 Mac 系统,并提供方便的快捷键 (Opt

macOS 版 ChatGPT 被指以纯文本存储 AI 对话,OpenAI 紧急更新修复

IT之家 7 月 4 日消息,开发者 Pedro Vieito 于 2 天前在 Thread 平台发布动态,表示 macOS 版 ChatGPT 应用会以纯文本方式存储用户对话,OpenAI 公司今天回应称已更新其应用,对存储在 Mac 设备上的聊天记录进行了加密处理。IT之家 6 月 26 日报道,OpenAI 公司发布了适用于苹果 macOS 系统的 ChatGPT 聊天机器人应用程序。OpenAI 称,macOS 版 ChatGPT 将无缝集成用户日常操作,原生支持 Mac 系统,并提供方便的快捷键 (Opt

能在后台对话!iOS 版 ChatGPT App 1.2024.150 更新带来多任务交互体验

距离苹果与 OpenAI 达成官方合作、将类似 ChatGPT 的智能功能引入 iOS 18 仅剩几天时间。图源 Pexels在这一重磅消息揭晓前夕,ChatGPT 官方 iOS 应用迎来重大更新(1.2024.150),用户现在可以在使用其他应用的同时继续与 ChatGPT 进行对话。这将为 iPhone 用户带来媲美桌面端的强大交互体验。IT之家注意到,ChatGPT 的这项全新多任务功能默认处于关闭状态,需要手动开启。以下为详细步骤:更新 ChatGPT 应用至最新版本。点击侧边栏底部的用户名,打开应用设置。

ChatGPT 真能记住你的话吗?DeepMind 与开源大佬揭示 LLM 记忆之谜

【新智元导读】LLM 有记忆能力吗?有,也没有。虽然 ChatGPT 聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。Django 框架的创始人之一、著名开发者 Simon Willison 最近发表了一篇博客文章,核心观点是 —— 虽然很多 LLM 看起来有记忆,但本质上是无状态函数。文章地址: 和 FireFox 的联合创始人、JavaScript 发明者 Brendan Eich 也在推特上称赞这篇博客。似乎有记忆的 LLM从计算机科学

学而思学习机智能助手“小思”升级:新增作业模式、圈圈学、AI 口语分级练

IT之家从学而思智能官方公众号获悉,学而思学习机内置智能助手“小思”升级至 2.0 版本,新增了作业模式、圈圈学、AI 口语分级练、小思对话等 AI 功能。小思作业模式有多种作业布置方式,可以自己拍照添加,也可以通过家长端添加;写作业时,会有任务计时、轻音乐背景;完成作业后,可以拍照提交作业,同步到家长端。写作业时遇到问题,可以呼唤“小思小思”,不认识的字和单词小思可以给出提示,对于数学题小思会给出思路引导并进行主动提问。新增“小思圈圈学”功能,遇到问题将其圈起来,可实现数学题目思路指引、英语翻译、生字讲解等。“A

用户吐槽微软 Copilot Pro 有偏执倾向,会单方面结束对话

微软昨日宣布,在全球 222 个国家和地区推出 Copilot Pro,并提供 1 个月免费试用,后续每月费用为 20 美元。不过根据网友的反馈,Copilot Pro 的表现无法令其满意,存在偏执、多疑等倾向。根据网友晒出的图片,Copilot Pro 在经历几段对话之后,语气会变得比较强硬,然后会单方面中断对话。IT之家附上截图如下:另一位 Reddit 用户也表达了自己的失望:我现在非常恼火。我本来表现得非常得体和友好,但它却关闭了我的对话,如果这有什么关系的话,我用的是手机,总之,我试着跟它解释为什么关闭对

在24项场景中优于人类医生,Google团队开发基于自博弈的诊断对话大模型

编辑 | 白菜叶医学的核心在于医患对话,熟练的病史采集为准确的诊断、有效的管理和持久的信任铺平了道路。能够进行诊断对话的人工智能(AI)系统可以提高护理的可及性、一致性和质量。然而,学习临床医生的专业知识是一个巨大的挑战。Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型(LLM)的人工智能系统,针对诊断对话进行了优化。AMIE 使用一种新颖的基于自博弈(se

MathGPT大模型发布:落地学而思AI学习机

近日,按照《生成式人工智能服务管理暂行办法》规定,学而思大模型MathGPT完成了相关备案并已通过审核,正式成为首批通过备案的教育大模型。据好未来透露,随着MathGPT通过备案,未来将在学习机上陆续落地基于自研大模型的AI能力应用,MathGPT也将从即日起由内测阶段转为全面开放。据了解,学而思学习机陆续上线的功能包括“AI对话学”、“AI讲题助手”、“中英文写作助手”等等。其中“AI对话学”通过多轮对话的方式将精准学定位到步骤级,不管是准确度还是个性化程度上,都实现了代际化的提升。作为教育领域的垂直大模型,Ma