应用
字节豆包大模型已支持实时语音通话
IT 之家 8 月 9 日消息,字节跳动旗下火山引擎今日宣布推出对话式 AI 实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎 RTC 实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,简化语音到文本和文本到语音的转换过程,提供智能对话和自然语言处理能力,帮助应用实现用户和云端大模型的实时语音通话。▲ 对话式 AI 实时交互服务方案架构字节跳动介绍称,对话式 AI 实时交互解决方案支持开箱即用快速搭建,只需调用标准的 OpenAPI 接口即可配置所需的语音识别(ASR
MSU世界视频编码器大赛成绩出炉,腾讯包揽全部指标第一名
今日获悉,由莫斯科国立大学举办的 MSU 世界视频编码器大赛结果揭晓。在全部参赛编码器中,腾讯编码器包揽所有 15 项指标的全部第一,再次斩获全场最佳。MSU 大赛官网比赛结果,腾讯编码器全面第一(MSU Main Report)。注:MSU 比赛规则:结果差别 1% 以内编码器排名相同,存在并列第一。其中,Tencent TVC 在全场各类编码器总计 15 项指标中取得 14 个第一,第一总数最多。在各编码赛道中,Tencent266 编码器包揽 H.266 赛道 15 项指标全部第一;Tencent V265
DeepMind机器人打乒乓球,正手、反手溜到飞起,全胜人类初学者
但可能打不过公园里的老大爷?巴黎奥运会正在如火如荼地进行中,乒乓球项目备受关注。与此同时,机器人打乒乓球也取得了新突破。刚刚,DeepMind 提出了第一个在竞技乒乓球比赛中达到人类业余选手水平的学习型机器人智能体。论文地址: 这个机器人打乒乓球什么水平呢?大概和人类业余选手不相上下:正手反手都会:对手采用多种打法,该机器人也能招架得住:接不同旋转的发球:不过,比赛激烈程度似乎不如公园老大爷对战。对机器人来说,乒乓球运动需要掌握复杂的低水平技能和策略性玩法,需要长期训练。DeepMind 认为战略上次优但可以熟练地
奥特曼「草莓」模型跳票,OpenAI凌晨大新闻,把网友整懵了
GPT-5 大模型?不要太着急。昨晚,很多人彻夜未眠,都在等待 OpenAI 的「大新闻」。因为在本周三,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。奥特曼虽然偶尔会发一些心灵鸡汤,但大多数的推文都是在宣传公司的产品,人们看法很快达成了一致——此中必有深意。有人展开解读:四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?奥特曼在回应网友时也在暗示,惊喜马上就来。这激起了人们的好奇心,预测 GPT-5 发布的时间从草莓成熟所需要的 4 到
英国 CMA 启动对亚马逊与 AI 创企 Anthropic 合作关系第一阶段调查
感谢英国竞争与市场管理局 CMA 当地时间 8 月 8 日宣布,正式启动对亚马逊与 AI 企业 Anthropic 合作关系的第一阶段调查。CMA 将在 2024 年 10 月 4 日前完成本阶段调查并宣布是否启动更广泛详细的第二阶段调查。CMA 此前于 4 月表达了对亚马逊 - Anthropic 等科技巨头与新兴 AI 创企间合作关系的关注,并对这些合作是否符合英国合并法规向第三方征求了意见。亚马逊已累计通过现金或云服务代币积分的形式向 Anthropic 提供了价值 40 亿美元(AI在线备注:当前约 287
小米旗舰设备国际版将接入谷歌 Gemini 大模型,OPPO 此前已接入
感谢小米创办人雷军 8 月 7 日宣布,小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能,7 月 30 日,小米小爱同学「大模型小爱」宣布全量升级,支持自然问答、图片编辑、车外唤醒防御等,覆盖核心品类设备。8 月 5 日,小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能,包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉,2024 Google 开发者大会于 8 月
手机跑大模型提速 4-5 倍:微软亚研院开源新技术 T-MAC,有 CPU 就行
有 CPU 就能跑大模型,性能甚至超过 NPU / GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术 —— T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在 CPU 上高效部署低比特大语言模型一般来说,要想在手机、PC、树莓派等端侧设备上使用大语言模型,我们需要解决存储和计算问题。常见的方法是模型量化,即将模型的参数量化到较低的比特数,比如 4 比特、3 比特甚至更低,这样模型所需的存储空间和计算资源就会减少。不过这也意味着,在执行推理时,需要进行混合精
乒乓球 AI 机器人赢了人类!正反手灵活转换,擦网球高球都能接,专业教练称达到中级选手水平
巴黎奥运会乒乓球团体赛如火如荼,谷歌机器人申请出战 —— 首个达到人类竞技水平的机器人 Agent 发布!你看一个没留神,就赢了专业教练一个球!正反手快速转换,连续进攻也是不在话下~面对一些突发战术,比如长球高球擦网球,也能沉稳应对。实际测试中,机器人实时适应不同选手风格,最终赢下了与初学者的所有比赛,同中级玩家对打也有 55% 的胜率。小小乒乓球,拿下!与它对阵的美国乒乓球明星 Barney J. Reed 给予了高度评价:超出预期,这个机器人已经达到中级水平。看完它的表现,网友们纷纷表示:可以买吗?想要。遭遇战
“法观”明日公测:首个通过中国法考的 AI 模型,Lawbench 跑分超过 GPT-4
感谢中国司法大数据研究院官方公众号昨日(8 月 8 日)发布博文,“法观” AI 大模型产品以客观题 182 分及主观题优秀表现,通过中国法律职业资格考试。“万法”大模型中国司法大数据研究院紧跟大模型应用发展趋势,积极开展大模型前瞻布局,致力于为法律界提供专业的知识体系构建、精准的风险分析模型、智能化法律服务等能力。经过一年多的积累和沉淀,中国法研的“万法”大模型已经开始对外提供服务。“法观”大模型简介“法观”基于“万法”大模型,由中国司法大数据研究院、数智枫桥研究院联合设计研发,天同作为实务共建单位共同部署。“法
马斯克偏心 xAI,被曝挖走十多名特斯拉人才训练 Grok AI 模型
科技媒体 electrek 昨日(8 月 8 日)报道,埃隆・马斯克(Elon Musk)进一步向其 xAI 公司倾斜资源,目前已为其语言模型 Grok 聘请了十几名特斯拉员工,特斯拉公司股东因此提起诉讼。遭股东起诉马斯克在过去一段时间里,多次在公开场合强调特斯拉是一家 AI 公司,不过这种情况在马斯克去年成立新的人工智能初创公司 xAI 后发生变化。AI在线曾于今年 6 月报道,一群特斯拉投资者起诉了马斯克、特斯拉公司及董事会成员,指控马斯克将资源从特斯拉转移到了他的人工智能初创公司 xAI,对特斯拉造成了损害。
OpenAI 任命卡内基梅隆大学教授 Zico Kolter 为新董事,加强 AI 安全管理
OpenAI 公司昨日(8 月 8 日)发布博文,宣布任命济科・科尔特(Zico Kolter)为 OpenAI 董事会成员。Zico Kolter 简介AI在线从报道中获悉,科尔特此前担任卡内基梅隆大学(Carnegie Mellon University)机器学习系的教授和主任,工作主要集中在人工智能的安全性、对齐和机器学习分类器的鲁棒性(robustness)方面。科尔特是卡内基梅隆大学计算机科学教授和机器学习系主任,他在该校担任要职已有 12 年之久。科尔特于 2010 年在斯坦福大学获得计算机科学博士学位
消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI
感谢路透社今天(8 月 9 日)报道,马斯克旗下的 X 平台同意不使用部分欧盟用户数据,来训练其 AI 聊天机器人。爱尔兰一家法院周四表示,社交媒体平台 X 同意在欧盟用户选择撤销同意之前,暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令,要求暂停或限制 X 公司,不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道,X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统,此举是在未事先获
OpenAI 6000 万美元领投网络摄像头公司 Opal;秘塔科技获超 1 亿元人民币融资,蚂蚁集团领投丨AI情报局
今日融资快报主打AI搜索,秘塔科技完成超 1 亿元人民币的新一轮融资,蚂蚁集团领投秘塔科技完成了超 1 亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,本轮投后估值达 1.5 亿美元。 秘塔之前的老股东有明势资本、猎豹移动和丰元资本等。 据了解,百度、腾讯等大型科技公司也曾在这轮融资期间与秘塔接触,最终蚂蚁与秘塔达成交易。
Qwen2-Math 开源 AI 模型发布:阿里通义千问家族新成员,数学能力超 GPT-4o
感谢阿里通义千问 Qwen2 开源家族迎来新成员 Qwen2-Math,共有 15 亿参数、70 亿参数和 720 亿参数三个版本,是基于 Qwen2 LLM 构建、专门用于数学解题的语言模型。简介Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),官方希望为科学界解决需要复杂多步逻辑推理的高级数学问题做出贡献。性能团队在一系列数学基准评测上评估了我们的数学专用模型 Qwen2-Math。在 Math 上的评
消息称蚂蚁集团投资 AI 公司秘塔科技,2023 年以来至少投资 6 家 AI 公司
感谢据晚点 LatePost 报道,秘塔科技近期完成了超 1 亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,本轮投后估值达 1.5 亿美元(AI在线备注:当前约 10.77 亿元人民币)。▲ 秘塔科技产品: AI 搜索消息称百度、腾讯等公司也曾在这轮融资期间与秘塔接触,最终蚂蚁与秘塔达成交易。去年以来,蚂蚁集团在 AI 领域已至少投资 6 家公司,包括大模型公司智谱 AI、月之暗面,视频生成公司爱诗科技、生数科技,AI 芯片公司墨芯和此次的秘塔。据秘塔官网介绍,上海秘塔网络科技有限公司成立于 2018 年
苹芯科技推出两款 PIMCHIP 系列 AI 芯片,探索推动存算一体技术落地
苹芯科技昨日(8 月 8 日)在北京举办“存算于芯智启未来”活动,推出了 PIMCHIP-S300 和 PIMCHIP-N300 两款 AI 芯片。PIMCHIP-S300官方介绍称该 AI 芯片是多模态智慧感知决策芯片,具备高能效、小面积、低功耗、低成本等特点。该芯片搭载基于 SRAM 的存算一体计算加速单元,计算核心能效比高达 27TOPS / W,让计算在存储器内部发生,有效减少计算过程中的数据搬运,核心计算单元的能效提升几十上百倍。AI在线从报道中获悉,PiMCHIP-S300 搭载轻量级 MCU 处理器,
美国监管机构公布新提案:规范 AI 电话 / 短信,遏制诈骗行为
美国联邦通信委员会(FCC)公布了新的提案,希望规范 AI 生成的电话和短信,明确其定义并构建完善的消费者保护机制,并要求运营公司披露关于在电话和短信服务中使用 AI 的报告。AI在线使用 Designer 生成FCC 表示:“这为消费者提供了一个机会,可以识别并避免那些欺诈风险的电话或短信。该机构还希望确保合法使用人工智能,保护和帮助残疾人正常交流”。FCC 希望推动该提案落地,切实保护消费者安全,遏制 AI 诈骗电话和短信,并呼吁电信公司打击这种做法。
美国 FCC 提议 AI 生成电话语音必须“自报”AI 身份,以打击骚扰、欺诈信息
AI“模仿”人类声音的能力日渐成熟,已经有部分用户开始无法凭借第一反应来判断说话者是人类还是人工智能。当前,AI 生成的语音被越来越多地用在语音通话中,例如广告宣传或推销等领域。据 TechRadar 北京时间今天报道,美国联邦通信委员会(AI在线注:下文简称 FCC)正试图打击一些利用 AI 生成通话语音的不法行为和恶意企图,并提出一项提案旨在加强对消费者的保护,使消费者免受“不受欢迎的”AI 自动电话的侵害。FCC 的计划将帮助“定义”AI 生成的电话和短信,从而使委员会能够设置界限和规则,例如强制要求 AI