AI资讯列表 - AI在线

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，来自小红书的技术团队 FireRed，提出了基于大语言模型的 FireRedTTS 语音合成系统，并分享了在短视频配音及聊天式语音对话等应用的一些实践。FireRedTTS 只需要给

突破传统：AI如何应对心电图中的长尾挑战？

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，上海交通大学、上海人工智能实验室和上海交通大学附属瑞金医院联合团队发布基于异常检测预训练的心电长尾诊断模型。论文链接：：Self-supervised Anomaly Detecti

两个人，三周做出开源模型新王Reflection 70B？靠谱吗？

技术报告下周公布。昨天，开源模型领域迎来一匹黑马 —— 一个名为 Reflection 70B 的模型横扫 MMLU、MATH、IFEval、GSM8K，在每项基准测试上都超过了 GPT-4o，还击败了 405B 的 Llama 3.1，成为开源模型新王。（参见《刚刚，开源大模型的新王诞生了：超越 GPT-4o，模型还能自动纠错》）模型发布后，社区反应强烈。官宣推文目前已经有了超过 270 万浏览量。另外，该项目也是目前 HuggingFace 上最热门的项目：Hugging Face：：，该模型仅由两位开发者在

特斯拉将获得 xAI 模型的授权，双方讨论未来收入协议

据华尔街日报报道，马斯克旗下 xAI 公司讨论了分享未来特斯拉收入的协议。根据拟议的协议，特斯拉将获得 xAI 模型授权。据知情人士透露，根据向投资者描述的一项拟议安排，特斯拉将获得 xAI 模型的授权，以助力开发“完全自动驾驶”（FSD）系统，并与这家初创公司分享部分收入。xAI 将协助为特斯拉开发其他功能，包括在其电动汽车内安装类似 Siri 的语音助理，以及为人形机器人 Optimus 提供动力的软件。知情人士称，xAI 和特斯拉之间的收入分享协议条款，部分取决于特斯拉在多大程度上依赖 xAI 的技术，而不是

英伟达携手达慕思大学推出免费生成式 AI 教学工具包

英伟达深度学习研究院（DLI）携手达慕思大学（Dartmouth College），合作开发出了全新、免费的“生成式人工智能教学工具包”（Generative AI Teaching Kit）。达慕思大学工程学兼职助理教授萨姆・雷蒙德（Sam Raymond）参与开发工具包，他表示：“我们的首要目标是让学生了解、掌握各种技能，用于开发自己的 GPU 加速生成式人工智能应用。相信，通过这门课程学习的学生将在就业市场上占据明显优势，并有助于弥补当今各行业的知识差距。”AI在线从报道中获悉，“生成式人工智能教学工具包”包

谷歌 AI 攻克连衣裙，数百品牌商品任你虚拟试穿

谷歌公司于 9 月 5 日周四发布新闻稿，宣布扩充和增强 AI 虚拟试穿工具，现支持用户虚拟试穿来自 Boden、Maje、Sandro、Simkhai 和 Staud 等数百个品牌的数千件连衣裙。谷歌表示连衣裙是该工具搜索次数最多的服装类别之一，但由于连衣裙相比较其它服装更细致和复杂，现有的 AI 扩散技术难以捕捉花卉或几何图案等印花细节，存在较大的挑战。此外，由于连衣裙通常覆盖身体的大部分，并有不同的长度（如中裙、大裙和迷你裙），给人穿上虚拟连衣裙往往会导致身体细节模糊不清。谷歌公司去年发布 AI 虚拟试穿工具

业内首个 AI 大模型供应链安全国际标准发布，蚂蚁集团、微软、谷歌、百度等数十家单位共同编制

世界数字技术院（WDTA）公众号昨日（9 月 6 日）发布博文，宣布其在外滩大会上正式发布了国际标准《大模型供应链安全要求》。该标准由云安全联盟（CSA）大中华区联合蚂蚁集团、微软、谷歌、百度、NIST、Meta、PrivateAI 等数十家单位的专家共同编制。AI在线注：这是业内首个大模型供应链安全国际标准，标志着全球 AI 治理的国际合作又迈出了坚实的一步。云安全联盟（CSA）大中华区主席李雨航表示，大模型系统的运行依赖于分布在全球相互联系的供应链生态系统。李雨航表示此次发布的《大模型供应链安全要求》为大模型系

Flyme AIOS媒体沟通会：星纪魅族携手生态好友，AI点亮美好生活

9 月 6 日，星纪魅族在北京举办「Flyme AIOS 和 TA 的朋友们」媒体沟通会。此次活动是星纪魅族 AI 生态季的一部分，旨在展示星纪魅族在 All in AI 战略驱动下的新动态、新成果。

不仅仅是「GPTs」，支付宝在做一种很新的智能体

9 月 5 日，外滩大会上，蚂蚁集团大模型应用负责人顾进杰完成了演讲，最后一页 PPT 上的唯一一句话是：让我们一起，推开智能体商业时代的大门。他在这段演讲中，透露了支付宝的一个重要动作：启动智能体生态共建计划，推出智能体开发平台「百宝箱」。智能体（AI Agent），在过去两年的大模型之战中，尚被 AI2.0 时代的初创公司视为偏前沿的应用方向，更多考虑的是在技术方面如何提高 Agent 在多轮对话中的鲁棒性。

《时代》公布 2024 年 AI 领域百大影响力人物榜单，魏哲家、黄仁勋和苏姿丰等上榜

《时代》（Time）杂志最新公布了 2024 年 AI 领域百大影响力人物榜单，台积电董事长魏哲家、英伟达首席执行官黄仁勋、AMD 董事长兼首席执行官苏姿丰等上榜。2024 年 AI 领域百大影响力人物榜单分为 4 类：领导者（Leaders）创新者（Innovators）塑造者（Shapers）思想者（Thinkers）在领导者类别中，除了魏哲家和黄仁勋之外，AI在线附上相关人物如下：谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）微软首席执行官萨蒂亚・纳德拉（Satya Nadella）OpenAI

大厂实战！百度APP个人中心 AI 版重构设计复盘

前言 AI 能力的迅猛发展，为产品设计带来了很多新的可能性和机会。百度作为 AI 领域的行业先锋，正在不断探索如何将 AI 技术深度融入到产品中，以赋能改进和提升产品的使用体验。本文将以百度 APP 个人中心 AI 重构项目为例，讲述如何运用 AI 智能推荐和对话能力来解决问题重构体验，将一个传统的固定入口型的个人中心打造成为一个高效智能的 AI 版个人中心。希望能为读者提供新的视角和思路，激发大家对于 AI 原生设计的理解和思考。一、个人中心旧版作为百度 APP 端内业务和基础功能设置的重要回访阵地，个人中

开源大模型新王 Reflection 70B 超越 GPT-4o：新技术可纠正自己幻觉，数学 99.2 分刷爆测试集

开源大模型王座突然易主，居然来自一家小创业团队，瞬间引爆业界。新模型名为 Reflection 70B，使用一种全新训练技术，让 AI 学会在推理过程中纠正自己的错误和幻觉。比如最近流行的数 r 测试中，一开始它犯了和大多数模型一样的错误，但主动在反思标签中纠正了自己。在官方评测中，70B 模型全面超越最强开源 Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro，特别是数学基准 GSM8K 上直接刷爆，得分 99.2%。这个结果也让 OpenAI 科学家、德扑

对抗Deepfake，近百名选手参与开源模型代码接力

当科技博主毕导看到数字人“毕导”大言不惭地抢自己的饭碗时，再一次直呼Amazing。9月6日下午，外滩大会AI创新赛·全球Deepfake攻防挑战赛的表演赛拉开帷幕，用AI技术对抗Deepfake的TOP选手代表，在全网期待中亮相。室外40度的天气，室内400度的热情。来自上海的观众朱先生表示，第一次肉眼看到生成式AI与deepfake检测技术的正面交锋，比赛太有意思了。人工PK人工智能，哪家强？在简短的Top选手颁奖之后，选手之间的比拼再次打响。中国科学技术大学网络空间安全学院和蚂蚁数科天玑实验室联合出题，对选手

华人小哥搞出一个鸡鸣狗叫GPT，可识别「毛孩子」80%的情绪

机器之能报道编辑：杨文铲屎官终于能理解汪星人的小心思了。「狗语翻译器」已经席卷娱乐圈。在节目中，贵气男孩尤长靖花了八百块钱，买了个「狗语翻译器」。视频链接：，「有两百的、四百的和八百的，要买哪个？」尤长靖斩钉截铁地说，「买八百的」。因为一分钱一分货，越贵的肯定越精准。结果买回来，它就各种胡言乱语。郭麒麟和陆虎也同样玩起了「狗语翻译器」。视频链接：，不少买家吐槽，这类长得像个蝴蝶结的狗语翻译器，简直就是智商税。狗叫的时候没反应，狗睡觉了它开始说话了。现在，AI 闯进了这个小众赛道，带来了不一样的效果。一位华人小哥搞出

“国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布，号称中文效果比 GPT-4o 更出色

西湖心辰昨日发布了心辰 Lingo 语音大模型，号称是“国内首个端到端通用语音大模型”。官方表示，针对心辰 Lingo 端到端语音大模型的能力，在多个领域和中文上进行增强，使得心辰 Lingo 的中文语音效果，相较 GPT-4o 更为出色。心辰 Lingo 于 8 月 24 日开启内测，至今已经有超千家企业用户预约测试。相比较传统 TTS，端到端语音大模型则是一种更为全面的技术，不仅可以语音识别，还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节，实现了从语音输入到语音反馈的完整交互过程。心辰 Ling

4800个大模型团队竞逐「产业真题」，这场金融科技大赛火出圈了

今年 7 月，一份《全球数字经济白皮书 (2024)》统计显示，全球目前已有 1300 多个基础大模型，美国的数量最多，中国紧随其后排在第二。这一数字对比说明，在大模型这张「牌桌」上，中美是最具实力的两个玩家。曾经，中国奋力追赶「OpenAI 们」，两年之后我们可以看到，国产大模型在技术层面已抵达全球第一梯队。而在这个过程中，圈内玩家逐渐分化出两条路线：一派继续卷性能，一派专注搞应用。国内的优势恰恰在于产业场景极其丰富，落地空间极其广阔。面向大模型的下半场战事，业界普遍认为，中国将在应用层展现出更强的后劲。目前的核

高通公司万卫星出席全球AI芯片峰会：以终端侧AI创新开启智能计算全新体验

9月6日，2024全球AI芯片峰会在北京召开。全球AI芯片峰会至今已成功举办六届，现已成为国内规模最大、规格最高、影响力最强的产业峰会之一。本届峰会以“智算纪元共筑芯路”为主题，共50多位来自AI芯片、Chiplet、RISC-V、智算集群与AI Infra系统软件等领域的嘉宾参与进行了报告、演讲、高端对话和圆桌Panel，对AI芯片筑基智算新纪元进行了全方位解构。高通AI产品技术中国区负责人万卫星受邀参加大会开幕式，并发表了以“终端侧AI创新开启智能计算全新体验”为主题的演讲。他在演讲中提出，高通公司持续深耕A

Andrej Karpathy最新激进观点：Transformer将超越人脑

还说 AI 可能会与人类融合……前些天，OpenAI 前首席科学家 Ilya Sutskever 创立的新公司获得 10 亿美元投资的新闻刷遍了各大新闻头条，而 OpenAI 的另一位早期成员和著名 AI 研究者 Andrej Karpathy 则正在「AI 教育」赛道耕耘，其创立的 Eureka Labs 公司正在积极打造其第一款产品。近日，播客节目 No Priors 发布了对这位著名 AI 研究者的专访视频。来自：No PriorsAndrej Ka