AI资讯列表 - AI在线

论文荣登计算机体系结构顶会ISCA，芯片架构成为边缘AI最佳并行计算选择

AI 大模型的爆发带动了 GPU 的强劲需求，从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。通过对比 GPGPU、FPGA、NPU 和 ASIC，可重构计算架构 CGRA 成为最适合边缘 AI 的并行计算架构。由芯动力提出的可重构并行处理器（RPP）是比传统 CGRA 更适合大规模并行处理的计算架构，这不但通过试验评测得到证实，而且也通过 ISCA 会议得到国际学术权威的认可。基于 RPP 架构的 R8 芯片及后续更高性能的迭代芯片将是边缘 AI 服务器和 AI PC 的理想 AI 加

不用部署，实现大模型切换自由！Token、算力免费薅！咱AI开发者今年整个秋天的奶茶都省出来了！

作为全公司产品做的最好的工程师，同时也是代码写得最好的产品经理，你深刻地知道：搞个靠谱的 AI 应用需要灵感，而好的灵感则需要一个靠谱的 demo 来验证。然而……当你已喝上了秋天的第一杯奶茶时，你的 demo 调用的却还是隔壁工位的小胡今年春天部署的第一个大模型…我们都知道：不是小胡懒得更新，而是帮你的 demo 换个模型 API 真的有点麻烦……首先，随着模型文件体积的不断增大，仅下载这些文件就需要花费个几天时间；而当文件下载完成后，又常常面临存储空间不足的问题，每增加一个新的模型版本，账单基数就又跳个台阶在下

开源AI视频工具，你只需要当导演，HuggingFace工程师打造

用 Clapper 做视频，你只需要当导演就行了。Sora 一出，视频领域似乎已经进入了生成式 AI 时代。不过直到今天，我们仍然没有用上 OpenAI 的官方视频生成工具，等不及的人们已经开始寻找其他的方法。最近几周，一款开源的视频编辑工具 Clapper 引发了人们的关注。与很多科技公司提供的视频生成器不同，Clapper 是一款开源 AI 故事可视化工具，于一年前推出原型。它的设计目的并非取代传统视频编辑器，或使用 3D 场景作为输入的现代 AI 编辑器。Clapper 的理念是集合各类生成式 AI 技术，让

首个支持普通话和方言混说的TTS大模型：河南话、上海话、粤语说得溜

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]自 2024 年 GPT-4o 出现以来，业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内，中文语音合成大模型如雨后春笋般涌现，如 chattts、seedtts、cos

首个全自动科学发现AI系统，Transformer作者创业公司Sakana AI推出AI Scientist

编辑 | ScienceAI一年前，谷歌最后一位 Transformer 论文作者 Llion Jones 离职创业，与前谷歌研究人员 David Ha共同创立人工智能公司 Sakana AI。Sakana AI 声称将创建一种基于自然启发智能的新型基础模型！现在，Sakana AI 交上了自己的答卷。Sakana AI 宣布推出 AI Scientist，这是世界上第一个用于自动化科学研究和开放式发现的 AI 系统！从构思、编写代码、运行实验和总结结果，到撰写整篇论文和进行同行评审，AI Scientist 开启

最强 AI 程序员 Genie 砸饭碗：84 秒跑通代码，像人一样思考，团队仅 5 人

继 Devin 之后，又一个 AI 软件工程师被刷屏了 —— 它叫 Genie，号称目前地表最强，已经可以像人一样思考和行动了！那么这个“地表最强”，到底强到什么程度？先来看下评测分数。在权威榜单 SWE-Bench 中，Genie 以解决了 30.07% 问题的成绩夺得榜首。（SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名 19.27%，解锁了提升 SOTA 的最大增幅 —— 57%！至于 Genie 的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解

首位“AI 科学家”问世：已独立生成 10 篇学术论文，还顺手搞了 AI 审稿人

史上首位“AI 科学家”，横空出世！一登场就一口气生成了十篇完整学术论文。▲ AI 生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码，到在 GPU 上执行实验并收集结果，最后完成论文撰写，一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元（约 107.62 元）。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统，The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司：Sakana AI。而且！这公司搞的事情

斥资 6.65 亿美元，AMD 完成收购欧洲最大私人 AI 实验室 Silo AI

AMD 今日正式宣布，已完成对欧洲最大私人 AI 实验室 Silo AI 的收购，交易金额约为 6.65 亿美元（AI在线备注：当前约 47.73 亿元人民币），采用全现金支付。至此，Silo AI 的科学家和工程师正式加入 AMD 大家庭。AMD 对 AI 领域的重视不言而喻，此次收购是其战略布局的重要一步，旨在进一步强化公司在 AI 及相关技术领域的领导地位。与谷歌、Meta、苹果等科技巨头一样，AMD 也在积极向 AI 转型，但与之不同的是，AMD 在这一领域的投入相对较晚。AMD 加速计算事业部（AIG）高

Falcon Mamba 7B 开源模型登顶：换掉 Transformer，任意长序列都能处理

只是换掉 Transformer 架构，立马性能全方位提升，问鼎同规模开源模型！（注意力机制不存在了）这就是最新 Falcon Mamba 7B 模型。它采用 Mamba 状态空间语言模型架构来处理各种文本生成任务。通过取消传统注意力机制，有效提升了模型处理长序列时计算效率低下的问题。它可以处理无限长序列，但内存需求不增加。无论上下文多长，生成每个 token 的时间基本一样。由此，Falcon Mamba 模型性能全方位提升，打败一众 Transformer 架构模型，如 Llama-3.1（8B）、Mistra

「AI 数据荒」雪上加霜，MIT 发现网页数据的公开共享正走向衰落

人工智能系统依靠充足、高质量的训练数据来获得高性能，但 MIT 等机构最近的一项研究发现，曾经免费提供的数据在多个方面变得越来越难获取。随着 GenAI 产品开发和研究变得越来越广泛，训练数据的抓取许可也越来越成为受关注的话题。最近，吴恩达在网站 The Batch 上提及了一篇有关数据许可的研究，其结果似乎让本就迫近的「AI 数据荒」雪上加霜。研究人员发现，C4、RefineWeb、Dolma 等开源数据集所爬取的各种网站正在快速在收紧他们的许可协议，曾经触手可及的开放数据越来越难以获取。这不仅会影响商用 AI

复旦团队国际首次验证超快闪存集成工艺：20 纳秒超快编程、10 年非易失

感谢据复旦大学官方今日消息，人工智能的飞速发展迫切需要高速非易失存储技术。当前主流非易失闪存的编程速度在百微秒级，无法支撑应用需求。复旦大学周鹏-刘春森团队前期研究表明二维半导体结构能够将速度提升一千倍以上，实现颠覆性的纳秒级超快存储闪存。然而，如何实现规模集成、走向实际应用极具挑战。从界面工程出发，复旦大学团队在国际上首次验证了 1Kb 超快闪存阵列集成验证，并证明了超快特性可延伸至亚 10 纳米尺度。北京时间 8 月 12 日下午 5 点，相关成果以《二维超快闪存的规模集成工艺》（“A scalable int

阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本

感谢阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。作为一个大规模音频语言模型，Qwen2-Audio 能够接受各种音频信号输入，并根据语音指令执行音频分析或直接响应文本，有两种不同的音频交互模式：语音聊天：用户可以自由地与 Qwen2-Audio 进行语音互动，而无需文本输入音频分析：用户可以在互动过程中提供音频和文本指令对音频进行分析官方在一系列基准数据集上进行了测试，Qwen2-Audio 超越了先前的最佳模型。▲ Q

梅赛德斯-奔驰中国与火山引擎战略合作，重点探索大模型应用

8月13日，梅赛德斯-奔驰（中国）投资有限公司（以下简称“梅赛德斯-奔驰中国”）与北京火山引擎科技有限公司（以下简称“火山引擎”）双方官宣签署战略合作备忘录，以前沿AI科技加持智能座舱技术发展，在大模型、生成式人工智能和大数据等领域开展探索和合作，以“中国速度” 为中国客户带来数字豪华的产品和科技。梅赛德斯-奔驰（中国）投资有限公司高级执行副总裁、梅赛德斯-奔驰中国研发和采购负责人欧立甫（Oliver Löcher）表示：“中国已成为全球汽车产业创新的核心驱动力之一。多年来，我们不断加大在华研发投入，特别是在数字化

豆包上线音乐生成，用户可一键生成词曲

8月8日，字节跳动旗下智能AI助手豆包上线音乐生成功能。用户在豆包的“音乐生成”中输入主题或自己写的歌词，设定音乐风格、情绪及音色，便能快速生成一首约1分钟的词曲，每个人都能体验音乐创作和表达的乐趣。目前，豆包音乐生成功能提供民谣、嘻哈、R&B等11种音乐风格，其中还涵盖了爵士、雷鬼、电音等相对小众的曲风，用户可选择男声或女声演唱。生成的声音，在吐字清晰度和流畅性上表现很好。同时，为让AI音乐更好贴合普通用户的情感表达，豆包预设了快乐、伤感等多种情绪状态。借助豆包，用户可以创作更具个人属性的音乐。例如，在一次骑行之

四个月融两轮，千寻智能获 2 亿元天使轮融资；大模型公司卓世科技获亿元人民币 B+ 轮融资；小鹏机器手首次亮相丨AI情报局

今日融资快报四个月融两轮，具身智能机器人公司千寻智能获得2亿人民币天使轮融资千寻智能创始人兼CEO韩峰涛在机器人行业拥有十余年丰富经验，曾任珞石机器人联合创始人&CTO，是国内高性能轻型工业机器人领军者和国内力控协作量产交付第一人。千寻智能也是国内唯一具备AI 机器人生产力级全栈技术能力的具身智能公司，先后完成了近2亿元的种子轮天使轮融资。天使轮融资由弘辉基金领投，达晨和千乘跟投，种子轮投资人顺为资本和绿洲资本继续跟投。

IBM 推出生成式 AI 网络安全助手

近日，IBM 宣布在其托管威胁检测和响应服务中引入生成式 AI 功能，供 IBM Consulting （IBM 咨询）的分析人员使用，从而协作客户推进和简化安全运营。全新的 IBM Consulting Cybersecurity Assistant 基于 IBM 的数据和 AI 平台 watsonx 构建，旨在加快和改进对关键安全威胁的识别、调查和响应。除了被纳入 IBM Consulting 的威胁检测和响应服务，Cybersecurity Assistant 还将成为 IBM Consulting Adva

Meta 深化与环球音乐合作：遏制 AI 音乐影响，提高艺术家报酬

Meta 公司昨日发布公告，宣布和环球音乐集团（Universal Music Group）深化合作，达成了新的多年合作协议。Meta 公司在公告中表示，新协议反映了双方共同致力于保护人类创作者和艺术，包括确保艺术家和词曲作者得到公平报酬，帮助艺术家和词曲作者在 Meta 平台上提供更广阔的发展空间和商业机遇。两家公司并未披露协议细节，不过双方表示会进一步推动 UMG 艺术家和环球音乐出版集团歌曲作者在 Facebook、Instagram、Messenger、Horizon、Threads 以及 WhatsApp

我国完成备案并上线、能为公众提供服务的生成式 AI 服务大模型达 180 多个

据“工信微报”消息，在日前召开的第十二届互联网安全大会上，中央网络安全和信息化委员会办公室副主任、国家互联网信息办公室副主任王京涛介绍，截至目前，我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型达 180 多个，注册用户数已突破 5.64 亿。据介绍，近年来我国人工智能发展取得显著成效。一方面，初步构建了较为全面的人工智能技术产业体系，相关企业超过 4500 家，产业规模持续扩大；另一方面，人工智能与实体经济融合不断深化，人工智能应用加速探索，建成 2500 多个数字化车间和智能工厂，经过人工智能