AI资讯列表 - AI在线

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]文章的第一作者是上海交通大学博士研究生赵峻图（主页：），他的研究方向包括计算机视觉和人工智能赋能的生命科学。此外，他还担任上海交通大学校田径队队长。文章的通讯作者为上海交通大学长聘教轨助理

智谱版Sora开源爆火：狂揽4K Star，4090单卡运行，A6000可微调

智谱AI把自研打造的大模型给开源了。国内视频生成领域越来越卷了。刚刚，智谱 AI 宣布将与「清影」同源的视频生成模型 ——CogVideoX 开源。短短几个小时狂揽 4k 星标。代码仓库：：：月 26 日，智谱 AI 正式发布视频生成产品「清影」，得到大家广泛好评。只要你有好的创意（几个字到几百个字），再加上一点点耐心（30 秒），「清影」就能生成 1440x960 清晰度的高精度视频。官宣即日起，清影上线清言 App，所有用户都可以全方位体验。想要尝试的小伙伴可以去「智谱清言」上体验「清影」生视频的能力。「清影

AIGCRank：2024年7月AI微信公众号排行榜

AI在线发布第 2 期「AI行业微信公众号排行榜」2024年7月月度 TOP50 榜单

ACL 2024 Oral | 大模型也会被忽悠？揭秘AI的信念之旅

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本篇论文的第一作者是清华大学交叉信息院的二年级硕士生许融武。主要指导老师为美国东北大学 Weiyan Shi 助理教授、清华大学邱寒助理教授和徐葳教授。地球是平的吗？当然不是。自古希腊数学

错误率从10%降至0.01%，领英全面分享LLM应用落地经验

随着大型语言模型（LLM）技术日渐成熟，各行各业加快了 LLM 应用落地的步伐。为了改进 LLM 的实际应用效果，业界做出了诸多努力。近期，领英（LinkedIn）团队分享了他们在构建生成式 AI 产品的过程中总结的宝贵经验。领英表示基于生成式人工智能构建产品并非一帆风顺，他们在很多地方都遇到了困难。以下是领英博客原文。过去六个月，我们 LinkedIn 团队一直在努力开发一种新的人工智能体验，试图重新构想我们的会员如何进行求职和浏览专业内容。生成式人工智能的爆发式增长让我们停下来思考，一年前不可能实现的事情现在有

科大讯飞发布智能办公本Air 2，打造更懂你的办公AI助手

更懂你的AI助手，让办公轻得自在。8月6日，科大讯飞举行“AI懂你，轻得自在”智能办公本新品发布会，正式发布科大讯飞智能办公本Air 2系列。Air 2深度融合了讯飞星火大模型能力，带来会议纪要、笔记分析、AI写作三大AI绝招；Air 2也首次使用了语义转折点识别算法，大幅提升多人会议的分角色转写准确率；此外，Air 2还拥有88.5%超大视觉屏占比，在轻薄便携的同时带来墨水屏视野“大”体验。轻薄超便携，88.5%超大屏占比Air 2采用了8.2英寸E Ink墨水屏，并拥有88.5%超大视觉屏占比，同时依然保持了5

免费！字节这款AI音乐神器，30秒速成抖音神曲

机器之能报道编辑：杨文抖音神曲制造机。近日，字节酝酿许久的 AI 音乐创作神器 —— 海绵音乐，终于向公众开放啦！只需要输入主题或者几句歌词，短短几十秒钟，它就能一口气创作出 3 首神曲。歌词、旋律、演唱一锅出，看来以后抖音上会蹦出一堆 AI 歌曲。例如，我们输入「不想上班了，想回家种地」，不到 30 秒，三首民谣歌曲就出炉了。试听链接：，第一首竟有点赵雷的味道。-1-206 首精选歌曲，总有一款适合你与 Suno 类似，海绵音乐也推出了精选榜单，涵盖 R&B、摇滚、嘻哈、电子、国风等多种音乐风格。我们耐着性子数了

最晚明年上半年落地L3：理想端到端自动驾驶，性能大幅提升

最近一段时间，生成式 AI 技术兴起，众多造车新势力都在探索视觉语言模型与世界模型的新方法，端到端的智能驾驶新技术似乎成为了共同的研究方向。上个月，理想汽车发布了端到端 VLM 视觉语言模型世界模型的第三代自动驾驶技术架构。此架构已推送千人内测，将智能驾驶行为拟人化，提高了 AI 的信息处理效率，增强了对复杂路况的理解和应对能力。李想曾在公开的分享中表示，面对大部分算法难以识别和处理的罕见驾驶环境，VLM（Visual Language Model）即视觉语言模型可以系统地提升自动驾驶的能力，这种方法从理

共探产业第二增长曲线！2024腾讯全球数字生态大会定档9月5日

即日，腾讯宣布2024年腾讯全球数字生态大会定档于9月5日——6日，在深圳国际会展中心举行。大会将以“智启新机，云驱增长”为主题，与海内外客户、生态合作伙伴、技术开发者、政府及社会组织，共同探讨AI等前沿数字技术的新发展，探索数字化助力产业新增长的现实可行路径。腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生表示，增长是企业发展的核心诉求。AI大模型的持续落地，为行业发展、模式创新带来新一轮机遇；以数字化为核心的营销、服务、生产、经营流程的重塑，成为企业实现发展创新、降本增效的切实路径；同时，以“云”为载

准确率达60.8%，浙大基于Transformer的化学逆合成预测模型，登Nature子刊

编辑 | KX逆合成是药物发现和有机合成中的一项关键任务，AI 越来越多地用于加快这一过程。现有 AI 方法性能不尽人意，多样性有限。在实践中，化学反应通常会引起局部分子变化，反应物和产物之间存在很大重叠。受此启发，浙江大学侯廷军团队提出将单步逆合成预测重新定义为分子串编辑任务，迭代细化目标分子串以生成前体化合物。并提出了基于编辑的逆合成模型 EditRetro，该模型可以实现高质量和多样化的预测。大量实验表明，模型在标准基准数据集 USPTO-50 K 上取得了出色的性能，top-1 准确率达到 60.8%。结果

OpenAI 宣布 10 月起举办第 2 届 DevDay 开发者大会：无新 AI 模型，聚焦 API 和开发工具

OpenAI 公司宣布将于 2024 年 10 月 1 日起，在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动，遗憾的是本次活动不会发布新的 AI 前沿模型。OpenAI 计划在旧金山、伦敦和新加坡分别举办活动，AI在线附上具体日程如下：旧金山：10 月 1 日伦敦：10 月 30 日新加坡：11 月 21 日OpenAI 公司于 2023 年 11 月举办了首届 DevDay 开发者大会，公布了具有 128K 上下文和更低价格的 GPT-4 Turbo、新的 Assistants API、GPT-4

图灵奖得主 LeCun 加盟 AI 芯片黑马 Groq，估值 28 亿美元挑战英伟达

英伟达又双叒迎来强劲挑战者了。成立于 2016 年的初创公司 Groq 在最新一轮融资中筹集了 6.4 亿美元，由 BlackRock Inc. 基金领投，并得到了思科和三星投资部门的支持。目前，Groq 的估值已经达到 28 亿美元。公司创始人 Jonathan Ross 曾在谷歌从事 TPU 芯片的开发，而 Groq 目前的顶梁柱 LPU 也是专门用于加速 AI 基础模型，尤其是 LLM。Ross 表示，一旦人们看到在 Groq 的快速引擎上使用大语言模型有多么方便，LLM 的使用量将会进一步增加。以更低的价格

你能分辨 AI 生成的图片和真实照片吗？微软总裁挑战你的眼力

微软副董事长兼总裁布拉德・史密斯推出了一项趣味测试，挑战人们辨别 AI 生成图像和真实照片的能力。他在名为“真或假”网站上线了该测试，每个测试包含 15 张图片，玩家需要判断图片是 AI 生成的还是真实拍摄的。测试中的图片每次都会随机更换，因此玩家可以反复挑战，提高鉴别能力。虽然最初的几道题相对简单，但随着测试的进行，难度逐渐增加。尽管有些图片一眼就能看出真假，但 AI 生成图像的逼真度已经达到令人惊讶的水平。同时，现实世界中也存在许多奇特的场景，足以迷惑人们。经过多次尝试，笔者发现测试难度逐渐增加，前十题相对简单

英伟达神秘视频基础模型「Cosmos」曝光，数据全靠偷

为了这个视频模型，英伟达每天正在疯狂地爬取相当于 80 年时长的视频数据。今天，一则关于英伟达要下场做视频模型的消息引爆了 Reddit。消息源出自外媒 404 Media，据它获得的 Slack 聊天（英伟达的内部聊天平台）、电子邮件和文件显示，英伟达正在从 Youtube 和其他几个来源抓取视频，收集用于其 AI 产品的训练数据。404 Media 查看的英伟达内部对话显示，当参与该项目的员工提出有关使用「禁止商用的研究数据集」和「YouTube 视频」可能产生法律问题时，管理人员告诉他们，他们已获得公司最高层

OpenAI人事地震：奥特曼盟友Brockman长期休假，联创Schulman转投Anthropic，产品负责人已离职

OpenAI 的领导层，再次传来三则人事变动的重要消息。首先，OpenAI 总裁、11 位联合创始人之一 Greg Brockman 将长期休假。这位高管在将 OpenAI 突破性成果转化为大规模 AI 模型和产品（如 ChatGPT）方面发挥了至关重要的作用，而且在山姆・奥特曼被董事会罢免后争取重返公司期间，他还是山姆・奥特曼的重要盟友。Greg Brockman 告诉员工的版本是，自己计划在延长假期后重返公司。不过，身居要职的高管进行长期休假，难免让外界产生一些猜测。此外，另一位联合创始人 John Schul

英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

科技媒体 404Media 披露的文件显示，英伟达收集了大量受版权包含的内容，用于训练人工智能（AI）。该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示，英伟达从 YouTube 等多个来源收集视频素材，用于扩充训练 AI 的数据集。该媒体披露的对话显示参与该项目的员工曾提出质疑，认为擅自使用 YouTube 视频以及研究目的编译的数据集，在法律层面可能会存在问题。不过项目经理的回复是，这种收集模式已经获得了公司最高层的许可，可以使用这些内容训练 AI，并认为“完全符合版权法的文字描述和精神”。一位

OpenAI 宣布改变开发者大会举办形式，不会公布 GPT-5

8 月 6 日消息，去年，人工智能初创公司 OpenAI 在旧金山举办了首次开发者大会，声势浩大，并推出了包括最终未能成功的 GPT Store（类似苹果应用商店）在内的多款新产品和工具。然而，今年的活动将相对低调。本周一，OpenAI 宣布，将其 DevDay 开发者大会转型为一系列聚焦开发者的参与式会议。公司还确认，在 DevDay 期间不会发布下一代主旗舰模型，而是将重点放在其 API 和开发者服务的更新上。OpenAI 发言人透露：“我们不打算在开发者大会上宣布我们的下一个模型。我们将更多地专注于向开发者介

OpenAI 人事巨变：三位核心人物一个休长假，两个离职

感谢据彭博社报道，OpenAI 公司发言人表示，OpenAI 总裁、公司核心人物之一 Greg Brockman 将休长假，以“放松和充电”。另外，研究员 John Schulman 今日离职，将前往竞争对手人工智能 AI 初创公司 Anthropic。Brockman 在 X 上表示，其将休假到年底，他写道，“自 9 年前共同创立 OpenAI 以来，这是第一次放松。任务还远没有完成，我们仍然有一个安全的 AGI 需要构建。”Schulman 也证实了他的离职，“我做出了离开 OpenAI 的艰难决定。这个选择源