AI资讯列表 - AI在线

智源更新大模型排行榜：豆包大模型“客观评测”排名国产第一

6月中旬，智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单：在有标准答案的“客观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包大模型）以75.96分排名第二，同时也是得分最高的国产大模型；其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在开放问答等“主观评测”中，Doubao-Pro 同样排名第二，得分超过 GPT-4o 和 GPT-4。图：豆包大模型在 FlagEval 客观评测中获综合评分第二（2024年6月）FlagEval 大

目标打造“超级互联生态系统”，三星明年拟推出配备 AI 的家电产品

感谢据 Businesses Korea 18 日报道，三星电子计划从明年开始在其家电产品内置 AI 功能。继今年早些时候推出其首款 AI 智能手机 Galaxy S24 之后，三星旨在迅速主导横跨家电和智能手机的“超级互联生态系统”，在“AI 竞赛”中与苹果公司一决高下。报道引述行业消息称，三星电子家电部门正在开发相关产品，这是三星首次将“端侧 AI”的计划具体化。具体来看，搭载于设备上的 AI 将通过机器自身来完成信息处理和计算，无需连接服务器。三星已经计划在今年 7 月为支持 Bixby 语音助手控制的智能家

OpenAI 拓展医疗保健领域，GPT-4o 模型打造 AI 工具：辅助筛查 / 治疗癌症

OpenAI 公司宣布和 Color Health 合作，借助 AI 开发造福癌症患者的新方法。双方探索使用 GPT-4o 模型创建 AI 工具 Cancer Copilot，帮助医生根据患者数据（包括个人风险因素和家族史）制定筛查和治疗计划。该工具可以识别缺失的诊断结果，并创建量身定制的工作计划，让医疗服务提供者能够就癌症筛查和治疗做出循证决策。IT之家查询公开资料，Color Health 是一家基因检测公司，成立于 2013 年，总部位于加利福尼亚州的伯灵格姆。该公司致力于简化大规模癌症检测和护理，提供技术、

风清、风雷、风顺，中国气象局发布三个 AI 气象大模型系统

感谢中国气象局昨日（6 月 18 日）发布公告，宣布推出“风清”、“风雷”、“风顺”三种 AI 气象大模型系统。全球中短期预报系统“风清”该模型具有大气强物理融入和可解释性，在实现高效计算的同时，可为预测结果提供物理可解释性依据，自动挖掘包括天气系统内在的物理演变。IT之家援引检验结果，该模型全球可用预报天数达到 10.5 天，超过欧美主流气象预报大模型，尤其是在较长预报时效，具有更为明显的优势。人工智能临近预报系统“风雷”该模型将数据驱动与物理驱动两大科学范式紧密结合，显著提高了公里尺度下 0 至 3 小时雷达回

SD超详细教程！AI创意字体海报设计完整思路

一、前言当夏至晨曦轻抚池塘，垂钓者的悠闲与水中生灵的欢腾交织成章，一幕幕夏日风情画缓缓展开，唤醒心底那份久违的宁静与欢愉。本文聚焦如何用 SD WebUI 巧制夏至字体海报，实战案例解锁设计思路。文中品牌 IP 亮相，纯属友情客串，无任何商业意图。话不多说，直奔主题，满满的设计思路全部奉上，评论区已备好，期待你的独到见解！二、设计思路 1. 制作字体形状画图软件新建画布；绘制字体轮廓，确保位置恰当；保存图像，以备 ControlNet 使用2. 选模型调参数打开 SD/LibLibAI，选择模型，输入正反向

谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音

据谷歌 DeepMind 新闻稿，DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。IT之家获悉，当前 DeepMind 这款 AI 模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步

「千脑计划」启动，模仿人类大脑皮层，开发全新AI，盖茨资助

编辑 | KX一项名为「千脑计划」（Thousand Brains Project）的宏伟新计划正式启动，其目标是开发一种全新的人工智能框架。加州人工智能公司 Numenta 的联合创始人 Jeff Hawkins 表示，该框架将按照与人脑相同的原理运行，但与当今主导人工智能的深度神经网络的原理有着根本的不同。在盖茨基金会的资助下，这项开源计划旨在与电子公司、政府机构和大学研究人员合作，探索其新平台的潜在应用。20 世纪 90 年代，Jeff Hawkins 共同发明了掌上电脑（Palm Pilo）。该公司于 6

成功率超越RoseTTAFold系列，用序列信息直接预测蛋白质-配体复合物结构

编辑 | 萝卜皮蛋白质-配体对接是药物发现和开发中一种成熟的工具，用于缩小实验测试的潜在治疗范围。然而，高质量的蛋白质结构是必需的，而且蛋白质通常被视为完全或部分刚性的。在这里，柏林自由大学（Freie Universität Berlin）的研究人员开发了一个人工智能系统，可以直接从序列信息预测蛋白质-配体复合物的完全柔性全原子结构。虽然经典对接方法仍然更胜一筹，但这也取决于目标蛋白质的晶体结构。除了预测灵活的全原子结构外，预测置信度指标 (plDDT) 还可用于选择准确的预测，以及区分强结合剂和弱结合剂。该研究

AI在用 | 鳌拜和韦小宝秀恩爱、奥特曼和黄仁勋打起来，Luma翻车离谱到可爱

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。前几天，旧金山初创公司 Luma AI 干了件大事，推出新一代 AI 视频生成模型 Dream Machine，声称对标 Sora。大量用户闻风而动，纷纷前去体验，以至于服务器差点被挤爆。至于效果如何，评价呈现两极分化。有网友直呼

金山办公 WPS AI 海外版发布，海外月活设备数已超两亿

亚马逊云科技今日宣布，金山办公海外版使用亚马逊云科技 Amazon Bedrock 等生成式 AI 技术与服务，在海外正式推出人工智能应用 WPS AI，锚定 AIGC（内容创作）、Copilot（智慧助理）、Insight（知识洞察）三方面，为全球用户打造一站式智能办公平台。据介绍，在内容创作方面，基于 Amazon Bedrock 支持的 AnthropicClaude 3 系列模型，WPS AI 可为用户提供包括语义检查、内容改写、文档润色和一键生成 PPT 等功能。自 WPS AI 海外版开启测试以来，以

AI 助力下仅耗时 3 月，英 Materials Nexus 成功开发新型无稀土永磁材料 MagNex

英国企业 Materials Nexus 近日宣布在 AI 平台的助力下仅耗时三月就完成了无稀土永磁材料 MagNex 开发。▲ MagNex 生产场景永磁材料被广泛用于电动汽车、机器人、无人机和风力发电机等行业，而含稀土元素的永磁材料磁性远强于传统永磁体，是这些应用的最佳选择。稀土元素的紧缺，加之对高磁性永磁体的旺盛需求，导致稀土永磁材料的供应不足近在眼前。开发出可替代稀土永磁体的无稀土永磁材料已成为材料科学研究热点。根据IT之家的了解，新材料发现在传统上是一个缓慢而资源密集的过程，通常需要反复试错才能找出有实际

国家药监局：AI 可用于药品说明书适老化改造、业务办理及政策咨询等场景

国家药监局今日印发《药品监管人工智能典型应用场景清单》（以下简称清单），旨在推动人工智能技术在药品监管领域的研究探索。清单列出了 15 个应用场景，如说明书适老化改造、业务办理及政策咨询等，完整内容下载见链接：：说明书适老化改造人工智能技术可用于药品说明书的适老化改造。许多老年人面临着阅读和理解药品说明书困难的问题，利用人工智能大语言模型，可以将药品说明书中专业术语和复杂表述转换为易于理解的语言，或抽取说明书中适合当前用药人的信息开展定制化说明；还可以将说明书文本转换为结构化信息，例如成分、用法、副作用等，便于特定

单镜头16秒720p高清视频一键生成，开源版Sora又有新惊喜了

潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展，支持无缝产出任意风格的高质量短片，令人惊喜的是，他们选择再给开源社区带来亿点点震撼，继续全部开源。开源地址：，能够生成各种酷炫的短片，比如海浪和海螺的亲密接触，还有那些深不可测的森林秘境。人物肖像的渲染也相当逼真。还能精准渲染赛博朋克风，让短片瞬间充满强烈的未来感和科技感。图片经过压缩。也能生成有趣生动的动画镜头，带来极具表现力的视觉体验。

杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！

AI圈这遍地开花的大好局面，让吃瓜群众们甚是惊喜。这几天，大洋彼岸杀疯了！Luma 的热乎劲儿还没过去，昨晚 Runway 就甩出一个王炸 ——Gen-3 Alpha。（查看详情请移步：Runway 版 Sora 发布：高保真、超强一致性，Gen-3 Alpha 震撼到网友了）更没想到的是，一觉醒来，Google DeepMind 也有了新消息，悄咪咪地发布了视频生成语音（V2A）技术的进展。虽然这一功能还未向公众开放，不过从官方放出的视频 Demo 来看，效果那是相当丝滑。同时，Google DeepMind 强

字节打造大模型TTS：不仅能高保真合成，而且支持调整编辑

通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》：你猜的没错，这段有声书并非来自某个专业制作团队，而是一个 AI 模型 Seed-TTS，而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音，这是一种具备诸多妙用的技术，像是让个人智能助理说话、为视频或游戏配音、辅助视障人士、制作有声书等等。对于 TTS 技术研发者来说，流畅自然的表达一直以来都是值得追求的重要目标。字节跳动 Seed Team 发布的 Seed-TTS 不只是一个模型，而是一整个模型系列。论文标题：Seed-TTS:

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港科技大学、香港科技大学（广州）联合完成。主要作者包括：潘乐怡（第一作者），清华大学本科生，研究方向为大模型水印等；刘瑷玮

Runway版Sora发布：高保真、超强一致性，Gen-3 Alpha震撼到网友了

虽然生成的视频只有10秒左右，但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型。刚刚，AI视频生成初创公司Runway推出了新的视频生成基础模型Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。Runway表示，Gen-3 Alpha是即将推出的一系列模型中的首个。系列模型是在为大规模多模态训练而构建的新基础设施上训练的。与Gen-2相比，Gen-3 Alpha在保真度、一致性和运动性方面有了重大改进，并朝着构建通用世界模型迈出了重要一步。在博客中，

AI 教父 Hinton：我支持超级 AI 取代人类

【新智元导读】「AI 教父」Geoffrey Hinton 在最近的采访中表达了自己对 AI 智能的理解 ——LLM 并不是简单的统计模型，已经具备了理解能力。与此同时，网友翻出了去年 12 月的「过期」视频，惊奇地发现 Hinton 早就「叛变」了，竟然对超级 AI 取代人类的未来表示支持。最近，半退休的「AI 教父」Geoffrey Hinton 频频出现在各种采访中，输出他关于 ASI 的各种言论和观点，甚至只是聊点生涯轶事都可以引起网友们的热烈讨论。不到一个月之前，他就揭发了爱徒 Ilya 在暑假受够了炸薯