AI资讯列表 - AI在线

SD超详细教程！AI创意字体海报设计完整思路

一、前言当夏至晨曦轻抚池塘，垂钓者的悠闲与水中生灵的欢腾交织成章，一幕幕夏日风情画缓缓展开，唤醒心底那份久违的宁静与欢愉。本文聚焦如何用 SD WebUI 巧制夏至字体海报，实战案例解锁设计思路。文中品牌 IP 亮相，纯属友情客串，无任何商业意图。话不多说，直奔主题，满满的设计思路全部奉上，评论区已备好，期待你的独到见解！二、设计思路 1. 制作字体形状画图软件新建画布；绘制字体轮廓，确保位置恰当；保存图像，以备 ControlNet 使用2. 选模型调参数打开 SD/LibLibAI，选择模型，输入正反向

谷歌 DeepMind 新研究：利用 AI 模型为无声视频配音

据谷歌 DeepMind 新闻稿，DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。IT之家获悉，当前 DeepMind 这款 AI 模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步

「千脑计划」启动，模仿人类大脑皮层，开发全新AI，盖茨资助

编辑 | KX一项名为「千脑计划」（Thousand Brains Project）的宏伟新计划正式启动，其目标是开发一种全新的人工智能框架。加州人工智能公司 Numenta 的联合创始人 Jeff Hawkins 表示，该框架将按照与人脑相同的原理运行，但与当今主导人工智能的深度神经网络的原理有着根本的不同。在盖茨基金会的资助下，这项开源计划旨在与电子公司、政府机构和大学研究人员合作，探索其新平台的潜在应用。20 世纪 90 年代，Jeff Hawkins 共同发明了掌上电脑（Palm Pilo）。该公司于 6

成功率超越RoseTTAFold系列，用序列信息直接预测蛋白质-配体复合物结构

编辑 | 萝卜皮蛋白质-配体对接是药物发现和开发中一种成熟的工具，用于缩小实验测试的潜在治疗范围。然而，高质量的蛋白质结构是必需的，而且蛋白质通常被视为完全或部分刚性的。在这里，柏林自由大学（Freie Universität Berlin）的研究人员开发了一个人工智能系统，可以直接从序列信息预测蛋白质-配体复合物的完全柔性全原子结构。虽然经典对接方法仍然更胜一筹，但这也取决于目标蛋白质的晶体结构。除了预测灵活的全原子结构外，预测置信度指标 (plDDT) 还可用于选择准确的预测，以及区分强结合剂和弱结合剂。该研究

AI在用 | 鳌拜和韦小宝秀恩爱、奥特曼和黄仁勋打起来，Luma翻车离谱到可爱

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。前几天，旧金山初创公司 Luma AI 干了件大事，推出新一代 AI 视频生成模型 Dream Machine，声称对标 Sora。大量用户闻风而动，纷纷前去体验，以至于服务器差点被挤爆。至于效果如何，评价呈现两极分化。有网友直呼

金山办公 WPS AI 海外版发布，海外月活设备数已超两亿

亚马逊云科技今日宣布，金山办公海外版使用亚马逊云科技 Amazon Bedrock 等生成式 AI 技术与服务，在海外正式推出人工智能应用 WPS AI，锚定 AIGC（内容创作）、Copilot（智慧助理）、Insight（知识洞察）三方面，为全球用户打造一站式智能办公平台。据介绍，在内容创作方面，基于 Amazon Bedrock 支持的 AnthropicClaude 3 系列模型，WPS AI 可为用户提供包括语义检查、内容改写、文档润色和一键生成 PPT 等功能。自 WPS AI 海外版开启测试以来，以

AI 助力下仅耗时 3 月，英 Materials Nexus 成功开发新型无稀土永磁材料 MagNex

英国企业 Materials Nexus 近日宣布在 AI 平台的助力下仅耗时三月就完成了无稀土永磁材料 MagNex 开发。▲ MagNex 生产场景永磁材料被广泛用于电动汽车、机器人、无人机和风力发电机等行业，而含稀土元素的永磁材料磁性远强于传统永磁体，是这些应用的最佳选择。稀土元素的紧缺，加之对高磁性永磁体的旺盛需求，导致稀土永磁材料的供应不足近在眼前。开发出可替代稀土永磁体的无稀土永磁材料已成为材料科学研究热点。根据IT之家的了解，新材料发现在传统上是一个缓慢而资源密集的过程，通常需要反复试错才能找出有实际

国家药监局：AI 可用于药品说明书适老化改造、业务办理及政策咨询等场景

国家药监局今日印发《药品监管人工智能典型应用场景清单》（以下简称清单），旨在推动人工智能技术在药品监管领域的研究探索。清单列出了 15 个应用场景，如说明书适老化改造、业务办理及政策咨询等，完整内容下载见链接：：说明书适老化改造人工智能技术可用于药品说明书的适老化改造。许多老年人面临着阅读和理解药品说明书困难的问题，利用人工智能大语言模型，可以将药品说明书中专业术语和复杂表述转换为易于理解的语言，或抽取说明书中适合当前用药人的信息开展定制化说明；还可以将说明书文本转换为结构化信息，例如成分、用法、副作用等，便于特定

单镜头16秒720p高清视频一键生成，开源版Sora又有新惊喜了

潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展，支持无缝产出任意风格的高质量短片，令人惊喜的是，他们选择再给开源社区带来亿点点震撼，继续全部开源。开源地址：，能够生成各种酷炫的短片，比如海浪和海螺的亲密接触，还有那些深不可测的森林秘境。人物肖像的渲染也相当逼真。还能精准渲染赛博朋克风，让短片瞬间充满强烈的未来感和科技感。图片经过压缩。也能生成有趣生动的动画镜头，带来极具表现力的视觉体验。

杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！

AI圈这遍地开花的大好局面，让吃瓜群众们甚是惊喜。这几天，大洋彼岸杀疯了！Luma 的热乎劲儿还没过去，昨晚 Runway 就甩出一个王炸 ——Gen-3 Alpha。（查看详情请移步：Runway 版 Sora 发布：高保真、超强一致性，Gen-3 Alpha 震撼到网友了）更没想到的是，一觉醒来，Google DeepMind 也有了新消息，悄咪咪地发布了视频生成语音（V2A）技术的进展。虽然这一功能还未向公众开放，不过从官方放出的视频 Demo 来看，效果那是相当丝滑。同时，Google DeepMind 强

字节打造大模型TTS：不仅能高保真合成，而且支持调整编辑

通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》：你猜的没错，这段有声书并非来自某个专业制作团队，而是一个 AI 模型 Seed-TTS，而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音，这是一种具备诸多妙用的技术，像是让个人智能助理说话、为视频或游戏配音、辅助视障人士、制作有声书等等。对于 TTS 技术研发者来说，流畅自然的表达一直以来都是值得追求的重要目标。字节跳动 Seed Team 发布的 Seed-TTS 不只是一个模型，而是一整个模型系列。论文标题：Seed-TTS:

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文由清华大学、上海交通大学、悉尼大学、UCSB、香港中文大学、香港科技大学、香港科技大学（广州）联合完成。主要作者包括：潘乐怡（第一作者），清华大学本科生，研究方向为大模型水印等；刘瑷玮

Runway版Sora发布：高保真、超强一致性，Gen-3 Alpha震撼到网友了

虽然生成的视频只有10秒左右，但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型。刚刚，AI视频生成初创公司Runway推出了新的视频生成基础模型Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。Runway表示，Gen-3 Alpha是即将推出的一系列模型中的首个。系列模型是在为大规模多模态训练而构建的新基础设施上训练的。与Gen-2相比，Gen-3 Alpha在保真度、一致性和运动性方面有了重大改进，并朝着构建通用世界模型迈出了重要一步。在博客中，

AI 教父 Hinton：我支持超级 AI 取代人类

【新智元导读】「AI 教父」Geoffrey Hinton 在最近的采访中表达了自己对 AI 智能的理解 ——LLM 并不是简单的统计模型，已经具备了理解能力。与此同时，网友翻出了去年 12 月的「过期」视频，惊奇地发现 Hinton 早就「叛变」了，竟然对超级 AI 取代人类的未来表示支持。最近，半退休的「AI 教父」Geoffrey Hinton 频频出现在各种采访中，输出他关于 ASI 的各种言论和观点，甚至只是聊点生涯轶事都可以引起网友们的热烈讨论。不到一个月之前，他就揭发了爱徒 Ilya 在暑假受够了炸薯

Canalys 预计今年全球 AI 手机市场份额达 16%，2028 年将激增至 54% 首次过半

根据 Canalys 对具有生成式 AI 能力智能手机市场的调研预测，2024 年，AI 手机出货量预计占全球智能手机出货量的 16%，到 2028 年，这一比例将激增至 54%。从 2023 年到 2028 年，AI 手机市场年均复合增长率（CAGR）将达到 63%。▲ 图片源于 Canalys 官网，下同从一些关键数据来看，全球有 63% 的受访者对于手机上的 AI 应用及 AI 能力有兴趣，仅有 7% 的受访者对 AI 手机展现出极高度的兴趣倾向。印度和中国大陆消费者对 AI 手机的兴趣倾向远高于德国和美国消

让用户更省心驾驭 PDF 文档，Adobe Acrobat 升级 AI 技能：文生图、梳理信息等

Adobe 公司昨日（6 月 17 日）发布新闻稿，表示将于本周晚些时候开始，通过 Adobe 的 Firefly Image 3 模型，为旗下 Acrobat 应用程序添加图像生成功能。Adobe 公司表示 Acrobat 应用程序将引入全新的“Generate Image”功能，用户可以选择 PDF 文件中的某段内容，调用 AI 来生成图片，此外用户还可以调整生成图片的样式和大小，让其更契合整个 PDF 文档内容。Adobe 新版 Acrobat 应用程序还引入了“Edit Image”功能，通过 Firefl

Runway 发布第三代视频生成模型，90 秒生成 10 秒片段

专为电影和图像内容创作者打造生成式 AI 工具的公司 Runway 发布了 Gen-3 Alpha 视频生成模型。IT之家附 Gen-3 Alpha 官方网站：表示，与其之前的旗舰视频模型 Gen-2 相比，该模型在生成速度和保真度方面有了“重大”改进，并且对生成视频的结构、风格和运动提供了细粒度的控制。Gen-3 将在未来几天内向 Runway 订阅用户提供，包括企业客户和 Runway 创意合作伙伴计划中的创作者。Runway 联合创始人 Anastasis Germanidis 表示，Gen-3 的视频生成

超强 AI 视频生成模型 Dream Machine 来啦！效果秒杀 Runway，可免费使用

大家好，这里是和你们一起探索 AI 的花生~ 最近一款新的 AI 视频生成模型 Dream Machine 爆火出圈，它虽然只能生成 5s 的视频片段，但是在画面清晰度、动态的自然流畅程度、以及对提示词的理解上秒杀了 Runway、Pika 等一众工具，甚至能与 Sora 一较高下，因此得到了很多专业人士的肯定和称赞。今天就为大家详细介绍一下 Dream Machine 的用法和特点。相关推荐：Dream Machine 官网直达： Dream Machine 是 Luma AI 新推出的一款视频生成模型，这家