AI资讯列表 - AI在线

手把手教程！5步搞定超热门的AI字体海报设计

大家好，这里是和你们一起探索 AI 的花生~ 最近在小红书上看到了很多非常好看的 AI 字体海报，基本做法就是在 Stable Diffusion 中通过 Lora 风格模型 Controlnet 外形控制直接生成带字体的场景插画，加上排版就成了一张完整的字体海报，效果非常惊艳。我自己也尝试了一下发现制作方法并不难，而且可以灵活更换字体和模型获得不同的效果，出图效率很高。今天就以端午节主题海报为例，为大家详细介绍一下如何在 Stable Diffusion WebUI 制作这种字体海报。：一、准备图片素材由于

保姆级教程！手把手教你用AIGC快速设计端午运营图

本文以实例深入解析 AIGC 端午运营图设计，提供全面指南，涵盖通用型、IP 融合型、业务融合型三类，所用品牌 IP 仅供示例交流，无任何商业意图。更多端午AI海报设计：前言端午前夕，粽香隐隐，龙舟鼓点遥遥，期待如江水满涨。品牌们已蓄势，欲以创意海报提前唤醒节日的温馨与深意。在不同设计目标和品牌关联深度的层次下，我认为节日海报设计可归纳为三大类：通用型：适用于广泛场合，侧重于传达基本的节日祝福和氛围，不特别强调特定品牌或业务。业务融合型：巧妙结合品牌业务或产品与节日元素，有力地推动品牌认知与市场互动。 IP

Zoom 创始人谈视频会议未来：数字人“代劳”参会，本人可抽出时间陪伴家人

视频会议平台 Zoom 创始人袁征（Eric Yuan）日前接受外媒 The Verge 采访，谈到了视频会议这一新兴会议形式的未来发展。袁征先前在思科工作，后续创办了 Zoom，并意识到有机会使视频会议更加简单易用。而在当下，袁征希望 Zoom“不仅仅”是一个视频会议平台，而是在企业软件领域与微软、谷歌一较高下，力图把文档、邮件和其他生产力工具做得像“聊天平台”一样。现如今各行各业都在拥抱 AI，Zoom 也不例外，并在 AI 领域投入了巨资。袁征表示，AI 在工作中的一大好处，就是所有人都能创造一个“数字孪生”

Nature重磅：微软潘海峰华盛顿大学王晟团队发布首个全切片数字病理学模型GigaPath

编辑 | ScienceAI近年来，数字病理学的蓬勃发展成为了精准医学加速突破的重要组成部分。在癌症护理过程中，利用全切片成像技术将肿瘤组织样本转换为高分辨率的数字图像，已经成为常规技术。高达十亿像素级别的病理学图片包含多样的肿瘤微环境信息，为癌症分型诊断，生存率分析以及精准免疫治疗提供了前所未有的契机。近期，生成式人工智能革命为准确感知、分析病理学图片中的海量信息提供了强有力的解决方案。与此同时，多模态生成式人工智能技术的突破更将助力从时空多尺度理解数字病理学图片并与其他生物医学模态相融合，从而更好刻画患者疾病演

OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队：研究不微调只靠提示词能走多远

除了 OpenAI 自己，居然还有别人能用上 GPT-4-Base 版？？也就是未经微调的预训练版，还不会对话聊天，只会补全句子的模型。EPFL（瑞士洛桑联邦理工）团队申请到了访问权限，用于研究“上下文学习足以让大模型跟随指令吗？”。也就是不用监督微调、也不用 RHLF 或其他强化学习对齐方法，只靠提示词能走多远？预训练模型，究竟能不能一步登天，直接改造成聊天机器人或 AI 助手？如果可行，将大大降低类 ChatGPT 大模型的开发难度。免微调对齐靠谱吗？免微调对齐，让刚出炉的预训练模型不止会“文本补全”，只从提示

AI 在用 | 我们用Suno V3.5，打造出「另类」汪峰

机器之能报道编辑：山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。AI 音乐创作神器 Suno V3.5，向公众免！费！开！放！了！一周前，Suno 不声不响地上线了 Suno V3.5，一开始还只是向付费会员开放，但 5 天后，Suno 大笔一挥，对所有用户都免费开放。据 Suno 官方称，

“全球首创”单台 RTX 4090 服务器推理，昆仑万维开源 2 千亿稀疏大模型天工 MoE

昆仑万维今日宣布开源 2 千亿稀疏大模型 Skywork-MoE，基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来，号称是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE 大模型，也是首个支持用单台 RTX 4090 服务器（8 张 RTX 4090 显卡）推理的开源千亿 MoE 大模型。据介绍，本次开源的 Skywork-MoE 模型隶属于天工 3.0 的研发模型系列，是其中的中档大小模型（Skywork-MoE-Medium），模型的总参数量为 1

谷歌：在新加坡的技术基础设施投资已达 50 亿美元

据路透社报道，谷歌今日宣布，其在新加坡的数据中心和云设施扩建工程现已竣工，这意味着该公司在新加坡的技术基础设施投资总额已达到 50 亿美元。谷歌方面表示，其在新加坡的数据中心雇用了 500 多名员工，负责谷歌搜索和地图等服务。上周，谷歌表示将在马来西亚投资 20 亿美元，在该国开发首个数据中心。目前谷歌已经在 11 个国家和地区建立并运营了数据中心，为全球用户提供服务。据IT之家此前报道，谷歌近期宣布在马来西亚投资 20 亿美元，投资项目包括建设首座数据中心、新的谷歌云区域以及进一步开发人工智能等。此外，亚马逊

研究显示 7% 的美国人每天使用 ChatGPT，个人使用率高于企业

研究和分析公司 GlobalData 报道称，尽管生成式人工智能备受关注，但只有 7% 的美国公民表示他们每天使用 ChatGPT。牛津大学和路透社研究所的一项研究调查了生成式人工智能在英国、美国、法国、日本等国家共 1 万多人的使用情况。日本只有 1% 的人每天使用 ChatGPT，法国和英国为 2%，美国为 7%。在调查的国家中，平均 27% 的受访者表示他们在个人生活中至少使用过一次生成式人工智能，21% 的受访者回答说他们在学校或工作中使用过它。ChatGPT 是受访者最广泛使用的 AI 工具，约有 50%

马斯克称将为 xAI 购买约 30 万块英伟达 AI 芯片，预估至少花费 90 亿美元

马斯克北京时间今天凌晨在回复一则投票时透露，xAI 的下一项重大举措可能是在明年夏天购买约 30 万块配备 CX8 网络的 B200 芯片。xAI 已在近期获得了 60 亿美元（IT之家备注：当前约 435.6 亿元人民币）融资，公司估值达到约 180 亿美元（当前约 1306.8 亿元人民币）。目前，xAI 计划通过加大对 GPU 集群的投资，大幅扩展其 AI 相关的产品组合。今年 4 月，X 平台（推特）博主“The Technology Brother”曾发帖表示，Meta 公司目前已经拥有约 35 万个 H

清北爸爸李永乐都搞不定的事情，这个隐身的大模型在发起挑战

最近有个热点新闻 ——「清北毕业爸爸辅导孩子数学也抓狂」。点开一看，新闻主角居然是李永乐老师。要知道，李永乐老师本科北大、研究生清华，现在还是人大附中的物理老师和知名的科普博主。如果连他都辅导不了自己的孩子，普通家长该有多崩溃。正所谓「不写作业，母（父）慈子孝；一写作业，鸡飞狗跳」。在辅导孩子这件事情上，似乎没有多少家庭能做到心平气和。巧的是，就在同一天，一个 AI 辅导孩子的视频也吸引了很多家长的注意。视频讲的是一位父亲在大模型的帮助下与女儿共同检查数学试卷。其间，大模型通过一问一答的方式，引导孩子独立思考，一步

斯坦福爆火Llama3-V竟抄袭国内开源项目，作者火速删库

斯坦福 Llama3-V vs 清华 MiniCPM-Llama3-V-2.5在 GPT-4o 出世后，Llama3 的风头被狠狠盖过。GPT-4o 在图像识别、语音理解上卓越的性能展现了它强大多模态能力。开源领域的领头羊 Llama3 曾在几乎所有基准测试中都超越了 GPT-3.5，甚至在某些方面超越了 GPT-4。这次就要闷声「吃瘪」了吗？5 月 29 日，一个来自斯坦福的研究团队发布了一个能够「改变现状」的产品：Llama3-V，号称只要 500 美元（约为人民币 3650 元），就能基于 Llama3 训练

全球最强GPU芯片已量产、下一代Rubin曝光，老黄继续打破摩尔定律

黄仁勋：我家的 GPU 芯片一年一更新，其他家怎么追？昨晚，英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。经典皮肤（皮衣）老黄亮相。在会上，黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。量产版 Blackwell 亮相下一代 AI 平台 Rubin 两年后到来今年 3 月，英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 B

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文作者为VMamba的原班人马，其中第一作者王兆植是中国科学院大学和鹏城实验室的2022级联合培养博士生，共同一作刘悦是中国科学院大学2021级直博生。他们的主要研究方向是视觉模型设计和

澳大利亚拟颁布新法律：制作、传播深度伪造色情内容者将被判刑

据《卫报》报道，将在本周提交至澳大利亚联邦议会审议的一项新法律规定，若民众分享经由“数字篡改”的深度伪造色情内容，将会被处以 6 年监禁，制作这些内容的人则将被处以 7 年监禁。据报道，澳大利亚总检察长马克・德雷福斯预计将在本周三提出立法，将“在未经同意的情况下，分享利用 AI 或其他技术手段制作的露骨内容”这一行为定性为新的刑事犯罪。若这项新法律生效，就意味着无论是在私人或公开平台、无论与个人还是与大众分享这些内容，都将是非法行为。德雷福斯在周六宣布新立法时表示，政府不会容忍这种“阴险的犯罪行为”。“未经同意而分

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。Scaling law 告诉我们：只要能适当地分配参数和数据，就能在固定计算预算下实现性能最大化。之前已有不少研究探索过神经语言模型的 Scaling law，而这些研究通常得出的结论是参数和训练 token 数应当一比一地扩展。但是，之前的语言模型 Scaling law 研究都是基于在散乱的网络文本上训练的 Transformer 得到的。这是一

上海交大卢策吾：具身智能与他的首个刮胡子机器人 | 智者访谈

查阅历史资料后表明，上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下，机械臂完成了刮胡子的动作。机器人给人刮胡子，看似简单，实则蕴含巨大挑战，除了行为泛化性，更重要的是需要极致鲁棒性。可以看到，当卢教授的头部移动时，这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化，既把胡须刮干净，又不会伤到他。如果大模型仅通过视觉判定轨迹输出，将难以完成任务。这也无法通过遥操作实现。在大模型风靡的 20

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。能够同时生成多种模态输出的多模态模型一般是通过某种形式的词汇扩展（将多模态表征转换为离散 token 并添加到模型的基本词汇表中）来实现的，即在预训练阶段或在后期微调阶段进行跨模态对齐。多模态预训练方法具有很强的性能优势（例如，一个模型可以原生理解多种模态），但也有缺点。例如，无法解决如何在预训练后添加新模态的问