AI资讯列表 - AI在线

亚马逊云科技展示Claude 3大模型能力，生成式AI落地正在加速

上周日，亚马逊云科技宣布 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。随着知名 AI 初创公司 Mistral AI、Anthropic 的前沿的大语言模型（LLM）陆续登陆 Amazon Bedrock，人们在构建生成式 AI 应用程序时，已经有了一系列先进模型的选择。

大模型生产力的头场变革，从英特尔商用 AI PC 说起

作者丨郭思编辑丨陈彩娴「水利万物而不争。」这是英特尔公司高级副总裁、英特尔中国区董事长王锐女士常说的一句话，看似没有压迫性，却切实点出了英特尔作为 AI PC 概念提出者，这场大语言模型技术革命中的思路。在2024 年 3 月 26 日，英特尔商用 AI PC 新品发布会上，我们也确切地看到了英特尔致力于让AI无处不在的种种举措。

AI在用| Midjourney+一个提示咒语，广告摄影师可以躺平了

机器之能报道编辑：Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。无论是打开餐厅菜单、翻开一本杂志，还是点咖啡时瞟一眼上新，我们都会看到很多质感精致，极富视觉冲击力的广告图片。人工拍摄的专业广告图片为了让食物、化妆品、日用品等产品呈现出精致、极富吸引力的视觉效果，这类专业图片（带有

千元级AI 模盒，云天励飞率先打响大模型「平民化」之战

从 Gemini、Lumiere、再到 Sora，“百模大战” 的 “战火” 延续至 2024 年。诸多的大模型已经诞生，接下来的任务是落地。但行业大模型在落地过程中，遇到的瓶颈就像是一座冰山，藏在冰山下面的问题，更加棘手。要做物理世界的解码者，为 “无形” 技术和 “有形” 世界构建通道，这是云天励飞的定位。如何构建 AI 落地的通道？2024 年，围绕 “自进化城市智能体” 的理念，云天励飞持续深耕 AI 市场，并且在 3 月发布 “深目” AI 模盒，为 AI 大模型落地长尾场景交上一份新答卷。AI 落地关键

N-S方程问题有解了？与黎曼猜想并列，千禧年数学难题胜利在望

这是数学中最著名的未解问题之一。新的工作已通过同行评审，全文可看。起猛了，流体力学迎来自己的超导时刻了？最近几天，数学圈内人们正在热烈讨论纳维 - 斯托克斯问题的正则哈密顿公式终于出现了 —— 这个数学史上悬而未决的问题可能有了解答。而在以前，人们甚至普遍认为这是不可能的。此事有多重要？纳维 - 斯托克斯方程与黎曼猜想一样，在 2000 年被列为「千禧年数学七大难题」。这七个世界级难题分别是：NP 完全问题、霍奇猜想、庞加莱猜想、黎曼假设、杨 - 米尔斯存在性与质量间隙、纳卫尔 - 斯托克斯方程、BSD 猜想。七个

超10秒高分辨率，北大Open Sora视频生成更强了，还支持华为芯片

北大团队联合兔展发起的 Sora 复现计划，现在有了新成果。OpenAI 在今年年初扔出一项重大研究，Sora 将视频生成带入一个新的高度，很多人表示，现在的 OpenAI 一出手就是王炸。然而，众多周知的是，OpenAI 一向并不 Open，关于 Sora 的更多细节我们无从得知。谁能率先发布类 Sora 研究成了一个热门话题。今年 3 月初，北大团队联合兔展启动了 Sora 复现计划 ——Open Sora Plan，该项目希望通过开源社区的力量复现 Sora。项目上线一个月，星标量已经达到 6.6k。项目地址

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

最近，多模态大模型（LMM）取得了一系列引人注目的成就，特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性，也为更多视觉场景下的应用探索了新的道路。尽管如此，在将 LMM 应用到计算机视觉任务上时，我们仍面临一个关键挑战：大多数 LMM 目前只限于文本输出，这限制了它们在处理更细粒度的视觉任务，如图像分割方面的能力。此外，图像分割领域内部的需求多样化，任务各异 —— 实例分割需为每个对象分配唯一 ID 并计算类别信赖度，指代分割（RES）则需要基于描述性语句来识别

无需训练，这个新方法实现了生成图像尺寸、分辨率自由

近日，来自香港中文大学 - 商汤科技联合实验室等机构的研究者们提出了FouriScale，该方法在利用预训练扩散模型生成高分辨率图像方面取得了显著提升。近期，扩散模型凭借其出色的性能已超越 GAN 和自回归模型，成为生成式模型的主流选择。基于扩散模型的文本到图像生成模型（如 SD、SDXL、Midjourney 和 Imagen）展现了生成高质量图像的惊人能力。通常，这些模型在特定分辨率下进行训练，以确保在现有硬件上实现高效处理和稳定的模型训练。图

CVPR 2024｜FairCLIP：首个多模态医疗视觉语言大模型公平性研究

作者 | 哈佛大学、纽约大学团队编辑 | ScienceAI公平性在深度学习中是一个关键问题，尤其是在医疗领域，这些模型影响着诊断和治疗决策。尽管在仅限视觉领域已对公平性进行了研究，但由于缺乏用于研究公平性的医疗视觉-语言(VL)数据集，医疗VL模型的公平性仍未被探索。为了弥补这一研究空白，我们介绍了第一个公平的视觉-语言医疗数据集（FairVLMed），它提供了详细的人口统计属性、真实标签和临床笔记，以便深入检查VL基础模型中的公平性。使用FairVLMed，我们对两个广泛使用的VL模型（CLIP和BLIP2）进

3倍灵敏度，搜索百万蛋白对只需几秒，复旦、山大、上海交大开发新的蛋白质语言模型

编辑 | 萝卜皮同源蛋白质搜索是蛋白质注释和分析最常用的方法之一。与结构搜索相比，仅从序列中检测远程进化关系仍然具有挑战性。复旦大学、山东大学以及上海交通大学的研究团队提出了 PLMSearch（Protein Language Model），一种仅以序列作为输入的同源蛋白质搜索方法，能够捕获隐藏在序列后面的远程同源信息。PLMSearch 可以像 MMseqs2 一样在几秒钟内搜索数百万个查询目标蛋白质对，同时将灵敏度提高三倍以上，可与当前最先进的结构搜索方法相媲美。此外，与传统的序列搜索方法不同，PLMSear

阿里通义千问开源 320 亿参数模型，已实现 7 款大语言模型全开源

感谢4 月 7 日，阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到，通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。此次开源的 320 亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡。例如，相比通义千问 14B 开源模型，32B 在智能体场景下能力更强；相比通义千问 72B 开源模型，32B 的推理成本更低。通义千问团队希望 32B 开源模型能为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了 7 款大语

加拿大政府公布人工智能领域一揽子预算，价值 24 亿加元

加拿大政府昨日公布了面向人工智能领域的一揽子措施，以确保该国在此领域的优势。这些措施将在加拿大政府本财年的预算中占到 24 亿加元（IT之家备注：当前约 127.92 亿元人民币）。具体而言，这部分 24 亿加元的预算将包含六大措施：投资 20 亿加元，为加拿大人工智能研究者和企业提供算力和基础设施，并促进主权人工智能发展；投资 2 亿加元，促进人工智能初创企业的技术商业化，加速人工智能在关键领域的应用；投资 1 亿加元，资助加拿大国家研究理事会的 IRAP AI Assist 项目，该项目通过部署人工智能解决方案

通义千问开源320亿参数模型，已实现7款大语言模型全开源

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实

效率翻倍！5 款不容错过的免费 AI 神器（三）

大家好，这里是你们一起探索 AI 的花生~ 今天我们继续 AI 效率神器推荐第三期，内容包括 AI 实时绘画、AI 风格化头像、AI 高清放大工具等。上期回顾：一、SunoMV 网址直达：这段时间 AI 神器 Suno 爆火，想必很多小伙伴都体验过它强大的歌曲生成能力了。SunoMV 则是一个专门针对 Suno 推出的 MV 免费生成平台，用户只需提供自己的 Suno 歌曲链接，就能在几分钟内生成一个歌词同步，并且具有精美视觉效果的歌曲短片，非常方便我们在社交平台上展示推广自己的作品。 SunoMV 支持横屏

超详细！写给设计师的LoRa模型训练SOP

写在前面：在推进 AIGC 技术在我们业务中的应用过程中，我发现许多同事，特别是设计师和跨部门协作的团队，对 LoRA 模型在图像生成中的真正价值理解还不够深入。我们似乎更多地停留在"别人在做,我也要做"的从众心态，而没有真正认识到 LoRA 模型的战略意义和变革潜力。这种认知差距可能会导致我们在实践中走一些弯路，无法充分发挥 LoRA 模型的优势，也难以实现 AIGC 技术在业务中的最大化赋能。因此，我针对 LoRA 模型训练流程进行了系统梳理和优化，希望能给大家一些启发，帮助我们更好地理解和应用这一强大的工

化学能力超GPT-4，首个化学领域百亿级大模型，思必驰、上交大、苏州实验室联合发布

编辑 | ScienceAI2024年3月12日，思必驰-上海交大智能人机交互联合实验室、苏州实验室共同发布了首个针对化学科学的百亿级专业化大模型ChemDFM。模型参数现已完全开源以帮助和促进大模型辅助化学科研领域的相关研究（）。此外，ChemDFM的研究论文也已作为相关领域的第一篇研究论文于arXiv预印本网站上公开发表。论文链接：，引入了海量的化学基础与前沿知识，充分学习并掌握化学科学的专有语言与表达方式，最终以130亿的参数量在大多数化学相关的能力上超越了公认最强大的模型GPT-4。此外，在进一步的评测中C

百度文心一言上线新功能，可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能，仅需几秒钟即可定制自己的声音。据IT之家了解，想要体验这一功能，只需打开文心一言 App，点击下方“ ”，然后选择创建智能体。在声音选项里，会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话，只需两秒左右的时间，系统便能捕捉到你的声音特点，为你生成一个独特的“语音助手”。在确认声音质量后，你的专属“语音库”就在瞬间构建完成。今后，在与智能体的每一次对话中，你都可以点击播放键，使用自己合成的音色进行语音播报。此外，还可以点击对话框上的通话按钮，与你自己构建的数字分身实时对话

AMD：锐龙 8040 系列处理器 AI 性能完胜英特尔酷睿 Ultra 处理器

AMD 近日公布了一系列基准测试，声称其锐龙移动版 7040 Phoenix 系列和 8040 系列处理器在运行大型语言模型 (LLMs) 方面，性能最高可领先于英特尔最新的 Core Ultra Meteor Lake CPU 达 79%。IT之家注意到，本次测试对比的是 AMD 锐龙 7 7840U 和英特尔 Core Ultra 7 155H 处理器，两款芯片均配备了硬件神经网络处理单元 (NPU)。AMD 展示了多张幻灯片，对比了这两款处理器的 Mistral 7b、Llama v2 和 Mistral I