AI资讯列表 - AI在线

CVPR 2024｜FairCLIP：首个多模态医疗视觉语言大模型公平性研究

作者 | 哈佛大学、纽约大学团队编辑 | ScienceAI公平性在深度学习中是一个关键问题，尤其是在医疗领域，这些模型影响着诊断和治疗决策。尽管在仅限视觉领域已对公平性进行了研究，但由于缺乏用于研究公平性的医疗视觉-语言(VL)数据集，医疗VL模型的公平性仍未被探索。为了弥补这一研究空白，我们介绍了第一个公平的视觉-语言医疗数据集（FairVLMed），它提供了详细的人口统计属性、真实标签和临床笔记，以便深入检查VL基础模型中的公平性。使用FairVLMed，我们对两个广泛使用的VL模型（CLIP和BLIP2）进

3倍灵敏度，搜索百万蛋白对只需几秒，复旦、山大、上海交大开发新的蛋白质语言模型

编辑 | 萝卜皮同源蛋白质搜索是蛋白质注释和分析最常用的方法之一。与结构搜索相比，仅从序列中检测远程进化关系仍然具有挑战性。复旦大学、山东大学以及上海交通大学的研究团队提出了 PLMSearch（Protein Language Model），一种仅以序列作为输入的同源蛋白质搜索方法，能够捕获隐藏在序列后面的远程同源信息。PLMSearch 可以像 MMseqs2 一样在几秒钟内搜索数百万个查询目标蛋白质对，同时将灵敏度提高三倍以上，可与当前最先进的结构搜索方法相媲美。此外，与传统的序列搜索方法不同，PLMSear

阿里通义千问开源 320 亿参数模型，已实现 7 款大语言模型全开源

感谢4 月 7 日，阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到，通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。此次开源的 320 亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡。例如，相比通义千问 14B 开源模型，32B 在智能体场景下能力更强；相比通义千问 72B 开源模型，32B 的推理成本更低。通义千问团队希望 32B 开源模型能为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了 7 款大语

加拿大政府公布人工智能领域一揽子预算，价值 24 亿加元

加拿大政府昨日公布了面向人工智能领域的一揽子措施，以确保该国在此领域的优势。这些措施将在加拿大政府本财年的预算中占到 24 亿加元（IT之家备注：当前约 127.92 亿元人民币）。具体而言，这部分 24 亿加元的预算将包含六大措施：投资 20 亿加元，为加拿大人工智能研究者和企业提供算力和基础设施，并促进主权人工智能发展；投资 2 亿加元，促进人工智能初创企业的技术商业化，加速人工智能在关键领域的应用；投资 1 亿加元，资助加拿大国家研究理事会的 IRAP AI Assist 项目，该项目通过部署人工智能解决方案

通义千问开源320亿参数模型，已实现7款大语言模型全开源

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实

效率翻倍！5 款不容错过的免费 AI 神器（三）

大家好，这里是你们一起探索 AI 的花生~ 今天我们继续 AI 效率神器推荐第三期，内容包括 AI 实时绘画、AI 风格化头像、AI 高清放大工具等。上期回顾：一、SunoMV 网址直达：这段时间 AI 神器 Suno 爆火，想必很多小伙伴都体验过它强大的歌曲生成能力了。SunoMV 则是一个专门针对 Suno 推出的 MV 免费生成平台，用户只需提供自己的 Suno 歌曲链接，就能在几分钟内生成一个歌词同步，并且具有精美视觉效果的歌曲短片，非常方便我们在社交平台上展示推广自己的作品。 SunoMV 支持横屏

超详细！写给设计师的LoRa模型训练SOP

写在前面：在推进 AIGC 技术在我们业务中的应用过程中，我发现许多同事，特别是设计师和跨部门协作的团队，对 LoRA 模型在图像生成中的真正价值理解还不够深入。我们似乎更多地停留在"别人在做,我也要做"的从众心态，而没有真正认识到 LoRA 模型的战略意义和变革潜力。这种认知差距可能会导致我们在实践中走一些弯路，无法充分发挥 LoRA 模型的优势，也难以实现 AIGC 技术在业务中的最大化赋能。因此，我针对 LoRA 模型训练流程进行了系统梳理和优化，希望能给大家一些启发，帮助我们更好地理解和应用这一强大的工

化学能力超GPT-4，首个化学领域百亿级大模型，思必驰、上交大、苏州实验室联合发布

编辑 | ScienceAI2024年3月12日，思必驰-上海交大智能人机交互联合实验室、苏州实验室共同发布了首个针对化学科学的百亿级专业化大模型ChemDFM。模型参数现已完全开源以帮助和促进大模型辅助化学科研领域的相关研究（）。此外，ChemDFM的研究论文也已作为相关领域的第一篇研究论文于arXiv预印本网站上公开发表。论文链接：，引入了海量的化学基础与前沿知识，充分学习并掌握化学科学的专有语言与表达方式，最终以130亿的参数量在大多数化学相关的能力上超越了公认最强大的模型GPT-4。此外，在进一步的评测中C

百度文心一言上线新功能，可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能，仅需几秒钟即可定制自己的声音。据IT之家了解，想要体验这一功能，只需打开文心一言 App，点击下方“ ”，然后选择创建智能体。在声音选项里，会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话，只需两秒左右的时间，系统便能捕捉到你的声音特点，为你生成一个独特的“语音助手”。在确认声音质量后，你的专属“语音库”就在瞬间构建完成。今后，在与智能体的每一次对话中，你都可以点击播放键，使用自己合成的音色进行语音播报。此外，还可以点击对话框上的通话按钮，与你自己构建的数字分身实时对话

AMD：锐龙 8040 系列处理器 AI 性能完胜英特尔酷睿 Ultra 处理器

AMD 近日公布了一系列基准测试，声称其锐龙移动版 7040 Phoenix 系列和 8040 系列处理器在运行大型语言模型 (LLMs) 方面，性能最高可领先于英特尔最新的 Core Ultra Meteor Lake CPU 达 79%。IT之家注意到，本次测试对比的是 AMD 锐龙 7 7840U 和英特尔 Core Ultra 7 155H 处理器，两款芯片均配备了硬件神经网络处理单元 (NPU)。AMD 展示了多张幻灯片，对比了这两款处理器的 Mistral 7b、Llama v2 和 Mistral I

超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k

在大模型落地应用的过程中，端侧 AI 是非常重要的一个方向。近日，斯坦福大学研究人员推出的 Octopus v2 火了，受到了开发者社区的极大关注，模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超越了 GPT-4，并将上下文长度减少了 95%。此外，Octopus v2 比 Llama7B RAG 方案快 36 倍。不少网友感叹：设备端 AI 智能体的时代到来了！论文：Octopus v2: On-device language mod

谷歌DeepMind发布Gecko：专攻检索，与大7倍模型相抗衡

Gecko 是一种通用的文本嵌入模型，可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要角色，为各种文本相关任务提供了强大的语义表示和计算能力。在语义表示上，文本嵌入模型将文本转换为高维向量空间中的向量表示，其中语义上相似的文本在向量空间中距离较近，从而捕捉了文本的语义信息，这种表示有助于计算机更好地理解和处理自然语言；在文本相似度计算上，基于文本嵌入的向量表示，可以轻松地计算文本之间的相似度，从而支持各种应用，如信息检索、问答系统和推荐系统；在信息检索上，文本嵌入模型可以用

揭秘AI幻觉：GPT-4V存在视觉编码漏洞，清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力，成为如今最领先的多模态大模型。然而，近期很多工作发现 GPT-4V 在很多基本能力上却意外的出现短板。例如，在微软一篇长达 166 页的技术报告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中，作者发现，对于一个不太复杂的图像中的苹果数量，GPT-4V 竟然怎么数也数不对。然而，学术界和工业界尚不清楚导致这些问题的底

二次元专用超分AI模型APISR：在线可用，入选CVPR

《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分，它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候，我们会突然有重温这些童年回忆的冲动，但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低，根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验，以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。针对这样的困扰（以及潜在的市场），一种做法是由动画公司制作重制版，但这项任务的人力和资金成本都不低。而随着多模态人工智能的性能日益强大，采用基于 AI 的

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

新智元报道编辑：Aeneas 好困【新智元导读】2026 年的数据荒越来越近，硅谷大厂们已经为 AI 训练数据抢疯了！它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天 AI 忽然吐出了我们的自拍照或者隐私聊天，该怎么办？谁能想到，我们多年前的聊天记录、社交媒体上的陈年照片，忽然变得价值连城，被大科技公司争相疯抢。现在，硅谷大厂们已经纷纷出动，买下所有能购买版权的互联网数据，这架势简直要抢破头了！图像托管网站 Photobucket 的陈年旧数据，本来已经多年无人问津，但

“看起来不像手机”，Altman和Jony Ive的AI硬件公司拟融资10亿美元

机器之能报道编辑：SiaJony Ive 和 Sam Altman 的 AI 设备初创公司正在与 Emerson Collective 和 Thrive Capital 进行融资谈判。Ive 希望筹集高达 10 亿美元的资金。据 The Information 独家消息，由前苹果设计师 Jony Ive 和 OpenAI CEO Sam Altman 创立的神秘 AI 硬件公司目前已经开始与一些最知名的风险投资公司进行融资谈判。The Information执行主编表示，它看起来不像手机据一位参与该过程的人士和另一

美国与欧盟计划借助 AI 寻找半导体生产中“永久化学品”PFAS 替代品

感谢据美国白宫官网，美国-欧盟贸易和科技委员会在近日的联合声明中表示计划借助 AI 寻找半导体生产中“永久化学品”PFAS 的替代品。这份声明是在该委员会于 4 月 4~5 日举办的第六次部长级会议上公布的。声明宣称：我们计划继续努力寻找在芯片中使用全氟和多氟物质（PFAS）的替代品的研究合作机会。例如，我们计划探索使用 AI 能力和数字孪生来加速发现合适的材料，以取代半导体制造中的 PFAS。PFAS 类有机物包含由完全氟化的碳原子组成的碳原子链。由于碳氟键的高强度，PFAS 具有化学惰性，难以同其他物质反应，故

金山办公 WPS 365 宣布 4 月 9 日全新发布：“一站式 AI 办公”

感谢金山办公生产力大会官宣 4 月 9 日 15 点举行，宣称“WPS 365 全新发布”。官方海报写有“一站式 AI 办公生产力即刻起飞”，暗示 WPS 365 将迎来更多 AI 功能升级。2023 年 4 月，金山办公面向政企客户发布了数字办公品牌 WPS 365，该服务提供一系列内容创作应用和办公协作工具，涵盖了内容创作、沟通创作、数字资产管理、开放生态四大版块，包含 WPS Office、文档中心、金山协作、金山会议、邮件、日历等通用办公套件。IT之家查询 WPS 365 官网获悉，该服务的体验版免费使用，