基础
Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了
编辑丨coisini识别显微镜图像中的对象,例如光学显微镜(LM)下的细胞和细胞核是生物学图像分析中的关键任务之一。 由于显微镜成像方式的多样性和不同维度(二维 / 三维,时间维度)的存在,这些识别任务具有挑战性,目前需要采用不同的方法来解决。 基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割,电子显微镜(EM)下的细胞、神经元和细胞器分割。
11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
编辑 | 萝卜皮大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展,可作为各种任务的多功能基础模型。 浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer,这是一种基于 LLM 的方法,用于快速设计具有所需特性的抗菌肽 (AMP)。 在 11 天内,AMP-Designer 实现了 18 种具有广谱抗革兰氏阴性细菌活性的 AMP 的从头设计。
多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现
编辑丨&在众多中下游任务中,收到广泛而多样的数据集训练的基础模型表现出的强大性能,在医疗领域表现却不甚得人心。 受到到数据量、异质性和隐私问题等问题的严重阻碍,基础模型得不到更进一步的发展。 桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight(VFMGL)框架,以促进各种医疗任务的专家临床模型的去中心化构建。
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存? 有人给出了些破解方法》。 简单来说,GRPO 算法丢弃了 critic model,放弃了价值函数近似,转而通过组内样本的相对比较来计算策略梯度,从而有效降低了训练的不稳定性,同时提高了学习效率。
Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
他是真的想教会大家。 刚刚,赛博活佛 Andrej Karpathy 更新了一个长达 2 个多小时的学习视频,主题是 ——「我是如何使用大型语言模型(LLM)的」。 这个视频是 Karpathy 面向普通观众的系列视频之一。
DeepSeek FlashMLA:大模型推理的“涡轮增压器”
FlashMLA(Flash Multi-head Latent Attention)是DeepSeek针对英伟达Hopper架构GPU(如H800/H100)设计的高效解码内核,其核心技术围绕多头潜在注意力(MLA)机制展开,通过软硬件协同优化实现性能突破
清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
字节最新OmniHuman数字人模型即将上线即梦
近期,即梦AI在官方社交媒体上发布了一条新功能上线预告片。 视频显示,采用了全新的多模态视频生成模型OmniHuman,用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。 图片来自即梦AI视频号内容截图OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。
突发|刚加入Anthropic的OpenAI联创John Schulman,又离职了!
距离他加入 Anthropic,仅仅过去了半年时间。 本周四消息,去年刚刚加入知名 AI 创业公司 Anthropic 的 OpenAI 联合创始人约翰・舒尔曼 (John Schulman) 已辞去这家人工智能初创公司的职务。 「我们很遗憾看到 John 离开,但我们完全支持他寻求新机会的决定,并祝他一切顺利,」Anthropic 首席科学官 Jared Kaplan 在发给媒体的电子邮件中表示。
Go语言开发AI智能体有多丝滑?字节重磅开源Eino框架,内含保姆级教程
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘
在人工智能浪潮席卷全球的今天,大语言模型 (LLM) 正在重塑软件开发流程。 近日,字节跳动首次对外披露其内部广泛应用的代码审查系统 BitsAI-CR 的技术细节,展示了 AI 在提升企业研发效率方面的重要进展。 论文地址:,但在大规模企业环境下面临严峻挑战。
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体
编辑 | ScienceAI优化酶的热稳定性对于蛋白质科学和工业应用至关重要。 目前,通过(半)理性设计和随机诱变方法可以较为准确地设计多个增强酶热稳定性的单点突变。 但当组合多个突变时,常常会出现复杂的上位效应,导致组合突变体完全失活。
27页综述,354篇参考文献!最详尽的视觉定位综述来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
为什么说DeepSeek的R1-Zero比R1更值得关注?
R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式? 「比起 R1,DeepSeek 同一时间发布的 R1-Zero 更值得关注。 」这是 ARC Prize 联合创始人 Mike Knoop 在一篇新博客中发表的观点。
首个公开发表的SAR图像目标识别基础模型!国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0
合成孔径雷达(Synthetic Aperture Radar, SAR)作为一种基于电磁波的主动探测技术,具有全天时、全天候的对地观测能力,已发展成为一种不可或缺的对地观测工具,在军民很多领域均有着重要的应用。 目标识别(Automatic target recognition,ATR)是 SAR 图像智能解译的核心问题,旨在对 SAR 图像中典型目标(通常为车辆、舰船和飞机等目标)进行自动定位和分类,复杂、开放、对抗环境下的 SAR 目标识别要做到高精准、高敏捷、强稳健、省资源,仍然面临很多挑战。 当前,SAR 目标识别主要面临两个层面挑战。
AI加速优化求解,达摩院连续两年获求解器全国赛事冠军
以“AI 优化求解器”助力能源绿色转型,达摩院自研“敏迭”求解器连续获得权威赛事冠军。 1月17日消息,达摩院自主研发的“敏迭”求解器在工信部产业发展促进中心组织的第二届能源电子产业创新大赛上,再次斩获“国产求解器技术专题赛”冠军。 这是继近期入选工信部“人工智能赋能新型工业化”典型应用案例后的又一殊荣。
- 1