资讯列表
2025 AAAI Fellow公布:港科大(广州)熊辉、华盛顿大学陈一昕等四位华人入选
AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」,而且评价时间以十年计。 由于其评判极其严格,历届 AAAI Fellow 入选会士均为人工智能领域公认的著名学者,每年严格限制入选人数,因此被誉为国际人工智能领域的名人堂。 今天,AAAI 公布了 2025 年度的 Fellow 评选结果,共有 16 位 AI 学者入选,其中有 4 位华人学者。
TPAMI-2024 | Uni-AdaFocus视频理解框架,让AI学会「划重点」,计算效率提升4-23倍!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
首个国产版AlphaFold3发布!大分子预测精度超车,在线平台即开即用,推理成本更是白菜价
来了,国内首个对标AlphaFold3的产品——HelixFold3,来自百度智能云与百度螺旋桨团队。 它在常规生物分子结构预测任务中实现了AlphaFold3媲美水平:尤其RNA分子和共价修饰场景中,精准度上持平或者实现了大幅超越。 △图注,蓝色为HelixFold3,黄色为AlphaFold3还有抗原-抗体结构预测任务中,成功率提升至80% ,感觉可以直接拿来研究抗体结合机制的水平。
看听读全都会的六边形战士MiniCPM,来啦
MiniCPM-o 2.6开源啦,该模型视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别。 图片简介MiniCPM-o 2.6是一个端侧多模态大模型,具有8B参数量。 它基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建,通过端到端的方式训练和推理。
大模型时代,人机交互体验将被怎样重塑?
在科技持续演进、创新浪潮迭起的当下,人类与计算机的关系日益紧密,成为推动社会发展的关键力量。 自从世界上第一台计算机ENIAC被发明以来,人机交互就成为计算机科学非常重要的一个分支学科。 人机交互(Human-Computer Interaction,HCI)指的是人类和计算机之间的信息交换和互动的过程,目标是使这种交互尽可能直观、高效、满足需求。
OpenAI前CTO最隐秘AI创业:没名字没方向,挖走OpenAI高管,10位顶尖人才投奔
公司名字没有,产品方向未定。 OpenAI前CTO创业几个月,却已经有10位顶尖研究员和工程师投奔。 且分别来自OpenAI、谷歌、Anthropic这几个巨头。
对2025年AI的四个大胆预测
随着2024年的结束,我们可以回顾并认识到,AI已经取得了令人瞩目且开创性的进展。 按照当前的发展速度,几乎无法预测2025年AI将带来怎样的惊喜,但有几个趋势为企业描绘了一幅来年可期以及如何充分准备的动人画卷。 推理成本骤降过去一年,前沿模型的成本稳步下降。
2025年AAAI Fellow名单出炉!港科大(广州)熊辉等四位华人学者入选
2025年AAAI Fellow名单火热出炉! 其中四位华人学者获选。 每年,AAAI通过其Fellow计划表彰一批在人工智能领域做出重大、持续贡献的个人。
图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍一个基于图像和文本的编辑的框架D-Edit,它是第一个可以通过掩码编辑实现图像编辑的项目,近期已经在HuggingFace开放使用,并一度冲到了热门项目Top5。 使用 D-Edit 的编辑流程。
一键编辑一万张图片,Adobe发布新款AI工具
1月16日消息,据外媒报道,Adobe正在推出新的生成式AI工具,可以自动完成劳动密集型的生产任务,如编辑大量图像和翻译视频演示。 其中最引人注目的是“Firefly Bulk Create”应用程序,允许用户快速调整多达1万张图片的大小,或者一次点击就可以替换所有的背景,而不是逐个编辑每张图片。 该工具是通过结合Adobe为开发人员提供的几个基于firefly的API而创建的,目的是使缺乏技术编码经验的创意人员更容易使用它们。
斯坦福研究:ChatGPT性能,曾出现下降趋势
斯坦福大学和加州伯克利大学的研究人员在“哈佛数据科学评论”上,发布了一篇名为《ChatGPT行为随时间变化》的论文。 研究人员通过GPT-3.5、GPT-4(2023年3月和6月两个版本)模型在数学问题、代码生成、多跳知识密集问答、美国医学执照考试、多跳知识密集型问题回答等7项任务进行了深度研究,以查看ChatGPT随着时间推移其性能的变化趋势。 结果显示, GPT-3.5 GPT-4的性能和行为在3个月内出现了明显波动。
引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)
本文经AIGC Studio公众号授权转载,转载请联系出处。 在图像处理领域,如何实现跨图像的一致编辑一直是技术挑战。 传统方法往往局限于单张图像的编辑,难以保证多张图像间编辑效果的一致性。
真正实时地图更新!GS-LIVO:首个可部署在资源受限嵌入式系统上的实时高斯SLAM框架
本文经3D视觉之心公众号授权转载,转载请联系出处。 实时地图更新近年来,随着同步定位与建图(SLAM)技术的发展,出现了多种显式地图表示方法,包括稠密彩色点云、稀疏基于块的结构,以及基于网格或基于曲面元素(surfel)的重建。 这些形式通常与基于特征的方法或直接方法相结合,在无人机和移动机器人等平台上支持高效、实时操作。
啥是AI Agent!2025年值得推荐入坑AI Agent的五大工具框架!
在AI技术飞速发展的今天,AI Agent已经成为了一个热门的研究和应用领域。 无论是企业还是个人开发者,都希望能够借助AI Agent来提升工作效率、优化业务流程或创造全新的用户体验。 然而,从零开始构建一个AI Agent并非易事,幸运的是,市面上有许多优秀的框架可以帮助我们快速入坑。
《自然》重磅:微软推出MatterGen ,AI 颠覆材料设计
刚刚,顶尖学术期刊《自然》(Nature)刊发了一项具有里程碑意义的研究成果:微软研究院的研究团队成功开发了一种名为MatterGen的全新扩散生成模型。 MatterGen 的出现为材料科学的逆向设计开启了一个全新的篇章,它不仅能够生成覆盖整个元素周期表、稳定且多样的无机材料,而且能够通过微调,精确地控制所生成材料的化学成分、对称性以及包括磁性密度、力学性能、电子特性等在内的多种物理性质MatterGen的创新之处MatterGen之所以能够取得如此显著的突破,源于其在模型架构和训练方法上的多维度创新:1. 定制化的扩散过程: 针对晶体材料的特殊性,MatterGen引入了一套定制化的扩散过程,该过程可以独立地对原子类型、坐标和晶格进行扰动,并将其导向一个符合物理规律的随机分布。
字节跳动豆包全新上线 AI 编程功能:支持一键上传多个本地代码文件、实时引入 GitHub 开源仓库
豆包官方公众号显示,豆包电脑版和网页版全新上线AI编程功能。该功能支持一键上传多个本地代码文件、实时引入GitHub开源仓库,快速获取项目的完整上下文,不需再逐段复制代码。
连续 19 年霸榜:三星携手 OpenAI 巩固电视龙头地位,探索个性化内容、翻译等 AI 功能
韩媒 MK 昨日(1 月 16 日)发布博文,报道称三星为巩固其在电视市场的领导地位,正与 OpenAI 达成合作,共同开发 AI 电视。
FlashRAG:重塑RAG研究的Python工具包
在人工智能和自然语言处理(NLP)的广阔领域中,检索增强生成(Retrieval-Augmented Generation,简称RAG)模型正逐渐成为研究和应用的新热点。 RAG模型通过结合信息检索和生成能力,极大地提高了文本生成的质量和多样性。 然而,RAG研究面临着诸多挑战,如计算效率低下、工具链复杂等。