学习

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。 论文标题:1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities论文链接: 链接:,强化学习的重要性因为 DeepSeek R1 等研究再次凸显出来,该方法通过试错让智能体学会在复杂环境中完成任务。 尽管自监督学习近年在语言和视觉领域取得了显著突破,但 RL 领域的进展相对滞后。

​上海交通大学发布 AI 使用规范:应自觉标注引用AI工具的必要信息

近日,上海交通大学发布了关于在教育教学中使用人工智能的最新规范,强调学生和教师在使用 AI 工具时应当遵循的价值定位和行为规范。 该规范旨在确保学生利用 AI 进行学习时,能够保持学术诚信和自主学习的能力,教师则需合理使用技术,促进教育质量的提升。 图源备注:图片由AI生成,图片授权服务商Midjourney根据新规,学生在课程学习和作业提交中必须了解并遵守各项关于人工智能的使用规范。

​Netflix 新招机器学习科学家与工程师,推动内容智能化

全球领先的娱乐服务平台 Netflix 近日宣布开放远程招聘机器学习科学家和机器学习工程师两个职位,这些岗位隶属于内容与媒体机器学习基础团队,旨在通过机器学习技术提升内容智能化、个性化以及广告效果。 该团队致力于构建基础机器学习解决方案,充分利用 Netflix 丰富的媒体数据,推动多模态内容理解的进步。 此外,团队还将探索生成式人工智能在影视制作和媒体智能领域的应用,力求将 Netflix 推向人工智能驱动的内容创作与分发的前沿。

Duolingo 推出 AI 功能,助力英语学习者推动业绩增长

在最近的财报中,Duolingo 公司(股票代码:DUOL)透露,英语学习者对其新推出的人工智能功能的热情远超其他语言学习者,助力该移动学习平台在第四季度实现了业绩超预期。 公司首席财务官 Matt Skaruppa 在接受彭博社采访时表示,英语学习者使用 Duolingo 的新视频通话功能的频率远高于学习其他语言的用户。 去年第三季度,Duolingo 推出了视频通话功能,旨在提升用户之间的互动体验。

打破AI遗忘诅咒的学习算法,慕尼黑-南大团队打造会自主积累知识的学习框架

编辑丨&人类可以在一生中不断积累知识并发展越来越复杂的行为和技能,这种能力被称为「终身学习」。 这种终身学习能力被认为是构成一般智能的基本机制,但人工智能的最新进展主要在狭窄的专业领域表现出色,对于这种终身学习能力显得有些缺乏。 慕尼黑大学与南京大学的研究团队联手打造了一款机器人终身强化学习框架,它通过开发一个受贝叶斯非参数域启发的知识空间来解决这一差距。

o1 核心作者 MIT 演讲:激励 AI 自我学习,比试图教会 AI 每一项任务更重要

“o1 发布后,一个新的范式产生了”。其中关键,OpenAI 研究科学家、o1 核心贡献者 Hyung Won Chung,刚刚就此分享了他在 MIT 的一次演讲。演讲主题为“Don’t teach. Incentivize(不要教,要激励),核心观点是:激励 AI 自我学习比试图教会 AI 每一项具体任务更重要思维链作者 Jason Wei 迅速赶来打 call:Hyung Won 识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022 年底,他意识到了强化学习的力量,并从那时起就一直在宣扬它。在演

真实教室里的虚拟教师:英国伦敦大卫游戏学院开设由 AI 教授的课程

现如今,虚拟教室里的真实教师(网课)已是司空见惯,但真实教室里的虚拟教师相对来说仍鲜有耳闻。北京时间今天凌晨,据 TechRadar 报道,英国一所私立学校 —— 伦敦大卫游戏学院,正在开设英国首个 AI 教学班,首期班级将有 20 名学生参与,他们将依靠 AI 平台、VR 头显来指导学习,而非人类教师。图源 Pexels报道称,该 AI 系统旨在通过人工智能实现个性化教育。当地投用的 Sabrewing 模型(AI在线注:以蜂鸟 Sabrewing 命名,强调速度和灵活性)可评估每个学生的优势和劣势,并根据这些优

第二届「简约与学习会议 (CPAL)」将在斯坦福大学举办,征稿进行中

CPAL会议简介CPAL是一年一度的研究型学术会议,专注于解决机器学习、信号处理、优化等领域中普遍存在的简约 (Parsimonious)、低维结构 (Low Dimensional Structures) 问题。 创办这个会议的出发点,即将其设计为一个普遍的科学论坛,使机器学习、应用数学、信号处理、优化、智能系统以及所有相关的科学和工程领域的研究人员能够聚集在一起,分享见解,并最终努力达成一个共同的现代理论和计算框架,从简约学习的角度理解智能和科学。首届CPAL于2024年1月在香港大学成功举办,会议吸引了数百名

成本减少90%以上,「主动学习+实验工作流程」加速催化剂开发

编辑 | 绿罗通过合成气的热催化加氢合成高级醇 (HAS) 仍然是一项有前途的技术。链增长和 CO 插入要求需要多组分材料,其复杂的反应动力学和广泛的化学空间不符合催化剂设计规范。在此,来自苏黎世联邦理工学院(ETH Zurich)的研究人员提出了一种替代策略,将主动学习整合到实验工作流程中,以 FeCoCuZr 催化剂系列为例。所提数据辅助框架简化了 86 个实验中广泛成分和反应条件空间的导航,与传统程序相比,环境足迹和成本减少了 90% 以上。它确定了具有优化反应条件的 Fe65Co19Cu5Zr11 催化剂,

全国高校首个,山东财经大学发布新文科教育教学专有大模型“AI 才”

AI在线从山东财经大学获悉,7 月 11 日,该校发布了全国高校首个新文科教育教学专有大模型 ——“AI 才”教育教学专有大模型,该模型由学校与百度智能云、山东银瑞科技合作共同开发。据介绍,该大模型可通过大数据、机器学习、知识图谱等关键技术,搭建智能科教环境,打造具有专业性、个性化、系统性、一站式特点,集“知”“教”“学”“研”“训”“智”为一体的教学科研服务平台。该大模型具备如下功能及特性:“知识数字化”板块:可在大模型平台上进行专业教材、科研数据、实习实训案例等知识的规范化、结构化梳理和沉淀,形成自有知识库,实

《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。最近,Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。项目地址: LLM 来说,指令微调能够有效

吴恩达团队新作:多模态多样本上下文学习,无需微调快速适应新任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本研究评估了先进多模态基础模型在 10 个数据集上的多样本上下文学习,揭示了持续的性能提升。批量查询显著降低了每个示例的延迟和推理成本而不牺牲性能。这些发现表明:利用大量演示示例可以快速适

SOTA性能,多尺度学习,中山大学提出蛋白质-药物相互作用AI框架

编辑 | 紫罗蛋白质、药物和其他生物分子之间的相互作用,在各种生物过程中发挥着至关重要的作用。了解这些相互作用对于破译生物学过程背后的分子机制和开发新的治疗策略至关重要。当前的多尺度计算方法,常常过于依赖于单一尺度,而对其他尺度的拟合不足,这可能与多尺度学习的不平多尺度衡性和固有的贪婪性有关。为了缓解优化不平衡,中山大学和上海交通大学的研究人员提出了一种基于变量期望最大化的多尺度表示学习框架 MUSE,它可以有效地整合多尺度信息进行学习。该策略通过相互监督和迭代优化,有效融合原子结构和分子网络尺度之间的多尺度信息。

准确预测药物-靶点相互作用,江南大学提出深度学习融合GNN新方法MINDG

编辑 | 紫罗药物-靶点相互作用(DTI)预测在药物发现中发挥着重要作用。尽管药物靶点预测的智能计算方法受到了广泛关注,并取得了许多进展,但仍然是一项具有挑战性的任务,需要进一步的研究。为了解决上述挑战,江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。MINDG 结合图学习和深度学习来提取药物和蛋白质的内在结构信息,以及它们之间的外在关系信息。因此,与之前的方法相比,MINDG 提高了模型预测的性能。相关研究以《MINDG: a drug–target interaction pr

提高光学数据集利用率,天大团队提出增强光谱预测效果 AI 模型

编辑 | 枯叶蝶近日,天津大学激光与光电子研究所吴亮副教授、姚建铨院士团队联合自然语言处理实验室熊德意教授团队报道了一种使用多频率补充输入的深度学习模型来增强光谱预测效果的方案。该方案可有效地提高现有光学数据集的利用率,在不额外增加训练成本的基础上,增强了与超表面结构对应的光谱响应的预测效果。相关研究成果以「Enhanced spectrum prediction using deep learning models with multi-frequency supplementary inputs」为题,于 20

AI 提高无创脑机接口性能,卡内基梅隆大学贺斌团队的新范式

编辑 | 萝卜皮脑机接口(BCI)有可能帮助恢复患者的运动功能,并通过提供大脑与机器人或其他设备的直接连接,使普通大众受益。在最新的工作中,卡内基·梅隆大学(Carnegie Mellon University)贺斌教授团队开发了一种使用基于深度学习 (DL) 的解码器来连续跟踪 BCI 系统的范例,并通过广泛的在线实验展示了其功能。该团队还研究了不同数量的训练数据如何影响 DL 性能,并收集了超过 150 h 的 BCI 数据,这些数据可用于训练新模型。研究结果为开发基于深度学习的 BCI 解码器提供了重要范式,

Nature|机器学习和物理模型的「双向奔赴」,3种AI气候建模方法

编辑 | ScienceAI气候科学家 Tapio Schneider 很高兴,因为机器学习让他摆脱了日常工作中繁琐乏味的任务。十多年前,当他第一次开始模拟云的形成时,这主要涉及到煞费苦心地调整描述水滴、气流和温度如何相互作用的方程。但自 2017 年以来,机器学习和人工智能 (AI) 改变了他的工作方式。「机器学习让这门科学变得更加有趣,」在加州理工学院工作的 Schneider 说。「它速度更快、更令人满意,而且你可以获得更好的解决方案。」传统的气候模型是由 Schneider 等科学家从头开始手动构建的,他们

让 AI 模型互相教学,谷歌推出社会学习框架

谷歌近日公开了一项名为“社会学习(Social Learning)”的 AI 框架,该框架允许 AI 语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的 AI 模型更具隐私保护性。据介绍,在这款“社会学习框架”中,“学生模型”会向多个已知特定任务解法的“教师模型”学习各种问题的解决方案,研究人员设计了“垃圾短信检测”、“解决小学数学问题”、“根据特定文字回答问题”等多项测试,来评估相关“社会学习”框架的成效。研究人员表示,部分 AI 模型只经过短暂的“社会学习”框架训练,便能够能获得良好