十种数据预处理中的数据泄露模式解析:识别与避免策略
在机器学习教学实践中,我们常会遇到这样一个问题:"模型表现非常出色,准确率超过90%!但当将其提交到隐藏数据集进行测试时,效果却大打折扣。 问题出在哪里?"这种情况几乎总是与数据泄露有关。 当测试数据在数据准备阶段无意中泄露(渗透)到训练数据时,就会发生数据泄露。- 969
- 0
Gartner认为企业必须探索的十大战略科技趋势
分析机构Gartner提出了2025年企业“需要探索”的十大战略技术趋势,其中一些趋势涉及人工智能,还有一些涉及数据管理和存储领域。 Gartner杰出的副总裁Gene Alvarez表示:“今年的十大战略技术趋势涉及人工智能的必要性和风险、计算的新前沿以及人机协同,”“跟踪这些趋势将有助于 IT 领导者以负责任并合乎道德的创新塑造组织的未来。 ”2025年最重要的战略技术趋势是:人工智能代理(A…- 969
- 0
基于关系型深度学习的自助机器学习
译者 | 朱先忠审校 | 重楼本文将探讨直接在关系数据库上执行机器学习的新方法——关系型深度学习。 本文示例项目数据集的关系模式(作者提供图片)在本文中,我们将深入探讨一种有趣的深度学习(DL)新方法,称为关系型深度学习(RDL)。 我们还将通过在一家电子商务公司的真实数据库(不是数据集!- 973
- 0
速度提高1000万倍,AI快速准确预测等离子体加热,助力核聚变研究
编辑 | 白菜叶用于等离子体加热的新型人工智能(AI)模型所能做的事情超出了人们之前的想象,不仅可以在保持准确性的情况下将预测速度提高 1000 万倍,而且还可以在原始数值代码失效的情况下正确预测等离子体加热。「凭借我们的智能,我们可以训练人工智能超越现有数值模型的限制。」美国能源部 (DOE) 普林斯顿等离子体物理实验室 (PPPL) 的副研究员、物理学家 Álvaro Sánchez-Vill…- 4
- 0
Nature子刊,基于量子实验数据进行机器学习,用于解决量子多体问题
编辑 | 萝卜皮量子硬件实现方面的进步使得人们能够获取传统计算机无法模拟的数据。将传统机器学习 (ML) 算法与这些数据相结合,有望揭示隐藏的模式。与仅使用传统计算机相比,这种混合方法扩展了可有效解决的问题类别,但由于当前量子计算机中噪声的普遍存在,这种方法仅能用于解决受限问题。韩国首尔大学(Seoul National University)的研究人员扩展了混合方法的适用性,用于解决多体物理学中…- 6
- 0
「可损伤编程设计」的超材料,上海交大团队用AI实现材料的自然抗裂机制
编辑 | 萝卜皮人造超材料的断裂行为往往会导致灾难性的破坏,并且对裂纹扩展的抵抗力有限。相比之下,骨头和陶瓷等天然材料具有微观结构,可产生空间可控的裂纹路径,并且增韧材料对裂纹的抵抗力会提高。上海交通大学的研究人员提出了一种受自然强化机制启发的方法,旨在开发一种系统的设计方法,使损伤可编程超材料能够在细胞中具有可工程化的微纤维,从而能够在空间上编程微尺度裂纹行为。机器学习可用于提供有效的设计引擎,…- 4
- 0
ML如何推动结构生物学的发展?哈佛科学家用AI在最小尺度上研究人类发育
编辑 | 白菜叶对于结构生物学家 Lucas Farnung 来说,没有比单个受精卵如何发育成一个功能齐全的人类更令人着迷的问题了。他正努力在最小尺度上研究这一过程:数万亿个原子必须同步工作才能实现这一过程。「我看不出解决 5,000 块拼图和我们在实验室进行的研究有什么大区别。」哈佛医学院布拉瓦尼克研究所(Blavatnik Institute at Harvard Medical School…- 5
- 0
谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰
「机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中,随着它真正开始发挥作用,我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。」有人说,机器人领域进展缓慢,甚至和机器学习的其他子领域相比显得毫无进展。谷歌 DeepMind 机器人科学家,SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为,这是因为机器人学是一…- 6
- 0
登Science,药物亲和力增加37倍,AI对蛋白、抗体复合物进行无监督优化
编辑 | 萝卜皮蛋白质参与了细胞组成、肌肉收缩、消化食物、识别病毒等众多生物学功能。为了设计出更好的蛋白质(包括抗体),科学家经常在不同位置反复变异氨基酸(按一定顺序排列组成蛋白质的单位),直到使蛋白质获得所需要的功能。但氨基酸序列的数量比世界上的沙粒还要多,因此找到最佳蛋白质,进而找到最佳潜在药物,通常难度巨大。当面临这一挑战时,科学家通常会花费数百万美元,并在微型化、简化版的生物系统中进行测试…- 4
- 0
Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI
编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型 (LLM),因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在…- 5
- 0
具身智能体三维感知新链条,TeleAI &上海AI Lab提出多视角混合具身模型「SAM-E」
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]当我们拿起一个板滞手表时,从正面会看到表盘和指针,从侧面会看到表冠和…- 22
- 0
ChatGPT如何「思考」?心理学和神经科学破解AI大模型,Nature发文
编辑 | X美国东北大学的计算机科学家 David Bau 非常熟悉这样一个想法:计算机系统变得如此复杂,以至于很难跟踪它们的运行体例。「我做了 20 年的软件工程师,钻研非常复杂的系统。这个课题总是存在的。」Bau 说。但 Bau 说,使用传统软件,具有内部知识的人通常可以推断出发生了什么。例如,如果一个网站在谷歌搜索中的排名下降,在谷歌工作了十几年的 Bau,会很清楚原因。他说,当前的人工智能…- 7
- 0
OpenAI和Moderna互助,推进mRNA医学
编辑 | X4 月 24 日,Moderna 和 OpenAI 宣布双方继续开展互助,联合创新,联合愿景是 AI 在将来商业和医疗保健规模的厘革潜力。Moderna 是 mRNA 医学规模创建的领导者,自成立以后就一直利用机器学习的力量。强大的数据基础及其强大的学习文明,使公司能够负责任地、无缝地将生成式 AI 集成到其运营中,并利用下一代人工智能创新。双方于 2023 年初开始互助,推出了 Mo…- 4
- 0
AI在用| 万万没想到,科技论文还能这么读
机器之能报道编辑:Cardinal以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何利用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能利用案例,来具体介绍AI利用步骤,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。Claude 3 具有非常大的内存( 200k 上下文窗口)和很强的调用准确性,它的上下文能力也因…- 3
- 0
如果 LLM Agent 成为了迷信家:耶鲁、NIH、Mila、上交等学者共同呼吁危险防范的重要性
最近的大型语言模型(LLMs)进步已经使我们处于革命性的时代,尤其是 LLMs 驱动的智能 Agents 在广泛恣意中展现出了通用性和有效性。这些被称为「AI 迷信家」的 Agent 已经开始探寻其在生物学和化学等各种范畴内举行自决迷信发觉的潜力。此类 Agents 已经表现出了选择适合恣意的对象,规划情况条件,以及实现实行自动化的才能。因此,Agent 可摇身一变成为真实的迷信家,能够有效地设计…- 8
- 0
聚类精度超96%,机器学习新算法可兑现更高脑机接口性能
编辑 | 萝卜皮使用多个电极纪录神经元活动已被广泛用于了解大脑的功效机制。增加电极数量使科学家能够解码更多种类的功效。然而,由于硬件资源有限和不可避免的热组织损伤,处理大量多通道电生理数据仍然具有挑战性。在这里,韩国大邱庆北科学技巧院(DGIST,Daegu Gyeongbuk Institute of Science & Technology)的钻研团队提出了鉴于机器学习(ML)的高频神…- 6
- 0
登Science,速度和准确性均超越人类化学家,且具独创性,AI自立化学合成机器人加速化学发觉
编辑 | X最近,在光化学和光催化方面的研讨出现了惊人的爆发,部分原因在于光作为反映源对环境无害。然而,许多研讨展示的是小规模反映,而扩大规模依赖于不同技术的拼凑,可能须要大量的试验和错误来优化。针对复杂光催化反映条件高效优化的需求,荷兰阿姆斯特丹大学 (UvA) 范特霍夫(Van 't Hoff)份子科学研讨所的 Timothy Noël 教授团队,开发了一种集成人工智能驱动机器学习单…- 4
- 0
以前所未有的精度,猜测超重核的衰变形式和半衰期,中山大学团队开发 AI 新方法
编辑 | 白菜叶有关超重地区核素衰变历程的信息对于研讨118号元素 Oganesson 和「稳定岛」之外的新元素至关重要。中山大学的研讨人员在懂得超重核衰变历程方面取得了重大突破。他们提出了使用随机丛林算法来研讨超重地区不同衰变形式之间的竞争,包括 α 衰变、β-衰变、β 衰变、电子俘虏和自觉裂变。观察到的半衰期和主要衰变形式得到了很好的再现。该研讨以「Random forest-based pr…- 7
- 0
某「新化合物」90年前就有了?伦敦大学学院教授对DeepMind参与的「A-Lab」提出质疑
编辑 | 紫罗上周,Google DeepMind 和加州大学伯克利分校的一组钻研人员在《Nature》杂志上发表了一篇备受期待的论文,提出了一个「自决尝试室」——A-Lab,旨在利用 AI 和机器人手艺加速新资料的发现和分解。被称为「自动驾驶尝试室」的 A-Lab 展现了一个雄心勃勃的愿景,即当配备计算建模、机器学习、自动化和自然语言处理方面的最新手艺时,人工智能驱动的系统可以在迷信钻研中实现什…- 4
- 0
机器学习
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!