机器学习
哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式
编辑 | 2049在人工智能快速发展的今天,计算效率成为制约其进一步发展的关键瓶颈。 神经形态计算凭借其借鉴生物大脑的创新架构,在能效比和实时处理等方面展现出巨大潜力。 然而,该领域长期缺乏统一的评测基准,使得技术创新难以得到客观衡量和有效比较。
如何将机器学习模型部署到生产环境?
译者 | 布加迪审校 | 重楼开发机器学习模型只完成了一半工作。 除非部署到生产环境、提供业务价值,否则模型仍然毫无用处。 知道如何部署自己的模型已成为任何数据科学家的一项基本技能,许多雇主已经要求我们能做到这一点。
研究警告AI语言模型极限:超8K上下文性能腰斩,概念推理成难关
慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型,在长文本概念推理任务中面临显著性能衰减。 尽管这些模型均支持至少128,000个标记的上下文处理,但其深层逻辑关联能力仍存在根本性局限。 研究团队开发的NOLIMA(无文字匹配)基准测试系统,通过刻意规避关键词重复的设计,揭示AI模型在概念联结上的脆弱性。
谷歌引入机器学习模型,加强验证机制防止青少年“谎报”年龄
这款新模型的目标是更准确地判断用户是否已满18岁,从而提供更符合其年龄的使用体验。不过,谷歌尚未透露具体的技术细节,因此该系统是否比现有的安全措施更有效,还有待验证。
Nature子刊新登,如何检测小分子机器学习中的覆盖率偏差
编辑丨&小分子机器学习旨在从分子结构中预测化学或生物特性,其应用包括毒性预测、配体结合和药代动力学等。 最近的一个趋势是开发避免显式领域知识的端到端模型。 这些模型假设训练和评估数据中没有覆盖率偏差,这意味着数据代表了真实分布。
AI/ML存储环境架构的三个技巧
人工智能彻底改变了我们周围的世界,其革命性影响源于它分析大量数据、从中学习并提供见解和自动化能力。 这些数据通常分布在数据仓库、数据湖、云和本地数据中心中,确保关键信息能够被访问和分析,以适应当今的人工智能计划。 人工智能激增的影响之一是传统商业模式的颠覆。
简易指南:运用AI/ML技术检测实时欺诈行为
译者 | 核子可乐审校 | 重楼随着技术的飞速发展,欺诈检测的重要意义也日益凸显。 根据注册欺诈审查师协会(ACFE)公布的数据,全球范围内的欺诈活动给企业造成的损失高达数万亿美元,占年销售总额的近5%。 随着欺诈手段愈发老练复杂,企业也开始借助AI与机器学习(ML)等前沿技术辅助分析,探索打击欺诈的新途径。
新的训练范式可以防止机器学习模型学习虚假相关性
译者 | 李睿审校 | 重楼机器学习领域长期存在的问题之一是错误相关性的记忆。 例如:假设开发人员正在开发一个深度神经网络对陆地鸟类和海洋鸟类的图像进行分类。 他们使用数千张标记过的图像训练模型,这个模型在训练集和测试集上的表现都非常出色。
历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型
就在刚刚,历史性的一刻出现了。 DeepSeek项目在GitHub平台上的Star数,已经超越了OpenAI。 热度最高的DeepSeek-V3,Star数如今已达7.7万。
DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战
近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。 这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。 该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。
人工智能的历史:从古代神话到现代机器,从图灵到未来
在人类宏伟成就的历史上,很少有演员能像人工智能一样如此引人注目、充满争议且大胆无畏。 深入人工智能 (AI) 的历史迷宫及其可能的未来,就像踏上一场穿越时空的冒险之旅,科幻小说与现实之间的界限比量子计算机解决魔方的速度更快。 请想象一下,如果有一天,机器不仅能执行任务,还能学习、适应和进化,你的烤面包机也许有一天会在国际象棋上胜过你,你的吸尘器也许能写出一首与莎士比亚媲美的十四行诗。
谷歌 X 实验室孵化新创业公司 Heritable Agriculture:利用人工智能提升农作物产量
谷歌 X “月球计划工厂” 近日宣布了一项新创业公司 Heritable Agriculture 的独立发展。 这个新公司致力于利用数据和机器学习技术来改进农作物的生长方式。 Heritable Agriculture 在一份声明中提到,植物是高效且令人惊叹的系统:“植物是太阳能驱动的、碳负的自组装机器,依靠阳光和水生存。
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
2025年主导AI的将是第3代scaling law:测试时计算。 正如Michael Dell转述所言:第一代scaling:预训练像读大学第二代scaling:微调像读博士第三代scaling:测试时计算就像深度思考和推理近日,计算机强校CMU机器学习系,发表博客文章解释LLM测试时计算优化问题,特别是涉及到的元强化学习(meta-RL)问题。 文章亮点如下:监督学习只是在训练模型「答案是什么」,只要学习「如何解答」,模型泛化性会更好。
使用 Yolov8 Flask 自定义训练实时火灾和烟雾检测
近年来,人工智能和机器学习的进步彻底改变了包括公共安全在内的各个行业。 这些技术在火灾和烟雾检测方面取得了显著进展,这对于早期预警系统和高效的应急响应至关重要。 实现这一目标的最有效方法之一是将YOLOv8强大的目标检测能力与基于Python的轻量级Web框架Flask的灵活性相结合。
人大、东北大学联合开发「图机器学习库」Jittor Geometric!性能超越PYG、DGL
近日,中国人民大学与东北大学联合开发了图机器学习库Jittor Geometric,其1.0版本近日已正式发布。 Jittor Geometric以国产深度学习框架Jittor为基础技术架构,聚焦图数据,在图存储、图计算、图学习等方面作了细致优化,整合、加速了现有多类图神经网络模型,模型运行时间在多种图学习任务上较Pytorch Geometric(PyG)、Deep Graph Library(DGL)等同类型框架提升10%~50%。 同时,Jittor Geometric简洁、易用、跨平台通用性强、用户学习成本低,目前已用于研究生课程教学。
机器学习的下一个前沿—量子扩展
译者 | 陈峻审校 | 重楼现如今,机器学习的速度比以往任何时候都快得多,也能够解决那些曾被认为完全无法解决的问题。 将来,在量子计算潜力的驱动下,人工智能(AI)模型会越来越大、越来越强,甚至会超越我们对其训练的工具。 说到模型训练,其计算和能源的消耗成本日趋高启。
终于把机器学习中的特征选择搞懂了!!
特征选择是机器学习中的一个重要过程,通过选择与目标变量最相关的特征,剔除冗余或无关的特征,从而提高模型的性能、减少训练时间,并降低过拟合的风险。 常见的特征选择方法有:过滤方法、包装方法和嵌入方法过滤方法过滤方法是一种基于统计特性和独立于模型的特征选择技术。 它通过计算特征与目标变量之间的相关性或其他统计指标来评估特征的重要性。
终于把机器学习中的类别不平衡搞懂了!!
今天给大家分享机器学习中的一个关键概念,类别不平衡。 类别不平衡指的是在分类问题中,不同类别的数据样本数量相差悬殊的情况。 在机器学习和深度学习的应用中,类别不平衡是一个常见的问题,尤其是在一些实际场景中,某些类别的数据相对较少,而其他类别的数据较多。