机器学习
AMD与约翰霍普金斯大学联手:AI实验室copilot自动化科研,成本节约84%!
编辑 | 2049科学研究,尤其是机器学习领域的研究,往往需要大量的时间和资源投入,从最初的构思到最终的结果产出,每一步都充满了挑战。 近年来,大型语言模型(Large Language Models,LLMs)在自然语言处理和代码生成方面取得了显著进展,这为自动化科学研究提供了新的可能性。 然而,现有的自动化研究工具通常只能处理单个环节,如文献综述或实验设计,无法实现全流程的自动化。
使用 Teachable Machine 构建图像识别模型
Teachable Machine 是由 Google 开发的一款基于网页的工具,允许任何人在不需要深入了解编程或机器学习的情况下创建机器学习模型。 它的设计易于使用且用户友好,适合初学者、教育工作者,甚至是想要探索人工智能概念的孩子们。 Teachable Machine 支持的模型Teachable Machine 支持以下机器学习模型:图像分类 — 识别图像中的物体音频分类 — 识别声音、语音或其他音频输入姿态分类 — 识别人体姿态或动作要训练模型,您需要为 Teachable Machine 提供自己的数据集,例如图像或录音。
PyTorch Geometric框架下图神经网络的可解释性机制:原理、实现与评估
在机器学习领域存在一个普遍的认知误区,即可解释性与准确性存在对立关系。 这种观点认为可解释模型在复杂度上存在固有限制,因此无法达到最优性能水平,神经网络之所以能够在各个领域占据主导地位,正是因为其超越了人类可理解的范畴。 其实这种观点存在根本性的谬误。
从零开始构建 DINO:自监督视觉 Transformer
DINO模型输出的狗冲刺无标签自蒸馏(DINO)《从几个“补丁”中重建完整图像 | 构建可扩展学习器的掩模自编码器》这边文章讲了如何构建可扩展学习器,这是我对视觉变换器系列的继续,其中我解释了最重要的架构及其从零开始的实现。 自监督学习自监督学习(SSL)是一种机器学习类型,模型通过无需手动标记的示例来学习理解数据。 相反,它从数据本身生成其监督信号。
终于把机器学习中的超参数调优搞懂了!!
今天给大家分享机器学习中一个重要的知识点,超参数调优超参数调优(Hyperparameter Tuning)是机器学习模型开发过程中一个关键步骤,旨在通过调整模型的超参数来优化模型的性能。 超参数不同于模型参数,后者是在训练过程中通过数据学习得到的,而超参数是在训练之前设定的,通常需要通过试验和优化来确定。 什么是超参数超参数是指在训练机器学习模型之前需要人为设定的参数。
图像相似度估计 | 结合三元组损失的暹罗网络
在机器学习领域,确定图像之间的相似度在各种应用中至关重要,从检测重复项到面部识别。 解决这个问题的一个强大方法是使用暹罗网络结合三元组损失函数。 在本文中,我们将探索如何构建和训练暹罗网络以估计图像相似度,并通过一个来自GitHub仓库的实际示例进行说明。
一文读懂 NVIDIA GPU 产品线
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景中一个至关重要的组成部分:构建高效、灵活的计算架构的基石—NVIDIA GPU 产品线。 在人工智能和深度学习领域,NVIDIA 凭借其强大的 GPU 产品线占据着举足轻重的地位。 NVIDIA 拥有数十款功能各异的 GPU 产品,可用于部署和运行不同规模的机器学习模型,从边缘设备到大规模数据中心,几乎涵盖了所有应用场景。
机器学习|从0开始大模型之模型LoRA训练
1、LoRA是如何实现的? 在深入了解 LoRA 之前,我们先回顾一下一些基本的线性代数概念。 1.1、秩给定矩阵中线性独立的列(或行)的数量,称为矩阵的秩,记为 rank(A) 。
设置机器学习管道的初学者指南
译者 | 陈峻审校 | 重楼不知你是否知晓,构建和运行机器学习(Machine Learning,ML)模型通常是一个虽有益但耗时且复杂的过程。 其中包括:数据准备、特征生成、模型拟合、以及验证和部署等阶段。 更重要的是,随着数据趋势的变化,这些模型需要保持更新。
麻省理工研究人员提高机器学习模型准确性
机器学习(ML)有可能通过利用大量数据进行预测洞察来改变医疗决策。 然而,当这些模型在不能充分代表所有人口群体的数据集上进行训练时,就会出现一个严重挑战。 预测疾病患者治疗计划的模型可以在主要包含男性患者的数据集上进行训练。
数据分布检验利器:通过Q-Q图进行可视化分布诊断、异常检测与预处理优化
在机器学习和数据分析中,我们经常需要验证数据是否符合某种特定的分布(如正态分布)。 这种验证对于选择合适的统计方法和机器学习模型至关重要。 例如许多统计检验和机器学习算法都假设数据服从正态分布。
终于把机器学习中的交叉验证搞懂了!!
交叉验证是一种评估机器学习模型性能的方法,用于衡量机器学习模型的泛化能力(即在未见数据上的表现)。 它通过将数据集分成多个部分,交替使用不同的部分作为训练集和测试集,从而充分利用数据、避免过拟合或欠拟合,并更准确地评估模型的泛化能力。 核心思想数据划分:将数据集划分为训练集和测试集。
使用机器学习技术进行时间序列缺失数据填充:基础方法与入门案例
在时间序列分析领域中,数据缺失是一个不可避免的挑战。 无论是由于传感器故障、数据传输中断还是设备维护等原因,这些缺失都会对数据分析和预测造成显著影响。 传统的处理方法,如前向填充或简单插值,虽然实现简单,但在处理复杂数据时往往表现不足。
当下企业需要首席人工智能官吗?
随着人工智能产业加速,首席人工智能官(CAIO)已成为商业世界中最热门的工作之一。 新的CAIO通常承担着双重任务,即利用人工智能推进业务目标,同时确保技术具有负责任的治理。 正如设想的那样,CAIO与其他高层领导合作,评估新的人工智能解决方案,支持产品路线图,开发创新的人工智能产品,实施负责任的人工智能实践,并确保业务中所有受人工智能影响的方面都平稳地运行。
原来机器学习那么简单—SVR
一、算法介绍 支持向量回归(SVR)是一种监督学习算法,用于解决回归问题。 其核心思想是找到一个超平面,这个超平面能够以最小的误差包含所有的训练样本。 与支持向量机处理分类问题类似,支持向量回归的目标是确保尽可能多的数据点位于由超平面决定的边界内。
时间序列模型的演变:人工智能引领新的预测时代
译者 | 布加迪审校 | 重楼我们正处于这样一个时代:大型基础模型(大规模通用神经网络以无监督的方式使用大量不同的数据进行预训练)彻底改变计算机视觉、自然语言处理以及最近的时间序列预测等领域。 这种模型通过实现零样本预测来重塑时间序列预测领域,允许使用新的、未见过的数据进行预测,无需针对每个数据集进行重新训练。 这一突破显著缩减了开发时间和成本,简化了为不同任务创建和微调模型的过程。
在PostgreSQL数据库中应用机器学习进行预测性容量规划
译者 | 李睿审校 | 重楼如今,数据库领域正在迅速向人工智能(AI)和机器学习(ML)迈进,数据库的工作量将会大幅增加。 对于数据库管理员来说,提前预测数据库基础设施的工作负载并满足需求将是一项额外的责任。 随着数据库规模的扩展和资源管理变得越来越重要,传统的容量规划方法往往难以满足需求,从而导致性能问题和计划外停机。
全球顶尖天气预报系统被AI击败,DeepMind新模型登Nature,8分钟搞定未来15天预测
编辑 | 萝卜皮天气预报从根本上来说具有不确定性,因此预测可能发生的天气情景范围对于重要决策至关重要,从警告公众注意危险天气到规划可再生能源的使用。 传统上,天气预报基于数值天气预报 (NWP),它依赖于基于物理学的大气模拟。 基于机器学习 (ML) 的天气预报 (MLWP) 的最新进展产生了基于 ML 的天气模型,其预测误差比单一 NWP 模拟要小。