机器学习

机器学习的下一个前沿—量子扩展

译者 | 陈峻审校 | 重楼现如今，机器学习的速度比以往任何时候都快得多，也能够解决那些曾被认为完全无法解决的问题。将来，在量子计算潜力的驱动下，人工智能（AI）模型会越来越大、越来越强，甚至会超越我们对其训练的工具。说到模型训练，其计算和能源的消耗成本日趋高启。

1/21/2025 8:11:24 AM

陈峻

终于把机器学习中的特征选择搞懂了！！

特征选择是机器学习中的一个重要过程，通过选择与目标变量最相关的特征，剔除冗余或无关的特征，从而提高模型的性能、减少训练时间，并降低过拟合的风险。常见的特征选择方法有：过滤方法、包装方法和嵌入方法过滤方法过滤方法是一种基于统计特性和独立于模型的特征选择技术。它通过计算特征与目标变量之间的相关性或其他统计指标来评估特征的重要性。

1/20/2025 9:21:00 AM

程序员小寒

终于把机器学习中的类别不平衡搞懂了！！

今天给大家分享机器学习中的一个关键概念，类别不平衡。类别不平衡指的是在分类问题中，不同类别的数据样本数量相差悬殊的情况。在机器学习和深度学习的应用中，类别不平衡是一个常见的问题，尤其是在一些实际场景中，某些类别的数据相对较少，而其他类别的数据较多。

1/20/2025 9:00:00 AM

程序员小寒

AMD与约翰霍普金斯大学联手：AI实验室copilot自动化科研，成本节约84%！

编辑 | 2049科学研究，尤其是机器学习领域的研究，往往需要大量的时间和资源投入，从最初的构思到最终的结果产出，每一步都充满了挑战。近年来，大型语言模型（Large Language Models，LLMs）在自然语言处理和代码生成方面取得了显著进展，这为自动化科学研究提供了新的可能性。然而，现有的自动化研究工具通常只能处理单个环节，如文献综述或实验设计，无法实现全流程的自动化。

1/14/2025 11:56:00 AM

ScienceAI

Teachable Machine 是由 Google 开发的一款基于网页的工具，允许任何人在不需要深入了解编程或机器学习的情况下创建机器学习模型。它的设计易于使用且用户友好，适合初学者、教育工作者，甚至是想要探索人工智能概念的孩子们。 Teachable Machine 支持的模型Teachable Machine 支持以下机器学习模型：图像分类 — 识别图像中的物体音频分类 — 识别声音、语音或其他音频输入姿态分类 — 识别人体姿态或动作要训练模型，您需要为 Teachable Machine 提供自己的数据集，例如图像或录音。

1/11/2025 11:14:52 PM

二旺

PyTorch Geometric框架下图神经网络的可解释性机制：原理、实现与评估

在机器学习领域存在一个普遍的认知误区，即可解释性与准确性存在对立关系。这种观点认为可解释模型在复杂度上存在固有限制，因此无法达到最优性能水平，神经网络之所以能够在各个领域占据主导地位，正是因为其超越了人类可理解的范畴。其实这种观点存在根本性的谬误。

1/9/2025 2:06:31 PM

J Kwak

从零开始构建 DINO：自监督视觉 Transformer

DINO模型输出的狗冲刺无标签自蒸馏（DINO）《从几个“补丁”中重建完整图像 | 构建可扩展学习器的掩模自编码器》这边文章讲了如何构建可扩展学习器，这是我对视觉变换器系列的继续，其中我解释了最重要的架构及其从零开始的实现。自监督学习自监督学习（SSL）是一种机器学习类型，模型通过无需手动标记的示例来学习理解数据。相反，它从数据本身生成其监督信号。

1/9/2025 11:14:13 AM

机器学习

终于把机器学习中的超参数调优搞懂了！！

今天给大家分享机器学习中一个重要的知识点，超参数调优超参数调优（Hyperparameter Tuning）是机器学习模型开发过程中一个关键步骤，旨在通过调整模型的超参数来优化模型的性能。超参数不同于模型参数，后者是在训练过程中通过数据学习得到的，而超参数是在训练之前设定的，通常需要通过试验和优化来确定。什么是超参数超参数是指在训练机器学习模型之前需要人为设定的参数。

1/7/2025 12:55:28 PM

程序员小寒

图像相似度估计 | 结合三元组损失的暹罗网络

在机器学习领域，确定图像之间的相似度在各种应用中至关重要，从检测重复项到面部识别。解决这个问题的一个强大方法是使用暹罗网络结合三元组损失函数。在本文中，我们将探索如何构建和训练暹罗网络以估计图像相似度，并通过一个来自GitHub仓库的实际示例进行说明。

12/31/2024 8:20:00 AM

二旺

一文读懂 NVIDIA GPU 产品线

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景中一个至关重要的组成部分：构建高效、灵活的计算架构的基石—NVIDIA GPU 产品线。在人工智能和深度学习领域，NVIDIA 凭借其强大的 GPU 产品线占据着举足轻重的地位。 NVIDIA 拥有数十款功能各异的 GPU 产品，可用于部署和运行不同规模的机器学习模型，从边缘设备到大规模数据中心，几乎涵盖了所有应用场景。

12/30/2024 7:00:00 AM

架构驿站

机器学习|从0开始大模型之模型LoRA训练

1、LoRA是如何实现的? 在深入了解 LoRA 之前，我们先回顾一下一些基本的线性代数概念。 1.1、秩给定矩阵中线性独立的列（或行）的数量，称为矩阵的秩，记为 rank(A) 。

12/26/2024 12:46:25 AM

周末程序猿

设置机器学习管道的初学者指南

译者 | 陈峻审校 | 重楼不知你是否知晓，构建和运行机器学习（Machine Learning，ML）模型通常是一个虽有益但耗时且复杂的过程。其中包括：数据准备、特征生成、模型拟合、以及验证和部署等阶段。更重要的是，随着数据趋势的变化，这些模型需要保持更新。

12/25/2024 8:00:00 AM

陈峻

麻省理工研究人员提高机器学习模型准确性

机器学习（ML）有可能通过利用大量数据进行预测洞察来改变医疗决策。然而，当这些模型在不能充分代表所有人口群体的数据集上进行训练时，就会出现一个严重挑战。预测疾病患者治疗计划的模型可以在主要包含男性患者的数据集上进行训练。

12/23/2024 1:28:22 PM

AI情报室

数据分布检验利器：通过Q-Q图进行可视化分布诊断、异常检测与预处理优化

在机器学习和数据分析中，我们经常需要验证数据是否符合某种特定的分布（如正态分布）。这种验证对于选择合适的统计方法和机器学习模型至关重要。例如许多统计检验和机器学习算法都假设数据服从正态分布。

12/17/2024 2:33:57 PM

Adarsh Singh

终于把机器学习中的交叉验证搞懂了！！

交叉验证是一种评估机器学习模型性能的方法，用于衡量机器学习模型的泛化能力（即在未见数据上的表现）。它通过将数据集分成多个部分，交替使用不同的部分作为训练集和测试集，从而充分利用数据、避免过拟合或欠拟合，并更准确地评估模型的泛化能力。核心思想数据划分：将数据集划分为训练集和测试集。

12/16/2024 2:14:19 PM

程序员小寒

使用机器学习技术进行时间序列缺失数据填充：基础方法与入门案例

在时间序列分析领域中，数据缺失是一个不可避免的挑战。无论是由于传感器故障、数据传输中断还是设备维护等原因，这些缺失都会对数据分析和预测造成显著影响。传统的处理方法，如前向填充或简单插值，虽然实现简单，但在处理复杂数据时往往表现不足。

12/16/2024 1:15:15 PM

Sara Nóbrega

当下企业需要首席人工智能官吗？

随着人工智能产业加速，首席人工智能官（CAIO）已成为商业世界中最热门的工作之一。新的CAIO通常承担着双重任务，即利用人工智能推进业务目标，同时确保技术具有负责任的治理。正如设想的那样，CAIO与其他高层领导合作，评估新的人工智能解决方案，支持产品路线图，开发创新的人工智能产品，实施负责任的人工智能实践，并确保业务中所有受人工智能影响的方面都平稳地运行。

12/16/2024 1:12:01 PM

AI情报室

原来机器学习那么简单—SVR

一、算法介绍支持向量回归（SVR）是一种监督学习算法，用于解决回归问题。其核心思想是找到一个超平面，这个超平面能够以最小的误差包含所有的训练样本。与支持向量机处理分类问题类似，支持向量回归的目标是确保尽可能多的数据点位于由超平面决定的边界内。

12/13/2024 9:11:12 AM

BBSM

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型全能且实用！实战测评谷歌最新模型Gemini 2.5 Pro 大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略基于 DeepSeek GRPO 的 1.5B Rust 代码生成模型训练实战 DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI 模态编码器|CLIP详细解读 50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习 GPT 开源微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习模态苹果 AI视频驾驶文本搜索 xAI 人形机器人 Copilot 神器推荐 LLaMA 大语言模型具身智能字节跳动 Claude 算力安全应用视频生成科技视觉干货合集亚马逊 2024 AGI 特斯拉 DeepMind 架构

机器学习

机器学习的下一个前沿—量子扩展

终于把机器学习中的特征选择搞懂了！！

终于把机器学习中的类别不平衡搞懂了！！

AMD与约翰霍普金斯大学联手：AI实验室copilot自动化科研，成本节约84%！

使用 Teachable Machine 构建图像识别模型

PyTorch Geometric框架下图神经网络的可解释性机制：原理、实现与评估

从零开始构建 DINO：自监督视觉 Transformer

终于把机器学习中的超参数调优搞懂了！！

图像相似度估计 | 结合三元组损失的暹罗网络

一文读懂 NVIDIA GPU 产品线

机器学习|从0开始大模型之模型LoRA训练

设置机器学习管道的初学者指南

麻省理工研究人员提高机器学习模型准确性

数据分布检验利器：通过Q-Q图进行可视化分布诊断、异常检测与预处理优化

终于把机器学习中的交叉验证搞懂了！！

使用机器学习技术进行时间序列缺失数据填充：基础方法与入门案例

当下企业需要首席人工智能官吗？

原来机器学习那么简单—SVR