终于把卷积神经网络算法搞懂了！！！

2025-02-21 08:29

大家好，我是小寒今天给大家分享一个强大的算法模型，卷积神经网络算法卷积神经网络算法（CNN）是一种专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式，能够自动从图像中提取特征，从而进行分类、检测等任务。卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。

大家好，我是小寒

今天给大家分享一个强大的算法模型，卷积神经网络算法

卷积神经网络算法（CNN）是一种专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像分类、目标检测、语义分割等任务。

CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式，能够自动从图像中提取特征，从而进行分类、检测等任务。

卷积神经网络的基本组成

CNN 主要包括卷积层、池化层和全连接层。

卷积层

卷积层是 CNN 的核心组成部分，它的作用是通过卷积操作从输入数据中提取局部特征。

卷积操作的基本思想是用一个小的滤波器（也叫卷积核）在输入图像上进行滑动，通过卷积运算生成特征图。

图片

核心概念

卷积核卷积核，也称为滤波器（Filter），是卷积层中用于提取特征的一个小型权重矩阵。卷积核在输入数据上滑动，通过与输入数据的局部区域进行卷积运算，生成特征图。通常，卷积核的大小为或，选择卷积核的大小时要考虑计算效率和特征的提取能力。

图片

步长步长指的是卷积核在输入数据上滑动的步长。通过调整步长的大小，可以控制输出特征图的尺寸。步长越大，输出特征图的尺寸越小，计算量也会减少，但可能会导致信息丢失。

图片

填充为了控制输出特征图的尺寸，避免因为卷积操作导致特征图的尺寸过小，通常会在输入数据的边缘进行填充。常见的填充方式有

无填充（Valid）：不增加边界，输出特征图较小。

零填充（Same）：在输入边界填充零，使得输出特征图尺寸与输入图像尺寸相同

激活函数

卷积操作后的结果会通过一个非线性激活函数来引入非线性，使网络能够学习复杂的模式。

常见的激活函数包括

终于把卷积神经网络算法搞懂了！！！

ReLU 函数通常用于卷积神经网络中的激活层，因为它能够有效地解决梯度消失问题，并且计算速度较快。

图片

池化层

池化层用于对卷积层输出的特征图进行下采样，减少特征图的尺寸，从而减小计算量并增强模型的平移不变性。

常见的池化操作包括最大池化和平均池化。

最大池化取池化窗口中的最大值，能够保留最显著的特征。
平均池化取池化窗口中的平均值，适用于平滑特征。

图片

全连接层

在卷积层和池化层提取到足够多的特征之后，通常会将这些特征图展平（flatten）并输入到全连接层。

在全连接层中，前一层的所有神经元都会与这一层的每个神经元相连接。通过加权和，最终输出用于预测的结果。

图片

卷积神经网络算法的优缺点

优点

自动特征提取CNN能够从原始数据中自动提取特征，而无需人工设计特征。这是卷积神经网络最重要的优势之一。通过多层的卷积和池化操作，CNN能够学习到从低级到高级的特征，例如边缘、纹理、形状、颜色等，而不需要手动提取这些特征。
共享权重在卷积层中，同一个卷积核在输入图像的所有位置上共享权重，这使得 CNN 的参数数量大大减少。共享权重不仅减少了内存消耗，还提高了计算效率。
局部感知卷积神经网络通过卷积核进行局部感知，每个卷积核只与图像的一小部分区域进行计算。这种局部感知的特性使得网络在图像处理任务中能够更有效地捕捉到图像的局部特征。随着网络层次的加深，网络逐渐从局部特征提取到全局特征，使得模型能够捕捉到复杂的高层次抽象。
平移不变性卷积操作对图像进行滑动窗口处理，使得 CNN 具备了一定的平移不变性。也就是说，CNN 可以识别图像中的相同特征，无论该特征出现在图像的哪个位置。

缺点

需要大量标注数据虽然 CNN 能够自动学习特征，但是它需要大量的标注数据进行训练，尤其是在深度网络的情况下。数据集的规模直接影响到模型的训练效果和泛化能力。如果标注数据量不足，可能导致模型过拟合或无法学习到有效的特征。
难以解释性CNN 被认为是“黑箱”模型，尽管其在很多任务中取得了令人瞩目的成果，但它的内部工作原理和特征学习过程通常难以解释和理解。

案例分享

下面是一个使用卷积神经网络算法进行手写数字识别（MNIST 数据集）的示例代码。

TensorFlow 实现

复制

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical
import matplotlib.pyplot as plt
import numpy as np

# 加载 MNIST 数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0
x_train = x_train.reshape((x_train.shape[0], 28, 28, 1))
x_test = x_test.reshape((x_test.shape[0], 28, 28, 1))
y_train = to_categorical(y_train, 10)  # 10 是类别数（0-9的数字）
y_test = to_categorical(y_test, 10)

# 构建卷积神经网络模型
model = models.Sequential()
# 卷积层 1：32 个 3x3 的卷积核，使用 ReLU 激活函数
model.add(layers.Conv2D(32, (3, 3), activatinotallow='relu', input_shape=(28, 28, 1)))
# 池化层：2x2 最大池化
model.add(layers.MaxPooling2D((2, 2)))
# 卷积层 2：64 个 3x3 的卷积核，使用 ReLU 激活函数
model.add(layers.Conv2D(64, (3, 3), activatinotallow='relu'))
# 池化层：2x2 最大池化
model.add(layers.MaxPooling2D((2, 2)))
# 卷积层 3：128 个 3x3 的卷积核，使用 ReLU 激活函数
model.add(layers.Conv2D(128, (3, 3), activatinotallow='relu'))
# 展平层：将二维数据展平为一维数据
model.add(layers.Flatten())
# 全连接层：128 个神经元，ReLU 激活函数
model.add(layers.Dense(128, activatinotallow='relu'))
# 输出层：10 个神经元，对应 10 个类别（数字 0-9），softmax 激活函数
model.add(layers.Dense(10, activatinotallow='softmax'))

model.compile(optimizer='adam',  # 使用 Adam 优化器
              loss='categorical_crossentropy',  # 多类交叉熵损失函数
              metrics=['accuracy'])  # 评估标准：准确率

# 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=64, validation_data=(x_test, y_test))

# 评估模型性能
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'测试集准确率: {test_acc:.4f}')
predictions = model.predict(x_test[:5])

# 可视化预测结果和图像
for i in range(5):
    plt.subplot(1, 5, i+1)  
    plt.imshow(x_test[i].reshape(28, 28), cmap='gray')  
    plt.title(f"预测: {predictions[i].argmax()}")  
plt.show()

图片

PyTorch 实现

复制

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import numpy as np

# 数据加载与预处理
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

# 加载 MNIST 数据集
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)

trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

# 定义卷积神经网络模型
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)  # 1通道输入，32通道输出，3x3卷积核
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)  # 32通道输入，64通道输出，3x3卷积核
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3, padding=1)  # 64通道输入，128通道输出，3x3卷积核
        self.fc1 = nn.Linear(128 * 3 * 3, 128)  # 全连接层，输入维度为卷积输出的展开维度
        self.fc2 = nn.Linear(128, 10)  # 输出层，10个数字类别

    def forward(self, x):
        x = torch.relu(self.conv1(x))
        x = torch.max_pool2d(x, 2)  # 2x2最大池化
        x = torch.relu(self.conv2(x))
        x = torch.max_pool2d(x, 2)  # 2x2最大池化
        x = torch.relu(self.conv3(x))
        x = torch.max_pool2d(x, 2)  # 2x2最大池化
        x = x.view(-1, 128 * 3 * 3)  # 展平
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 初始化模型、损失函数和优化器
model = CNN()
criterion = nn.CrossEntropyLoss()  # 使用交叉熵损失
optimizer = optim.Adam(model.parameters(), lr=0.001)  # 使用Adam优化器

# 训练模型
num_epochs = 5
for epoch in range(num_epochs):
    model.train()  # 设置模型为训练模式
    running_loss = 0.0
    for i, (inputs, labels) in enumerate(trainloader, 0):
        optimizer.zero_grad()  # 清零梯度
        outputs = model(inputs)  # 计算模型输出
        loss = criterion(outputs, labels)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新参数
        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(trainloader)}")

print("Finished Training")

# 测试模型
model.eval()  # 设置模型为评估模式
correct = 0
total = 0
with torch.no_grad():  # 在测试时不计算梯度，减少内存消耗
    for inputs, labels in testloader:
        outputs = model(inputs)
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f"Test Accuracy: {100 * correct / total:.2f}%")

# 获取前 5 张图片及其预测结果
dataiter = iter(testloader)
images, labels = dataiter.next()

# 获取模型预测结果
model.eval()  # 设置模型为评估模式
outputs = model(images)
_, predicted = torch.max(outputs, 1)

# 显示图像和预测结果
fig, axes = plt.subplots(1, 5, figsize=(12, 3))
for i in range(5):
    ax = axes[i]
    ax.imshow(images[i].numpy().squeeze(), cmap='gray')  # 显示图像
    ax.set_title(f"Pred: {predicted[i].item()}\nTrue: {labels[i].item()}")
    ax.axis('off')

plt.show()

图片

终于把图神经网络算法搞懂了！！！

今天给大家分享一个强大的算法模型，GNN。图神经网络（GNN）是一类专门处理图结构数据的深度学习模型。在传统的深度学习中，输入数据通常是结构化的（如图像、文本、时间序列等），这些数据都可以表示为一个规则的网格或序列。

12/12/2024 12:29:03 AM

程序员小寒

神经形态计算：从实验室原型到产业变革的前夜

编辑 | matrix数十年来，科研人员一直致力于构建类脑计算机硬件，但这一领域尚未迎来真正的突破性进展。如今，领先的研究者认为，构建首个能解决实际问题的规模化神经形态设备的时机已然成熟。从仿生启发的潜力到技术深层的差异近年来推动人工智能进步的神经网络技术，虽从大脑中获得灵感，但其算法和硬件与生物神经元存在本质差异。

3/27/2025 12:01:00 PM

ScienceAI

Nature子刊：科学家在类脑芯片上实现类似LSTM的功能，能效高1000倍

格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明，他们找到了一种在神经形态芯片上模拟 LSTM 的方案，可以让类脑神经形态芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及，手机游戏也越来越受欢迎。但视频游戏等程序会大量耗电耗能。与 GPU 等标准硬件相比，基于 spike 的神经形态芯片有望实现更节能的深度神经网络（DNN）。但这需要我们理解如何在基于 event 的稀疏触发机制（sparse firing regime）中模拟 DNN，否则神经形态芯片的节能优势就会丧失。比如

5/21/2022 4:43:00 PM

机器之心

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

终于把卷积神经网络算法搞懂了！！！

卷积神经网络的基本组成

卷积层

激活函数

池化层

全连接层

卷积神经网络算法的优缺点

优点

缺点

案例分享

TensorFlow 实现

PyTorch 实现

相关资讯

终于把图神经网络算法搞懂了！！！

神经形态计算：从实验室原型到产业变革的前夜

Nature子刊：科学家在类脑芯片上实现类似LSTM的功能，能效高1000倍