自定义训练的 YOLOv8 模型进行邮票整理

2025-02-07 02:52

还记得人们过去常常寄信和明信片的日子吗？明信片上通常描绘了你所访问的城市或国家的一些风景如画的景色，但对许多人来说，邮票才是主要的吸引力。它们被视为微型艺术品，被认为是非常值得收藏的。

由于每张明信片、信封、包裹和邮包都需要邮票，许多人最终拥有了大量的邮票收藏。这变成了一个计算机视觉项目：我没有一张一张地拍摄每张邮票的照片，而是拍摄了邮票相册的每一页，并使用目标检测来找到并存储图片中所有邮票的图像。

目标检测

由于我之前没有尝试过目标检测（只做过图像分类），我花了一些时间寻找完成这项任务的最佳方法。我在Roboflow上发现了一个类似的项目[1]，并能够在线测试一些我自己的图像，使用已经在一个邮票数据集上训练过的YOLOv8模型。然而，我无法让模型在我自己的机器上本地运行，所以我决定使用Ultralytics的YOLOv8模型训练自己的模型。下图展示了我自定义训练的YOLOv8目标检测模型如何处理一张包含57张意大利邮票的图片。

自定义训练的 YOLOv8 模型进行邮票整理

使用自定义训练的YOLOv8模型进行邮票检测

每张检测到的邮票也自动保存为单独的裁剪图像文件，其中一些如下所示。

自定义训练的 YOLOv8 模型进行邮票整理

自动裁剪并保存的单个邮票图像

在自定义数据集上训练YOLO

加载一个YOLO模型（使用COCO数据集的预训练权重）并在你自己的机器上使用自定义数据集进行训练并不困难。一旦创建了虚拟环境并安装了所需的Python库（例如pytorch、ultralytics），实际的训练和推理只需要几行代码。

困难的部分可能是获取足够大的标注数据集。在我的情况下，我很幸运地在网上找到了一个已经标注并已转换为YOLOv8格式的邮票数据集[1]。如果你必须制作自己的数据集来让YOLO检测不属于其开箱即用的80个类别之一的东西，Roboflow和CVAT提供了注释工具，你可以使用它们来完成这项工作。

一旦数据集准备好并保存在本地文件夹中，可以使用config.yaml文件提供模型训练、验证和测试所需的类标签和路径。我的config.yaml文件如下所示：

复制

path: /home/username/venv_folder/venv_name/yolov8-project/ # absolute path to dataset
test: test/images # relative path to test images
train: train/images # relative path to training images
val: val/images # relative path to validation images

# classes
names:
  0: postage-stamp

使用自定义数据集训练YOLOv8所需的Python代码如下所示。建议使用GPU，并在训练前检查其可用性。

复制

import torch, ultralytics


# Check library versions
print("PyTorch version:", torch.__version__)
print("Ultralytics version:", ultralytics.__version__)


# Check if GPU is available
if torch.cuda.is_available():
    print(f"GPU is available: {torch.cuda.get_device_name(0)}")
else:
    print("GPU is not available")

自定义训练的 YOLOv8 模型进行邮票整理

在训练之前，加载带有预训练权重的YOLOv8模型。模型名称末尾的字母（yolov8n.pt）可用于选择模型大小。字母n表示最小且最快的模型，具有最少的可训练参数，但如果需要更高的精度且速度不是关键，你可以选择另一个模型（n,s,m,l,x）[2]。

复制

from ultralytics import YOLO


# Load model with pretrained weights (recommended)
model = YOLO("yolov8n.pt") 


# Optionally load a model without pretrained weights
# model = YOLO("yolov8n.yaml")


# You can also try yolo11n
# model = YOLO("yolo11n.pt")


# Train model
model.train(data="config.yaml", epochs=100, patience=10)

训练完成后，会生成一个runs/detect/train/文件夹，其中包含许多有用的信息，如训练/验证指标和混淆矩阵，因此请务必查看它们以更好地了解模型性能。

自定义训练的 YOLOv8 模型进行邮票整理

YOLOv8训练指标

要使用自定义训练的模型从新图像中检测对象，请从runs/detect/train/weights文件夹加载它。你可以选择best.pt或last.pt，前者是得分最高的模型，后者是最后一个epoch训练的模型。

复制

# Load the trained YOLO model
model = YOLO("/home/username/venv_folder/venv_name/runs/detect/train/weights/best.pt")


# Specify folder containing images for object detection
image_folder = "/home/username/venv_folder/venv_name/images"


# Perform object detection on every image in specified folder
results = model(
    source=image_folder,
    show=False,  # Set to True if you want to display the image
    cnotallow=0.60,  # Confidence threshold
    save=True,  # Save results
    save_txt=True,  # Save results as text files
    save_cnotallow=True,  # Save confidence scores
    line_width=3,  # Adjust line width for bounding boxes
    save_crop=True  # Save cropped detections as image files
    )

由于每张图像的目标检测结果都保存到单独的文本文件中，你可以使用pandas读取所有这些文件以获取检测到的对象总数。结果文件还包含每个检测的类别、x_center、y_center、宽度和高度，这些数据可能对进一步分析有用。

复制

import os
import pandas as pd


# Path to folder containing result text files
folder_path = "/home/username/venv_folder/venv_name/runs/detect/predict/labels"


# Empty list to store data from each file
dataframes = []


# Define column names
column_names = ["class", "x_center", "y_center", "width", "height", "confidence"]


# Iterate over all result files in the folder
for filename in os.listdir(folder_path):
    file_path = os.path.join(folder_path, filename)
    df = pd.read_csv(file_path, delimiter=' ', header=None, names=column_names,)
    df['filename'] = filename  # Add column to record filename of each result
    dataframes.append(df) # Append results to dataframes list


# Combine all into a single DataFrame
combined_df = pd.concat(dataframes, ignore_index=True)


# Check the top five rows of the DataFrame
display(combined_df.head(5))


# Count number of rows in DataFrame
num_rows = combined_df.shape[0]
print(f"Number of detected stamps: {num_rows}")

自定义训练的 YOLOv8 模型进行邮票整理

检测结果的DataFrame（前五行）和检测到的对象计数

人脸检测

现在，收藏中每张邮票的图像都已保存（在我的情况下总共945张图像），如何搜索其中包含人脸的邮票呢？没问题，使用人脸数据集训练新模型并再次运行目标检测。

自定义训练的 YOLOv8 模型进行邮票整理

使用人脸数据集训练的YOLOv8n检测邮票中的人脸

一些看起来更像卡通的人脸没有被检测到，因为训练数据由实际人脸的图片组成。需要进一步调整以获得更好的性能，但希望我能够展示使用自定义数据集训练YOLO检测任何对象是多么容易。

参考资料

[1] https://universe.roboflow.com/jackwildgooglecom/detect-postage-stamp
[2] https://docs.ultralytics.com/models/yolov8/#supported-tasks-and-modes

计算机视觉：使用 YOLOv8 创建交通热力图

在一个由数据驱动和导向的世界中，解释、可视化并基于这些数据做出决策的能力变得越来越重要。这意味着，应用正确的工具和技术可能决定一个项目的成败。在计算机视觉领域，有许多技术可以解释从视频（录制、流媒体或实时）中获取的数据。

1/24/2025 7:37:19 AM

二旺

YOLOv8 图像分类及 .tflite 部署

目标检测是计算机视觉中用于识别和定位图像或视频中对象的一种技术。图像定位是使用边界框来识别一个或多个对象的正确位置的过程，这些边界框对应于对象周围的矩形形状。这个过程有时会与图像分类或图像识别混淆，后者的目标是将图像或图像中的对象预测为一个类别或类别之一。

2/24/2025 9:50:21 AM

二旺

微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集

目标检测在计算机视觉中是一个至关重要的任务，而YOLO（You Only Look Once）因其速度和准确性而脱颖而出。在本指南中，我将带你了解如何微调一个YOLO模型，以检测各种道路标志和物体，例如：车辆行人不同颜色的交通灯人行横道速度限制标志禁止标志警告标志本指南适用于使用Linux的用户。对于Windows用户，Poetry和Cuda的安装可能会有所不同。

12/23/2024 1:10:00 PM

二旺

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

自定义训练的 YOLOv8 模型进行邮票整理

目标检测

在自定义数据集上训练YOLO

人脸检测

相关资讯

计算机视觉：使用 YOLOv8 创建交通热力图

YOLOv8 图像分类及 .tflite 部署

微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集