一文教你如何利用 Python 进行图像处理

图像处理是计算机视觉领域的一个重要分支，广泛应用于各种场景，如社交媒体滤镜、医疗影像分析、自动驾驶等。 Python 作为一门强大的编程语言，提供了多种库来帮助我们轻松地进行图像处理。今天，我们就一起来学习如何使用 Python 进行图像处理。

图像处理是计算机视觉领域的一个重要分支，广泛应用于各种场景，如社交媒体滤镜、医疗影像分析、自动驾驶等。Python 作为一门强大的编程语言，提供了多种库来帮助我们轻松地进行图像处理。今天，我们就一起来学习如何使用 Python 进行图像处理。

1. 安装必要的库

首先，我们需要安装一些常用的图像处理库。最常用的是 Pillow 和 OpenCV。你可以使用以下命令来安装它们：

复制

pip install pillow opencv-python

2. 使用 Pillow 库读取和显示图像

Pillow 是 Python Imaging Library (PIL) 的一个分支，提供了丰富的图像处理功能。我们先来看如何使用 Pillow 读取和显示图像。

复制

from PIL import Image

# 读取图像
image = Image.open('example.jpg')

# 显示图像
image.show()

这段代码首先导入了 Image 模块，然后使用 Image.open() 方法读取图像文件，最后使用 image.show() 方法显示图像。

3. 图像的基本操作

(1) 裁剪图像

裁剪图像是一个常见的操作，可以通过指定坐标来实现。

复制

# 裁剪图像
cropped_image = image.crop((50, 50, 200, 200))
cropped_image.show()

这里，crop() 方法接受一个元组 (left, upper, right, lower)，表示裁剪区域的左上角和右下角坐标。

(2) 调整图像大小

调整图像大小可以使用 resize() 方法。

复制

# 调整图像大小
resized_image = image.resize((300, 300))
resized_image.show()

resize() 方法接受一个元组 (width, height)，表示新的宽度和高度。

(3) 旋转图像

旋转图像是另一个常见的操作。

复制

# 旋转图像
rotated_image = image.rotate(90)
rotated_image.show()

rotate() 方法接受一个角度值，表示旋转的角度。

4. 使用 OpenCV 进行图像处理

OpenCV 是一个强大的计算机视觉库，提供了更多的图像处理功能。我们来看一些基本的操作。

(1) 读取和显示图像

复制

import cv2

# 读取图像
image = cv2.imread('example.jpg')

# 显示图像
cv2.imshow('Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

这里，cv2.imread() 用于读取图像，cv2.imshow() 用于显示图像，cv2.waitKey(0) 用于等待用户按键，cv2.destroyAllWindows() 用于关闭所有窗口。

(2) 转换为灰度图像

将彩色图像转换为灰度图像是一个常见的操作。

复制

# 转换为灰度图像
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow('Gray Image', gray_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.cvtColor() 方法用于颜色空间转换，cv2.COLOR_BGR2GRAY 表示将 BGR 颜色空间转换为灰度。

(3) 边缘检测

边缘检测是计算机视觉中的一个重要任务。

复制

# 边缘检测
edges = cv2.Canny(gray_image, 100, 200)
cv2.imshow('Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.Canny() 方法用于边缘检测，接受两个阈值参数，分别表示低阈值和高阈值。

5. 实战案例：图像分类

假设我们有一个简单的图像分类任务，需要识别图像中的猫和狗。我们可以使用预训练的深度学习模型来完成这个任务。这里我们使用 Keras 和 TensorFlow。

复制

import tensorflow as tf
from tensorflow.keras.applications.resnet50 import ResNet50, preprocess_input, decode_predictions
from tensorflow.keras.preprocessing import image
import numpy as np

# 加载预训练模型
model = ResNet50(weights='imagenet')

# 读取图像
img_path = 'cat_or_dog.jpg'
img = image.load_img(img_path, target_size=(224, 224))

# 预处理图像
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)

# 预测
preds = model.predict(x)
print('Predicted:', decode_predictions(preds, top=3)[0])

这段代码首先加载了一个预训练的 ResNet50 模型，然后读取并预处理图像，最后进行预测并输出结果。

{{userData.name}}已认证

一文教你如何利用 Python 进行图像处理

1. 安装必要的库

2. 使用 Pillow 库读取和显示图像

3. 图像的基本操作

4. 使用 OpenCV 进行图像处理

5. 实战案例：图像分类

利用 YOLO11 做停车管理

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合

AI 助力脑瘤手术：10 秒内精准识别残留肿瘤

DeepL 推出首个语音翻译解决方案 DeepL Voice，号称消除虚拟会议中语言障碍

零一万物与华为启动合作，将基于昇腾硬件底座开发原生大模型应用

AI 可“听”出电池起火征兆，准确率达 94%

钉钉AI重磅更新：深入业务场景，上线工单等场景AI助理

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

谷歌 Gemini 发布苹果 iOS 版 App：集成灵动岛，支持 AI 语音聊天

{{userData.name}}已认证

1. 安装必要的库

2. 使用 Pillow 库读取和显示图像

3. 图像的基本操作

4. 使用 OpenCV 进行图像处理

5. 实战案例：图像分类

利​用 YOLO11 做停车管理

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合

AI 助力脑瘤手术：10 秒内精准识别残留肿瘤

DeepL 推出首个语音翻译解决方案 DeepL Voice，号称消除虚拟会议中语言障碍

零一万物与华为启动合作，将基于昇腾硬件底座开发原生大模型应用

AI 可“听”出电池起火征兆，准确率达 94%

钉钉AI重磅更新：深入业务场景，上线工单等场景AI助理

一句话爆改三维场景！斯坦福吴佳俊团队新作：场景语言，智能补全文本到3D的场景理解

谷歌 Gemini 发布苹果 iOS 版 App：集成灵动岛，支持 AI 语音聊天

利用 YOLO11 做停车管理