OpenCV 是一款跨平台的计算机视觉和机器学习软件平台,在计算机视觉领域广泛使用,是目前人工智能应用中的重要基础平台。
OpenCV 4.10.0 版本更新于昨日发布(点此查看),对其深度神经网络(DNN) 模块进行了许多改进、实验性 NumPy 2.0 支持、Android 改进、NVIDIA CUDA 12.4+ 平台支持、RISC-V 和 ARM 改进、oneAPI 2024 支持、实验性 Windows ARM64 支持、实验性苹果 VisionOS 支持,以及 Linux 上的本机 Wayland 后端。
IT之家附 OpenCV 4.10.0 更新内容如下:
Core Module:
为 cv::Mat 添加了 CV_FP16 数据类型 #24892, #24918。弃用了 convertFp16 函数,添加了对 cv::Mat::convertTo 及其类似函数的 FP16 支持。
修复了一些与 FP16 算术相关的未定义行为 #25598
扩展了 HAL API,用于 minMaxIdx #25563, LUT #25554, meanStdDev #25483, moments 25490, normHamming #25491。为 transpose #25342 和一些算术函数 #25574, #25506 添加了 HAL 条目。
持久性:将实数输出为用户友好的表达方式。#25351
为并行框架添加了 cgroups v2 支持 #25285
添加了对 cartToPolar 和 polarToCart 的就地支持 #24893
Imgproc Module:
为 cv::remap 添加了相对位移场选项 #24621
添加了新的 findContours 实现 #25146, #25680, #25385
修复了 EMD 分配问题 #25583
修复了大内核情况下 stackBlur 的错误 #25513
扩展了 HAL 支持 projectPoints #25511, equalizeHist #25565, Otsu threshold #25509。为 gaussianBlur #25397, remap #25399, bilaterialFilter #25343 添加了新的 HAL 条目。
Calib3d Module:
修复了手眼校准方法中的几个错误 #24897, #25423
修复了 findHomography 实现中的几个错误 #25308, #25665
在 findChessboardCorners 实现中进行了多项改进:#25365, 25195, 25177, 25182, 25145, 24779, 24710, 24833, 25090
改进了对称圆点网格图案检测 #25258
修复了 USAC 中可能的无限循环 #24987
改变了鱼眼校准中焦距初步估计的方法 #25030
添加了 Fisheye 相机模型的 solvePnP 实现 #25028
DNN Module:
显著改进了 DNN 的内存消耗 #25181, 25163
添加了 Net::dumpToPbtxt 方法,以使用 Netron 审查优化后的图 #25582
添加了对多个 TFLite 层的支持:Global_Pool_2D #25613, Transpose #25297, HardSwishInt8 #24985, split, fully connected, SoftMax, Cast #25273。
修复了多个 ONNX 层中的错误:Slice #25660, Range #25414, Clip #25319, ReduceMean #25120, Einsum #25100, Norm #24808, Concat 中负轴支持 #24865。
添加了新的 ONNX 层:Mod #24765, GroupNorm 层 #24610。
添加了更多与 OpenVINO 兼容的 DNN 层 #25524, #25291, 25518。
优化了 RISC-V RVV 扩展的 fastDepthwiseConv #25361 和 int8 层 25230
优化了 RISC-V P Packed SIMD Extension v0.5.2 的 fastDepthwiseConv #24556
优化了 Attention #24476, #25271, #25238, #24613, 25076。
为 scatter 和 scatterND 添加了并行版本 #24813
在 CuDNN 后端中添加了广播支持(如果 a.rank() != b.rank())#24834
调整了卷积的 Winograd 算法使用 #24709
添加了 Raft 模型支持和示例 #24913
为 DNN 模块中的 NaryEltwiseLayer 添加了 Vulkan 后端 #24768
改进了现代 Yolo 检测器的支持。添加了示例和文档 #24898, #24611
添加了 CuDNN 9+ 支持 #25412
添加了 OpenVINO 2024 支持 #25199
G-API Module:
将 G-API ONNXRT 后端移植到 V2 API #25662
实现了并发执行器 #24845
为 GMat 添加了快速值初始化支持 #25055
修复了 OV 后端对非实数类型的均值 / 尺度预处理支持 #24704
Objdetect Module:
修复了某些情况下 Charuco 棋盘生成的不准确问题 (.generateImage ()) #24873, #25673
修复了 Aruco 检测器的线程安全问题 #24807,使 Aruco 检测器更加确定性 #24829
添加了 QR 码结构化附加解码模式 #24548
修复了 QR 码检测器和解码器中的多个错误 #25026
修复了条形码 detectAndDecode #25035
将剩余的 Aruco 和 Charuco 文档和示例移植到现代 API #23018
VideoIO:
修复了 InternalFFMpegRegister 初始化中的竞争条件。#25419
Orbbec 相机支持 MacOS,Gemini2 和 Gemini2L 支持 Y16 格式 #24877
为 V4L2 后端添加了 V4L2_PIX_FMT_SGRBG8 像素格式支持 #25249
修复了当 CAP_PROP_FORMAT == -1 时,VideoCapture 返回的不正确时间戳 #24828
Python Bindings:
实验性 NumPy 2.0 支持
为 Rect2f 和 Point3i 添加了 Python 绑定 #24919
将 MatLike 的 dtype 切换为数值类型,而不是通用类型 #25406
在文件名预期的地方添加了路径对象支持 #24773:
为 JavaCameraView 添加了任何屏幕方向支持 #24827,在安卓示例中添加了 avaCamera2View 和 NativeCameraView 支持 #24869。修复了 JavaCamera2View 中的双预览初始化错误 #24869。
从构建脚本和教程中移除了 Android AIDL,因为自 4.9.0 起不再需要 #24843
启用 Emscripten 文件系统 #24949
为现代 Android Studio 更新了安卓示例。添加了从 Maven 支持 OpenCV 的功能。#24473
向 AAR 添加了 kotlin 类 #24884
为 ARM v8 和 v9 处理器添加了 KleidiCV 作为 HAL(CMake 选项 -DWITH_KLEIDICV=ON)#25443, #25618
平台支持:
CUDA 12.4+ 支持 #25658
Linux 的 Wayland 后端 #25551, #25510, #25502
MacOS 及其衍生产品的新 LAPACK 接口支持 #24804, #25625
为带有 P 扩展的 RISC-V 处理器添加了初始 HAL 版本 #25167
为 ARM v8 和 v9 处理器添加了 KleidiCV 作为 HAL(CMake 选项 -DWITH_KLEIDICV=ON)#25443, #25618
添加了 zlib-ng 作为经典 zlib 的替代品(CMake 选项 -DWITH_ZLIB_NG=ON)#24782
OneAPI 2024 支持(IPP, TBB)
实验性 Apple VisionOS 支持
实验性 Windows ARM64 支持