YOLO
YOLOe问世,实时观察一切,统一开放物体检测和分割
它能像人眼一样,在文本、视觉输入和无提示范式等不同机制下进行检测和分割。 自 2015 年由华盛顿大学的 Joseph Redmon 研究团队提出 YOLO(You Only Look Once)以来,这项突破性的目标检测技术就像为机器装上了「闪电之眼」,凭借单次推理的实时性能刷新了计算机视觉的认知边界。 传统的 YOLO 系列如同我们人工效准的精密仪器,其识别能力被严格框定在预定义的类别目录之中,每个检测框的背后,都需要工程师手动输入认知词典。
3/13/2025 11:11:04 AM
机器之心
YOLOv8 图像分类及 .tflite 部署
目标检测是计算机视觉中用于识别和定位图像或视频中对象的一种技术。 图像定位是使用边界框来识别一个或多个对象的正确位置的过程,这些边界框对应于对象周围的矩形形状。 这个过程有时会与图像分类或图像识别混淆,后者的目标是将图像或图像中的对象预测为一个类别或类别之一。
2/24/2025 9:50:21 AM
二旺
YOLO 详解:基于深度学习的物体检测
引言本文介绍了YOLO(You Only Look Once),一种基于卷积神经网络(CNN)的物体检测模型。 与依赖基于分类方法的传统物体检测模型不同,YOLO通过基于回归的方法直接推断边界框来预测物体位置。 这种端到端的CNN模型以其卓越的处理速度和高预测精度脱颖而出,在这两方面都优于许多现有的物体检测架构。
1/13/2025 10:00:00 AM
二旺
YOLO、SSD 和 Faster R-CNN 三种方案实现物体识别的对比
本文旨在开发一个能够准确检测和分割视频中物体的计算机视觉系统。 我将使用最先进的三种SoA(State-of-the-Art)方法:YOLO、SSD和Faster R-CNN,并评估它们的性能。 然后,我通过视觉分析结果,突出它们的优缺点。
1/6/2025 12:20:00 PM
二旺
微调 YOLO 做车辆、人员、交通标志检测 | 附代码+数据集
目标检测在计算机视觉中是一个至关重要的任务,而YOLO(You Only Look Once)因其速度和准确性而脱颖而出。 在本指南中,我将带你了解如何微调一个YOLO模型,以检测各种道路标志和物体,例如:车辆行人不同颜色的交通灯人行横道速度限制标志禁止标志警告标志本指南适用于使用Linux的用户。 对于Windows用户,Poetry和Cuda的安装可能会有所不同。
12/23/2024 1:10:00 PM
二旺
解决方案:结合 YOLO 和 TensorFlow 做目标检测和图像分类
目标检测和图像分类是两个不同的任务,每个任务都有其特定的用途。 在本文中,我将向你解释什么是目标检测和图像分类,如何训练模型,最后,我将同时使用目标检测和图像分类模型来分类和检测狗的品种。 目标检测 图像分类目标检测目标检测是一项基本的计算机视觉任务,用于检测和定位物体。
12/23/2024 6:30:00 AM
二旺
超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联
YOLO(You Only Look Once)系列是目标检测领域中的主流方法,以其高效性和实时性而著称。 然而,现有的YOLO模型在处理跨层特征融合和复杂的高阶特征关系时存在局限,无法充分捕捉跨位置和跨尺度的复杂特征关联。 为了解决这一难点,清华大学提出了Hyper-YOLO:一种基于超图计算的目标检测方法。
12/12/2024 11:58:29 AM
新智元
提升 YOLO 模型:使用 Albumentations 进行高级数据增强
在计算机视觉领域迅速发展的今天,YOLO(You Only Look Once)模型已成为实时目标检测任务的热门选择。 从自动驾驶到视频监控,YOLO模型因其速度和准确性而表现出色。 然而,与任何机器学习模型一样,训练数据的质量极大地影响着它们的性能。
12/4/2024 4:50:35 PM
二旺
使用 YOLO 和 EasyOCR 从视频文件中检测车牌
本文将介绍如何通过Python中的YOLO(ou Only Look Once)和EasyOCR(光学字符识别)技术来实现从视频文件中检测车牌。 本技术依托于深度学习,以实现车牌的即时检测与识别。 从视频文件中检测车牌先决条件在我们开始之前,请确保已安装以下Python包:复制实施步骤步骤1:初始化库我们将首先导入必要的库。
11/28/2024 3:56:05 PM
二旺
利用 YOLO11 做停车管理
对于繁忙的城市和公共场所来说,有效管理停车至关重要。 传统方法常常跟不上需求,导致拥堵和挫败感。 随着人工智能的进步,我们现在有了YOLO,这是一个强大的目标检测工具,可以用来改进停车管理系统。
11/20/2024 4:06:20 PM
二旺
- 1
资讯热榜
上海AI实验室开源InternVL3系列多模态大型语言模型
Haisnap横空出世,小白用户也能轻松打造AI应用
「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
本地部署DeepSeek+DiFy平台构建智能体应用
kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking,多项基准超越 GPT-4o
韩国初创公司 RLWRLD 获 1480 万美元融资,致力于机器人基础模型开发
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
深度学习
AI视频
模态
人形机器人
驾驶
xAI
文本
搜索
字节跳动
大语言模型
Copilot
Claude
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练