为什么YOLO在目标检测领域如此流行?

文章目录YOLO架构YOLO目标检测是如何工作的? YOLO的应用场景 安全监控 YOLO, , , , , YOLOR, YOLOX, , , 比较- 渐进式改进- 目标检测的最佳速度和准确性YOLOR?—?You Only Look OneYOLOX - 2021年超越YOLO系列- 一种面向工业应用的单阶段物体检测框架 - 可训练的免费工具包为实时目标检测器设定了新的技术水平结论
本文主要介绍; YOLO(You Only Look Once) 目标检测的 优势、它在过去几年中的发展情况以及一些现实生活中的应用 。什么是目标检测
目标检测( )是计算机视觉中使用的一种技术,用于识别和定位图像或视频中的对象 。
图像定位是指使用边界框( boxes)来识别一个或多个对象的正确位置的过程,这些边界框对应于围绕对象的矩形形状 。
这个过程有时会与图像分类或图像识别混淆,后者旨在将图像或图像中的对象预测为类别或类别之一 。
下面的插图对应于上述解释的计算机视觉技术 。在图像中检测到的对象是“人” 。
在本文中,将首先了解目标检测的优势,然后介绍最先进的目标检测算法YOLO 。
在第二部分中,我们将更加关注YOLO算法及其工作原理 。之后,我们将提供一些使用YOLO的实际应用 。
最后一节将解释YOLO从2015年到2020年的演变,然后总结下一步的步骤 。
What is YOLO?
You Only Look Once (YOLO) 是一种最先进的实时目标检测算法,由 、 、Ross 和Ali 于2015年在他们著名的研究论文“You Only Look Once: , Real-Time”中引入 。
YOLO 的核心思想就是把目标检测转变成一个回归问题,而不是分类任务 。利用整张图作为网络的输入,仅仅经过单个卷积神经网络 (CNN),得到 box(边界框) 的位置及其所属的类别 。
为什么YOLO在目标检测领域如此流行?
YOLO之所以领先竞争对手,原因包括:
1. 速度快
YOLO之所以非常快,是因为它不涉及复杂的流程 。它可以以每秒45帧的速度处理图像 。此外,与其他实时系统相比,YOLO的平均精度(mAP)超过了两倍,使其成为实时处理的绝佳选择 。从下面的图表中,我们可以看到YOLO的速度远远超过其他目标检测器,达到了91 FPS 。
2. 高检测精度
YOLO的准确性远远超过其他最先进的模型,几乎没有背景误差 。
3. 更好的泛化性
特别是对于新版本的YOLO,本文稍后会讨论 。通过这些改进,YOLO在新领域提供了更好的泛化性能,使其非常适合依赖快速和强大的目标检测应用程序 。例如,《使用YOLO深度卷积神经网络自动检测黑色素瘤》的研究表明,版本的平均精度最低,而和版本的平均精度更高 。
4. 开源
将YOLO开源使得社区可以不断改进模型 。这是YOLO在有限的时间内取得如此多改进的原因之一 。
YOLO架构
YOLO架构类似于 。如下图所示,它总共有24个卷积层,四个最大池化层和两个全连接层 。
该架构的工作方式如下:
YOLO目标检测是如何工作的?
上一节已经了解了YOLO的架构,让我们简单介绍一下YOLO算法如何使用一个简单的用例来执行目标检测 。
想象一下,你构建了一个YOLO应用程序,可以从给定的图像中检测出球员和足球 。但是如何向某个人,特别是非专业人士解释这个过程呢?
该算法基于以下四种方法进行操作:
让我们更详细地了解每一种方法 。
残差块( )
这一步首先将原始图像(A)划分为NxN个具有相等形状的网格单元,其中N在我们的案例中为4,如右侧的图像所示 。网格中的每个单元负责定位和预测其覆盖的对象的类别,以及概率()/置信度值( value.) 。
边界框回归( box )
下一步是确定与图像中的所有对象相对应的边界框,可以有与给定图像中的对象数量相同的边界框 。YOLO使用以下格式的单个回归模块确定这些边界框的属性,其中Y是每个边界框的最终向量表示 。