为什么YOLO在目标检测领域如此流行？ _模型

文章目录YOLO架构YOLO目标检测是如何工作的？ YOLO的应用场景安全监控 YOLO, , , , , YOLOR, YOLOX, , , 比较- 渐进式改进- 目标检测的最佳速度和准确性YOLOR?—?You Only Look OneYOLOX - 2021年超越YOLO系列- 一种面向工业应用的单阶段物体检测框架 - 可训练的免费工具包为实时目标检测器设定了新的技术水平结论
本文主要介绍; YOLO（You Only Look Once）目标检测的优势、它在过去几年中的发展情况以及一些现实生活中的应用。什么是目标检测
目标检测（）是计算机视觉中使用的一种技术，用于识别和定位图像或视频中的对象。
图像定位是指使用边界框（ boxes）来识别一个或多个对象的正确位置的过程，这些边界框对应于围绕对象的矩形形状。
这个过程有时会与图像分类或图像识别混淆，后者旨在将图像或图像中的对象预测为类别或类别之一。
下面的插图对应于上述解释的计算机视觉技术。在图像中检测到的对象是“人” 。
在本文中，将首先了解目标检测的优势，然后介绍最先进的目标检测算法YOLO 。
在第二部分中，我们将更加关注YOLO算法及其工作原理。之后，我们将提供一些使用YOLO的实际应用。
最后一节将解释YOLO从2015年到2020年的演变，然后总结下一步的步骤。
What is YOLO?
You Only Look Once (YOLO) 是一种最先进的实时目标检测算法，由、、Ross 和Ali 于2015年在他们著名的研究论文“You Only Look Once: , Real-Time”中引入。
YOLO 的核心思想就是把目标检测转变成一个回归问题，而不是分类任务。利用整张图作为网络的输入，仅仅经过单个卷积神经网络 (CNN)，得到 box（边界框）的位置及其所属的类别。
为什么YOLO在目标检测领域如此流行？
YOLO之所以领先竞争对手，原因包括：
1. 速度快
YOLO之所以非常快，是因为它不涉及复杂的流程。它可以以每秒45帧的速度处理图像。此外，与其他实时系统相比，YOLO的平均精度（mAP）超过了两倍，使其成为实时处理的绝佳选择。从下面的图表中，我们可以看到YOLO的速度远远超过其他目标检测器，达到了91 FPS 。
2. 高检测精度
YOLO的准确性远远超过其他最先进的模型，几乎没有背景误差。
3. 更好的泛化性
特别是对于新版本的YOLO，本文稍后会讨论。通过这些改进，YOLO在新领域提供了更好的泛化性能，使其非常适合依赖快速和强大的目标检测应用程序。例如，《使用YOLO深度卷积神经网络自动检测黑色素瘤》的研究表明，版本的平均精度最低，而和版本的平均精度更高。
4. 开源
将YOLO开源使得社区可以不断改进模型。这是YOLO在有限的时间内取得如此多改进的原因之一。
YOLO架构
YOLO架构类似于。如下图所示，它总共有24个卷积层，四个最大池化层和两个全连接层。
该架构的工作方式如下：
YOLO目标检测是如何工作的？
上一节已经了解了YOLO的架构，让我们简单介绍一下YOLO算法如何使用一个简单的用例来执行目标检测。
想象一下，你构建了一个YOLO应用程序，可以从给定的图像中检测出球员和足球。但是如何向某个人，特别是非专业人士解释这个过程呢？
该算法基于以下四种方法进行操作：
让我们更详细地了解每一种方法。
残差块( )
这一步首先将原始图像(A)划分为NxN个具有相等形状的网格单元，其中N在我们的案例中为4，如右侧的图像所示。网格中的每个单元负责定位和预测其覆盖的对象的类别，以及概率（）/置信度值（ value.）。
边界框回归（ box ）
下一步是确定与图像中的所有对象相对应的边界框，可以有与给定图像中的对象数量相同的边界框。YOLO使用以下格式的单个回归模块确定这些边界框的属性，其中Y是每个边界框的最终向量表示。