[ADAS预研笔记]感知算法 - 引言及常用数据集 _模型

CNN用于图像分类、目标检测、语义分割等方向；
RNN用于与时序相关的追踪等方向。
现代深度学习算法结构（引言）
在现代深度学习算法研究中，通用的骨干网络（）+特定任务头（head）成为一种标准的设计模式。
背景：
详细的与head介绍将在下文各类CNN介绍后展开。
常用数据集
模型训练依赖于已经打好标签的数据集作为loss计算的依据以及模型验证，目前主流的开放数据集有如下三类。
与
：是一个超过15 的图像数据集，大约有22,000类。
：全称 Large-Scale，从2010年开始举办到2017年最后一届，使用数据集的一个子集，总共有1000类；
是图像分类领域最具影响力的竞赛，诞生了绝大多数的图像分类算法。
算法研究中常用竞赛数据集来训练模型并验证模型效果，竞赛数据集面向图像分类+目标检测，其输入大小为224*224，深度为3 。各年的竞赛所使用的数据集如下：
年份
图像分类数据集
目标检测数据集
2012
not
2013
2012
2014
2012
more than 2013
2015
2012
2014
2016
2012
2014
2017
2012
2014
VOC

文章插图
VOC挑战赛主要面向目标检测与语义分割，比赛于2012年停办，但研究者依然可以使用 VOC数据集训练模型并上传验证结果。
VOC数据集输入大小为448*448，主要分为 VOC 2007和，两者相互独立；
VOC 2007公开了训练集、验证集、测试集；
VOC 2012仅公开了训练集、验证集，需提交到官方服务器来评估测试集结果。
训练集用作训练模型；验证集用作自我验证模型效果；测试集用作测试模型效果，不公开可以避免参赛者面向结果编程。
MS COCO
全称为in (MS COCO)，面向目标检测、语义分割及其他方向
训练集的不同标注
我们在了解模型时，论文中经常可以看到各种训练集的标注，其含义如下：
其他语义分割数据集
：50个城市的城市场景语义理解数据集
：至少有一个前景物体的一组户外场景
：有400多类的室内和室外场景
：剑桥大学公开发布的城市道路场景的数据集
SUN RGB-D：普灵斯顿大学的&Group 公开的一个有关场景理解的数据集
自动驾驶相关数据集驾驶数据集：
【[ADAS预研笔记]感知算法 - 引言及常用数据集】交通标志数据集：