失眠网 > 通用目标检测基准数据集及其评价指标介绍|Detection Benchmarks

通用目标检测基准数据集及其评价指标介绍|Detection Benchmarks

时间：2021-01-06 03:14:39

文章目录

摘要概念补充：一、通用目标检测的基准1.1基准数据集1.2 评估指标：参考文章

摘要

本文将介绍generic object detection的一些检测基准数据集（也称detection benchmarks）。

概念补充：

benchmark：其中文名叫基准。我认为benchmark是用于某行业中比较不同科研成果的一个标准，可以让某项科研成果具体带来的性能提升更为普遍的理解。在目标检测领域，benchmark就包括了数据集和评价指标，科研人员将科研成果在基准数据集上测试，然后按一个通用的指标来衡量这项工作，从而得知工作是否进步或是有什么进步。

baseline：有时论文中我们会看见baseline一词，通常指代其他论文提出的方法。所以我的理解是在以benchmark data做的实验中，测试A B C D四个模型，然后以结果最差的一个模型，假设是C，作为baseline，看看其他模型相对C提高了多少。

一、通用目标检测的基准

1.1基准数据集

Pascal VOC 是一个目标检测中一个中等规模的数据集，共有20个类别。其数据分为三部分：训练、验证和测试，每部分分别包含 2501, 2510 和 5011张图片。

Pascal VOC是一个用于对象检测的中型数据集，与Pascal VOC拥有相同的20个类别。其数据分为三部分：训练、验证和测试，每部分分别包含5717、5823和10991张图像。VOC测试集没有标注信息（annotation）。VOC数据集的详细介绍可以看我的另一篇文章。目标检测数据集PASCAL VOC笔记

MSCOCO 是具有80个类别的大规模数据集。其数据分为三部分：训练、验证和测试，每部分分别包含 118287, 5000 和 40670张图片。其测试数据集没有标注信息。

Pascal Open Images 包含1.9M图像，1500万个对象，600个类别。其中500个频率最大的种类用做目标检测基准，这500个种类中超过70%的有1000个以上的样本数量。

LVIS是一个新收集的基准，包含164000张图像和1000多个类别。

ImageNet 也是一个拥有200个类别的重要数据集。然而景观其规模很大，但是目标的尺度范围和VOC数据集相似，所以通常不用做目标检测的基准数据集。但是目标检测模型的backbone却仍在大量采用使用ImageNet预训练好的模型。

以上数据集样本示例：

图1.Pascal VOC, MSCOCO, Open Images 和 LVIS的一些样本图片。

1.2 评估指标：

目标检测算法使用检测准确度和推断时间作为评估指标。

对于检测准确度，使用mean Average Precision(mAP)作为这些基准数据集上的评估指标。对于VOC、VOC和ImageNet, mAP的IoU阈值设置为0.5，而MSCOCO则采用了更为综合的评估指标，共有6种评估得分，对应其在不同IoU阈值和不同目标尺度上的评价指标。具体可以参考下表.

表1.各种检测任务的通用检测指标。##### 1.3 VOC、VOC和MSCOCO上近几年基准

Pascal VOC、VOC和MSCOCO是评价检测算法最常用的三个数据集。

Pascal VOC和VOC的每幅图像有2 - 3个目标的中尺度数据集，VOC数据集中目标的大小范围不大。对于MSCOCO来说，每幅图像都有近10个目标，而且大多数目标都是大尺度范围的小目标，这给检测算法带来了很大的挑战。在表3和表2中，我们给出了VOC、VOC和MSCOCO在最近几年的基准。

表2.近年来各种模型在VOC数据集上的检测结果。以VOC 来评测的默认用了和的train和val部分的数据集来做训练，然后的test部分作检测。而以来作检测的默认采用的的所有数据集（train,val,test）加上的train和val部分数据集来训练，使用的test部分来测试。表3.近年来各种模型在MS COCO数据集上的检测结果。++表示使用了多尺度检测、图像翻转等策略