对象检测是计算机视觉中的一项任务,用于识别和定位图像或视频中的对象。它在监控、自动驾驶和机器人技术等应用中起着重要作用。根据网络对同一输入图像的使用次数,目标检测算法可以大致分为两类。
单次目标检测
单次对象检测通过单次传递预测图像中对象的存在和位置,提高计算效率。
然而,单次目标检测通常不如其他方法准确,尤其在检测小物体方面表现欠佳。尽管如此,这些算法仍可在资源有限的环境中实时检测对象。
两次目标检测
目标检测通常会使用两次输入图像来预测物体的存在和位置。第一次检测会生成一组潜在对象位置的建议,而第二次检测会对这些建议进行进一步提炼和筛选,最终得出最准确的预测结果。虽然这种方法相比于单次目标检测更准确,但也因此增加了计算成本。
总的来说,单次和两次目标检测之间的选择取决于应用程序的具体要求和约束。
通常,单次目标检测更适合实时应用,而两次目标检测更适合精度更重要的应用。
对象检测模型性能评估指标
为了确定和比较不同对象检测模型的预测性能,我们需要标准的定量指标。
两个最常见的评估指标是并集交集(IoU)和平均精度(AP)指标。
并集交集(IoU)
IoU(Intersection over Union)是一种流行的度量标准,用于测量定位精度和计算目标检测模型中的定位误差。
为了计算预测边界框和真实边界框之间的IoU,我们首先获取同一对象的两个相应边界框之间的交叉区域。在此之后,我们计算两个边界框覆盖的总面积——也称为“并集”,以及它们之间的重叠区域称为“交集”。
交集除以Union给出了重叠与总面积的比率,可以很好地估计预测边界框与原始边界框的接近程度。
平均精度(AP)
平均精度(AP)计算为一组预测的精度与召回曲线下的面积。
召回率计算为模型在某个类别下所做的总预测与该类别的现有标签总数的比率。精度是指真实阳性与模型做出的总预测的比率。
召回率和精度提供了一种权衡,通过改变分类阈值以图形方式表示为曲线。该精度与召回率曲线下的面积为我们提供了模型每个类别的平均精度。该值在所有类别中的平均值称为平均精度(mAP)。