-
术语
Ground truth 目标的实际区域
Prediction 算法识别的区域 -
IoU(Intersection over Union)
对于图像上的物体,IoU是Ground truth与Prediction交集的面积与Ground truth与Prediction并集的面积比值. -
精度(precision)与召回率(Recall)
精度: 算法发现且正确的物体数量与算法发现的物体数量比值.
召回率: 算法发现且正确的物体数量与所有正确的物体数量比值.
比如某数据集有1000个样本,其中有色素质的样本是200个.某算法分析该数据集,发现了300个色素质样本,其中有180个是正确的.那么该算法的精度是 180/300=0.6,召回率是180/200=0.9 -
AP(average preision)
AP是针对某一类对象而言.图1,图2中的阴影部分是某目标的Ground truth.矩形框是算法的Prediction. 1,2,3,4,5是Prediction的编号, 零点几几是各个Prediction的IoU.要计算上面对象的AP,要先建下表.编号 IoU Result Precision Recall 1 0.8 True 1 0.5 2 0.7 True 1 1 3 0.2 False 0.67 1 4 0.1 False 0.5 1 5 0 False 0.4 1 上表第1列是编号,第2列是各个Prediction的IoU由大到小排序.第3列表示识别是否正确.这里识别正确是指IoU大于0.5(0.5是参数也可以选其他值)且Prediction 的类别和Ground truth的类别一致.对于一个目标物体,若有多个Prediction和Ground truth有交集,则选IoU最大的Prediction(当然IoU要大 于0.5)的Reuslt为True. 所以对于一个目标物体,最多只有一个Prediction的result列为true.Precision是由上到下求当前识别出目标物体的精度. Recall是由上到下求当前识别出目标物体的召回率.可以把上表的Precision当成纵轴坐标,把Recall当成横轴坐标,那么就可以在坐标系中画出各点坐标. 再把各点连起来,可得到下图.
图中阴影部分的面积即为该目标的AP. -
mAP
多个类别AP的平均值即为mAP -
参考资料