目标检测(Object Detection)

定义:目标检测是计算机视觉任务,用于定位(通过边界框)和分类图像中的物体。
重要指标

  1. mAP(平均精度均值):综合多个类别和不同IoU阈值下的平均检测精度。
  2. IoU(交并比):预测框与真实框的重叠面积与并集面积的比值,衡量定位准确性。
  3. Precision(精确率):正确检测框占所有预测框的比例。
  4. Recall(召回率):正确检测框占所有真实框的比例。
  5. F1 Score:Precision和Recall的调和平均,平衡检测的准确性与覆盖率。
  6. FPS(帧率):每秒处理的图像数,衡量实时性。

语义分割(Semantic Segmentation)

定义:对图像中的每个像素进行分类,区分不同语义类别(如“人”“车”),但不区分同类物体的不同实例(如两个篮球会被标记为同一类别)。
重要指标

  1. Pixel Accuracy(像素精度):正确分类的像素占总像素的比例。
  2. mIoU(平均交并比):所有类别的IoU均值,衡量分割区域与真实区域的匹配度。
  3. Dice Coefficient:重叠区域的两倍与总像素的比值,与IoU高度相关。
  4. Frequency Weighted IoU:根据类别出现频率加权的IoU,缓解类别不平衡问题。

实例分割(Instance Segmentation)

定义:在语义分割的基础上,区分同一类别的不同实例(如将两个篮球分为两个独立对象)。常用于需精确识别物体边界和数量的场景(如医学细胞计数、自动驾驶)。


问题解答:篮球分割属于哪种任务?

结论:属于实例分割
原因

  1. 目标要求:分割“多个篮球”并计算每个的面积,需区分每个篮球的独立实例。
  2. 语义分割的局限:语义分割会将所有篮球标记为“篮球”类别,但无法区分个体,只能计算总面积。
  3. 实例分割的优势:为每个篮球生成独立掩膜,精确提取边缘并单独计算面积,满足需求。

示例
• 若图中两个篮球部分重叠,语义分割会将其视为单一区域,实例分割则会分割为两个独立对象。
• 计算每个篮球的面积需实例分割提供的独立掩膜信息。