目标检测(Object Detection)
定义:目标检测是计算机视觉任务,用于定位(通过边界框)和分类图像中的物体。
重要指标:
- mAP(平均精度均值):综合多个类别和不同IoU阈值下的平均检测精度。
- IoU(交并比):预测框与真实框的重叠面积与并集面积的比值,衡量定位准确性。
- Precision(精确率):正确检测框占所有预测框的比例。
- Recall(召回率):正确检测框占所有真实框的比例。
- F1 Score:Precision和Recall的调和平均,平衡检测的准确性与覆盖率。
- FPS(帧率):每秒处理的图像数,衡量实时性。
语义分割(Semantic Segmentation)
定义:对图像中的每个像素进行分类,区分不同语义类别(如“人”“车”),但不区分同类物体的不同实例(如两个篮球会被标记为同一类别)。
重要指标:
- Pixel Accuracy(像素精度):正确分类的像素占总像素的比例。
- mIoU(平均交并比):所有类别的IoU均值,衡量分割区域与真实区域的匹配度。
- Dice Coefficient:重叠区域的两倍与总像素的比值,与IoU高度相关。
- Frequency Weighted IoU:根据类别出现频率加权的IoU,缓解类别不平衡问题。
实例分割(Instance Segmentation)
定义:在语义分割的基础上,区分同一类别的不同实例(如将两个篮球分为两个独立对象)。常用于需精确识别物体边界和数量的场景(如医学细胞计数、自动驾驶)。
问题解答:篮球分割属于哪种任务?
结论:属于实例分割。
原因:
- 目标要求:分割“多个篮球”并计算每个的面积,需区分每个篮球的独立实例。
- 语义分割的局限:语义分割会将所有篮球标记为“篮球”类别,但无法区分个体,只能计算总面积。
- 实例分割的优势:为每个篮球生成独立掩膜,精确提取边缘并单独计算面积,满足需求。
示例:
• 若图中两个篮球部分重叠,语义分割会将其视为单一区域,实例分割则会分割为两个独立对象。
• 计算每个篮球的面积需实例分割提供的独立掩膜信息。