ReMind

Recent Writing

A Brief Survey of Train-free Methods for Diffusion Models
Nov 24, 2025
Diffusion Model Deep understanding
Nov 07, 2025

See 262 more →

❯

❯

❯

❯

CV各领域基础知识

CV各领域基础知识

Apr 24, 20254 min read

目标检测（Object Detection）

定义：目标检测是计算机视觉任务，用于定位（通过边界框）和分类图像中的物体。
重要指标：

mAP（平均精度均值）：综合多个类别和不同IoU阈值下的平均检测精度。
IoU（交并比）：预测框与真实框的重叠面积与并集面积的比值，衡量定位准确性。
Precision（精确率）：正确检测框占所有预测框的比例。
Recall（召回率）：正确检测框占所有真实框的比例。
F1 Score：Precision和Recall的调和平均，平衡检测的准确性与覆盖率。
FPS（帧率）：每秒处理的图像数，衡量实时性。

语义分割（Semantic Segmentation）

定义：对图像中的每个像素进行分类，区分不同语义类别（如“人”“车”），但不区分同类物体的不同实例（如两个篮球会被标记为同一类别）。
重要指标：

Pixel Accuracy（像素精度）：正确分类的像素占总像素的比例。
mIoU（平均交并比）：所有类别的IoU均值，衡量分割区域与真实区域的匹配度。
Dice Coefficient：重叠区域的两倍与总像素的比值，与IoU高度相关。
Frequency Weighted IoU：根据类别出现频率加权的IoU，缓解类别不平衡问题。

实例分割（Instance Segmentation）

定义：在语义分割的基础上，区分同一类别的不同实例（如将两个篮球分为两个独立对象）。常用于需精确识别物体边界和数量的场景（如医学细胞计数、自动驾驶）。

问题解答：篮球分割属于哪种任务？

结论：属于实例分割。
原因：

目标要求：分割“多个篮球”并计算每个的面积，需区分每个篮球的独立实例。
语义分割的局限：语义分割会将所有篮球标记为“篮球”类别，但无法区分个体，只能计算总面积。
实例分割的优势：为每个篮球生成独立掩膜，精确提取边缘并单独计算面积，满足需求。

示例：
• 若图中两个篮球部分重叠，语义分割会将其视为单一区域，实例分割则会分割为两个独立对象。
• 计算每个篮球的面积需实例分割提供的独立掩膜信息。

Graph View

目标检测（Object Detection）
语义分割（Semantic Segmentation）
实例分割（Instance Segmentation）
问题解答：篮球分割属于哪种任务？

Created with Quartz v4.5.0 © 2025

GitHub