Key Issue

以往的网络都依赖于大数据集，而医学等任务数据集很少，需要有一种方法来解决

滑动窗口方法通过平移窗口得到大量patch，弥补了数据集问题，且可以定位，但是又以下缺陷：

文章关注于提出一种新方法，在小数据上实现高精度分割

Motivation

右边是原图（有效的图），左侧是镜像拼接之后的图片，使用大卷积核时，可以扫过拼接的镜像部分，得到这部分上下文（平移不变性），用于预测

上图描述了这个重叠切片方法，这个方法是在无法整图输入的情况下，配合分patch机制，保留空间上下文的方法，同时每次只保留中间区域的预测，去除了部分冗余计算

编码器使用3卷积x2+ReLU+2采样，解码器与对应层的编码器中间结果裁剪后拼接，采用2卷积上采样，再3卷积x2

编码器往下逐层学习，其中间结果为解码器提供细节信息，裁剪是因为每次卷积都会在边界引入无用信息

拼接是通道拼接，通过卷积将通道转化为尺寸，实际上就是结合两种信息做特征融合

提出加权交叉熵方法

E = x \in Ω \sum w (x) lo g (p_{ℓ (x)} (x))

因为背景远大于前景，如果直接学习，模型会偏向于预测背景来实现更低的损失，所以提出要对每个像素加权，像素权重由类别出现的频率来定，出现少的权重高

w (x) = w_{c} (x) + w_{0} \cdot exp (- \frac{( d _{1} ( x ) + d _{2} ( x ) ) ^{2}}{2 σ ^{2}})

同时，还需要加强边界的权重，d1是像素和最近边界的距离，d2是次进的距离，当距离越近，权重越大，强调边界学习

做了很多的弹性变换，灰度变换，平移变换等等来增加数据量

U-net提出了一个不完全对称的U形结构，通过编码解码过程的跳跃连接，overlap-tile策略等，训练了一个端对端的卷积网络，解决数据少，计算量大，预测慢等问题，取得卓越成果，且适用于很多下游任务

【代码】

【参考】