U-Net: Convolutional Networks for Biomedical Image Segmentation

2021/7/13

来源:MICCAI15
resource:github上备份的包括ipad标注的pdf版本。
作者是University of Freiburg的Olaf Ronneberger, Philipp Fischer和Thomas Brox,这篇文章属于开宗立派的鼻祖文章了,单篇引用2.8w+!

Summary:文中提出了一种新颖的网络结构,因为特征提取与恢复部分呈镜像对称而命名为U-Net,这篇文章(的网络结构)从医学图像分割一路杀穿了图像分割、图像去噪等领域,成为魔改结构的经典(?)。

rating:5.0/5.0(不要不识抬举)
comprehension:3.5/5.0

文章的贡献有:

  • 提出了一种新颖的全卷积网络结构U-Net,只需要非常少的数据配合数据增强就能取得非常理想的分割性能,后来在医学图像分割等领域取得了辉煌战果;

1 Introduction

  • 图像分割输出的通道数和分类数目一致,本质上是个per-pixel生成label的过程。

网络结构如下所示:

U-Net由两块组成(这两块分别可以看成Encoder和Decoder),分别取名叫contracting path和 symmetric expanding path,前者提取语义信息,后者用来定位。卷积采用有效卷积,因此每次卷积后feature map的尺寸都会缩小,需要精心设计feature map的尺寸(后续的工作有觉得比较麻烦,所以直接换成Same Conv了),在两条path之间连有skip connection,将前面的信息保留到后面(这里有个尺寸的对齐)。采用的降采样方法是max pooling,采用的升采样方法是up conv。网络中没有全连接层,是个全卷积神经网络。

网络有个tile-strategy,因为有效卷积生成的feature map只占输入图像的一小部分,所以对大图像进行分割时就要在有效部分外留足额外图像,这对于中间的分块来说比较容易满足,但是边缘分块则需要用镜像来填补(不补0,充分利用图像信息),但是这个策略是因为有效卷积产生的,替换掉有效卷积是不是就不用这么麻烦了?而且去噪的话少一点边信息应该问题不大?

此外,为了解决数据量不够的问题,作者使用elastic deformations作为数据增强的方法,这对于细胞来说还是比较合适的。

为了分辨出细胞的边界,作者提出对细胞边界的像素乘以一个较大权值,这一部分不是很重要(有一些细节也没懂),用截图放出:

最后是些训练设置等等细枝末节的东西。