resource:github上备份的包括ipad标注的pdf版本。
作者是University of Freiburg的Olaf Ronneberger, Philipp Fischer和Thomas Brox,这篇文章属于开宗立派的鼻祖文章了,单篇引用2.8w+!
Summary:文中提出了一种新颖的网络结构,因为特征提取与恢复部分呈镜像对称而命名为U-Net,这篇文章(的网络结构)从医学图像分割一路杀穿了图像分割、图像去噪等领域,成为魔改结构的经典(?)。
rating:5.0/5.0(不要不识抬举)
comprehension:3.5/5.0
文章的贡献有:
网络结构如下所示:
U-Net由两块组成(这两块分别可以看成Encoder和Decoder),分别取名叫contracting path和 symmetric expanding path,前者提取语义信息,后者用来定位。卷积采用有效卷积,因此每次卷积后feature map的尺寸都会缩小,需要精心设计feature map的尺寸(后续的工作有觉得比较麻烦,所以直接换成Same Conv了),在两条path之间连有skip connection,将前面的信息保留到后面(这里有个尺寸的对齐)。采用的降采样方法是max pooling,采用的升采样方法是up conv。网络中没有全连接层,是个全卷积神经网络。
网络有个tile-strategy,因为有效卷积生成的feature map只占输入图像的一小部分,所以对大图像进行分割时就要在有效部分外留足额外图像,这对于中间的分块来说比较容易满足,但是边缘分块则需要用镜像来填补(不补0,充分利用图像信息),但是这个策略是因为有效卷积产生的,替换掉有效卷积是不是就不用这么麻烦了?而且去噪的话少一点边信息应该问题不大?
此外,为了解决数据量不够的问题,作者使用elastic deformations作为数据增强的方法,这对于细胞来说还是比较合适的。
为了分辨出细胞的边界,作者提出对细胞边界的像素乘以一个较大权值,这一部分不是很重要(有一些细节也没懂),用截图放出:
最后是些训练设置等等细枝末节的东西。