Codecrazer (高永碩醫師): [深度學習] U-net 簡介

2020年11月24日星期二

在目前深度學習超級熱門的情況下, 在醫學裡面的應用也是非常的廣, 其中影像分割(Segmentation) 的角色也是非常重要, 目前有許多又新又強的模型, 不過很多都是基於U-net變化來的, 訪間關於U-net的文章非常多, 不過東西就是要自己整理過一次, 才會吸收, 以下是我的U-net筆記

U-net 的經典圖形就是長的像U字型, 所以稱之為U-net, 其結構如下:

可以看到幾個重點:

1. 先做所謂的downsampling, 提取影像特徵, 之後再做所謂的upsampling

2. 擔心downsampling 會把重要消息丟失, 因此在做 upsampling的時候, 還有和之前downsampling 的數據做concatenation

3. output 出來的影像會比input小, 因為沒有做padding

4. 初始版本是用2D 影像, 後續版本還有所謂的 3D U-net

5. 每次down-sampling, feature channel 加倍, 每次up-sampling, feature channel 減半

文章先打到這裡, 之後補上python 實現

reference

Codecrazer (高永碩醫師)