在目前深度學習超級熱門的情況下, 在醫學裡面的應用也是非常的廣, 其中影像分割(Segmentation) 的角色也是非常重要, 目前有許多又新又強的模型, 不過很多都是基於U-net變化來的, 訪間關於U-net的文章非常多, 不過東西就是要自己整理過一次, 才會吸收, 以下是我的U-net筆記
U-net 的經典圖形就是長的像U字型, 所以稱之為U-net, 其結構如下:
圖片點此:
可以看到幾個重點:
1. 先做所謂的downsampling, 提取影像特徵, 之後再做所謂的upsampling
2. 擔心downsampling 會把重要消息丟失, 因此在做 upsampling的時候, 還有和之前downsampling 的數據做concatenation
3. output 出來的影像會比input小, 因為沒有做padding
4. 初始版本是用2D 影像, 後續版本還有所謂的 3D U-net
5. 每次down-sampling, feature channel 加倍, 每次up-sampling, feature channel 減半
文章先打到這裡, 之後補上python 實現
reference
1. U-Net: Convolutional Networks for Biomedical Image Segmentation
沒有留言:
張貼留言