2020年11月24日 星期二

[深度學習] U-net 簡介

在目前深度學習超級熱門的情況下, 在醫學裡面的應用也是非常的廣, 其中影像分割(Segmentation) 的角色也是非常重要, 目前有許多又新又強的模型, 不過很多都是基於U-net變化來的, 訪間關於U-net的文章非常多, 不過東西就是要自己整理過一次, 才會吸收, 以下是我的U-net筆記

U-net 的經典圖形就是長的像U字型, 所以稱之為U-net, 其結構如下:

圖片點此: https://images.app.goo.gl/eiWHV2rWxuyQYPt77


可以看到幾個重點:

1.  先做所謂的downsampling, 提取影像特徵, 之後再做所謂的upsampling

2. 擔心downsampling 會把重要消息丟失, 因此在做 upsampling的時候, 還有和之前downsampling 的數據做concatenation

3. output 出來的影像會比input小, 因為沒有做padding

4. 初始版本是用2D 影像, 後續版本還有所謂的 3D U-net

5. 每次down-sampling, feature channel 加倍, 每次up-sampling, feature channel 減半

文章先打到這裡, 之後補上python 實現

reference

1. U-Net: Convolutional Networks for Biomedical Image Segmentation

沒有留言:

張貼留言