因為教授可能想讓我做 partial & segmentation,

所以被 assign 了這篇論文。
SegGCN 做了兩件事情:

一是 Fuzzy Spherical 的波波獸(Proposal),
可以有效提升舊有 Hard Spherical 的準確度、提升稀疏點雲的 robustness。
二來提出了新的 SegGCN 架構,只有提到效能還不錯,
主要是 Decoder 端的 Resnet block 換成 1×1 的 Conv。
這篇主要比較對象是 KPConv。
首先來了解 Fuzzy Spherical,
Fuzzy Spherical 是 base on Hard Spherical。
而 Hard Spherical 是 Octree guided CNN 那個流派提出來的,
Octree guided CNN 主要的貢獻就是用 球座標 來處理點雲。
為了更好的節省球座標的記憶體容量,所以用了八元樹(Octree)來處理。
有點混亂?
沒關係,你只要知道 Hard Spherical  是球座標的一種模式就可以了。
用論文圖來解釋:
圖(一)

假設把球座標投影至二維平面(後面會提到特別指 XY平面)。
左邊的 (a) 就是 Hard Spherical,每個區塊有個別的權重、越靠近原點的區塊權重越大,
這就是 Hard Spherical  的核心概念。  
Hard Spherical  的三維概念大概長這樣:
圖(二)
在論文裡面 Hard Spherical 尺寸是 n * p * q ,但讀論文的時候要注意:
總共有 n * p * q 個 Bins
"n , p , q"在這裡全都代表分割的個數,不是軸的概念。
論文裡面還是用球座標的 


{displaystyle (r, theta , varphi )}

但是這裡 Hard Spherical 會遇到兩個問題:
第一
看到 圖(一) 左側的 s,t 點,當兩點很接近 Bin 邊緣的時候,
空間位置接近、但是權重會落差很大。
第二
見圖(三),當兩點 phi 角呈正負關係,且其餘兩維不變時,
在 Hard Spherical 裡面權重會不一樣。
附註.這裡的權重為 

k for Hard Spherical
圖(三)
所以 Fuzzy Spherical 的解決方法就是把 半徑 r 軸線性化、不分 Bin 了。
想像一下,把上面 圖(一) 視為 球座標 對 XY軸 的投影。
使用新的 k 計算方法:
比較一下 Fuzzy Spherical(上) 與 Hard Spherical(下) 的特徵方程式:
可以看到有個靠北難念的 ξk 向量,
那代表在 Fuzzy Spherical 中所有點都考慮隔壁鄰居 k 的關係向量。
而 Hard Spherical 是 Fuzzy Spherical 的特例,把 ξk 變成 one-hot 向量去處理掉了。
(one-hot 向量 這篇 講得不錯,建議閱讀。)

再來是 SegGCN 架構:

比較特別的是把編碼器把權重複製進解碼器,這樣就不用多餘的計算(?)
還有解碼器用 1×1 的 Conv 把 Resnet block 換掉,結論是比較快。

最後給了個在 SegGCN 中使用 Fuzzy 與 Hard 的比較圖,
這張圖同樣在 8192 點的資料下面做的、變因是 dropout 的參數。
可以看到 Fuzzy 的很 robust。
但是用哪個資料集就沒有明講,
可能是什麼獨家機密吧(#?
結論:
1. Fuzzy Spherical 在取樣點數少的情況下較 robust,換句話說 Acc 也比較高。
2. SegGCN 在 S3DIS 與 ScanNET 資料集下比 KPConv 快 100倍。
(但是 mIOU 跟 mAcc 是輸的xD)

他們給的解釋是 16 for 20 都有贏啦
(剩下四個巨爛)
然後自己搞了個 Kernal comparison 說我們把 Fuzzy Spherical 帶進 KPConv 有贏!

用哪個資料集、怎麼比的都不知道xD

哇,如此厚顏無恥之人!
好總之,晚安。

By wuyiulin

喜歡騎單車的影像算法工程師

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *