分類: #CPP

  • 完美關掉 Python OpenCV 圖片視窗的方法

     

    相信各位做影像的同行在驗證自己演算法的時候,
    總是像我一樣眼見為憑、需要把圖片秀出來對吧?

    在很多的 OpenCV 教學文裡面都教我們用這行程式碼關掉視窗:

    cv2.imshow('Image', img)
    cv2.waitKey(0)

    但是用這行程式碼的問題是如果你按了視窗右上角的 “X” 來關掉視窗,
    那麼你的程式就會卡住,因為 OpenCV 不知道視窗被關掉了,
    所以視窗的程序就繼續執行跟你演。

    我每次遇到這狀況就快要中風,
    為了避免各位同行也中風我在此提供解決方法。

    cv2.imshow('Image', img)
    while True:
        if (cv2.getWindowProperty('Image', cv2.WND_PROP_VISIBLE) <= 0 or cv2.waitKey(1) > 0):
            cv2.destroyWindow('Image')
            break
    

    原理是去檢查名稱叫做 Image 的視窗狀態,
    如果他被關掉了,那就把視窗的程序結束掉讓程式就繼續進行。

    至於為什麼要放 waitKey(1) 而不是 waitKey(0),
    那是因為 waitKey(0) 放在條件式裡面會像王寶釧苦守寒窯十八年,
    等你在視窗按下任意鍵。

    如果你又按 “X” 把視窗結束掉了,那就真的老死不相往來了。

    那你說 CPP 裡面怎麼辦呢?有 CPP 的版本嗎?

    我也覺得很奇怪,Python 版的 OpenCV 理論上是 bind CPP版 的 OpenCV ,
    兩邊實現應該會一樣?

    但是 CPP 中 waitKey(0) 可以偵測視窗關掉(也就是按右上角”X”也能關掉視窗程序)。

    以上,謝謝指教。

  • 如何使用 CPP 加速 DCT 運算

    如何使用 CPP 加速 DCT 運算

    本篇文章來自 想知道網戀對象有沒有修圖嗎?試試看這款修圖偵測機器人! 的續篇,

    因為 Python 的方法實在是太慢了,所以我一直在尋求加速的方法。
    俗話說得好:
    要看一個人怎麼做立委,就要看他怎麼做立委!

    不是,我是說有些人可能不適合做立委、適合做總統!

    舉個例子:
    拿 Python 去做文字處理就很開心,但是拿 C/CPP 去做文字處理你就準備腦血栓;
    反之拿 Python 做數學運算也會慢到中風,但是拿 C/CPP 做數學運算就風馳電掣。

    所以我用 CPP 實現了需要數學運算的 DCT 方法,

    主要是使用 extern “C” 方法來與 Python 對接,在 Python 那邊設定好輸出入的參數。

    這邊比較需要注意的是因為我選用的讀圖方式是 OpenCV 的 CPP 函式庫,

    所以寫 Makefile 的時候需要注意把 OpenCV 包進來。
    在編譯的過程中 Makefile 也會發生抓不到 g++ 的時候
    (想好好編譯真難 😇)
    總之做了一點 Soft-link 還有 Dirty work 後終於能正確編譯了。
    因為我是用”Single Thread”、”Mask” 的方法來實現 DCT 變換的,
    所以讓我們來看看與 Python 版 與 CPP 版 比較效果如何:

    CPP 版的運算速度比 Python 版快了近六倍,
    有夠優質!

    相關開源我更新在:
    https://github.com/wuyiulin/GraphAppBot

    想要測試一下這個服務:

    https://t.me/DynamicGraphApp_bot

    如果有任何問題歡迎聯絡我:
    wuyiulin@gmail.com

  • 解決 OpenCV 編譯後不定時崩潰、失效等問題

    解決 OpenCV 編譯後不定時崩潰、失效等問題

     

    這邊提供 OpenCV 編譯後崩潰的可能解決方法:

    我的環境是 OpenCV 4.5.4、Ubuntu 22.04,

    並使用 g++ 11.4.0 編譯我的專案。

    我遇到的情境問題是,我得到一包 C/C++ 的專案,

    裡面用 Makefile 來整合編譯專案,裡面包含我自己寫的一段高斯濾波程式碼。

    這貨整包編譯時沒有出錯;

    獨立把高斯濾波程式碼放到另一個編譯、運行也都沒有出錯。

    但當我在源碼裡面運行這段高斯濾波程式碼時”有機率”會出錯:

        int ksize = 3;
        cv::Size size = image.size();
        int width = size.width;
        int height = size.height;
        cv::Mat blurred_image(height, width, CV_8UC1, cv::Scalar::all(0));
        cv::GaussianBlur(grey, blurred_image, cv::Size(ksize, ksize), 0, 0);
    

    然而我給定的高斯核大小為 3×3,

    非常奇怪,程式會跳說高斯核定義不是奇數,所以不合法:

    error: (-215:Assertion failed) ksize.width > 0 && ksize.width % 2 == 1 && 
    ksize.height > 0 && ksize.height % 2 == 1 in function 'createGaussianKernels'
    

    除此之外,當我想使用旋轉圖片、在圖片上畫點的功能也全部失效,但是編譯又沒有出錯,

    這件事情真的是非常奇怪。

    因為是運行時錯誤,於是我先用 GDB 檢查了函式是否重複定義:

    然而並沒有,這就奇了怪了。

    後來我開始埋 log 想辦法抓鬼,也完全抓不到。

    解決方法:

    把專案的 Makefile 打開,有關於 OpenCV 的部份改寫,

    讓 Makefile 繞過 pkg-config ,手動給定 OpenCV.hpp 還有 libopencv_XXX.so 的路徑。


    如果我的 OpenCV.hpp 放在 /usr/include/opencv4/opencv2 底下,

    那就把 CFLAGS+= 裡面加入 -I/usr/include/opencv4;

    libopencv_XXX.so 放在 /usr/lib/x86_64-linux-gnu 下面,

    那就把 LDFLAGS += 裡面加入 -L/usr/lib/x86_64-linux-gnu。


    原版:

    ifeq ($(OPENCV), 1) 
    COMMON+= -DOPENCV
    CFLAGS+= -DOPENCV
    LDFLAGS+= `pkg-config --libs opencv4`
    COMMON+= `pkg-config --cflags opencv4`
    endif
    



    改寫成:

    ifeq ($(OPENCV), 1) 
    COMMON+= -DOPENCV
    CFLAGS+= -DOPENCV -I/usr/include/opencv4
    LDFLAGS+= `pkg-config --libs opencv4` 
    LDFLAGS+= -L/usr/lib/x86_64-linux-gnu -lopencv_core -lopencv_highgui -lopencv_imgproc -lopencv_imgcodecs
    COMMON+= `pkg-config --cflags opencv4`
    endif
    


    完美解決

    雖然我另外一份獨立的 CPP 檔案能夠用 pkg 找到 OpenCV 也能編譯,

    pkg PATH 裡面也有 OpenCV,暫時不知道哪裡耦合到了,

    先留紀錄改天遇到再來深究。

    若有錯誤請聯絡我 – wuyiulin@gmail.com

  • 如何利用 Intel 內顯資源進行 OpenCL 開發

    如何利用 Intel 內顯資源進行 OpenCL 開發

     

    這篇主要介紹 Linux/Windows 兩個平臺使用 Intel 內顯資源開發 OpenCL 的解決方案,
    並且不用重新編譯核心,不像這篇太 Hardcore 了xD

    首先你當然要確定自己的 Intel CPU 有沒有支援 OpenCL?

    先參考 Supported APIs for Intel® Graphics

    但是只是參考就好,因為我在裡面用一塊號稱支援 OpenCL 2.0 的晶片支援了 OpenCL 3.0。

    我認為 Intel 並不知道自己在做什麼。

    LINUX

    筆者在此使用 Ubuntu 22.04 做為開發環境,

    在此 OS 下你只需按照這篇安裝 intel i915 驅動,

    然後驗證驅動有沒有裝好?

    sudo apt-get install clinfo
    
    clinfo -l

    如果有裝好應該會像筆者的畫面這樣:

    接著你想要用 gcc 或 g++ 開發都沒問題,

    甚至用 make 編譯專案也可以直接車過去,這就是 UNIX 帶原生編譯器的好處。

    Windows

    筆者在此使用 Windows 10 做為開發環境,

    在 Windows 不用特別去裝 intel 驅動,理論上一定會自行下載。


    但 Windows 因為沒有原生編譯器的優勢,所以你必須選擇編譯器流派。

    如果你沒有要編譯整個專案,只想自己寫一點東西來驗證,

    我推薦使用 MinGW64 就好。

    MinGW64 只要再額外安裝 libheaders 便可以執行後續驗證。

    使用這份 .C程式碼來驗證:

    #include 
    #include 
    
    int main() {
        cl_uint platformCount;
        clGetPlatformIDs(0, nullptr, &platformCount);
    
        if (platformCount == 0) {
            std::cerr << "No OpenCL platforms found." << std::endl;
            return 1;
        }
    
        cl_platform_id* platforms = new cl_platform_id[platformCount];
        clGetPlatformIDs(platformCount, platforms, nullptr);
    
        std::cout << "Number of OpenCL platforms: " << platformCount << std::endl;
    
        for (cl_uint i = 0; i < platformCount; ++i) {
            char platformName[128];
            clGetPlatformInfo(platforms[i], CL_PLATFORM_NAME, sizeof(platformName), platformName, nullptr);
    
            std::cout << "Platform " << i + 1 << ": " << platformName << std::endl;
        }
    
        delete[] platforms;
    
        return 0;
    }
    
    

    如果你需要 CMake 整份專案,

    那先跟我大喊一聲:Fuck you Intel!

    原因是網路上安裝 Intel OpenCL 的教學大多都需要這份:

    ​Intel SDK for OpenCL applications​

    但是這份已經停更了。

    根據 Intel 官方表示後續會分散在各 OneAPI 部件裡面支援,

    所以我們會被引導到這個 Intel 官方文件頁面:

    Intel Tools for OpenCL™ Applications

    我試過了都沒用,不要浪費時間跟 Intel 官方文件在那邊鬧。

    他們最近不知道想推 SYCL 還是什麼東西,總之沒有支援。

    我會說沒有支援的原因是因為:

    你要能 CMake 一份專案最主要要引用兩份東西,

    一份叫做 OpenCL.lib,一份叫做 CL.h or CL.hpp。

    按照 Intel 官方文件裝完上述套件都找不到 CL.h or CL.hpp,

    就算找來 KhronosGroup 版本的 CL.h 代打也會有問題,

    天知道 Intel 怎麼寫他們的 OpenCL.lib?

    另外一個不推 Intel 解決方案的原因是近年來他們都綁 MSVC,

    代表我要載又肥又呆的 Virtual Studio,個人不是很喜歡。

    怎麼辦呢?

    打不贏就加入!

    我在開發死線前尋尋覓覓,發現敵人就在本能寺!

    發現敵人的敵人就是朋友,AMD 有做這個欸?

    我能不能用 AMD 的文件驅動 Intel CPU 呢?

    哇靠!可以!

    大家只要下載這個來安裝,並記住安裝路徑。

    他會提供 CMake 最需要的 OpenCL.lib 及 CL.h。

    接著在你的 CMakeLists.txt 裡面修改,

    通常上面兩行要新增 OpenCL.lib 及 CL.h 的路徑,

    下面兩行應該本來就有,新增一下就好。

    find_path(OPENCL_INCLUDE_DIRS CL/cl.h PATHS /path/to/opencl/include)
    find_library(OPENCL_LIBRARIES OpenCL PATHS /path/to/opencl/lib)
    
    include_directories(${OPENCL_INCLUDE_DIRS})
    target_link_libraries(YourExecutable ${OPENCL_LIBRARIES})
    

    這樣應該就能成功編譯專案了!

    如果本篇內容有誤歡迎聯絡我:

    wuyiulin@gmail.com

    謝謝大家!

    REF.
    OpenCL入门一:Intel核心显卡OpenCL环境搭建

    How to install OpenCL on Windows

    Intel Arc 独显Ubuntu安装指南

  • [面試] 瑞鼎 – 觸控演算法工程師面試紀錄

    2023 – 11

    瑞鼎 – 觸控演算法工程師

    工作內容

    1. 客戶需求專案支援
    2. 觸控演算法開發與維護
    3. 觸控演算法數據分析

    職務類別

    演算法工程師




    白板題


    Q1-1. 不使用 size of 算出這個結構佔用記憶體大小

    struct ST
    {
        int I;
        float F;
    }AA;
    


    解答:

    struct ST
    {
        int I;
        float F;
    }AA;
    
    int mysize(struct ST* a)
    {
        return (char*)(a + 1) - (char*)a;
    }
    
    int main()
    {
        AA.I = 10;
        AA.F = 4.5;
        printf("Size of AA: %dn", mysize(&AA));
        return 0;
    }
    
    
    Terminal:
    Size of AA: 8
    

    可以這樣解的原因是結構變數指標+1 就是獲得這個結構變數後的記憶體位置,

    用 char* 算是因為 char 佔用 1 Byte。



    Q1-2. 用 C 實現 $ sum_{x=0}^{2} frac{2^{x}e^{x-1}}{32}$,不能使用 division,

                並把整數與浮點數部份分別存入 AA 結構。 

                        ($e^{-1}=0.367879, e^{0}=1, e=2.718281$)


    解答:

    #include <stdio.h>
    #include <stdlib.h>
    #include <math.h>
    
    struct ST
    {
        int I;
        float F;
    }AA;
    
    
    int main()
    {
        int size = 3;
        float *exp = malloc((size + 1) * sizeof(float));
        exp[0] = 0.367897;
        exp[1] = 1.0;
        exp[2] = 2.718281;
        exp[3] = 0.0;
        
        for(int x=0; x<size; x++)
        {
            float bx = 2.0;
            bx = pow(bx, (x-5));
            exp[size+1] = exp[size+1] + bx*exp[x]; 
        }
        
        AA.I = (int)exp[size+1];
        AA.F = exp[size+1] - AA.I;
        
        printf("Result int part: %d, float part: %f", AA.I, AA.F);
        
        return 0;
    }
    
    Terminal:
    Result int part: 0, float part: 0.413782
    

    除了那個 pow 的 MATH.h 不太確定能不能用外,

    其他東西還蠻直覺的。

    Q2.利用指標反轉陣列 array arr[7] ={1,2,3,4,5,6,7}


    解答:

    void swap(int *head, int *tail)
    {
        *head = (*head)^(*tail);
        *tail = (*head)^(*tail);
        *head = (*head)^(*tail);
    }
    
    
    int main()
    {
        int arr[7] = {1,2,3,4,5,6,7};
        int *head = &arr[0];
        int *tail = &arr[6];
        
        while(head<tail)
        {
            swap(head, tail);
            head++;
            tail--;
        }
        for (int i = 0; i < 7; i++)
        {
            printf("%d ", arr[i]);
        }
        
        return 0;
    }
    
    Terminal:
    7 6 5 4 3 2 1


    Q3. array arr={1,3,5,7,9,11,13,17} ,用二分搜尋法找出 11 的 index 為何?


    解答:

      
    int find(int* arr, int H, int T, int target)
    {
        if(H==T) {return H;}
        
        if (target < arr[(int)((H + T)/2)])
        {
            return find(arr, H, (int)((H + T)/2), target);
        }
        else
        {
            return find(arr, (int)((H + T)/2)+1, T, target);
        }
    }
    
    
    int main()
    {
        int arr[8] = {1,3,5,7,9,11,13,17};
        int target = 11;
        int res = find(arr, 0, 7, 11);
        printf("Index of 11: %d", res);
        return 0;
    }
    
    Terminal:
    Index of 11: 6
    

    Q4.下面這段函式定義是否合法? 

    Q5.為什麼它合法或不合法?

      
    int* fun(int *x){return &x*&x;}
    float* fun(float *x){return &x*&x;}
    
    int main()
    {
        int x1 = 4;
        float x2 = 4.5;
        int* result1 = fun(x1);
        float* result2 = fun(x2);
        return 0;
    }
    

    解答:

    Q4 不合法

    Q5 主要有兩個原因:

            第一個是沒給編譯器定義,這關係到函式多載(Function Overloading),

            在 C 裡面就不允許函式多載、不同 IO 共用同一個函式名稱,

            在 CPP 的話就允許,但是這邊沒說到用 gcc or g++ 編譯。


            第二個是指標觀念,當函式傳入 *x,則函式內的 &x 等價 **x。

            雙重指標 **x 沒有辦法直接做乘法運算。

    心得

    現場我有把 Q2, Q3 解出,

    Q1-1肯定是我自己寫錯,Q1-2 第一眼看成積分直接空白,回來越想越不對。

    Q4, Q5 可能是我 CPP 寫太多直覺以為只考函式多載,就騰了合法兩字送出,

    還大膽解釋了一下。

    沒想到裡面還有藏指標(汗。

    以上都是英文出題,但是我沒記好英文全文,所以就憑自己印象寫出來,

    如有筆誤歡迎來信指正。

    這次是 104 主動投遞,人資主動打來約時間,

    我也問了在職的話能不能一面線上?

    結果是要到新竹現場考試,也通知筆試沒過就不面試。

    行前還要我準備碩論跟部落格的報告。

    這次整個面試流程大概是我提早半個小時到瑞鼎,

    櫃台帶我去一樓小房間,

    約定時間快到時,一位看起來像是人資(?)的人進來發考卷說寫半小時。

    考完後人資將考卷拿給主管批改,過大概二十分鐘下來說我沒過資格,

    還問我會不會出去?

    OS:這不廢話嗎?不然你以為我怎麼出現在這裡?

             嚴重懷疑你有特異功能看得到我的隱形直昇機或是隱形任意門。

    雖然回家想想自己解得不甚理想,但是從頭到尾都沒見到主管這點讓我有點火大。

    準備了一堆東西連主管都沒見著,幹麻不讓我線上開筆記本實況寫程式就好了?

    以上。

  • LeetCode 解題紀錄  221. Maximal Square 圖片中最大的正方形

    LeetCode 解題紀錄 221. Maximal Square 圖片中最大的正方形

    繼 200. Number of Islands 後,又遇到一個影像處理的問題。

    這題要用動態規劃來解,菜雞如我第一時間沒想到動態規劃,

    但是後來也自己解出來了,紀錄一下我的解題心路歷程。

    題目簡介:

    給你一張尺寸為 m x n 像素且只包含(0,1)的圖片稱為 Matrix ,

    其中 1 代表有像素的區域,找出此張圖片中含有 1 的最大正方形區域面積。

    第一階段想法:循序檢測法

    把每個點都當作候選正方形的左上角,

    先求 Row 再驗證每個 Col 是否符合正方形區域預想?

    若有,就回傳正方形區域面積;
    若無,就回傳 0。

    假設圖片中有 N 個元素,這個想法的時間複雜度為:

    $$O(N^{2})$$

    但是我們會遇到一個特殊情況,當最大正方形在驗證失敗的候選正方形的的情況,

    像是:

    就很尷尬,其中 $$S_m$$ 不等於 6 的原因是本圖中最大正方形是交由 min(m, n) 決定,

    所以不用檢查到 $$S_m = 6$$ 可以降低計算時間。

    結果:Wrong Answer

    第二階段:動態規劃法

    所以我決定再不增加時間複雜度的情形下,由小到大、每個正方形都檢測。

    使用動態規劃,每一步驟又拆成兩小步:

    第一步:驗證對角線是否為 ‘1’ ?

    第二步:驗證相應 X, Y軸是否為 ‘1’ ?

    若有任一步檢測到 ‘0’ ,則回傳步數 S 的平方當作正方形面積。

    不過鑑於這個作法時間複雜度遇到 Worst Case (全為 ‘1’ 的圖片時)仍為 $$O(N^{2})$$

    結果:Time Limited Error

    第三階段:利用影像(數據)特性降低時間複雜度。

    問自己一個問題:最低滿足圖片中最大正方形的條件是什麼?


    答案是任何大於(長/2)*(寬/2)的正方形,

    因為本題目中不考慮重疊問題,所以用數學上來說:

    一圖片尺寸為 m*n ,若有任意正方形面積大於(m/2 + k)(n/2 + k),

    而 k 恆大於零的話,此正方形為圖片中最大的正方形就成立。

    而候選次大正方形面積必定為(m/2 – k)(n/2 – k),

    所以每個點出發後,

    檢測 (m*n/4) + m + n – 1 個像素就知道這個正方形是不是最大的了。

    結果:Accept

  • 費波納契數列的最佳計算複雜度 O(logn) 實現及推導(fibonacci sequence in cpp)

    因為最近在解 Leetcode 的 91. Decode Ways


    要用到 Fibonacci sequence 來解,就我所知上次解 70Climbing Stairs 的時候,
    用 recursive 求解 Fibonacci sequence 的時候會 TLE。
    (所以我就偷懶跑去用 Python3 解大數)


    這次再遇到應該是要進步了xDDD


    正文開始:

    Fibonacci sequence 會長這個樣子:



    根據基本定義,第 N 個 Fibonacci value 等於前兩個 Fibonacci value 相加,
    我們便可以得到公式:



    得到公式以後把它擴展成 轉移矩陣 M 的形式,
    因為我們把前兩項當作初始值,所以 轉移矩陣 M 的指數會減二:



    所以我們現在只要計算 M 的 (n-2) 次方就能得到第 N 個 Fibonacci value。
    (左上角的 M00 會等於 第N個 Fibonacci value

    此時的計算複雜度為:O(n)

    以第 45 個 value 值來比較,此方法已經比遞迴快很多了xD




    但是我還要教你一個威力加強版外掛:平方求冪
    (左岸又稱快速冪 or double-and-add


    我們在這裡要用平方求冪去優化轉移矩陣 M。


    平方求冪的想法是把任何高階指數都化為與指數二有關的指數和,
    屁話一堆直接看數學比較快:


    如果你說 n 是 odd 怎麼辦?
    啊不簡單?直接減一再乘回去R~:




    這樣的好處是能大大的減少計算量,數學意義上來說是二分搜尋法,
    以找 n = 16 舉例,

    沒有平方求冪的版本會很老實地計算十五次乘法,
    而有平方求冪外掛的版本會跳著算:



    像是圖中有幾個節點,就計算幾次,
    每次都是跟自己相乘,所以實際上只要算黃色螢光筆那條路徑,
    不必考慮其他條黑色路徑。

    由此可以 16 = 2^4,所以有 4 個節點,只需計算 4次。
    此時又可推導出 計算複雜度為:O(logn)
    (log 以 2 為底。)


    用 C++ 實現的程式碼我放在這裡


    有興趣的可以直接拿來用,不用再造車輪了xD

    感謝各位