處於邊緣的工業機器視覺應用開發選項

│新東西市集│東西講座│影音頻道│出版中心│智動化專區│

元件次系統自動控制

最新動態

產業快訊

整合創新X智造未來TIMTOS 2025 聚焦AI新商機

汽配及移動科技產業，參展熱烈報名中!

CTIMES / 文章 /

處於邊緣的工業機器視覺應用開發選項

【作者： Mark Patrick】 2019年02月23日星期六

瀏覽人次：【33413】

伴隨我們進入工業4.0和工業物聯網（IIOT）時代，更多重點肯定會放在自動化層面。機器視覺技術變得越來越複雜，在提高製造商產品品質水準同時，也有巨大潛力加速提升產出效能。這項技術之應用範圍也一直在擴大，新應用註定會在我們日常生活中發揮更大作用，如在汽車ADAS系統中處理物件偵測/識別，使基於面部識別的安全機制能夠整合到可攜式電子設備，以及無數其他關鍵任務。

為了減小延遲，並在需要時即時進行操作，需要在網路邊緣部署大量工業機器視覺設備。透過這些，可以避免成本高昂的生產線停工風險，並防止作業人員生命受到威脅。然而，還有一些重大的影響需要考量，因為這意味著必須在網路邊緣實現高度自主。

透過機器學習推斷，可以從捕獲的資料中提取出迴圈模式，進而有助於在未來處理類似場景時做出更好決策。然而，必須注意，在邊緣網路應用這種人工智慧（AI）有重大技術挑戰，特別是在現有資源有限情況之下。

機器視覺系統無處不在，你到處都能遇到它們，它們已經是你所有使用一切的一部分。從垃圾郵件篩檢程式到影像識別和處理，它們已經滲透到我們日常生活，無論是在家裡，在工作中，還是在兩者之間的往返途中。在工業製造和生產環境，你會發現部署了許多基於機器視覺的系統。舉例來說，最基本的應用是數位相機可以捕捉大米包裝被填充和密封的影像，電腦演算法即時地用來處理這些影像，並透過將它們與已知的「好」影像進行比較，來偵測潛在的問題，例如可能是袋子裂開了，或者沒有完全填滿，或者是密封過程在角處留下漏孔。隨著機器視覺的進步，其偵測潛在故障的能力也越來越強，從而能夠提高產品品質和生產效率。

這種在機器視覺系統中使用的演算法可被廣泛地歸類為基於人工智慧，並利用深度學習神經網路能夠以數位方式「看到」要檢查的物件。伴隨工業4.0和工業物聯網（IIOT）等倡議持續推動製造業運營轉型，機器視覺應用將在提高運營效率方面發揮越來越大作用。早期人工智慧實現需要大量運算資源，而這些資源通常被限制在資料中心。與早期的人工智慧應用不同，如今基於人工智慧的機器視覺應用需要更靠近「邊緣」，以便提供非常準確、快速和可操作的影像偵測。

深度學習和神經網路

傳統的電腦程式是針對給定數量的輸入條件而需要提供一系列結果而編寫。當你知道輸入是什麼，並且在輸入數量是有限的時候，這都沒有問題。然而，假若一個系統面對以前從未見過的情況會發生什麼？該如何使系統以一種適當和有用的方式做出回應？

機器學習概念允許演算法從過去的資料中進行學習，然後在遇到未來資料時做出決策或預測。分析資料或影像可以採用多面層方式，每一層都比上面一層更詳細。這樣，系統就可以學會對以前從未見過的情況做出回應。機器學習對於目標偵測和識別特別風行，通常使用人工或卷積神經網路（CNN）。

圖1 : 基本的神經網路概念。（source：Intel）

卷積神經網路是大腦處理視覺訊息部分的數位呈現。與任何神經網路一樣，CNN也包含節點層，但它們不同之處在於，某些神經元只與選定的其他神經元相連。這是因為CNN與我們大腦一樣，強調資料的空間架構。例如，當我們看到起初認為可能是一輛汽車的影像（例如車輪、擋風玻璃和車門後視鏡）時，我們會在與這些元件相同的區域尋找其他元素，以確認或反駁這種判斷，例如方向盤、車門柱或車燈。而隨意查看影像的另一個部分則沒有太多價值，因為它不太可能導致我們明確地判斷影像是否真的是一台汽車。CNN工作原理基本相同，因此比完全連接的網路更有效，尤其是在處理大型影像時。

將CNN技術用於機器視覺應用

CNN的架構被稱作「網路拓撲架構」，有一些已經成為業界標準，其中包括風行的Alexnet和Googlenet。Googlene正在得到快速流行，而且比Alexnet複雜得多。其他拓撲架構還包括VGG 和ResNet。從開發的角度來看，有許多開源碼庫、CNN框架和跨平臺的平行程式設計語言，可用於?明CNN的編碼和快速部署。CAffe是一個流行的框架例子，它包含有創建、培訓、測試和完善CNN需要的所有網路元素。

如何建立自己的CNN將取決於你當今和未來想要達到之目標。你要找的「東西」有多少種不同的類別，是一小部分，還是成千上萬？你將使用何種影像解析度或畫面播放速率？這些要求未來會提高嗎？你只是需要偵測一個物體，還是需要在它周圍畫一個詳細的邊界框並追蹤它的運動？

對於類似快速生產線等工業機器視覺應用，有許多特定的影像識別挑戰。其中大部分與被偵測影像的品質有關，可能涉及到一定程度的預CNN演算法影像處理。除了能夠在偵測區域內隔離物體外，物體照明的均勻性也是另一個考量因素。例如，要能夠識別產品標籤是否正確固定在瓶子上，需要偵測標籤邊緣和瓶子邊緣。如果瓶子是由透明玻璃製成，標籤背面也是透明，影像處理需要生成更多的深色圖元，以便清晰地識別邊緣，它還需要避免由於生產設備或其他運動元件的反射光而引起錯誤觸發。在這些情況下，通常使用邊緣偵測和閾值演算法來提高識別可靠度。

選擇何種硬體平臺來運作機器視覺應用涉及到許多決策。隨著處理器性能提高，在高性能CPU或GPU上運作機器視覺應用已經是一個現實，然而FPGA一直是熱門候選者。FPGA能夠針對試圖解決之問題動態構建運算體系架構，並提供極高性能。這是由於FPGA的特性而得以實現，它包括數千個專用的單精確度浮點乘法和累加器模組，以及一個嵌入式高頻寬記憶體，可配置為一系列緩衝和緩存架構，並與FPGA的運算元素緊密耦合。這能夠使晶片保持很低的延遲，並可實現可程式設計互連，從而能夠將邏輯整合在一起，準確地構建所需的拓撲架構。最終，硬體的選擇將由視覺偵測系統偵測到的速度決定，如果超出範圍，則會突顯錯誤，以便其他進程可以干預。

對基於人工智慧機器視覺應用日益增長的需求導致許多製造商在提供現成的完整評估和開發平臺，以加速系統驗證和原型設計。例如，專業嵌入式相機製造商 Basler為其Dart系列相機提供一套完整的評估套件，其中包括pylon攝像頭軟體套件。

圖2 : Pylon攝像頭軟體套件。（來源：Basler）

基於Intel Atom四核處理器，AAEON UP嵌入式視覺套件還包括一個Basler相機和pylon軟體。

以上兩款套件都可為簡單機器視覺應用提供良好的開端，但一個功能齊全的基於人工智慧的方案則需要更多能夠加速神經網路處理的運算資源和能力。

圖3 : AAEON UP開發套件。（來源：AAEON UP）

例如，Intel能夠為機器視覺應用提供許多不同的方案。如前所述，FPGA長期以來一直用於機器視覺領域，非常適合運作神經網路。Intel Max 10 FPGA即是一個非常受歡迎的產品系列，適合於許多基於人工智慧的視覺應用，其功能框圖見圖4。

圖4 : Intel Max 10機器視覺基本功能架構。（來源：Intel）

最近發佈的OpenVino（開放式視覺推理和神經網路優化）軟體工具包完全支援Intel的FPGA和CPU，有助於加快應用的開發速度，並優化各種Intel硬體設備的工作載荷性能。OpenVino方案透過常用的API支援CPU、FPGA和GPU執行CNN任務的異構能力，它使用函式程式庫和預先優化的內核來幫助減少總體開發週期並加快上市時程，它還承載對OpenCV電腦視覺庫和OpenVX跨平臺電腦視覺加速API的優化調用。

該工具包由三部分組成：深度學習、基於CNN的電腦視覺技術和硬體加速，它還包括一些預先演算過的深度學習模型。電腦視覺層面包括一個基於python的優化器，可以透過命令列介面調用，從Caffe等框架中導入經過演算的模型。

圖5 : Intel OpenVINO 框架。（來源：Intel）

加速是一個添加重要且通常是平行運算資源的過程，不僅僅局限于機器視覺應用，也可適用於越來越多的其他應用，其中一例是用於加快流覽器搜索速度的資料中心。然而，許多工業視覺應用的重點是運算需求須處於「邊緣」，系統可以在不依賴雲端服務情況下運作。

Intel最近發佈了Intel Neural Compute Stick 2，這是一個基於USB的綜合神經網路原型平臺，它採用Intel Movidius Myriad X視覺處理單元（VPU）。Movidius VPU包含16個128位元元超長指令字（VLIW），能夠運作混合架構向量引擎（SHAVE）內核（可用C語言程式設計），以及專用的神經運算加速器引擎。Movidius Myriad X VPU能夠為神經網路處理提供令人印象深刻的每秒1萬億次操作（TOPS），詳見圖6。

圖6 : Intel Neural Compute Stick 2。（來源：Intel）

Neural Compute Stick 2無需風扇，能夠仰仗一台筆記型電腦進行深入學習神經網路部署。它附帶一個Intel OpenVino以進一步幫助創建工作原型。一旦工作原型系統得以創建，就可以快速部署在基於Movidius的單板模組上，比如mini-PCI Express 尺寸格式的AAEON UP AI CORE。

籍由OpenVino等全面神經網路軟體和開發套件，以及Caffe等 CNN框架，基於人工智慧的機器視覺應用現在能夠進行快速開發和部署。緊湊、低功耗的硬體原型平臺更進一步加速了處於網路邊緣節點的視覺系統開發。

(本文作者Mark Patrick任職於貿澤電子)

‧	當生成式AI遇上機器視覺
‧	用於快速評估三相馬達驅動設計的靈活平台
‧	晶圓檢測：高解析度全域快門相機提升晶圓缺陷檢測效率
‧	機器視覺與電腦視覺技術的不同應用
‧	運用嵌入式視覺實現咖啡AI選豆

comments powered by Disqus

相關討論