帳號:
密碼:
最新動態
產業快訊
CTIMES / 文章 /
運用FPGA加速運算 將大數據挑戰轉化為機遇
 

【作者: Daniel Eaton】   2018年12月27日 星期四

瀏覽人次:【7980】

新宇宙的誕生

大量的電子元件和連接至互聯網的「事物(thing)」創造了數位宇宙,其包含任何事情和所有在工廠、在整個連鎖餐廳、橫跨整個智慧城市,或在某些研究專案中正在發生之事物的資料。從資料中獲取價值就有機會提升業務績效、加速醫療進步、加強安全和執法,並改善全球數百萬數位消費者的日常生活,及提高社交媒體體驗等,就不再此一一列舉。


傳統的資料庫和查詢工具無法處理龐大的資料量、各種不同的資料類型,以及為獲得所需洞察力而用來組合和運算資料的複雜方式。因此,新型資料來源(如Hadoop)、日誌工具(如Splunk)和視覺化工具(如Tableau)正在興起,它們更適合用於分析作業負載。


適用於資料分析作業負載

大數據分析工具在存取和使用資料的方式,與歷史應用查詢資料庫事務的過程不同。事務應用以順序索引的方式處理少量資料,而SAP預測分析這類的應用則可以批量檢索資料,並能夠應用各種分析技術。此外,使用者手中的設備數量迅速增加,且與物聯網相連的設備也正在以指數級速度大量的產生資料。



圖1 :  資料中心
圖1 : 資料中心

綜合起來,資料的爆炸性增長和作業負載的複雜性,已逐漸超過現有資料中心運算平台的效能。然而客戶現在為達業務或財務目的,都要求分析應用能夠快速(有時甚至是即時)地產出深刻的洞察,這使得傳統架構無法跟上腳步。隨著與摩爾定律相關的CPU進程,及工作頻率的增長(Dennard 縮放)在過去五年內的雙雙放緩,提升效能的傳統方法也開始慢慢失效。另一方面,從成本、空間和功耗的角度來看,簡單地添加額外的刀鋒(blade)或機櫃來提升效能,也變得越來越困難。


專家之見

高效能運算領域的專家正在推動新平台的開發,此平台將會運用整合了傳統CPU、繪圖處理器(GPU)和現場可編程閘陣列(FPGA)的靈活異質架構內的硬體來加速。新一代運算加速器正在興起,它利用每種處理器的獨特優勢,讓效能、功耗和空間效率方面均有顯著的提升。


賽靈思聯盟計劃(Xilinx Alliance Program)成員InAccel的執行長Chris Kachris認為,採用FPGA等硬體加速器的異質運算,正變成高效執行資料分析的主要平台。他表示:「典型的處理器無法承受分析應用增加的運算複雜性,而FPGA可以透過即用型模組和專用晶片的效能,來發揮處理器的靈活性。」


InAccel創建高效能加速器,並應用於機器學習、財務或其他應用中的IP,包含採用Apache Spark 應用的加速器,且這些加速器可部署到FPGA IaaS,如亞馬遜 AWS EC2 F1執行個體、 華為FPGA加速雲伺服器 (FACS)、阿里巴巴彈性運算服務F2執行個體,或就地部署(on-premise)到賽靈思、研華科技(Advantech)、Bittware和其他公司的PCIE FPGA板。加速器可提高關鍵任務應用的效能,並顯著降低客戶的擁有成本。


Kachris補充表示:「FPGA能提供比其他平台更高的效能,並且擁有足夠的靈活性,來滿足未來需求及演算法。我們可以在採用函式庫的方案中部署FPGA,且無需更改原始應用。」


異質運算平台

Bigstream的Brad Kashani提供更多關於適合GPU與FPGA作業負載類型的細節。他表示:「像密集矩陣乘法或記憶體需求非常高的運算,可能適用於GPU。而FPGA則能夠更有力地支援Sparse矩陣運算、SQL運算(如過濾、連接或分類)或涉及運算資料格式的應用,且FPGA 提供了有效擷取大量資料分析運算所需的靈活性。」


「此外,通過在內聯(inline)模式使用FPGA,能夠在無需CPU干預的情況下,直接從網路介面卡(NIC)處理資料,進而成功加速。這種模式提供了我們目前所見過的最高效能,同時減少了整個系統的延遲變化。」


其中,為因應巨量資料的需求,需要一款能在機器集群上運行的解決方案,而異質架構則可透過支援運算密集型任務和重複任務,從主CPU上卸載來滿足需求,而可配置的加速器(如 FPGA)可因而獲得最佳化。Vitesse Data執行長暨共同創辦人CK Tan解釋他們公司如何將這種方法付諸行動,來進一步加速該司Deepgreen DB 的效能,其為Greenplum 的一種變體,運行速度比開源方案快數倍。



圖2 : 大數據分析與雲端資料
圖2 : 大數據分析與雲端資料

「許多分析應用均需要在MPP資料庫上運行SQL,且客戶希望獲得最快的處理效能。然而,集群(cluster)中的CPU存在密度限制,很明顯地CPU本身無法滿足更快速聚合業務情報和臨時OLAP查詢的需求。」若使用FPGA作為加速器,就可釋放CPU用於處理其他合併查詢,進而提高系統的整體回應能力。「這使我們能夠在不擴大占用面積的情況下,將集群上可用的運算資源增加四倍,而這與從企業資料中獲取更多情報和深刻洞察的需求十分吻合。」


他進一步闡述了如何讓終端使用者有效地看見加速力。「透過簡單倒換資料庫軟體,Greenplum客戶就可以切換至Deepgreen,且會立即看到其應用在同一硬體上運行得更快。此外,客戶還可以通過在機器中添加 FPGA 卡,使系統運行速度更快;Deepgreen DB為使用額外的資源將效能指標進一步向上推動。」


預測和學習

隨著大數據分析不斷地發展,許多公司都希望在預測分析領域獲得巨大的額外價值,以幫助預測從機器維護到金融服務等各個領域的趨勢和事件。Xelera執行長Felix Winterstein表示:「像建構手頭資料的預測模型等這類的大規模分析,流程設定通常在夜間運行。但我們發現越來越多的客戶不是想要更精確的模型,就是希望將周轉時間縮短到幾小時,甚至是幾分鐘,以便更快的獲得資料模型。」


為了滿足這些需求,Xelera已透過使用 FPGA,在目標應用中比多核CPU 提供高達兩個數量級的加速。Winterstein表示:「在一些本質上非常適合GPU 架構的應用中,GPU是一個強而有力的加速工具選項。然而,FPGA則屬於極其通用的加速器,可以加速更廣泛的應用。」


藉由硬體加速不僅能達到更短的分析作業負載執行時間,還可以進一步節省功耗。Ryft透過將FPGA用於模糊文本搜索、訊號處理和機器學習影像或視訊分析等作業負載,達到10到100之間的加速因子,同時,功耗也降低許多。工程設計副總裁Pat McGarry表示:「在許多現實場景中,我們已成功降低高達十倍以上的功耗。對邊緣分析感興趣的客戶而言,通過較小的功耗需求獲得巨大的效能提升才能真正振奮他們,因為在這些領域裡,功耗通常非常高,而設備的相交堆疊的機架根本不用考慮。」


McGarry進一步探討了硬體加速在本地(on-premise)和混合邊緣/雲端部署模型中的作用。「雖然我們大多數的客戶在本地運行時,都是運用本地FPGA加速資源,來通過PCIe連接至標準的機架式x86伺服器,但我們還是提供了在 AWS FPGA 加速的 EC2 F1 執行個體上運行 FPGA 的能力,這能加速採用雲端的作業負載,甚至落實結合本地和雲端運算的混合部署模型。」


McGarry預計隨著時間的推移,混合部署將變得越來越重要。「很明顯地,我們無法即時將『所有』的邊緣資料傳送至雲端,且也不符合成本效益。因此,我們將看到具有前瞻性的分析平台在邊緣,利用一些有意義的資料分析進行資料處理,這將減少傳送到雲端的資料,以進行更廣泛的處理。」McGarry同意FPGA在混合方程式的兩端皆佔有一席之地,並補充表示:「FPGA 在各種機器學習用途中所能提供的邊緣運算加速能力,將由今天的小眾應用,擴展為廣受資料分析領域關注的方法。」


展望未來,隨著資料產生速度不斷的提高,即時演算法能力、儲存、網路頻寬、運算效能和人類分析能力都很難同時並進,因此,機器學習對於未來的有效資料分析而言,將變得前所未有的重要。


結論

企業和科學使用者越來越意識到,從物理和虛擬世界中收集到的大量資料所擁有的價值。對資料分析的需求通常與正在產生的資料量成正比,因此,隨著資料量持續呈指數增長,對資料分析的需求將以類似的速率增加。


當代的硬體和軟體架構無法以低成本的方式來滿足資料產生、儲存和分析的需求,因此,迫切需要採用適當地耦合CPU和FPGA資源之異質運算平台的新穎方法。FPGA具有可配置性、靈活性、並行性和功率效率,可確保有效且高效地對資料處理作業負載進行加速。


(本文作者Daniel Eaton為賽靈思策略市場開發資深經理)


相關文章
FPGA開啟下一個AI應用創新時代
以協助因應AI永無止盡的能源需求為使命
大數據和AI預測助力 快土石流不只一步!
未來無所不在的AI架構導向邊緣和雲端 逐步走向統一與可擴展
專攻低功耗工業4.0應用 可程式化安全功能添防禦
comments powered by Disqus
相關討論
  相關新聞
» 數智創新大賽助力產學接軌 鼎新培育未來AI智客
» 巴斯夫與Fraunhofer研究所共慶 合作研發半導體產業創新方案10年
» 工研院IEK眺望2025:半導體受AI終端驅動產值達6兆元
» ASM攜手清大設計半導體製程模擬實驗 亮相國科會「科普環島列車」
» SEMI提4大方針增台灣再生能源競爭力 加強半導體永續硬實力


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.188.109.38
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw