PC應用PCI(Peripheral Component Interconnect)介面來連結各類周邊裝置已經行之有年,不僅成為業界的標準,整個PC產業也因之蓬勃發展。透過PCI介面所推出的顯示卡、音效卡、網路卡等等,各種創新加值讓PC從辦公室到個人都成為必要的應用配備。
當然,隨著PC主結構的發展,需要運算處理的數據越來越龐大,更高速的傳輸介面需求也隨之而來,因此由PCI-SIG組織在2003年制定了PCI Express (PCIe)1.0的新高速傳輸介面標準,速度為2.5 GT/s。然而PC處理器隨著摩爾定律發展速度倍增,高速傳輸介面也要跟著配合發展,從2003年到今2024年已經從PCIe1. 0發展到6.0,速度達到64 GT/s,預計2025年推出的PCIe 7.0版本將達到128 GT/s。
表一:PCIe版本比較表
版本
|
推出年份
|
速度
|
主要特點
|
PCIe 1.0
|
2003年
|
2.5 GT/s
|
引入串行連接,替代以往的並行架構
|
PCIe 2.0
|
2007年
|
5 GT/s
|
速度提升到原來的兩倍,引入了更高效的編碼方法(8b/10b)
|
PCIe 3.0
|
2010年
|
8 GT/s
|
進一步提升速度,並引入了128b/130b編碼技術
|
PCIe 4.0
|
2017年
|
16 GT/s
|
再次加倍數據傳輸速率,對信號完整性進行了增強
|
PCIe 5.0
|
2019年
|
32 GT/s
|
持續加倍帶寬,對高頻寬應用如AI、數據中心、高性能計算提供了更大的支持
|
PCIe 6.0
|
2022年
|
64 GT/s
|
引入了Pulse Amplitude Modulation 4 (PAM-4)技術,並包括向前錯誤更正(FEC)
|
PCIe 7.0
|
預計推出年份:2025年
|
128 GT/s
|
將再次加倍數據傳輸速率,預期將提供更高的能效,更低的延遲
|
AI PC帶動超大量數據傳輸
圖一 : PCIe在未來的AI伺服器或AI PC中將扮演一個關鍵性角色,主要由於其高速數據傳輸能力和廣泛的設備支持。 |
|
PCIe在未來的AI伺服器或AI PC中將扮演一個關鍵性角色,主要由於其高速數據傳輸能力和廣泛的設備支持。AI應用,尤其是那些涉及深度學習和機器學習的應用,對運算速度和數據處理能力有極高的要求,PCIe在這些領域提供了關鍵的基礎技術支持,主要原因有下列幾點:
1.AI工作負載需要高頻寬和低延遲:AI 工作負載通常需要處理大量數據,並且對延遲敏感。PCIe 提供了高頻寬和低延遲,這使其成為 AI 應用程序的理想選擇。
2.PCIe是一種成熟且廣泛採用的標準:這意味著它得到廣泛支持並且易於使用。這對於 AI 應用程序很重要,因為它們通常需要在各種硬體上運行。
3.PCIe不斷發展以滿足不斷變化的需求:PCIe 不斷發展以滿足不斷變化的需求。PCIe 5.0、6.0和7.0都提供了比以前版本更高的頻寬和更低的延遲。這意味著 PCIe 將繼續滿足AI應用程序不斷增長的性能需求。
以現有已推出的PCIe 5.0與6.0來看,PCIe 5.0提供了每秒32GT/s的數據傳輸速率,頻寬是PCIe 4.0的兩倍。這樣的提升對於需要高頻寬和低延遲的AI計算工作負荷來說,可以顯著提高效率和性能。
而PCIe 6.0預計將提供每秒64 GT/s的傳輸速率,這將進一步加強支持高性能計算應用,包括AI和機器學習。而且PCIe 6.0引入了Pulse Amplitude Modulation with 4 levels(PAM-4)和 Forward Error Correction(FEC)技術,這些都是為了提高信號完整性和增強錯誤校正能力,非常適合高負荷和要求苛刻的AI應用。
這些技術創新預示著PCIe在AI硬體發展中的關鍵角色,尤其是在訓練更為複雜、數據密集的AI模型方面。PCI-SIG(負責PCIe標準的組織)清楚地意識到了這一點,並在設計這些新標準時考慮到了未來AI和其他高性能應用的需求。
圖二 : 影片:PCI-SIG說明PCIe如何增強AI應用(source:https://youtu.be/FkEUT7e8Jy4?si=HE0P9r8nJCEFDsxe) |
|
PCIe在主機AI加速器的具體應用
在人工智慧(AI)的發展和應用中,專用的AI加速器已成為提高計算效率和處理速度的重要工具。這些加速器包括專門設計的硬體,如GPU、FPGA、ASIC和其他專為AI工作負載優化的設備。PCIe在連接這些AI加速器方面扮演了關鍵角色,以下是一些具體應用:
連接GPU
在AI中,特別是在深度學習和機器學習領域,GPU由於其大規模並行處理能力而被廣泛使用。PCIe介面允許多個GPU在單個主機或伺服器上高效通信,實現數據並行處理。高寬頻和低延遲的特性使PCIe成為連接GPU的理想選擇,尤其是當涉及到大規模數據集和複雜模型訓練時。
支援FPGA和ASIC
FPGA和ASIC提供了更高效的能源利用率和更快的處理速度,適合特定類型的計算任務,如圖像處理和語音識別。PCIe提供了足夠的靈活性和擴展性來支持這些加速器,使它們可以被直接插入到服務器的PCIe插槽中,並與主機系統的其他部件(如CPU和記憶體)進行高速數據交換。
模組化和擴展
在某些情況下,AI加速器需要可擴展的配置,以應對不斷增長的處理需求。PCIe技術的模組化設計允許輕鬆添加或升級加速器卡,支持企業根據需要擴展其計算能力。
數據中心和雲端運算
在數據中心和雲端運算環境中,AI加速器經常需要與大量的服務器和儲存系統協作。利用PCIe介面,數據中心可以實現加速器與服務器之間的高效連接,提高整體系統的性能和響應速度。
直接記憶體存取(DMA)
AI應用需要大量的數據交換,高效的數據傳輸對於性能至關重要。PCIe支持DMA,這允許AI加速器直接從主記憶體讀取或寫入數據,而無需CPU介入,這樣可以大幅提高數據處理速度和效率。
總之,PCIe以其高頻寬、低延遲和靈活的連接能力,是連接AI加速器的理想選擇,尤其適合處理大量數據和高速計算的AI應用。隨著技術的發展,PCIe將繼續支持更高效的AI計算解決方案。
PCIe在筆電或行動PC的具體應用
在AI筆記型電腦上,PCI Express(PCIe)扮演著至關重要的角色,提供高速數據傳輸通道以支援各種高性能計算任務。以下是PCIe在AI筆記型電腦上的一些具體應用:
GPU加速
AI應用,特別是深度學習和機器學習,大量依賴於圖形處理單元(GPU)來進行數據並行處理。PCIe提供高速連接,使筆記型電腦的主處理器(CPU)能夠快速與GPU通信,這對於需要大量運算的AI模型訓練和推理非常重要。使用PCIe x16插槽連接GPU,可以實現高頻寬數據傳輸,減少CPU和GPU之間的資料傳輸延遲。
高速儲存解決方案
筆記型電腦經常需要處理和儲存大量數據集。PCIe介面的固態硬碟(SSD),特別是支持NVMe技術的SSD,提供了遠超過傳統SATA SSD的讀寫速度,這對於加快數據處理和減少模型訓練時間至關重要。PCIe NVMe SSD通過直接連接至PCIe通道,提供更高的傳輸速率和更低的響應時間。
外部設備擴展
AI研究和開發經常需要使用多種外部設備,如額外的顯示器、高速網路介面卡或其他專業設備。PCIe通過外部擴展埠或通過Thunderbolt介面(基於PCIe技術)連接這些外部設備,提供了足夠的靈活性和擴展性。Thunderbolt 3和Thunderbolt 4介面允許筆記型電腦通過單一介面連接多達兩個4K顯示器以及其他高速周邊設備,同時還可以供電。
數據中心和雲連接
AI筆記型電腦在處理大型AI模型或數據集時,可能需要連接到數據中心或雲服務。PCIe網路卡(如10GbE卡)提供了高速網絡連接,支持快速的數據上傳和下載。高性能PCIe網路卡通過提供比標準乙太網更快的網路速度,使AI開發者能夠有效地與雲基礎設施互動。
這些應用展示了PCIe在AI筆記型電腦上的關鍵作用,特別是在需要高速數據處理和傳輸的場景中。隨著AI技術的進步,對於這些高性能連接技術的需求也將持續增長。
PCIe潛在的競爭者
表二:PCIe潛在競爭者性能比較
特性
|
PCIe
|
CXL
|
NVMe
|
USB
|
雷電
|
NVLink
|
頻寬
|
高
|
高
|
高
|
中等
|
高
|
高
|
延遲
|
低
|
低
|
低
|
中等
|
低
|
低
|
靈活性
|
高
|
高
|
中等
|
高
|
高
|
低
|
廣泛採用
|
高
|
低
|
高
|
高
|
高
|
低
|
複雜性
|
高
|
高
|
中等
|
低
|
中等
|
高
|
功耗
|
高
|
高
|
中等
|
低
|
中等
|
高
|
成本
|
高
|
高
|
中等
|
低
|
中等
|
高
|
PCIe的廣泛適用性、彈性和支持範圍使其成為許多系統和設備中的首選介面。每種技術都有其獨特的優勢和專門的應用場景,以下常見的幾種連結介面:
CXL(Compute Express Link)是一種新型互連標準,旨在滿足數據中心和高性能計算 (HPC) 的需求。CXL 提供比 PCIe 更高的頻寬和更低的延遲,並支持多處理器之間的互連。
NVMe(Non-Volatile Memory Express)是一種用於固態硬碟的互連標準。NVMe提供比傳統SATA介面更高的頻寬和更低的延遲。
USB(Universal Serial Bus)是一種通用互連標準,用於連接各種設備。USB 提供中等頻寬和中等延遲,但價格低廉且廣泛採用。最新的USB4標準支援與Thunderbolt 3兼容,其中包括利用PCIe通道進行數據傳輸的能力。這意味著具備USB4介面的設備可以實現類似於Thunderbolt的功能。
Thunderbolt是一種由Intel和Apple開發的高速互連標準。Thunderbolt提供比 USB更高的頻寬和更低的延遲,並支援多種設備類型。
NVLink是一種由NVIDIA開發的互連標準,專為多GPU系統而設計。NVLink 提供比PCIe更高的頻寬和更低的延遲,並支援多個GPU之間的互連。
總體而言,PCIe是一種功能強大的互連標準,可為各種應用提供高性能和靈活性。但是,對於具有特定需求的應用,其他標準(例如CXL、NVMe、USB、雷電和NVLink)可能更合適。在選擇互連標準時,務必考慮應用程序的具體需求,這些PCIe潛在的競爭者,與其說是競爭者,在很多面向反而是一種互補合作的應用。
結語
在AI廣泛應用的時代,從主機伺服器到AI筆電,高速傳輸的需求只有越來越高,應此PCIe等高速傳輸介面的發展也沒有止盡。甚至,為了因應AI周邊多元的應用,即插即用的高速傳輸介面也會有各種相互連接、互補應用的需求,這些都是業者在發展產品時所需要觀察選擇的重點。