NVIDIA (輝達) 本月3日宣布 NVIDIA GPU 雲 (NGC) 已支援微軟 Azure 平台,使成千上萬的開發者、資料科學家以及研究人員可以立即展開其 GPU 運算計畫。NGC 與 Azure 的可立即運作容器讓開發者不僅能隨時隨地使用 GPU 運算資源並針對需求進行擴充,還能消弭軟體整合與測試的複雜流程。
加速 AI 與 HPC 計畫
打造並測試可靠的軟體堆疊來執行如 TensorFlow、Microsoft Cognitive Toolkit、PyTorch 以及 NVIDIA TensorRT 等熱門的深度學習軟體,不僅困難重重且耗時,還涉及作業系統層級的驅動程式、函式庫以及執行時間,且許多套件還會建議採用不同的支援元件。不僅如此,各種框架與應用程式經常更新,意謂著每當釋出新版本時就必須再重複作業一遍,並測試新版本以確保它能提供和先前一樣好的效能。完成上述所有繁瑣工作後,才能真正開始執行計畫。
就 HPC 而言,其困難處在於如何將最新軟體部署到系統叢集,除了搜尋與安裝正確元件以及測試等各項作業外,還必須橫跨多個系統並在多租戶環境下完成上述作業。NGC 透過提供附有 GPU 加速軟體的預先設定容器,消除這些複雜程序。藉由 NVIDIA 持續的研發與投資,確保 NGC 的深度學習容器能發揮最新的 GPU 功能優勢。NVIDIA 在各種深度學習容器中針對完整軟體堆疊進行測試、調校以及最佳化,並每月定期更新以確保達到最佳效能。
NVIDIA 與 NGC 上其他容器的開發者合作,除了著手優化其應用程式外,還測試其效能與相容性。
NGC 搭配微軟 Azure
可以透過 35 種 GPU 加速容器運行各種深度學習軟體、HPC 應用程式、HPC 視覺化工具以及 NGC 容器庫中各夥伴的應用程式,並使用 NVIDIA GPU 於以下微軟 Azure 執行個體類型中運行:
‧ NCv3 (1、2 或4 顆 NVIDIA Tesla V100 GPU)
‧ NCv2 (1、2 或4 顆 NVIDIA Tesla P100 GPU)
‧ ND (1、2 或4 顆 NVIDIA Tesla P40 GPU)
相同的 NGC 容器還能在各種 Azure 執行個體類型中運行,甚至還能搭配不同種類或數量的 GPU。而使用 NGC 容器搭配 Azure 相當簡單,首先必須註冊取得免費的 NGC 帳號,接著只要連上微軟 Azure Marketplace,並找到適用於深度學習與 HPC 的 NVIDIA GPU 雲圖像,此為預先設定的 Azure 虛擬機器圖像,內含執行 NGC 容器所需的所有元件,並在 Azure 上啟動相容的 NVIDIA GPU 執行個體,再將想要用的容器從 NGC 庫推到運行中的執行個體。
除使用 Azure Marketplace 上 NVIDIA 發表的圖像來執行這些 NGC 容器外,還能運用 Azure Batch AI 在 Azure NCv2、NCv3以及 ND虛擬機器上的 NGC 下載與執行這些容器。依照 GitHub 的簡單指示即可在 NGC 容器啟動 Batch AI。藉由 NGC 支援 Azure,每個人皆能更輕易地在雲端環境中開始進行 AI 或 HPC。