Azure Nvidia A100 GPU雲端超級電腦服務正式上線
微軟Azure周三宣佈Azure ND A100 v4 Cloud GPU 執行個體正式上線(General Availability),號稱是雲端上的超級電腦。
這項服務搭載Nvidia A100 Tensor Core GPU,是為運算需求極大的任務,像是跑AI及高效能運算(high performance computing, HPC)的用戶而設計。微軟指出,ND A100 v4組合了市場產業標準的高效能運算(HPC)和AI工具及函式庫而成,不需任何專屬軟體或框架即可操作。
微軟表示,ND A100 v4使用的函式庫Nvidia NCCL 2也是市場上GPU加速的AI和HPC應用主流支援的函式庫,因此也不需擔心底層網路拓璞的問題。在同一Azure VM Scale Set中供應(provision)一個VM,網路互連設定會自動完成。
微軟宣稱,ND A100 v4 164個VM能產生16.59 petaflops的浮點運算能力。以世界五百大超級電腦排名來比擬,大約等同當今全球第20大運算系統。
雲端超級電腦
根據微軟的資料,ND A100 v4最基本層級為1 VM、8顆Nvidia Ampere架構的A100 Tensor Core GPUs,但單一叢集可不限顆數擴充GPU。每顆Nvidia A100 GPU使用Nvidia HDR 200Gb/s InfiniBand,使得每VM(8顆A100 GPU系統)產生驚人的1.6Tb/s互連頻寬。
此外,Azure還為每顆8-GPU的VM搭配NVLink互連以確保VM內GPU和GPU之間連線超過600 GB/s。
任何人都可以將本地部署的AI和HPC任務利用ND A100 v4帶上雲端,但如果是Azure原生部署的專案,則可使用Azure Machine Learning提供為ND A100 v4最佳化(內建驅動程式和函式庫)的VM及容器環境。此外還提供範本及Jupyter Notebook以協助使用者快速上手多種框架,包括PyTorch、TensorFlow以訓練BERT等模型。
目前ND A100 v4服務已在Azure 4個區域上線,包括美國東、西部、西歐和中美國中南區域。