• <li id="yeaqi"><button id="yeaqi"></button></li>
  • <fieldset id="yeaqi"></fieldset>
    <fieldset id="yeaqi"><table id="yeaqi"></table></fieldset>

    •  

      全球觀熱點:英偉達發(fā)布DGX GH200超級計算機:集成256個GH200芯片
      發(fā)布時間:2023-05-29 16:25:09 文章來源:IT之家
      DGXGH200人工智能超級計算平臺是英偉達針對最高端的人工智能和高性能計算工作負載而設計的系統(tǒng)和參考架構,


      (相關資料圖)

      IT之家 5 月 29 日消息,英偉達今日在 2023 臺北電腦展大會上發(fā)布了多項重磅消息,其中最引人注目的是其 Grace Hopper 超級芯片已經(jīng)全面投產(chǎn)。這些芯片是英偉達新推出的 DGX GH200 人工智能超級計算平臺和 MGX 系統(tǒng)的核心組件,它們專為處理海量的生成型人工智能任務而設計。英偉達還宣布了其新的 Spectrum-X 以太網(wǎng)網(wǎng)絡平臺,專為人工智能服務器和超級計算集群而優(yōu)化。

      Grace Hopper 超級芯片是英偉達開發(fā)的基于 Arm 架構的 CPU+GPU 集成方案,它將 72 核的 Grace CPU、Hopper GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一個封裝中,共有 2000 億個晶體管。這種組合提供了 CPU 和 GPU 之間驚人的數(shù)據(jù)帶寬,高達 1 TB / s,為某些內(nèi)存受限的工作負載提供了巨大的優(yōu)勢。

      DGX GH200 人工智能超級計算平臺是英偉達針對最高端的人工智能和高性能計算工作負載而設計的系統(tǒng)和參考架構,目前的 DGX A100 系統(tǒng)只能將八個 A100 GPU 聯(lián)合起來作為一個單元,考慮到生成型人工智能的爆炸式增長,英偉達的客戶迫切需要更大、更強大的系統(tǒng),DGX GH200 就是為了提供最大的吞吐量和可擴展性而設計的,它通過使用英偉達的定制 NVLink Switch 芯片來避免標準集群連接選項(如 InfiniBand 和以太網(wǎng))的限制。

      DGX GH200 的細節(jié)還不太清楚,但已確認英偉達使用了一種新的 NVLink Switch 系統(tǒng),包含 36 個 NVLink 開關,將 256 個 GH200 Grace Hopper 芯片和 144TB 的共享內(nèi)存連接成一個單元,英偉達 CEO 黃仁勛表示,GH200 芯片為“巨型 GPU”。這是英偉達第一次使用 NVLink Switch 拓撲結構來構建整個超級計算機集群,英偉達稱這種結構提供了比前一代系統(tǒng)高出 10 倍的 GPU 到 GPU 和 7 倍的 CPU 到 GPU 的帶寬。它還設計了提供比競爭對手高出 5 倍的互連功耗效率和高達 128 TB / s 的對分帶寬。該系統(tǒng)有 150 英里(IT之家備注:約 241.4 公里)的光纖,并且重達 4 萬磅,但是呈現(xiàn)出來就像一個單一的 GPU。英偉達表示,256 顆 Grace Hopper 超級芯片將 DGX GH200 的“AI 性能”提升到了 exaflop(一百萬萬億次)。

      英偉達將把 DGX GH200 的參考藍圖提供給其主要客戶谷歌、Meta 和微軟,并且還將把該系統(tǒng)作為云服務提供商和超大規(guī)模數(shù)據(jù)中心的參考架構設計。英偉達自己也將部署一個新的英偉達 Helios 超級計算機,由四個 DGX GH200 系統(tǒng)組成,用于自家的研發(fā)工作。這四個系統(tǒng)共有 1024 個 Grace Hopper 芯片,并且用英偉達的 Quantum-2 InfiniBand 400 Gb / s 網(wǎng)絡連接起來。

      英偉達 DGX 面向最高端的系統(tǒng),HGX 系統(tǒng)面向超大規(guī)模數(shù)據(jù)中心,而新的 MGX 系統(tǒng)則處于這兩者之間,而且 DGX 和 HGX 將與新的 MGX 系統(tǒng)共存。英偉達的 OEM 合作伙伴在設計人工智能中心的服務器時面臨著新的挑戰(zhàn),會降低設計和部署的速度。英偉達的新 MGX 參考架構旨在加快這一過程,提供了 100 多種參考設計。

      MGX 系統(tǒng)由模塊化設計組成,涵蓋了英偉達的 CPU 和 GPU、DPU 和網(wǎng)絡系統(tǒng)的各個方面,但也包括了基于常見的 x86 和 Arm 處理器的設計。英偉達還提供了空冷和液冷的設計選項,以適應各種應用場景。華碩、技嘉、永擎和和碩都將使用 MGX 參考架構來開發(fā)將在今年晚些時候到明年初推出的系統(tǒng)。

      至于新的 Spectrum-X 網(wǎng)絡平臺,英偉達稱它為“專為人工智能而打造的高性能以太網(wǎng)”網(wǎng)絡平臺。Spectrum-X 設計采用了英偉達的 51 Tb / s Spectrum-4 400 GbE 以太網(wǎng)交換機和英偉達 Bulefield-3 DPU,搭配軟件和 SDK,使開發(fā)人員能夠根據(jù) AI 工作負載的獨特需求調(diào)整系統(tǒng)。

      與其他基于以太網(wǎng)的系統(tǒng)相比,英偉達稱 Spectrum-X 是無損的,從而提供了更好的 QoS 和延遲。它還具有新的自適應路由技術,這在多租戶環(huán)境中特別有用。

      關鍵詞:

      樂活HOT

      娛樂LOVE