HPE 宣布獲選為美國能源部(DOE)的橡樹嶺國家實驗室(Oak Ridge National Laboratory, ORNL)建造兩套超級運算系統,旨在推進美國於AI與超級運算領域的領導地位,並支援科學、能源和國家安全發展。此兩套系統包括次世代的百萬兆級(Exascale)超級電腦「Discovery」,其將接替該實驗室的 Frontier(由HPE建造並突破百萬兆級運算門檻的超級電腦);以及一個新的AI叢集「Lux」系統,該叢集將透過多租戶(multi-tenant)雲端化平台,協助美國能源部推進 AI 與機器學習的計畫。
Discovery 將採用全新的 HPE Cray Supercomputing GX5000,此為 HPE 針對領導級系統推出的次世代超級運算平台,利用統一的AI與高效能運算(HPC)架構簡化全站點和分散式叢集的運作。其將搭載內嵌分散式非同步物件儲存(Distributed Asynchronous Object Storage, DAOS)的全新 HPE Cray Supercomputing Storage Systems K3000(作為 HPE Cray Supercomputing GX5000 的選配儲存系統)進行增強。再者,Discovery 進一步提升 HPE Frontier 超級電腦的百萬兆級運算能力,協助該實驗室在各個科學領域開創新視野,同時推動創新與安全使命。
Discovery 將為 AI、高效能運算與量子運算提供全新功能,預計可將特定應用程式的生產力提高十倍1,協助科學家加速在精準醫療、癌症研究、核能和航太等領域取得突破。
Lux 是一套專用的 AI 系統,採用直接液冷式(direct liquid-cooled)的 HPE ProLiant Compute XD685,並搭載 AMD Instinct MI355X GPU、AMD EPYC™ CPU 與 AMD Pensando™ 網路。Lux 旨在增強對 AI 資源的存取,為全美研究人員提供雲端般的存取權限,能連接至專為訓練與推論配備資源的主權 AI 工廠(sovereign AI factory)。
HPE 總裁暨執行長 Antonio Neri 表示,我們很榮幸能憑藉此一領導創新技術,持續與美國能源部、橡樹嶺國家實驗室和 AMD 建立強大的公私夥伴關係,透過打造 Discovery 和 Lux 系統,加速推動科學探索和 AI 創新的下一個時代。
橡樹嶺領導運算中心(Oak Ridge Leadership Computing Facility)科學總監 Bronson Messer 則表示,期待 Discovery 和 Lux 系統能協助實驗室研究人員擴展科學研究,且 Discovery 將為高效能運算、AI 與量子運算融合能力的新境界奠定基礎,結合其他系統提供更深入的洞察,以及 Lux 將大幅擴展研究人員對專用 AI 資源的存取。我們期待這兩套系統將有助於生產力的典範轉移(paradigm shift),並在各個關鍵的科學研究和領導領域達到前所未有的成果。
AMD董事長暨執行長蘇姿丰博士(Dr. Lisa Su)表示,過去十多年,AMD 與 HPE 持續攜手突破高效能運算的極限,提供能探索並改變世界的解決方案,我們與橡樹嶺國家實驗室攜手合作,透過 Discovery 和 Lux 推進次世代 AI 系統的發展,賦能研究人員加速創新,並鞏固美國在科學與技術領域的領導地位。
進一步了解次世代百萬兆級的超級電腦 Discovery
Discovery 的技術突破源於 HPE 全新推出的HPE Cray Supercomputing GX5000。HPE Cray Supercomputing GX5000 專為百萬兆級運算打造,在CPU、GPU、加速器、網路、軟體、儲存與液冷方面,皆具備先進的端到端能力。透過全新架構,Discovery將提供:
- 更高效能與最佳化空間:此新平台專為擴展至百萬兆級效能所打造。相較於上一代2,具有更高密度,每機櫃所需的資料中心空間減少 25%。
- HPE Slingshot 提供高效能互連(Interconnect):次世代 HPE Slingshot 為 Discovery 提供現代化且高效能的互連網路,滿足 HPC、機器學習與分析應用程式對高頻寬、低延遲網路的需求。
- 業界首創的 HPC DAOS 儲存效能3:藉由全新的 HPE Cray Supercomputing Storage Systems K3000,Discovery 每個儲存機架的每秒輸入/輸出操作數(IOPS)與Frontier相比將增加 300%4,使 AI 應用程式能以更高生產力運行。HPE Cray Supercomputing Storage Systems K3000 為業界首個內嵌分散式非同步物件儲存(DAOS)開源軟體的原廠建置(factory-built)儲存系統,其為一款具備成本效益的全快閃(all-flash)儲存系統,能與同樣搭載於 Discovery 的 Lustre檔案系統 HPE Cray Supercomputing Storage Systems E2000 互補。
- 次世代液冷加速運算:Discovery 將搭載代號為「Venice」的次世代AMD EPYC處理器與 AMD Instinct MI430X GPU,為建模、模擬和 AI 專案提供進階的效能及準確性。憑藉 HPE 在液冷領域長達 50 年創新的經驗5,Discovery 運算基礎架構將採用完全液冷技術,以最佳化超級運算環境中的能源效率與成本效益。

1 與橡樹嶺國家實驗室前一代超級電腦Frontier相比的應用程式效能。
2 GX5000單一900毫米機櫃的尺寸與EX4000的1,200毫米機櫃相比。
3 基於DAOS的儲存系統於全球IO500儲存基準測試中名列第1與第2位,且其合計的儲存基準分數是排在其後30個儲存系統總和的四倍。
4 部署於Frontier超級電腦的Cray ClusterStor E1000儲存系統,每個儲存機櫃能提供高達1,800萬次IOPS(每秒輸入/輸出操作),而部署於Discovery超級電腦的 HPE Cray Supercomputing Storage Systems K3000則能提供高達7,500萬次 IOPS。
5 Cray-1超級電腦於1975年推出。

