谷歌、微軟和Meta展示高性能計算機的新藍(lán)圖,微軟、GrandTeton
在最近的 OCP(開(kāi)放(fàng)計算項目)全球峰會上,谷歌、微軟和 Meta 展示了他們對高性能計算機的新藍(lán)圖,而這種新一(yī)代設計的出現有可能改變傳統的服務器架構。數據顯示,雲提供商(shāng)将繼續降低 CPU 的優先級,同時更多地關注網絡、存儲和加速器,例如 GPU 和 AI 芯片。
元:大(dà)提頓
Meta 推出了名爲 Grand Teton 的服務器,以及基于其磁盤對應物(wù)的配套“Grand”大(dà)容量存儲陣列。該公司正在爲數據中(zhōng)心部署服務器以運行人工(gōng)智能應用程序。Meta 的工(gōng)程副總裁表示,Meta 的目标是爲其大(dà)型數據中(zhōng)心帶來更多的 AI 功能,這支持其社交媒體(tǐ)平台上的許多功能,同時也爲未來的元宇宙做準備。
大(dà)提頓
Grand Teton 是 2021 年推出的 Zion-EX 擴展系統的繼任者。Grand Teton 的速度明顯快于其前身,主機到 GPU 的帶寬是其四倍,計算能力和吞吐量是其兩倍。
與包含多個獨立子系統的 Zion 和 Zion 不同,Grand Teton 系統是單闆設計,包括 CPU、GPU、PCI 交換機和網絡接口卡在内的所有組件都可以插入其中(zhōng)。這提高了系統的可靠性,減少了電(diàn)纜和連接的數量,并減少了故障的機會。事實上,Grand Teton 的設計完全消除了除電(diàn)源和網絡之外(wài)的任何外(wài)部布線。
Meta 計劃到 2025 年建立一(yī)個擁有 4000 多個加速器的大(dà)型集群。核心将被組織成一(yī)個網格,加速器之間的帶寬将達到每秒 1 TB。
Meta 的服務器設計基本方法包括在系統和芯片級别移除不必要的組件和縮小(xiǎo)硬件。縮小(xiǎo)系統和芯片尺寸将有助于創建 AI 訓練集群,這些集群将消耗更多功率,但也提供更高的每瓦性能。表示深度學習模型的參數将增長到數萬億,可能需要計算來訓練。“人工(gōng)智能和機器學習模型正變得越來越強大(dà)和複雜(zá),需要更多高性能的基礎設施來匹配。”
微軟:山。
微軟展示了一(yī)個名爲 Mt. 的模塊化系統,這是一(yī)個可以容納人工(gōng)智能和高性能計算加速器的機箱。它的使命是“将開(kāi)源和開(kāi)放(fàng)協作的優勢應用到硬件上”。
在高性能計算、人工(gōng)智能和視頻(pín)編解碼器領域,需要一(yī)種将外(wài)形尺寸、電(diàn)源和管理接口整合到模塊化設計中(zhōng)的融合架構。Mt. 是一(yī)個模塊化機箱,可将多個加速器集成到一(yī)個支持 48V 供電(diàn)的機箱中(zhōng)。Mt. 與 Molex 合作設計,旨在與 Open Rack V3 完全兼容,具有支持大(dà)功率設備的模塊化外(wài)形,以及可靈活改變模塊之間連接的熱插拔模塊。Mt 還支持将主機連接到機箱的額外(wài)靈活性。
微軟山模塊化架構
微軟表示,Mt. 解決了在數據中(zhōng)心實施加速器時面臨的常見問題。加速器可以在數據中(zhōng)心電(diàn)源、冷卻和連接指南(nán)中(zhōng)輕松實施,并自動與基于軟件的管理接口進行硬件控制。
根據 64 首席分(fēn)析師的說法,加速器的多樣化服務器硬件一(yī)直是當務之急。今年的OCP峰會讨論了CXL(鏈接)這個話(huà)題。
CXL 是一(yī)個關鍵構建塊,旨在改變服務器的設計、定制和配置方式。CXL 允許更輕松地選擇和組裝服務器構建塊。該技術提供計算、内存和存儲系統之間的通信連接,并包括跨服務器提供和管理計算的工(gōng)具。
“雖然支持 CXL 的通用處理器尚未發布(包括 Intel 和 AMD 的 Genoa),但 CXL 已被迅速接受,”他說。
谷歌:多
在 OCP 峰會上, 提出了未來“多)服務器的願景,它将存儲、加速器、内存和基礎設施處理單元組合到單獨的托盤中(zhōng)。模塊化硬件架構基于包括 CXL 和 NVMe 在内的互連以及分(fēn)布式系統管理工(gōng)具比如和。
将傳統服務器設計轉變爲跨大(dà)型機計算、加速器、内存擴展托盤、基礎設施處理單元的更加模塊化和分(fēn)布式的系統。
表示小(xiǎo)型服務器制造商(shāng)會對 CXL 感到興奮。“随着這些産品的問世,我(wǒ)認爲較小(xiǎo)的服務器制造商(shāng),特别是在雲計算領域基于網絡硬盤的設計,将會關注這些技術。”
關于 OCP
開(kāi)放(fàng)計算項目基金會(OCP)成立于 2011 年,是由 Meta、Intel、 Sachs 和 Sachs 聯合發起的開(kāi)源硬件組織。其使命是将開(kāi)源和開(kāi)放(fàng)協作的優勢應用到硬件上,圍繞數據中(zhōng)心網絡設備、通用和 GPU 服務器、存儲設備和設備,可擴展的機架設計正在迅速加快創新步伐。
今年的OCP峰會于10月18日至20日在加利福尼亞州聖何塞舉行基于網絡硬盤的設計,參展商(shāng)超過60家。本次會議探讨的主題不再僅僅是計算、存儲和網絡,還包括加速器、CXL 内存、機架和電(diàn)源、數據中(zhōng)心設施、光學、安全等。
微信公衆号後台回複“”獲取數據下(xià)載
*本文編譯自
了解更多學習網絡推廣知(zhī)識,就來廣西網絡推廣。
上一(yī)篇:微型消防站聯勤聯訓工(gōng)作實施細則(試行)總則第一(yī)條广西南宁弄潮营销策划有限责任公司 : 版權所有