來源:華爾街見聞
就在剛剛,$騰訊控股(00700.HK)$發(fā)布了號稱國內(nèi)性能最強的大模型計算集群。
據(jù)騰訊微信公眾號4月14日消息,騰訊云正式發(fā)布面向大模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計算集群。
【資料圖】
該集群采用騰訊云星星海自研服務(wù)器,搭載英偉達最新代次H800 GPU,服務(wù)器之間采用業(yè)界最高的3.2T超高互聯(lián)帶寬,為大模型訓(xùn)練、自動駕駛、科學(xué)計算等提供高性能、高帶寬和低延遲的集群算力。
據(jù)騰訊介紹,實測顯示,新一代集群整體性能比過去提升了3倍,是國內(nèi)性能最強的大模型計算集群。
早在去年10月,騰訊訓(xùn)練框架AngelPTM,完成了首個萬億參數(shù)大模型訓(xùn)練——混元NLP大模型訓(xùn)練。在同等數(shù)據(jù)集下,將訓(xùn)練時間由 50 天縮短到 11 天。如果基于新一代集群,訓(xùn)練時間將進一步縮短至 4 天。
針對大模型場景,星星海自研服務(wù)器采用 6U 超高密度設(shè)計,相較行業(yè)可支持的上架密度提高 30%;利用并行計算理念,通過 CPU 和 GPU 節(jié)點的一體化設(shè)計,將單點算力性能提升至更高。
除此以外,H800 GPU也是新集群的一大看點。公開資料顯示,H800為英偉達旗下最先進的芯片之一,對人工智能研發(fā)極為重要,其算力超過旗艦芯片A100三倍,這也是國內(nèi)首次發(fā)布搭載H800的大模型產(chǎn)品。
網(wǎng)絡(luò)層面,騰訊發(fā)布自研的星脈網(wǎng)絡(luò)能提供3.2T通信帶寬,為業(yè)內(nèi)最高數(shù)據(jù)。
騰訊表示,搭載同樣的GPU卡,3.2T星脈網(wǎng)絡(luò)相較前代網(wǎng)絡(luò),能讓集群整體算力提升20%,使得超大算力集群仍然能保持通信開銷比和吞吐性能。并提供單集群高達十萬卡級別的組網(wǎng)規(guī)模,支持更大規(guī)模的大模型訓(xùn)練及推理。
存儲層面,幾千臺計算節(jié)點同時讀取一批數(shù)據(jù)集,需要盡可能縮短加載時長。騰訊云自研的文件存儲、對象存儲架構(gòu),具備TB級吞吐能力和千萬級IOPS,滿足大模型訓(xùn)練的大數(shù)據(jù)量存儲要求。
新一代集群還集成了騰訊云自研的 TACO 訓(xùn)練加速引擎,對網(wǎng)絡(luò)協(xié)議、通信策略、AI 框架、模型編譯進行大量系統(tǒng)級優(yōu)化,大幅節(jié)約訓(xùn)練調(diào)優(yōu)和算力成本。
另外,騰訊自研芯片已經(jīng)量產(chǎn),包括用于AI推理的紫霄芯片。它采用自研存算架構(gòu)和自研加速模塊,可以提供高達3倍的計算加速性能和超過45%的整體成本節(jié)省。
在上月召開的電話會議上,騰訊方面表示,未來將投入大量資源并建立自己的基礎(chǔ)模型,并將其整合進公司的所有業(yè)務(wù)中。不過騰訊表示,將做對的事,不會倉促行事。
騰訊還說,AIGC可以用來提升騰訊旗下旗艦產(chǎn)品的用戶體驗。未來可能每一個用戶都會有人工智能助理,如果效果好,有可能將生成式AI納入微信和QQ。
關(guān)鍵詞:

10天超2500萬玩家 《守望先
綠竹生物通過港交所聆訊 核
電話車險便宜嗎(電話車險怎
【電訴寶】“中公教育”被指
快訊 | 迅銷集團2023上半
移動5G安全監(jiān)測 守大壩安全
48小時點擊排行
