在9月18日開幕的華為全聯(lián)接2019大會上,號稱全球最快AI訓(xùn)練集群華為Atlas 900發(fā)布。它是如何構(gòu)成的,有哪些優(yōu)勢,又能被應(yīng)用到哪些領(lǐng)域,下面讓我們來一一解密。
集成數(shù)千顆昇騰910AI處理器

Atlas 900 AI訓(xùn)練集群,由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,最終成為當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計算能力。
目前,華為已在華為云上部署了一個Atlas 900 AI訓(xùn)練集群,集群規(guī)模為1024顆昇騰910 AI處理器。基于當(dāng)前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數(shù)據(jù)集”,Atlas 900AI訓(xùn)練集群只需59.8秒就可完成訓(xùn)練,排名全球第一。

“ ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓(xùn)練集群比第2名快15%。
Atlas 900 AI訓(xùn)練集群領(lǐng)先技術(shù)優(yōu)勢
首先是AI算力業(yè)界領(lǐng)先。Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。其次是最佳集群網(wǎng)絡(luò)。Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時延,梯度同步時延縮短10~70%。此外還有系統(tǒng)級調(diào)優(yōu)。Atlas 900 AI訓(xùn)練集群通過華為集合通信庫和作業(yè)調(diào)度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強(qiáng)大性能。最后是極致散熱系統(tǒng)。Atlas 900 AI訓(xùn)練集群采用全液冷方案,創(chuàng)新性設(shè)計業(yè)界最強(qiáng)柜級密閉絕熱技術(shù),支撐>95%液冷占比。單機(jī)柜支持高達(dá)50kW超高散熱功耗,實現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。
Atlas 900 AI 集群適用場景
Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供超強(qiáng)算力,可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快地進(jìn)行圖像、視頻和語音等AI模型訓(xùn)練,可被應(yīng)用于探索宇宙奧秘、預(yù)測天氣、勘探石油和加速自動駕駛的商用進(jìn)程。

如在天文探索方面,在一張匯聚有20萬顆星星的南半球星空圖上,天文學(xué)家想找出某種特征的星體,需要169天的工作量。Atlas 900,只需要10秒。
推薦閱讀
Facebook推出Portal TV,可通過電視進(jìn)行視頻聊天
據(jù)CnBet消息稱,F(xiàn)acebook宣布推出Portal TV,這是一款將公司的廣角視頻聊天帶入家中最大屏幕的配件。Portal TV將于11月5日開始發(fā)售,售價149美元,2個捆綁售價248美元。用戶>>>詳細(xì)閱讀
本文標(biāo)題:解密華為Atlas 900:數(shù)千顆昇騰910構(gòu)成全球最快AI訓(xùn)練集群
地址:http://www.geekbao.cn/a/zhibo/308733.html