Atlas 900 AI 訓練集群介紹
在大型數(shù)據(jù)集上進行訓練的神經(jīng)網(wǎng)絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統(tǒng)等各個方面,訓練這些神經(jīng)網(wǎng)絡模型需要大量浮點計算能力。近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規(guī)模分布式AI集群環(huán)境來提升神經(jīng)網(wǎng)絡訓練系統(tǒng)的浮點計算能力。
此次發(fā)布的Atlas 900 AI訓練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構成,是當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
Atlas 900 AI訓練集群領先技術優(yōu)勢
AI算力業(yè)界領先
Atlas 900 AI訓練集群采用業(yè)界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓練集群將數(shù)千顆昇騰910 AI處理器互聯(lián),打造業(yè)界第一的算力集群。
昇騰910 AI處理器采用SoC設計,集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數(shù)據(jù)預處理任務,充分提升訓練效率。
最佳集群網(wǎng)絡
Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡,降低網(wǎng)絡時延,梯度同步時延縮短10~70%。
在AI服務器內部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍,使得數(shù)據(jù)傳輸更加快速和高效。在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內的所有AI服務器接入高速交換網(wǎng)絡。
獨創(chuàng)iLossless 智能無損交換算法,對集群內的網(wǎng)絡流量進行實時的學習訓練,實現(xiàn)網(wǎng)絡0丟包與E2E μs級時延。
責任編輯:楊林宇
特別聲明:本網(wǎng)登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網(wǎng)贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯(lián)系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。
- 華為“企業(yè)智慧屏”曝光,可連接電腦和手機2020-02-21
- 華為回應美司法部提起新訴訟:新指控缺乏依據(jù)2020-02-14
- 華為手機新設計專利曝光:后置“X”五攝2020-01-21
- 最新科技前沿 頻道推薦
-
CETV4課堂怎么回看直播 CETV4課堂直播回看教2020-02-24
- 進入新聞頻道新聞推薦
- AI畫筆勾勒戲曲新美學
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻
- 一周熱點新聞


已有0人發(fā)表了評論