
英特爾最近宣布Habana Gaudi深度學(xué)習(xí)處理器在MLPerf行業(yè)測(cè)試優(yōu)于英偉達(dá)A100提交的AI5月在英特爾的訓(xùn)練時(shí)間突出On產(chǎn)業(yè)創(chuàng)新峰會(huì)發(fā)布Gaudi視覺(jué)上處理器(ResNet-50)和語(yǔ)言(BERT)訓(xùn)練時(shí)間在模型上的優(yōu)勢(shì)。
芯片采購(gòu)網(wǎng)專注于整合國(guó)內(nèi)外授權(quán)IC代理商現(xiàn)貨資源,芯片庫(kù)存實(shí)時(shí)查詢,行業(yè)價(jià)格合理,采購(gòu)方便IC芯片,國(guó)內(nèi)專業(yè)芯片采購(gòu)平臺(tái)。
英特爾執(zhí)行副總裁、數(shù)據(jù)中心和人工智能部總經(jīng)理 Sandra Rivera很高興能和大家分享Gaudi 2在MLPerf我也為英特爾團(tuán)隊(duì)在產(chǎn)品發(fā)布僅一個(gè)月的成績(jī)感到自豪。我們相信,在視覺(jué)和語(yǔ)言模型中提供領(lǐng)先的性能可以給客戶帶來(lái)價(jià)值,有助于加速他們AI深入學(xué)習(xí)解決方案。”
借助Habana Labs的Gaudi該平臺(tái),英特爾數(shù)據(jù)中心團(tuán)隊(duì)可以專注于深度學(xué)習(xí)處理器技術(shù),使數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師能夠有效地進(jìn)行模型培訓(xùn),實(shí)現(xiàn)新模型構(gòu)建或現(xiàn)有模型遷移,提高工作效率,降低運(yùn)營(yíng)成本。
Habana Gaudi2處理器縮短訓(xùn)練時(shí)間(TTT)與第一代相比Gaudi有了顯著的提升。Habana Labs2022年5月提交的Gaudi2處理器在視覺(jué)和語(yǔ)言模型訓(xùn)練時(shí)間上已經(jīng)超過(guò)了英偉達(dá)A100-80G的MLPerf測(cè)試結(jié)果。其中,針對(duì)視覺(jué)模型ResNet-50,Gaudi2處理器的TTT結(jié)果與英偉達(dá)相比A100-80GB與戴爾提交的相比,縮短了36%。ResNet-50和BERT模型,使用8個(gè)加速器A100-40GB服務(wù)器,Gaudi2的TTT測(cè)試結(jié)果縮短了45%。
MLCommons2022年6月發(fā)布的數(shù)據(jù)。https://mlcommons.org/en/training-normal-20/
與第一代相比Gaudi處理器,Gaudi2在ResNet-訓(xùn)練吞吐量增加了50模型的3倍,BERT訓(xùn)練模型的吞吐量增加了4.7倍。這是因?yàn)楣に噺?6納米到7納米,Tensor處理器內(nèi)核數(shù)量增加了三倍GEMM高帶寬存儲(chǔ)容量的發(fā)動(dòng)機(jī)計(jì)算能力和包裝增加了三倍,SRAM帶寬增加,容量增加一倍。訓(xùn)練視覺(jué)處理模型,Gaudi2集成媒體處理引擎的處理器可以獨(dú)立完成AI對(duì)壓縮圖像進(jìn)行數(shù)據(jù)增強(qiáng)和預(yù)處理。
兩代Gaudi在沒(méi)有特殊軟件操作的情況下,處理器的性能是通過(guò)的Habana實(shí)現(xiàn)客戶開(kāi)箱即用的商業(yè)軟件棧。
在商用軟件提供的開(kāi)箱即用性能中Habana 8個(gè)GPU服務(wù)器與HLS-Gaudi2參考服務(wù)器上的測(cè)試比較。其中,訓(xùn)練吞吐量來(lái)自NGC和Habana公共庫(kù)的TensorFlow docker,在混合精度訓(xùn)練模式下測(cè)量雙方推薦的最佳性能參數(shù)。值得注意的是,吞吐量是影響最終訓(xùn)練時(shí)間收斂的關(guān)鍵因素。
圖形測(cè)試配置詳見(jiàn)說(shuō)明部分。
圖形測(cè)試配置見(jiàn)說(shuō)明部分。
除了Gaudi2在MLPerf測(cè)試中的優(yōu)異表現(xiàn),第一代Gaudi128加速器和256加速器RBelFuse代理esNet基準(zhǔn)測(cè)試顯示出強(qiáng)大的性能和令人印象深刻的近線性擴(kuò)展,支持客戶高效的系統(tǒng)擴(kuò)展。
Habana Labs首席運(yùn)營(yíng)官Eitan Medina說(shuō):我們最新的MLPerf測(cè)試結(jié)果證明Gaudi2在訓(xùn)練性能方面具有顯著優(yōu)勢(shì)。我們將繼續(xù)深入學(xué)習(xí)訓(xùn)練結(jié)構(gòu)和軟件創(chuàng)新,創(chuàng)造最具成本效益的AI訓(xùn)練解決方案。
關(guān)于MLPerf基準(zhǔn)測(cè)試:MLPerf社區(qū)旨在設(shè)計(jì)公平實(shí)用的基準(zhǔn)測(cè)試,公平測(cè)量機(jī)器學(xué)習(xí)解決方案的準(zhǔn)確性、速度和效率。該社區(qū)來(lái)自學(xué)術(shù)界、研究實(shí)驗(yàn)室和行業(yè)AI領(lǐng)導(dǎo)者建立了基準(zhǔn),制定了一套嚴(yán)格的規(guī)則,以確保所有參與者都能公平公正地進(jìn)行性能比較。基于一套明確的規(guī)則,能夠公平比較端到端任務(wù),目前MLPerf是AI行業(yè)唯一可靠的基準(zhǔn)測(cè)試。此外,MLPerf同行對(duì)基準(zhǔn)測(cè)試結(jié)果進(jìn)行為期一個(gè)月的評(píng)估,這將進(jìn)一步驗(yàn)證報(bào)告結(jié)果。
說(shuō)明:
ResNet-50性能比較中使用的測(cè)試配置
A100-80GB:Habana于2022年4月在Azure實(shí)例Standard_ND96amsr_A100_v4上測(cè)量,使用一個(gè)A100-80GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
A100-40GB:Habana于2022年4月在DGX-A測(cè)量100,使用一個(gè)A100-40GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
V100-32GB?:Habana于2022年4月在p3dn.24xlarge測(cè)量,使用一個(gè)V100-32GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
Gaudi2:Habana于2022年5月在Gaudi2-HLS測(cè)量系統(tǒng),使用一個(gè)Gaudi二、其中應(yīng)用SynapseAI TF docker 1.5.0(BS=256)
結(jié)果可能會(huì)有所不同。
BERT性能比較中使用的測(cè)試配置
A100-80GB:Habana于2022年4月在Azure實(shí)例Standard_ND96amsr_A100_v4.測(cè)試,使用一個(gè)A100-80GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=312,accu steps=256;Phase-2:seq len=512,BS=40,accu steps=768)
A100-40GB:Habana于2022年4月在DGX-A100測(cè)試,使用一個(gè)A100-40GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)
V100-32GB:Habana于2022年4月在上p3dn.24xlarge測(cè)試,使用一個(gè)V100-32GB,包含NGC的TF docker 21.12-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=8,accu steps=4096)
Gaudi2:Habana于2022年5月在上Gaudi2-HLS測(cè)試,使用一個(gè)Gaudi2,包含SynapseAI TF docker 1.5.0(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)
結(jié)果可能會(huì)有所不同。
Habana Labs、Habana、Habana標(biāo)識(shí)、Gaudi和SynapseAI是Habana Labs的商標(biāo)。
- 搶先看!CITE2022黑科技產(chǎn)品大盤(pán)點(diǎn)
- BOE出現(xiàn)在2022年智博會(huì)上 用屏幕物聯(lián)賦能智慧生活
- 半導(dǎo)體一周要聞3.7-3.11
- 瑞薩電子為全球員工推出了瑞薩日和星期五聚焦
- Snapdragon Sound驍龍暢聽(tīng)技術(shù)支持漫步者推出兩款全新的真無(wú)線半入耳藍(lán)牙耳機(jī)
- 西部數(shù)據(jù)公司推出了新的大容量SSD產(chǎn)品 支持大規(guī)模云數(shù)據(jù)中心的高性能性能
- LCD行業(yè)缺少一個(gè)重要的玩家 關(guān)閉生產(chǎn)線的知名品牌
- 卡脖子也沒(méi)用 國(guó)內(nèi)廠商繞過(guò)芯片新技術(shù)EUV光刻機(jī)
- 需要東數(shù)西算IDC,數(shù)字科技產(chǎn)業(yè)鏈需要全面協(xié)調(diào)
- 場(chǎng)景應(yīng)用推動(dòng)上游快速發(fā)展——IDC發(fā)布中國(guó)蜂窩通信模塊及應(yīng)用市場(chǎng)分析報(bào)告
- PCIe 5.0 SSD下半年開(kāi)戰(zhàn),選擇你的控制器參團(tuán)
- 哪吒汽車和英飛凌宣布了電動(dòng)汽車電池管理的整體解決方案
