国产精品久久精品牛牛影视-国产精品久久精品视-国产精品久久九九-国产精品久久久-国产精品久久久99

芯片采購(gòu),IC采購(gòu),芯片采購(gòu)平臺(tái)
芯片
每日新聞?lì)^條
Habana Gaudi2性能穩(wěn)超英偉達(dá)A100有助于實(shí)現(xiàn)高效率AI訓(xùn)練
(2025年5月21日更新)

英特爾最近宣布Habana Gaudi深度學(xué)習(xí)處理器在MLPerf行業(yè)測(cè)試優(yōu)于英偉達(dá)A100提交的AI5月在英特爾的訓(xùn)練時(shí)間突出On產(chǎn)業(yè)創(chuàng)新峰會(huì)發(fā)布Gaudi視覺(jué)上處理器(ResNet-50)和語(yǔ)言(BERT)訓(xùn)練時(shí)間在模型上的優(yōu)勢(shì)。

芯片采購(gòu)網(wǎng)專注于整合國(guó)內(nèi)外授權(quán)IC代理商現(xiàn)貨資源,芯片庫(kù)存實(shí)時(shí)查詢,行業(yè)價(jià)格合理,采購(gòu)方便IC芯片,國(guó)內(nèi)專業(yè)芯片采購(gòu)平臺(tái)

英特爾執(zhí)行副總裁、數(shù)據(jù)中心和人工智能部總經(jīng)理 Sandra Rivera很高興能和大家分享Gaudi 2在MLPerf我也為英特爾團(tuán)隊(duì)在產(chǎn)品發(fā)布僅一個(gè)月的成績(jī)感到自豪。我們相信,在視覺(jué)和語(yǔ)言模型中提供領(lǐng)先的性能可以給客戶帶來(lái)價(jià)值,有助于加速他們AI深入學(xué)習(xí)解決方案。”

借助Habana Labs的Gaudi該平臺(tái),英特爾數(shù)據(jù)中心團(tuán)隊(duì)可以專注于深度學(xué)習(xí)處理器技術(shù),使數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師能夠有效地進(jìn)行模型培訓(xùn),實(shí)現(xiàn)新模型構(gòu)建或現(xiàn)有模型遷移,提高工作效率,降低運(yùn)營(yíng)成本。

Habana Gaudi2處理器縮短訓(xùn)練時(shí)間(TTT)與第一代相比Gaudi有了顯著的提升。Habana Labs2022年5月提交的Gaudi2處理器在視覺(jué)和語(yǔ)言模型訓(xùn)練時(shí)間上已經(jīng)超過(guò)了英偉達(dá)A100-80G的MLPerf測(cè)試結(jié)果。其中,針對(duì)視覺(jué)模型ResNet-50,Gaudi2處理器的TTT結(jié)果與英偉達(dá)相比A100-80GB與戴爾提交的相比,縮短了36%。ResNet-50和BERT模型,使用8個(gè)加速器A100-40GB服務(wù)器,Gaudi2的TTT測(cè)試結(jié)果縮短了45%。

MLCommons2022年6月發(fā)布的數(shù)據(jù)。https://mlcommons.org/en/training-normal-20/

與第一代相比Gaudi處理器,Gaudi2在ResNet-訓(xùn)練吞吐量增加了50模型的3倍,BERT訓(xùn)練模型的吞吐量增加了4.7倍。這是因?yàn)楣に噺?6納米到7納米,Tensor處理器內(nèi)核數(shù)量增加了三倍GEMM高帶寬存儲(chǔ)容量的發(fā)動(dòng)機(jī)計(jì)算能力和包裝增加了三倍,SRAM帶寬增加,容量增加一倍。訓(xùn)練視覺(jué)處理模型,Gaudi2集成媒體處理引擎的處理器可以獨(dú)立完成AI對(duì)壓縮圖像進(jìn)行數(shù)據(jù)增強(qiáng)和預(yù)處理。

兩代Gaudi在沒(méi)有特殊軟件操作的情況下,處理器的性能是通過(guò)的Habana實(shí)現(xiàn)客戶開(kāi)箱即用的商業(yè)軟件棧。

在商用軟件提供的開(kāi)箱即用性能中Habana 8個(gè)GPU服務(wù)器與HLS-Gaudi2參考服務(wù)器上的測(cè)試比較。其中,訓(xùn)練吞吐量來(lái)自NGC和Habana公共庫(kù)的TensorFlow docker,在混合精度訓(xùn)練模式下測(cè)量雙方推薦的最佳性能參數(shù)。值得注意的是,吞吐量是影響最終訓(xùn)練時(shí)間收斂的關(guān)鍵因素。

圖形測(cè)試配置詳見(jiàn)說(shuō)明部分。

圖形測(cè)試配置見(jiàn)說(shuō)明部分。

除了Gaudi2在MLPerf測(cè)試中的優(yōu)異表現(xiàn),第一代Gaudi128加速器和256加速器RBelFuse代理esNet基準(zhǔn)測(cè)試顯示出強(qiáng)大的性能和令人印象深刻的近線性擴(kuò)展,支持客戶高效的系統(tǒng)擴(kuò)展。

Habana Labs首席運(yùn)營(yíng)官Eitan Medina說(shuō):我們最新的MLPerf測(cè)試結(jié)果證明Gaudi2在訓(xùn)練性能方面具有顯著優(yōu)勢(shì)。我們將繼續(xù)深入學(xué)習(xí)訓(xùn)練結(jié)構(gòu)和軟件創(chuàng)新,創(chuàng)造最具成本效益的AI訓(xùn)練解決方案。

關(guān)于MLPerf基準(zhǔn)測(cè)試:MLPerf社區(qū)旨在設(shè)計(jì)公平實(shí)用的基準(zhǔn)測(cè)試,公平測(cè)量機(jī)器學(xué)習(xí)解決方案的準(zhǔn)確性、速度和效率。該社區(qū)來(lái)自學(xué)術(shù)界、研究實(shí)驗(yàn)室和行業(yè)AI領(lǐng)導(dǎo)者建立了基準(zhǔn),制定了一套嚴(yán)格的規(guī)則,以確保所有參與者都能公平公正地進(jìn)行性能比較。基于一套明確的規(guī)則,能夠公平比較端到端任務(wù),目前MLPerf是AI行業(yè)唯一可靠的基準(zhǔn)測(cè)試。此外,MLPerf同行對(duì)基準(zhǔn)測(cè)試結(jié)果進(jìn)行為期一個(gè)月的評(píng)估,這將進(jìn)一步驗(yàn)證報(bào)告結(jié)果。

說(shuō)明:

ResNet-50性能比較中使用的測(cè)試配置

A100-80GB:Habana于2022年4月在Azure實(shí)例Standard_ND96amsr_A100_v4上測(cè)量,使用一個(gè)A100-80GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

A100-40GB:Habana于2022年4月在DGX-A測(cè)量100,使用一個(gè)A100-40GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

V100-32GB?:Habana于2022年4月在p3dn.24xlarge測(cè)量,使用一個(gè)V100-32GB,其中應(yīng)用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

Gaudi2:Habana于2022年5月在Gaudi2-HLS測(cè)量系統(tǒng),使用一個(gè)Gaudi二、其中應(yīng)用SynapseAI TF docker 1.5.0(BS=256)

結(jié)果可能會(huì)有所不同。

BERT性能比較中使用的測(cè)試配置

A100-80GB:Habana于2022年4月在Azure實(shí)例Standard_ND96amsr_A100_v4.測(cè)試,使用一個(gè)A100-80GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=312,accu steps=256;Phase-2:seq len=512,BS=40,accu steps=768)

A100-40GB:Habana于2022年4月在DGX-A100測(cè)試,使用一個(gè)A100-40GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)

V100-32GB:Habana于2022年4月在上p3dn.24xlarge測(cè)試,使用一個(gè)V100-32GB,包含NGC的TF docker 21.12-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=8,accu steps=4096)

Gaudi2:Habana于2022年5月在上Gaudi2-HLS測(cè)試,使用一個(gè)Gaudi2,包含SynapseAI TF docker 1.5.0(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)

結(jié)果可能會(huì)有所不同。

Habana Labs、Habana、Habana標(biāo)識(shí)、Gaudi和SynapseAI是Habana Labs的商標(biāo)。


芯片采購(gòu)網(wǎng)|IC采購(gòu)|IC代理商 - 國(guó)內(nèi)專業(yè)的芯片采購(gòu)平臺(tái)
芯片采購(gòu)網(wǎng)專注整合國(guó)內(nèi)外授權(quán)IC代理商的現(xiàn)貨資源,輕松采購(gòu)IC芯片,是國(guó)內(nèi)專業(yè)的芯片采購(gòu)平臺(tái)
主站蜘蛛池模板: 国产亚洲一区二区精品张柏芝 | 日韩无遮挡大尺度啪啪影片 | 久草视频新 | 美女国产网站 | 国产麻豆精品在线 | 一级做a爱过程免费视频麻豆 | 午夜激情视频在线 | 欧美一级毛片免费播放aa | 国产高清国内精品福利99久久 | a级黄色免费看 | 亚洲国产精品乱码在线观看97 | 国产裸舞福利资源在线视频 | 国产成人99久久亚洲综合精品 | 免费看av的网址 | 亚洲精品黄 | 久久精彩视频 | 国产精品免费看久久久香蕉 | 免费看三级全黄 | 97婷婷色 | 国产日韩久久久精品影院首页 | 国产午夜精品久久久久免费视小说 | 日本一级二级三级久久 | 美国免费三片在线观看 | 中国黄色网址大全 | 男女做污污无遮挡激烈免费 | 97精品国产综合久久 | 日韩精品久久一区二区三区 | 欧美一区高清 | 成人综合久久综合 | 在线观看精品自拍视频 | 日韩欧美精品一区二区三区 | 成年人免费影院 | 日本公妇色中文字幕 | 精品免费久久久久久久 | 成年女人视频播放免费观看 | xxxxx爽日本护士在线播放 | 三黄色| 欧美黄色高清视频 | 国产欧美日韩一区二区三区 | 一级的黄色片 | 免费播放国产性色生活片 |