試驗(yàn)均采用200G的RDMA網(wǎng)卡和GPU訓(xùn)(xùn )練卡,使用All Reduce算子。在不(bú )同的智(zhì )算場(chǎng)(chǎng )景下,將本(běn )方案(àn )與(yǔ )傳統(tǒng)ECMP方案進(jìn)行對(duì)(duì )比。試驗(yàn)結(jié)果顯示,當(dāng)QP會(huì)(huì )話數(shù)(shù )固定時(shí),從(cóng )32卡到128卡,隨著算力規(guī)模的增加,傳(chuán )統(tǒng)(tǒng )的ECMP方案因哈希不(bú )均導(dǎo)致?lián)砣怕屎托阅芰踊觿?,而基于?fèn )布式解耦的網(wǎng)絡(luò)能力(lì )增強(qiáng)技術(shù)方案因(yīn )采用(yòng )信(xìn )元交(jiāo )換機(jī)制避免了擁塞(sāi )的產(chǎn)生,帶寬利用(yòng )率相對(duì)穩(wěn)(wěn )定,約為95%,更適用于大規(guī)模的AI訓(xùn)練;當(dāng)(dāng )算力規(guī)模固定(dìng ),QP會(huì)話較少時(shí),基于分布式(shì )解耦的網(wǎng)絡(luò)能力增強(qiáng)(qiáng )技(jì )術(shù)方案的優(yōu)勢(shì)比較明顯,負(fù)載均衡的(de )效果更優(yōu),可較好地適用(yòng )于商用(yòng )場(chǎng)景。
Copyright ? 2008-2018 JIZZJIZZ国产免费A片|免费人成黄页在线观看视频|99热成人精品热久久6网站|亚洲人成毛片在线播放|少妇真人直播APP|青龙影院