【ITBEAR】8月9日消息,據(jù)最新報(bào)道,中國電信在智算網(wǎng)絡(luò)建設(shè)方面取得了顯著進(jìn)展,其上海與北京兩大萬卡集群已成功投產(chǎn)運(yùn)營。
據(jù)ITBEAR了解,中國電信不僅實(shí)現(xiàn)了兩大集群的投產(chǎn),還通過其智算網(wǎng)絡(luò)和自研的“息壤”算力調(diào)度平臺,完成了全國范圍內(nèi)21EFlops算力的有效調(diào)度與互聯(lián)互通,實(shí)現(xiàn)了算力資源的按需調(diào)用。
中國電信科技委主任邵廣祿指出,面向未來的AI大模型訓(xùn)練,智算集群需要從傳統(tǒng)的互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)向AI驅(qū)動的數(shù)據(jù)中心(AIDC)轉(zhuǎn)型升級。他強(qiáng)調(diào),應(yīng)圍繞模型算力利用率(MFU)、線性加速比、穩(wěn)定性、時(shí)延、丟包率以及GPU利用率等關(guān)鍵指標(biāo),持續(xù)開展智算集群的設(shè)計(jì)、建設(shè)、運(yùn)營和優(yōu)化工作,以提升大模型訓(xùn)練的效率與效能。
邵廣祿進(jìn)一步提出,算力網(wǎng)絡(luò)化正成為發(fā)展的必然趨勢。他建議推動算力生態(tài)的開源開放,為異構(gòu)算力的互通提供基礎(chǔ)的開發(fā)環(huán)境,并通過統(tǒng)一標(biāo)準(zhǔn)對接各類異構(gòu)硬件,以便大模型能在不同的異構(gòu)算力間自由切換。同時(shí),他也倡導(dǎo)共建共享的原則,以促進(jìn)算力資源的更高效利用。