伴隨我國超大規(guī)模預(yù)訓(xùn)練模型的發(fā)展,國內(nèi)人工智能算力需求持續(xù)攀升,人工智能算力中心的建設(shè)如火如荼。新形勢迫切需要在此建設(shè)過程中不僅考慮將算力中心作為獨(dú)立的系統(tǒng)發(fā)揮作用,更應(yīng)形成相互聯(lián)接的算力網(wǎng)絡(luò),以滿足網(wǎng)絡(luò)化算力聯(lián)通調(diào)度的需求。
12 月 19 日,“人工智能算力網(wǎng)絡(luò)推進(jìn)聯(lián)盟”在 2021 新一代人工智能院士高峰論壇暨啟智開發(fā)者大會(huì)上成立。12 月 20 日,為了更好地探索智算網(wǎng)絡(luò)的建設(shè)、實(shí)踐、保障和運(yùn)營,峰會(huì)智算網(wǎng)絡(luò)分論壇順利召開。

智算網(wǎng)絡(luò)分論壇現(xiàn)場,鵬城實(shí)驗(yàn)室與華為、百度、國家超級(jí)計(jì)算濟(jì)南中心、武漢人工智能創(chuàng)新生態(tài)中心、中原人工智能計(jì)算中心、琴智科技研究院、中科類腦等智算聯(lián)盟首批聯(lián)盟單位完成了聯(lián)盟簽約儀式。

匯聚科創(chuàng)力量 共建算網(wǎng)融合
人工智能算力中心作為智能時(shí)代的新型公共基礎(chǔ)設(shè)施,是發(fā)展人工智能產(chǎn)業(yè)的基礎(chǔ)資源保障。為發(fā)揮其公共基礎(chǔ)設(shè)施的作用,就要不僅建得好還要用得好。因此構(gòu)建能夠支撐人工智能產(chǎn)業(yè)持續(xù)發(fā)展的智算網(wǎng)絡(luò)和管理運(yùn)營機(jī)制就變得至關(guān)重要。
華為集群計(jì)算解決方案架構(gòu)師崔金帶來題為《人工智能算力網(wǎng)絡(luò)調(diào)度平臺(tái)系統(tǒng)架構(gòu)》的報(bào)告。他認(rèn)為, 作為一項(xiàng)具有重要意義的新技術(shù),算力網(wǎng)絡(luò)的落地節(jié)奏會(huì)分三個(gè)階段:第一階段,實(shí)現(xiàn)運(yùn)營層面的互聯(lián),如提供統(tǒng)一的門戶入口等。第二階段,算力網(wǎng)絡(luò)利用作業(yè)調(diào)度層面的互聯(lián),實(shí)現(xiàn)不同計(jì)算中心負(fù)載和網(wǎng)絡(luò)的實(shí)時(shí)感知與簡單調(diào)度。第三階段,跨數(shù)據(jù)中心并行。系統(tǒng)可以進(jìn)行細(xì)粒度任務(wù)調(diào)度,大模型并行訓(xùn)練,安全數(shù)據(jù)管理,還可以從應(yīng)用場景支持各類復(fù)雜的多樣性運(yùn)用。

武漢人工智能生態(tài)創(chuàng)新中心副總經(jīng)理蔡維康在現(xiàn)場作《武漢人工智能生態(tài)創(chuàng)新中心運(yùn)營分享》主題報(bào)告,主要圍繞武漢人工智能中心的運(yùn)營模式以及武漢人工智能中心的發(fā)展?fàn)顩r等內(nèi)容進(jìn)行分享。他表示,未來武漢人工智能生態(tài)創(chuàng)新中心將在產(chǎn)業(yè)集聚方面,吸引頭部科研院校及 AI 企業(yè)來漢合作,做實(shí)產(chǎn)業(yè)發(fā)展。

國家超級(jí)計(jì)算濟(jì)南中心主任助理、研究員郭猛在題為《超算互聯(lián)網(wǎng)的探索與實(shí)踐》的報(bào)告中指出,超算互聯(lián)網(wǎng)不僅僅是網(wǎng)絡(luò)的概念,智算網(wǎng)絡(luò)更應(yīng)提供應(yīng)用服務(wù),以促使開發(fā)者、超算和用戶的緊密耦合。打造從超級(jí)計(jì)算最底層的基礎(chǔ)軟件到中間件、編程工具、應(yīng)用軟件的全鏈條應(yīng)用生態(tài)。

百度深度學(xué)習(xí)技術(shù)平臺(tái)部主任研發(fā)架構(gòu)師、飛槳分布式技術(shù)負(fù)責(zé)人吳志華在《飛槳大規(guī)模分布式訓(xùn)練技術(shù)》報(bào)告中介紹,分布式訓(xùn)練技術(shù)能夠解決各種場景、各種硬件下多設(shè)備的協(xié)同訓(xùn)練問題。百度從產(chǎn)業(yè)實(shí)踐的角度不斷地進(jìn)行應(yīng)用落地的嘗試,做出分布式訓(xùn)練算力和算法上的極致優(yōu)化,在實(shí)際場景中打磨部署能力以提升用戶的最終體驗(yàn),讓深度學(xué)習(xí)的創(chuàng)新應(yīng)用更加簡單。

鵬城實(shí)驗(yàn)室開源軟件與平臺(tái)研究所副所長、OpenI 技術(shù)委員會(huì)委員曾煒發(fā)表《基于算力網(wǎng)絡(luò)的全國開源開放平臺(tái)》的報(bào)告。他指出,人工智能開源社區(qū)的最佳支撐是智能算力網(wǎng)絡(luò),算力網(wǎng)絡(luò)本身的發(fā)展是全球計(jì)算和通信產(chǎn)業(yè)結(jié)合的基礎(chǔ)。因此他希望各方資源能在軟件、硬件統(tǒng)一的模式為開源、開放提供服務(wù)。

業(yè)界大咖研討 構(gòu)建智算網(wǎng)絡(luò)建設(shè)藍(lán)圖
在當(dāng)日圓桌討論中,陳文光、管海兵、王子彥、崔金、蔡維康、郭猛等多位業(yè)界大咖齊聚現(xiàn)場,共同探討未來智算網(wǎng)絡(luò)建設(shè)之路。

管海兵教授從政府角度出發(fā),“工業(yè)社會(huì)看電力,信息社會(huì)看算力。算力對當(dāng)今社會(huì)而言,就像以前的電力和水一樣,是社會(huì)最必不可少的、非常重要的公共資源。”他認(rèn)為建立算力網(wǎng)絡(luò)是符合人類社會(huì)數(shù)千年來運(yùn)行規(guī)律非常重要的舉措。
王子彥回應(yīng)“智能算力網(wǎng)絡(luò)現(xiàn)狀是什么?”一問。他認(rèn)為,目前對于國家超算來說,國家做了投入,承擔(dān)了相關(guān)的電費(fèi)、運(yùn)營補(bǔ)貼等費(fèi)用。計(jì)算中心能夠產(chǎn)生相關(guān)的科研效益,仍然是它的公共屬性。但如果面向產(chǎn)業(yè)的話,地方政府要發(fā)展智算網(wǎng)絡(luò)的現(xiàn)狀壓力仍然大。
崔金表示,雖然算力的匯聚跟水電網(wǎng)絡(luò)有比較大的差別,算力網(wǎng)絡(luò)是要把用戶的數(shù)據(jù)、用戶的算法拿到算力中心來計(jì)算,但希望未來智算網(wǎng)絡(luò)能夠從體驗(yàn)和網(wǎng)絡(luò)特性上都能做成像水電網(wǎng)絡(luò)一樣。
曾煒表示,軟件問題是制約整個(gè)網(wǎng)絡(luò)體系打通和服務(wù)最關(guān)鍵的問題。他從開源和標(biāo)準(zhǔn)化的角度,鼓勵(lì)不同的企業(yè),甚至是圈子外的人在構(gòu)建軟件的過程中倡導(dǎo)共享,共同打造開放的軟件棧。
郭猛回顧了網(wǎng)格計(jì)算和算力網(wǎng)絡(luò)的發(fā)展歷史。他認(rèn)為網(wǎng)格計(jì)算是算力網(wǎng)絡(luò)必不可少的研究基礎(chǔ)。網(wǎng)格計(jì)算的分布式計(jì)算概念、作業(yè)調(diào)度的中間件、安全的解決方案和網(wǎng)格的文件傳輸工具對于構(gòu)建算力網(wǎng)絡(luò)都有非常重要的借鑒意義。
管海兵教授在回答現(xiàn)場提問者時(shí)總結(jié),發(fā)展算力網(wǎng)絡(luò)和發(fā)展智算網(wǎng)絡(luò)并不矛盾。算力發(fā)展的前期階段已經(jīng)有了成功的實(shí)踐,云計(jì)算就是一種算力網(wǎng)絡(luò)。云計(jì)算發(fā)展到今天,目前存在最大的問題是云和云之間不能互聯(lián)互通,對用戶的水平有一定的要求。因此,只有不斷的實(shí)踐,才能走到更大的普及、普惠、甚至普世的層面。
人工智能算力網(wǎng)絡(luò)推進(jìn)聯(lián)盟將以“平等自愿、優(yōu)勢互補(bǔ)、資源共享、合作共贏”為原則,結(jié)合國內(nèi)外人工智能技術(shù)和產(chǎn)業(yè)發(fā)展需求,整合業(yè)內(nèi)資源,加強(qiáng)相互合作,提升人工智能技術(shù)、產(chǎn)品研發(fā)水平和應(yīng)用能力,促進(jìn)人工智能產(chǎn)業(yè)健康快速發(fā)展,保障國家人工智能技術(shù)和產(chǎn)業(yè)的安全,推動(dòng)人工智能技術(shù)在社會(huì)各領(lǐng)域、傳統(tǒng)產(chǎn)業(yè)各領(lǐng)域的廣泛應(yīng)用。