在我國多樣性算力技術(shù)發(fā)展取得突破性進展,以 AI 大模型為代表的人工智能應(yīng)用高速發(fā)展,使得多樣性算力需求呈現(xiàn)爆發(fā)式增長。在此背景下,中國信通院發(fā)起“多算融創(chuàng),智賦萬企——第二屆多樣性算力典型案例征集活動”,并在第 12 屆可信云大會上,公布了 18 個符合要求的案例名單,“青云 AI 智算平臺解決多元異構(gòu)算力管理難題”順利通過本次典型案例評選。
青云 AI 智算平臺以算力調(diào)度與管理為核心,納管多元異構(gòu)算力,智能運維與運營,支持 GPU 池化與切分,滿足模型訓(xùn)練、微調(diào)、推理等需求,幫助企業(yè)達成 “像管理本地資源一樣管理 AI 基礎(chǔ)設(shè)施” 的目標(biāo)。具備以下關(guān)鍵能力:
多元算力統(tǒng)一調(diào)度。對多元算力進行統(tǒng)一調(diào)度管理,算力池化和切分,包括多樣顯卡、高速計算網(wǎng)路 InfiniBand以及 RoCE、本地 NVME 與并行文件存儲支持,實現(xiàn)算力資源按應(yīng)用、按需求隨時匹配,自動切換。
智能算力調(diào)度管理。具備分布式調(diào)度與管理能力,劃分不同資源組,自動分配和管理算力資源,與調(diào)度系統(tǒng)結(jié)合,能大幅縮短任務(wù)執(zhí)行時間,讓客戶專注于應(yīng)用開發(fā)和業(yè)務(wù)創(chuàng)新。
國產(chǎn)芯片異構(gòu)支持。統(tǒng)一管理多種異構(gòu)服務(wù)器、存儲、安全等設(shè)備,提供多廠商的統(tǒng)一管理分發(fā),為上層不同應(yīng)用提供蓬勃算力。
智簡運維,精細運營。通過統(tǒng)一運營和運維管理平臺,規(guī)范化、可視化高效運維資源,幫助管理員實現(xiàn)精細化資源分配,實現(xiàn)多種計算場景服務(wù)的標(biāo)準(zhǔn)化運營。結(jié)合多維資源監(jiān)控,提高算力利用效率。
智能生態(tài)支撐應(yīng)用。提供開放的應(yīng)用框架和模型服務(wù),提供豐富的計算環(huán)境,集成行業(yè)內(nèi)多家廠商生態(tài)應(yīng)用,打造豐富的應(yīng)用服務(wù),助力用戶實現(xiàn)全場景業(yè)務(wù)落地。
青云 AI 算力云服務(wù)采用了與 AI 智算平臺一致的架構(gòu),經(jīng)受了大規(guī)模實踐考驗,面向企業(yè)與開發(fā)者提供智算云服務(wù),按需調(diào)用彈性智算資源,支持從訓(xùn)練到推理的全流程 AI 開發(fā)場景,提供 DeepSeek、Qwen 等主流大模型 API 調(diào)用與云端獨立部署。
與此同時,青云 AI 智算平臺憑借多元異構(gòu)算力統(tǒng)一調(diào)度、一站式 AI 算力服務(wù)、算力池化與算力切分、云邊協(xié)同等能力,在多行業(yè)、多場景持續(xù)落地,陸續(xù)參與建設(shè)國內(nèi)重要算力中心節(jié)點,助力多個大型智算中心項目落地,為某四大行海量邊緣算力部署調(diào)度管理平臺,幫助某證券 GPU 算力資源池化,通過混合部署服務(wù)某頭部大模型公司的訓(xùn)練場景,幫助某大型互聯(lián)網(wǎng)企業(yè)實現(xiàn)異構(gòu)算力的部署與調(diào)度……
青云 AI 智算平臺通過技術(shù)能力,有效提升企業(yè)的算力資源利用率,降低運營運維成本,同時加速企業(yè) AI 創(chuàng)新發(fā)展與業(yè)務(wù)發(fā)展。此次 “青云 AI 智算平臺解決多元異構(gòu)算力管理難題” 入選典型案例,是對青云在多樣性算力領(lǐng)域技術(shù)創(chuàng)新與實踐成果的高度認可,也為應(yīng)對多元異構(gòu)算力管理挑戰(zhàn)提供了極具價值的參考范例。青云將堅持”技術(shù)比客戶需求快一小步“的理念,挖掘行業(yè)場景創(chuàng)新,廣泛與產(chǎn)業(yè)鏈展開深度合作,靈活滿足企業(yè)數(shù)智化需求,為推動我國算力產(chǎn)業(yè)的高質(zhì)量發(fā)展貢獻更多力量。