近期,青云 AI 算力云推出基于昇騰算力的大模型服務(wù),可按 Tokens 計(jì)費(fèi),為企業(yè)輕量化、低成本體驗(yàn)昇騰算力提供了新選擇。此前,青云 AI 智算平臺已完成對昇騰系列芯片的深度適配。基于昇騰算力的大模型服務(wù)的推出,標(biāo)志著青云智算正式實(shí)現(xiàn) “公有云服務(wù) + 私有化部署” 的混合架構(gòu)對昇騰算力的全面適配,為企業(yè)數(shù)智化提供全場景、一致性的國產(chǎn)算力支撐。
異構(gòu)算力調(diào)度 + 混合智算架構(gòu),牢筑國產(chǎn)算力底座
在企業(yè)數(shù)智化場景中,單一算力往往難以滿足復(fù)雜需求。青云 AI 智算平臺能夠統(tǒng)一管理多種異構(gòu)服務(wù)器、存儲、網(wǎng)絡(luò)等設(shè)備,提供包括昇騰在內(nèi)的多廠商的 GPU 統(tǒng)一管理分發(fā),實(shí)現(xiàn)算力池化和切分,并且通過分布式調(diào)度與管理能力,為企業(yè)劃分不同資源組,自動分配和管理算力資源,與調(diào)度系統(tǒng)結(jié)合,大幅縮短任務(wù)執(zhí)行時間。
在異構(gòu)算力的統(tǒng)一管理的支持方面,管理員可輕松查看集群內(nèi) GPU、CPU、NPU、DCU、內(nèi)存等多種資源的實(shí)時使用。通過直觀的界面,管理員能夠全面了解集群負(fù)載狀態(tài),為資源優(yōu)化提供數(shù)據(jù)支持。而基于集群的實(shí)時負(fù)載情況,管理員可靈活進(jìn)行節(jié)點(diǎn)添加、刪除及隊(duì)列調(diào)配等管理操作,確保資源的高效利用與動態(tài)平衡。
除昇騰外,青云已與海光、摩爾線程、燧原等多家國產(chǎn)算力廠商達(dá)成深度合作,真正構(gòu)建起覆蓋多元國產(chǎn)算力的異構(gòu)調(diào)度體系,全面支持國產(chǎn)算力,讓企業(yè)擁有更靈活的算力選擇。
此外,依托青云智算核心的公私一體化技術(shù)架構(gòu),實(shí)現(xiàn)了國產(chǎn)算力價值的充分釋放:企業(yè)在公有云環(huán)境中驗(yàn)證的模型與服務(wù),可無縫實(shí)現(xiàn)統(tǒng)一環(huán)境的私有化部署,無需重新適配;管理平臺、使用體驗(yàn)均保持高度一致,技術(shù)團(tuán)隊(duì)無需學(xué)習(xí)兩套操作體系,大幅降低管理成本。
生態(tài)應(yīng)用友好,加速企業(yè) AI 落地
青云致力于降低企業(yè)擁抱 AI 的技術(shù)門檻,生態(tài)應(yīng)用友好則是加速落地的關(guān)鍵。青云 AI 智算平臺提供開放的應(yīng)用框架和模型服務(wù),提供豐富的計(jì)算環(huán)境,集成行業(yè)內(nèi)多家廠商生態(tài)應(yīng)用,打造豐富的應(yīng)用服務(wù),助力用戶實(shí)現(xiàn)全場景業(yè)務(wù)落地。?
基于容器架構(gòu),青云 AI 智算平臺內(nèi)置多種深度學(xué)習(xí)框架和算法庫,讓企業(yè)輕松基于容器實(shí)例進(jìn)行模型開發(fā),同時支持多種推理框架,如 TensorFlow、PyTorch、PaddlePaddle 等,用戶可以根據(jù)自己的需求選擇合適的推理框架。?
在模型支持上,青云 AI 智算平臺內(nèi)置 DeepSeek、Qwen、Baichuan 等主流國產(chǎn)大模型,可一鍵進(jìn)行在線推理、模型微調(diào),讓用戶可根據(jù)業(yè)務(wù)需求挑選相應(yīng)的模型進(jìn)行開發(fā)、訓(xùn)練、調(diào)優(yōu)及推理部署等服務(wù)。?
青云將持續(xù)深化公私統(tǒng)一架構(gòu)的技術(shù)優(yōu)勢,拓展與包括昇騰在內(nèi)的國產(chǎn)算力廠商的合作深度與廣度,在生態(tài)適配、異構(gòu)算力調(diào)度優(yōu)化、應(yīng)用生態(tài)拓展等領(lǐng)域不斷突破,讓 AI 算力不僅成為企業(yè)數(shù)智化的 “基礎(chǔ)設(shè)施”,更成為驅(qū)動業(yè)務(wù)創(chuàng)新的 “核心引擎”。