新質生產(chǎn)力是由技術革命性突破、生產(chǎn)要素創(chuàng)新性配置、產(chǎn)業(yè)深度轉型升級而催生的當代先進生產(chǎn)力,它以勞動者、勞動資料、勞動對象及其優(yōu)化組合的質變?yōu)榛緝群?,以全要素生產(chǎn)率提升為核心標志。
新質生產(chǎn)力正成為推動經(jīng)濟增長的新引擎,隨著我們步入數(shù)字化與智能化時代,通用人工智能(AGI)作為新質生產(chǎn)力的加速器,正發(fā)揮著關鍵作用。以文心一言、通義千問、ChatGLM等為代表的大模型產(chǎn)品,通過不斷的迭代更新和日益普及的應用,引領著一場工業(yè)革命的新浪潮。這場革命正推動著生產(chǎn)力的轉型,從依賴計算能力向利用機器智能轉變,并促使經(jīng)濟從網(wǎng)絡驅動的數(shù)字經(jīng)濟向以數(shù)據(jù)為核心的智能經(jīng)濟快速邁進。以AI大模型落地實際應用所孕育的新興生產(chǎn)力,是新質生產(chǎn)力的重要形態(tài)。
在利用AI大模型轉化為生產(chǎn)力的實際業(yè)務場景中,用戶往往面臨來自各方面的業(yè)務需求,實際業(yè)務中需要利用多類不同的AI模型來滿足差異化的應用需求,例如:基于百億級規(guī)模模型支持RAG、Agent應用的大語言模型、支持模型微調訓練的文生圖大模型、支持復雜任務處理的多模態(tài)大模型等各類服務不同場景的模型服務。
AI&大模型業(yè)務應用需求痛點
在AI大模型投入業(yè)務服務之前,從訓練前的準備工作、訓練過程本身、到訓練完成后的上線部署,整個流程中存在眾多待解決的實際業(yè)務挑戰(zhàn)。這些問題的存在,影響大模型的迅速部署上線和業(yè)務服務的提供。
算力資源如何有效管理與調用
在底層基礎設施層面,海量算力是人工智能的基礎,智算中心的建設,建設后算力資源的有效運維、運營也是業(yè)務面臨的重要挑戰(zhàn)。
UIT Cloud AI智算平臺整體架構方案
UIT Cloud AI智算平臺是為AI應用服務量身定制的一站式AI算力管理平臺,該平臺在計算、網(wǎng)絡、存儲和調度等基礎設施能力上進行了全面的強化,有效屏蔽底層異構算力的差異性,解決了AI大規(guī)模分布式計算的需求,并實現(xiàn)AI應用從開發(fā)、訓練到推理的全生命周期管理。為AI應用提供穩(wěn)定、高效的底層支撐架構,同時為開發(fā)者提供完善的開發(fā)和訓練工具。通過一站式的AI服務平臺,助力行業(yè)客戶有效部署利用私有大模型,快速構建智能應用,幫助企業(yè)高效利用算力資源實現(xiàn)降本增效及業(yè)務新質生產(chǎn)力轉化。
AI智算平臺在底層算力基礎設施上,部署AI算力管理引擎,實現(xiàn)CPU/GPU的算力靈活調度,服務上層應用。通過AI智算調度系統(tǒng),支持CPU、GPU等各種異構計算資源,突破傳統(tǒng)計算瓶頸,開發(fā)者可以根據(jù)需要靈活選擇使用,而不需要關心底層的技術。調度系統(tǒng)功能覆蓋作業(yè)任務全周期,提供事前準備、事中調度、事后展示的能力,讓用戶隨時掌握模型的開發(fā)、訓練、發(fā)布情況,有效降低用戶在部署、調試、運維等環(huán)節(jié)的繁瑣工作,幫助用戶專注于核心業(yè)務的開發(fā)及運維。
構建在算力調度平臺上的AI訓推一體化平臺,在大模型的持續(xù)預訓練、精調、評估、壓縮和部署等環(huán)節(jié)提供完善易用的工具鏈,幫助客戶針對自身業(yè)務場景快速定制專屬大模型。支持Tensorflow、PyTorch等主流開源的AI開發(fā)框架,支持在線IDE環(huán)境,包括Jupyter、pycharm、vscode交互式建模,方便算法工程師對代碼進行調試;同時平臺內置多種算法組件,支持通過拖拉拽方式實現(xiàn)可視化建模,極大降低建模門檻。平臺提供從數(shù)據(jù)標注處理、算法開發(fā)、模型訓練、超參調整、模型管理與部署等環(huán)節(jié)的全流程支持,結合高性能異構算力底座,加速模型訓練速度,有效降低模型訓練門檻與訓練成本。
UIT Cloud AI 智算平臺亮點優(yōu)勢
異構算力資源池化:對CPU、GPU、AI 芯片等算力資源進行池化整合,支持英偉達、昇騰、曙光等多種異構算力資源,實現(xiàn)資源的集中調度、按需分配,使算力資源可被充分利用并降低碎片概率,提高總體有效算力、降低智算中心購置成本。
算力資源精細化管理:根據(jù) AI 任務的資源需求進行按需供給,契合多樣化業(yè)務的差異需求。算力池化技術可提供智能算力資源排隊的能力,可根據(jù)訓練任務的重要程度,設置資源使用的優(yōu)先級。
資源無感動態(tài)伸縮:池化技術可通過資源動態(tài)分配,為容器動態(tài)分配可用資源,上層應用可向算力調度平臺申請算力、顯存資源,實現(xiàn)資源動態(tài)垂直擴展。
算力資源可觀測:可視化并監(jiān)控網(wǎng)絡中所有 GPU 服務器的運行狀況、利用率、效率和可用性,為加速大模型訓推任務提供可視化參考依據(jù)。
一站式AI開發(fā)平臺:提供端到端AI開發(fā)平臺,支持大規(guī)模分布式訓練及端-邊-云模型按需部署能力,從數(shù)據(jù)準備到算法開發(fā)、模型訓練,模型部署一站式完成所有任務。
智能數(shù)據(jù)標注:提供數(shù)據(jù)集管理能力,支持數(shù)據(jù)篩選、標注等數(shù)據(jù)處理,提供數(shù)據(jù)集版本管理,特別是深度學習的大數(shù)據(jù)集,讓訓練結果可重現(xiàn)。
快速模型訓練:支持多種深度學習框架,更高效更易用,大幅提升訓練速度。
便捷AI應用構建:基于模型市場中的模型提供微調訓練快速構建專屬模型;支持圖片分類、物體檢測、視頻分類等業(yè)務場景模型的開發(fā)和部署,滿足不同場景業(yè)務需求;支持根據(jù)業(yè)務場景創(chuàng)建模型,自動調參,自動訓練,一鍵模型部署。
喜訊 | 創(chuàng)新科榮獲2024網(wǎng)信自主創(chuàng)新“尖鋒榜”
喜訊 | 創(chuàng)新科榮獲 “2023-2024年度新一代信息技術創(chuàng)新企業(yè)”
回顧2023,展望2024,攜手共創(chuàng)新篇章
創(chuàng)新科榮獲2023“科創(chuàng)中國”創(chuàng)新創(chuàng)業(yè)投資大會全國百強項目
夜深知雪重,時聞爆竹聲——創(chuàng)新科公司發(fā)力信息基礎設施安全、搭建國產(chǎn)化技術體系