作為人工智能的“發動機”和核心驅動力,算力逐漸成為稀缺資源和競爭新高地,實現AI算力的高效利用與精準調配成為亟待解決的問題。
“在AI大模型迅速發展的今天,算力成為了不可或缺的血液。”在2025全球數字經濟大會數字經濟產業國際交流合作體驗區,北京超級云計算中心(以下簡稱“北京超算”)CTO甄亞楠在接受記者采訪時表示,在破解算力“供不上、用不起”問題上,北京超算目前正在為用戶精準匹配算力資源,構建更加開放、高效和靈活的算力平臺及生態系統,讓算力資源的獲取、調度和使用變得更加容易,從而高效破解部分算力難題。
智能調度,讓算力資源利用最大化
大模型訓練作為典型的大規模超算應用,具有異構計算、大規模并行計算等典型超算應用特征,在當下大模型訓練算力需求爆發的時代,如何實現算力資源的最大化利用,成為關鍵問題。
圖:北京超級云計算中心展臺
甄亞楠介紹,北京超算推出按需構建算力資源的創新模式,旨在通過算力租賃,讓用戶依據業務需求獲取彈性的計算資源,實現大規模的計算任務。
“用戶只需支付實際使用所需的計算量與計算時間,大幅降低運營成本,適用于各種大規模計算需求的場景。此外,還能夠在用戶業務運行中提升利用效率。”他說。
甄亞楠隨即舉了一個典型案例:“某14B參數的模型優化前GPU利用率只有75%,經過我們的計算負載優化后,GPU利用率提升到97%,整體性能提升了30%。”
同時,為了讓算力資源利用率實現最大化,北京超算采用超算架構模式構建智算資源,將分布在國內的各大算力中心的資源加以整合,并利用成熟的算力網絡進行調度,以滿足大規模訓練所需的海量算力需求。例如,在與某科研機構的合作中,通過整合資源,成功將大模型訓練時間從原本的數月縮短至數周,切實地幫助用戶降本增效。
精準選型,讓算力更好用
通過算力預測判斷用戶真正所需的算力資源,北京超算基于應用運行特征分析進行算力選型,幫助用戶適配更高性價比的算力資源。那么,如何讓算力更好用?
圖:北京超算CTO甄亞楠報告
“我們為用戶提供的并非單一技術、單一資源,而是一套滿足用戶綜合發展需求的行業解決方案。”甄亞楠透露,北京超算具備萬卡集群工程化能力,同時擁有長達14年的專業服務經驗,有力保障大模型訓練、推理業務的開展,實現算力資源從可用到好用再到降本。
舉個例子:北京智源人工智能研究院(以下簡稱“智源研究院”)推出的“悟界”系列大模型,多模態架構突破數字物理邊界,引發全球關注。
這背后,北京超算出了“一份力”。
進行大模型研究工作,智源研究院迫切需要大量的GPU算力資源進行模型訓練,十分關注模型訓練的時間和執行效率。
基于算力網絡服務,北京超算AI智算云服務在短期內快速為智源提供了基于“超算架構”的A100算力資源,同時提供了基礎環境構建、模型部署、應用運行特征性能分析、7×24小時技術服務支持保障等服務,通過“算力+大模型+技術服務”的結合,為智源打造了高效、穩定的智算云算力底座。
無獨有偶。清華大學計算機系自然語言處理實驗室的大模型課題組急需使用上百塊高端GPU加速卡進行大語言模型訓練。但受限于供給關系影響,課題組在短期內很難獲得足夠數量的高端GPU算力。
為此,該實驗室與北京超算展開深度合作。北京超算提供了上百塊A100 GPU的共享算力資源,有力支持了該實驗室的大語言模型的訓練需求。
共享算力+模型服務,幫用戶節省成本
作為2025全球數字經濟大會重要活動,“首發首秀” 聚焦新技術研發成果、新產品迭代升級及場景化應用解決方案。北京超算也在現場發布了匯集了40多個主流大模型的MaaS平臺。
一位深入了解MaaS平臺的AI產業鏈企業負責人表示:“通過這個平臺就能一站式獲取所需的大模型服務,隨時隨地實現API調用,通過共享算力與AI模型的方式,企業無需自行購置硬件和部署AI模型,只需要進行簡單的集成與調用,從而節省大量人力成本,將大幅度縮短產品開發周期和市場投放時間。”
“MaaS平臺不僅集成了DeepSeek全系列模型,還整合了智譜GLM、Qwen、ERNIE-4.5等國產優秀模型。”在北京超算CTO 甄亞楠看來,這種多元化的模型選擇使民營企業能夠根據自身業務需求和算力預算,靈活選用最適合的AI能力,無需從零開始訓練大模型,大幅節省了研發投入和時間成本。
MaaS平臺強大的性能得益于背后的算力支撐體系。據悉,北京超算擁有萬卡級GPU集群,涵蓋主流加速卡和國產自主芯片,通過智能調度系統實現算力資源的動態分配與高效利用。“這種強大的算力基礎設施,可以保證企業在進行大規模模型訓練或復雜推理任務時,也能獲得穩定、高性能的計算支持。”甄亞楠提到。
“算力如同基石般支撐著人工智能不斷前進。”甄亞楠說。
據悉,北京超算成立于2011年,是由北京市政府主導、院市共建的北京超級云計算和國家重要信息化基礎平臺。目前已累計服務超過1000家科研機構、高校及企業。
2020年至2024年,北京超算連續5年榮獲中國HPC TOP100“通用CPU算力性能第一名”;2023年6月,入選成為《北京市人工智能產業創新合作伙伴計劃》首批算力伙伴。2024年榮獲世界人工智能算力性能AIPerf 500大模型訓練算力性能、AI推理延遲性能雙榜單第一。
目前,北京超算已與智源研究院、智譜AI、瀾舟科技、中科聞歌、深勢科技等模型伙伴等達成了算力合作,為國產大模型如智譜 GLM、孟子大模型等提供了算力服務支撐。
免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發布,可與本網聯系,本網視情況可立即將其撤除。
互聯網新聞信息服務許可證10120230012 信息網絡傳播視聽節目許可證0121673 增值電信業務經營許可證京B2-20171219 廣播電視節目制作經營許可證(京)字第10250號
關于我們 中宏網動態 廣告服務 中宏網版權所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.fljgs.cn. all rights reserved 運營管理:國家發展和改革委員會宏觀經濟雜志社