8月的鄂爾多斯,國際會展中心內(nèi)鍵盤敲擊聲密集如潮,一場國產(chǎn)算力生態(tài)技術(shù)人才的“巔峰對決”——第十二屆并行應用挑戰(zhàn)賽(PAC 2025)總決賽在此上演。
從2013年創(chuàng)辦時的“星星之火”,到如今覆蓋全國45座城市、吸引400余家單位參與,PAC大賽早已不是單純的技術(shù)比拼,更成為國產(chǎn)算力平臺“鯤鵬”展現(xiàn)實力、培育青年人才的核心舞臺。當200多支參賽隊伍帶著優(yōu)化方案角逐賽場,我們看到的不僅是一場熱鬧的賽事,更是國產(chǎn)算力從“能用”向“好用”“廣泛用”邁進的堅實步伐。
回溯這一歷程,PAC大賽恰如一面鏡子:早期參賽方案多基于國外技術(shù)體系,而最近兩屆大賽的顯著特征是,參賽作品主要構(gòu)建在“鯤鵬”全棧創(chuàng)新生態(tài)之上。從“跟跑”到“并跑”,再到局部“領(lǐng)跑”,大賽見證了國產(chǎn)算力平臺實現(xiàn)從芯片、基礎(chǔ)軟件到應用生態(tài)的完整突破。如今,“鯤鵬”生態(tài)的技術(shù)自主性與國際主流體系形成有益互補。這場持續(xù)十二年的技術(shù)馬拉松,正以中國方案為全球算力發(fā)展注入新動能。
鯤鵬:國產(chǎn)算力的“硬核底座”,讓高性能計算告別“卡脖子”
“鯤鵬”到底是什么?
簡單來說,它是一套完全國產(chǎn)化的高性能計算體系——從底層的ARM架構(gòu)CPU,到上層的openEuler操作系統(tǒng)、國產(chǎn)工具鏈,每一環(huán)都是“中國造”。過去,國內(nèi)高性能計算領(lǐng)域常依賴國外芯片和平臺,不僅成本高,還面臨技術(shù)“卡脖子”風險。而自2024年P(guān)AC大賽全面啟用“鯤鵬”平臺后,這個“國產(chǎn)底座”終于有了大規(guī)模實戰(zhàn)檢驗的機會。
在今年的 PAC 大賽中,“鯤鵬”的優(yōu)勢被展現(xiàn)得淋漓盡致。比如在“性能突破”上,有參賽隊伍在“鯤鵬”CPU上實現(xiàn)了與國外高端GPU相當?shù)腁I模型端到端訓練速度,而且支持超大批量數(shù)據(jù)計算時,模型收斂依然穩(wěn)定——這意味著,今后訓練生成式AI、處理海量數(shù)據(jù),不用再依賴進口GPU,國產(chǎn)平臺就能扛下重擔。
更讓人驚喜的是“鯤鵬”的適配能力。無論是氣象預測需要的復雜數(shù)值算法,還是醫(yī)學研究中的分子動力學模擬,甚至是核能領(lǐng)域的中子輸運計算,“鯤鵬”都能通過優(yōu)化適配,發(fā)揮出超強算力。南方科技大學與國家超級計算深圳中心的團隊,用“鯤鵬”平臺做分子動力學研究時,針對20億個原子的超大規(guī)模體系計算,居然能保持80%的并行效率——通俗講,就是把一個復雜任務拆給多臺機器同時算,還能保證“算得快、算得準”,這對新藥研發(fā)、材料科學突破至關(guān)重要。
賽場見真章:“鯤鵬”支撐下的技術(shù)突破,從“實驗室”走向“真場景”
PAC大賽的魅力,在于它不搞“紙上談兵”——賽題都源自產(chǎn)業(yè)真實需求,而“鯤鵬”平臺則成為選手們將理論轉(zhuǎn)化為實踐的“利器”。今年的應用賽道和優(yōu)化賽道上,一系列基于“鯤鵬”的技術(shù)突破,正在悄然改變多個行業(yè)的計算格局。
在應用賽道,“解決實際問題”是核心目標。清華大學深圳國際研究生院的“Freagarthach”隊拿下特等獎,他們做的是生成式AI模型DiT的優(yōu)化——簡單說,就是讓AI畫畫、寫文案時“跑得更快、更省資源”。團隊通過優(yōu)化“鯤鵬”的內(nèi)存調(diào)度和算法結(jié)構(gòu),不僅讓模型訓練速度提升,還降低了計算資源消耗。今后我們用AI生成設(shè)計圖、撰寫報告時,背后或許就有這套方案的影子。
中山大學的團隊則把“鯤鵬”用在了更硬核的領(lǐng)域——地震模擬。地震預測需要處理海量地質(zhì)數(shù)據(jù),過去一次大規(guī)模模擬可能要跑好幾天。他們針對“鯤鵬”的硬件特性,優(yōu)化了內(nèi)存管理和并行計算策略:把地震模擬區(qū)域拆成多個子區(qū)域,讓不同計算節(jié)點同時運算,再通過高效通信合并結(jié)果。最終,模擬效率提升了近一倍,為地震災害預警爭取了更多寶貴時間。
優(yōu)化賽道則更像是“算力潛能挖掘大賽”——選手們要在“鯤鵬”平臺上,把硬件潛力“榨干到極致”。清華大學“黃加紅等于橙”隊的全棧優(yōu)化方案堪稱典范:他們從硬件層面調(diào)整CPU與內(nèi)存的配合(NUMA綁核),減少數(shù)據(jù)等待時間;再到算法層面把復雜任務拆成小模塊(兩級分塊),讓計算更高效。這套方案讓目標應用的運行速度提升了數(shù)倍,相當于給“鯤鵬”裝上了“加速器”。
還有山東大學“滴水blow隊”針對AI領(lǐng)域的“Attention算子”優(yōu)化,更是讓人眼前一亮。Attention算子是AI模型(比如ChatGPT)的核心計算模塊,過去算一次要8880毫秒,團隊通過“鯤鵬”平臺的指令集優(yōu)化、算子融合等技術(shù),居然把時間縮短到0.67毫秒——速度提升了1.3萬倍!這意味著今后AI聊天、語音識別會更流暢,幾乎不用等待。
不止于比賽:PAC大賽為國產(chǎn)算力織就“生態(tài)網(wǎng)”
一場賽事的價值,遠不止于決出勝負。PAC 大賽的真正意義,在于它為國產(chǎn)算力搭建了“產(chǎn)學研用”的生態(tài)閉環(huán),全方位賦能人才、技術(shù)與產(chǎn)業(yè)。
首先是人才培養(yǎng)方面,過去高校教高性能計算,常面臨“學用脫節(jié)”——學生懂理論,但不會解決實際問題。而PAC大賽把氣象、醫(yī)療、核能等行業(yè)的真實需求變成賽題,學生在比賽中不僅要寫代碼,還要思考“技術(shù)怎么落地”。更貼心的是,大賽還搞“競賽招聘”,華為等企業(yè)直接在賽場選人才,優(yōu)秀選手能拿到實習機會。十多年來,大賽已培養(yǎng)超1.3萬名高性能計算人才,很多人如今成了華為、國家超算中心的骨干,甚至返回來當大賽指導老師、評委——國產(chǎn)算力的“人才梯隊”就這樣建起來了。
其次是“技術(shù)反哺”。參賽隊伍在優(yōu)化過程中,會不斷發(fā)現(xiàn)“鯤鵬”平臺的改進空間:比如某個算法在“鯤鵬”上跑不快,某個操作系統(tǒng)功能待完善。這些問題反饋給平臺方后,會直接推動國產(chǎn)軟硬件迭代升級。今年有團隊針對“鯤鵬”優(yōu)化中子輸運計算時,提出的“混合精度計算”方案,就被納入了國產(chǎn)工具鏈更新——相當于選手們幫“鯤鵬”打補丁、升等級,讓這個國產(chǎn)平臺越來越成熟。
最后是“產(chǎn)業(yè)落地”。大賽中的很多成果,已經(jīng)跳出賽場,走進了實際應用。比如有團隊做的“廣域海區(qū)計算優(yōu)化”,實現(xiàn)了海洋聲場的快速建模,如今已被國家海洋環(huán)境預報中心用于海洋風能評估;還有醫(yī)學領(lǐng)域的“FP16半精度差分算法”,能加速生物醫(yī)療數(shù)據(jù)處理,正在助力醫(yī)院提升疾病診斷效率。從“賽場”到“市場”,PAC大賽讓“鯤鵬”的算力真正變成了推動產(chǎn)業(yè)發(fā)展的“生產(chǎn)力”。
未來已來:青春力量引領(lǐng)全球算力新紀元
隨著PAC 2025總決賽在鄂爾多斯落幕,鍵盤敲擊聲雖已平息,但全球算力生態(tài)的變革浪潮正由新一代青年開發(fā)者掀起。這支以95后、00后為主力的創(chuàng)新軍團,正突破“技術(shù)使用者”的局限,在“鯤鵬”等自主平臺上構(gòu)建原創(chuàng)技術(shù)體系,更以跨學科視野探索算力賦能社會的無限可能。
當算力成為數(shù)字文明的基礎(chǔ)設(shè)施,技術(shù)標準的互操作性和資源全球化調(diào)度,標志著算力發(fā)展已進入?yún)f(xié)同創(chuàng)新階段。全球算力生態(tài)正迎來由青年開發(fā)者主導的深刻變革——從開源社區(qū)到國際競賽,技術(shù)創(chuàng)新的火花在多元文化碰撞中持續(xù)迸發(fā)。青春力量的核心使命,不僅共同參與書寫全球智慧的技術(shù)史詩,更為它注入了包容、開放、可持續(xù)的基因。
站在2025年的節(jié)點回望,我們或許正在見證人類計算文明新紀元的開端。
相關(guān)稿件