【環(huán)球網(wǎng)科技綜合報(bào)道】8月13日-16日,第21屆CCF全國(guó)高性能計(jì)算學(xué)術(shù)大會(huì)(CCF HPC China 2025)在鄂爾多斯舉辦,大會(huì)以“綠動(dòng)算力 超智融合”為主題,共同探討開創(chuàng)高性能計(jì)算高質(zhì)量發(fā)展新局面的實(shí)現(xiàn)路徑。
當(dāng)前,高性能計(jì)算學(xué)術(shù)研究和產(chǎn)業(yè)拓展正經(jīng)歷前所未有的橫向突破。本屆大會(huì)主席、中國(guó)工程物理研究院莫?jiǎng)t堯研究員在致辭中表示:“當(dāng)前,高性能計(jì)算正在邁入智算融合‘深水區(qū)’。我們既面臨效能等硬核挑戰(zhàn),也遭遇了軟件薄弱、區(qū)域發(fā)展失衡等系統(tǒng)性問題,亟需數(shù)字化、智能化學(xué)科交叉的攻堅(jiān)克難。破局之道在于全國(guó)一盤棋,將算力孤島、學(xué)科孤島、應(yīng)用孤島等凝聚為創(chuàng)新大陸,實(shí)現(xiàn)算力、數(shù)據(jù)、模型、軟件、應(yīng)用等資源的協(xié)同共享和融合普惠。我們?cè)絹?lái)越清楚地認(rèn)識(shí)到,開創(chuàng)高性能計(jì)算高質(zhì)量發(fā)展新局面,務(wù)必以協(xié)同共享為基礎(chǔ),以融合普惠為目標(biāo)。”
智算近年來(lái)發(fā)展迅猛。算力的獲取不僅要靠智算中心的芯片快速迭代,更重要的是靠技術(shù)規(guī)模的不斷擴(kuò)展。構(gòu)建高性能的網(wǎng)絡(luò)互聯(lián)不僅關(guān)系到數(shù)據(jù)中心的建設(shè),更是AI未來(lái)發(fā)展的關(guān)鍵技術(shù)之一。在此背景下,阿里云、中科院聯(lián)合成立了高通量以太網(wǎng)聯(lián)盟,致力于針對(duì)智算場(chǎng)景的高通量協(xié)議,推動(dòng)標(biāo)準(zhǔn)化,打造開源開放的智算場(chǎng)景下的國(guó)內(nèi)開放生態(tài)。在本次大會(huì)上,聯(lián)盟發(fā)布了多項(xiàng)重要成果:國(guó)產(chǎn)芯片落地,包括400G網(wǎng)卡芯片和25.6G交換芯片,以構(gòu)建智算中心網(wǎng)絡(luò);發(fā)布國(guó)產(chǎn)追光芯片;針對(duì)ERACK場(chǎng)景發(fā)布互聯(lián)以太網(wǎng)網(wǎng)絡(luò);發(fā)布UPN超性能網(wǎng)絡(luò),旨在基于單層的以太網(wǎng)和光技術(shù)構(gòu)建新型超全解耦超性能的網(wǎng)絡(luò)。
在超智融合加速發(fā)展的背景下,《超智融合集群能力要求》行業(yè)標(biāo)準(zhǔn)也在大會(huì)上正式發(fā)布。該標(biāo)準(zhǔn)首次系統(tǒng)地構(gòu)建了覆蓋架構(gòu)設(shè)計(jì)、功能性能、安全可信及評(píng)估方法的能力體系,重點(diǎn)解決跨廠商兼容性差、集群協(xié)同效率低等行業(yè)共性問題,為智能制造、智慧城市等場(chǎng)景提供統(tǒng)一的技術(shù)規(guī)范。

中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)理事長(zhǎng)孫凝暉指出,科學(xué)智能(AI4S)作為高性能計(jì)算與人工智能深度融合的前沿交叉領(lǐng)域,正深刻改變著科學(xué)研究的范式。其發(fā)展所面臨的模型復(fù)雜性、算力需求和數(shù)據(jù)挑戰(zhàn)顯著區(qū)別于傳統(tǒng)人工智能應(yīng)用。AI4S的最大作用是突破人類認(rèn)知的極限。AI不是萬(wàn)能工具,它離不開高性能計(jì)算這一重要手段。當(dāng)前,信息技術(shù)賦能科學(xué)的手段如同從“增強(qiáng)肌肉(算力)”到“提供營(yíng)養(yǎng)”(數(shù)據(jù)),再到“賦予大腦”(人工智能)的進(jìn)化。而信息學(xué)科的主要任務(wù)是提供工具,包括提高生產(chǎn)率的科研信息化工具和應(yīng)用開發(fā)中間件。
超級(jí)計(jì)算是推動(dòng)科學(xué)研究、技術(shù)突破、產(chǎn)業(yè)發(fā)展的創(chuàng)新引擎。隨著大數(shù)據(jù)、人工智能技術(shù)的快速發(fā)展,超算技術(shù)面臨著新挑戰(zhàn),比如能耗與復(fù)雜性的增加,但同時(shí)也迎來(lái)了新的機(jī)遇。
中山大學(xué)計(jì)算機(jī)學(xué)院教授、國(guó)家超級(jí)計(jì)算廣州中心主任、國(guó)家超級(jí)計(jì)算深圳中心主任盧宇彤呼吁,打造國(guó)產(chǎn)新一代超算系統(tǒng),關(guān)注極致性能、能效與自主可控等因素,設(shè)計(jì)實(shí)現(xiàn)新型體系架構(gòu)和融合軟件棧,打破多級(jí)異構(gòu)壁壘,構(gòu)建應(yīng)用生態(tài),實(shí)現(xiàn)多域場(chǎng)景的深度滲透。同時(shí),還應(yīng)基于標(biāo)準(zhǔn)與開源的協(xié)同體系,構(gòu)建產(chǎn)學(xué)研用的可持續(xù)發(fā)展生態(tài),有效支撐科學(xué)發(fā)現(xiàn)、產(chǎn)業(yè)革新和智能躍遷,讓超算成為國(guó)家科技創(chuàng)新和行業(yè)數(shù)智化升級(jí)的超級(jí)引擎。
會(huì)上,中國(guó)科學(xué)院理論物理研究所研究員、中國(guó)科學(xué)院大學(xué)學(xué)術(shù)副校長(zhǎng)吳岳良首先簡(jiǎn)要回顧和介紹從極小量子粒子到極大宇宙膨脹的重大理論突破與前沿研究。隨后重點(diǎn)闡述量子宇宙物理面臨的兩大關(guān)鍵挑戰(zhàn):其一,現(xiàn)有物理理論在定量預(yù)言與數(shù)值求解方面存在著理論計(jì)算瓶頸。無(wú)論是由廣義相對(duì)論所描述的引力相互作用,還是由量子色動(dòng)力學(xué)刻畫的強(qiáng)相互作用,均涉及高度復(fù)雜的非線性和非微擾特性,由此發(fā)展的數(shù)值相對(duì)論與格點(diǎn)規(guī)范理論對(duì)高性能計(jì)算和超算體系提出了前所未有的需求;其二,現(xiàn)有理論框架本身存在著根本性概念沖突,尤以廣義相對(duì)論與量子力學(xué)/量子場(chǎng)論的自洽結(jié)合最為突出。隨著引力波的發(fā)現(xiàn)與量子物理研究的深入,近年來(lái)引力量子場(chǎng)論與超統(tǒng)一場(chǎng)論等新理論框架的發(fā)展,對(duì)時(shí)空、能量、物質(zhì)和宇宙等觀念提出了全新認(rèn)識(shí)。從超統(tǒng)一場(chǎng)論的視角,粒子物理標(biāo)準(zhǔn)模型中的所有輕子和夸克作為物質(zhì)基本組元被統(tǒng)一為局域糾纏量子比特旋量場(chǎng), 所有基本相互作用由非齊次超自旋規(guī)范對(duì)稱性相應(yīng)的規(guī)范相互作用支配。
吳岳良表示,把宇宙視作為由量子信息動(dòng)力學(xué)自發(fā)演化的超級(jí)量子計(jì)算機(jī),為自然界基本構(gòu)造塊和基本相互作用提供量子信息動(dòng)力學(xué)的認(rèn)識(shí)和理解,探討信息、物質(zhì)、能量和時(shí)空相統(tǒng)一的動(dòng)力學(xué)描述,無(wú)論對(duì)基礎(chǔ)物理研究還是量子計(jì)算機(jī)發(fā)展都將有著深刻的啟示。
科學(xué)計(jì)算對(duì)系統(tǒng)的需求仍然在持續(xù)增長(zhǎng)。同時(shí)智能計(jì)算對(duì)系統(tǒng)的需求也在快速增加。現(xiàn)在科學(xué)智能計(jì)算走入AI for Science,將在更多的領(lǐng)域?qū)崿F(xiàn)賦能,大幅提升計(jì)算性能。
國(guó)防科技大學(xué)教授、博士生導(dǎo)師盧錫城表示,為進(jìn)一步提升計(jì)算性能,應(yīng)針對(duì)應(yīng)用特點(diǎn),并結(jié)合客觀條件對(duì)體系結(jié)構(gòu)進(jìn)行優(yōu)化設(shè)計(jì),綜合技術(shù)、工藝、成本等因素創(chuàng)新體系結(jié)構(gòu),實(shí)現(xiàn)軟硬件協(xié)同,目標(biāo)就是要均衡配置,更好地實(shí)現(xiàn)異構(gòu)加速。瞄準(zhǔn)高性能與易使用兩大用戶的基礎(chǔ)性要求,產(chǎn)業(yè)界應(yīng)不斷提升自主創(chuàng)新能力,充分吸收以往的成功經(jīng)驗(yàn),精誠(chéng)合作,實(shí)現(xiàn)軟件與硬件協(xié)同創(chuàng)新。
為了提升計(jì)算效率,首先要有一個(gè)好的算法,然后還要有好的機(jī)器,只有實(shí)現(xiàn)算法與機(jī)器協(xié)同,才能實(shí)現(xiàn)性能的優(yōu)化。北京應(yīng)用物理與計(jì)算數(shù)學(xué)研究所研究員徐小文指出,稀疏線性代數(shù)解法器是科學(xué)工程計(jì)算與工業(yè)仿真領(lǐng)域很多應(yīng)用軟件的基礎(chǔ)共性組件,也是主要的性能瓶頸。解法器的效率與健壯性是實(shí)際應(yīng)用中最值得關(guān)注的兩個(gè)問題。徐小文表示,復(fù)雜場(chǎng)景的多樣性和動(dòng)態(tài)演化特征將給這兩個(gè)方面帶來(lái)嚴(yán)峻挑戰(zhàn)。而要解決問題,關(guān)鍵是如何實(shí)現(xiàn)算法空間與特征空間的映射。報(bào)告提出了一類特征修正算法框架,并以實(shí)際應(yīng)用中的典型算法為例,深入探討了具有自動(dòng)適配能力的智能解法器。從發(fā)展趨勢(shì)看,智能解法器在給定應(yīng)用場(chǎng)景和機(jī)器的情況下,能夠自動(dòng)實(shí)現(xiàn)“特征-算法-優(yōu)化”三個(gè)空間的最優(yōu)映射。
人工智能引領(lǐng)新一輪工業(yè)革命,大模型技術(shù)成為驅(qū)動(dòng)本輪浪潮的關(guān)鍵支撐。對(duì)于用戶而言,高效、便捷且可靠的算力服務(wù)是實(shí)現(xiàn)大模型訓(xùn)練和推理的核心需求。然而,用戶在使用算力服務(wù)時(shí)面臨著多種挑戰(zhàn),包括高昂的成本、復(fù)雜的操作流程、資源分配的不均衡,以及對(duì)大模型訓(xùn)練特征的不熟悉等。正如北京并行科技股份有限公司董事長(zhǎng)陳健所說(shuō),從用戶視角來(lái)看,算力服務(wù)和算網(wǎng)服務(wù)的質(zhì)量、效率和易用性才是關(guān)鍵。因此,算力服務(wù)提供商需要從用戶需求出發(fā),圍繞業(yè)務(wù)的應(yīng)用運(yùn)行特征,提供多樣化的算力選型方案和解決方案。