超級計算機的用處是什么?
應用層:解決方案
圖 7 超級計算機應用示意圖
隨著計算機科學的成熟,越來越多的科研創新和應用問題解決離不開海量數據、高速計算,超級計算機成為了諸多領域不可或缺的技術手段。
1 石油氣勘探
石油勘探,尤其是石油地球物理勘探,一直是高性能計算技術的傳統和主要應用領域。長期以來,油氣地球物理勘探技術的發展與應用高度依賴于包括高性能計算技術在內的信息技術的發展,尤其是近年來“兩寬一高”(寬方位、寬頻帶、高密度)勘探技術的普及,和逆時偏移、全波形反演等一系列處理解釋手段的應用,使得石油勘探對超級計算機的需求進一步增加。
國家超級計算天津中心基于“天河一號”開展的石油勘探數據處理程序,實現了復雜地質條件下上千平方公里數據的逆時偏移處理,支持中石油、中石化等單位大規模高精度三維成像處理軟件的開發。解決方案與服務內容包括:①大規模地震數據處理軟件的測試服務;②石油地震勘探數據的偏移處理服務,在“天河一號”平臺部署了GeoEast地震數據處理解釋一體化系統和GeoEast-Lightning波動方程深度偏移模塊,可為用戶提供疊前時間偏移、單程波疊前深度偏移和逆時偏移等偏移處理的計算平臺服務;③石油應用并行優化開發服務,涉及處理新方法新技術研究、應用軟件高性能計算開發與優化、行業信息系統開發等方面的開發服務。
2 生物醫藥與智能醫療
超級計算機在探究基因奧秘、蛋白質結構、生物信息以及藥物設計等方面已經成為不可或缺的工具,生物醫藥與智能醫療也就成為了活躍度較高的應用領域之一。依托高性能計算、云計算、大數據及人工智能等技術的高度發展,生物醫藥、智能醫療技術必將推動醫療事業的繁榮發展,使國民健康行業走向真正意義上的智能化。
生物醫藥(Biological Medicine)綜合應用生命科學與工程科學的原理和方法,從工程學角度,在分子、細胞、組織、器官乃至整個人體系統,多層次認識人體的結構、功能和其他生命現象,研究用于防病、治病、人體功能輔助及衛生保健的人工材料、制品、裝置和系統技術。生物醫藥產業具有創新成本高、投資風險大、研發周期長等特點。而依托高性能計算、云計算及大數據平臺開展相關科學研究和項目合作,可以大大縮短研發周期、降低創新成本、整體提高行業和企業的競爭力。
智能醫療(Intelligent Medical)通過打造醫療信息平臺、智能診斷系統等,結合大數據、高性能計算和人工智能三大關鍵技術,結合循證醫學和經驗醫學兩大模型,將人工智能技術應用于醫療行業,核心算法融合一系列人工智能算法,白日輔助醫生看病,夜間把最新的病例和手冊等數據傳輸回超級計算機中心,進行機器學習,學習與診斷相互結合,顯著提高臨床疾病的診斷效率和精度。
案例:大規模基因數據處理分析。“天河一號”支持華大基因開展大規模生物基因處理及數據存儲:①開發了基于GPU的高效基因測序處理軟件,并利用該軟件進行了3000株水稻的基因組重測序分析,短序列比對程序相對于之前應用的CPU版本速度提高15倍,且輸出格式不需要再次進行轉換,降低了I/O消耗;②構建Hadoop平臺,將原來華大擁有的100個節點規模的計算平臺擴展至數千節點,大幅度縮短項目的計算時間;③構建華大基因北方基因庫,基因數據規模已經超過1PB;④開發完成了基于天河系統的群體基因型高分辨率分析軟件,使用“天河一號”的Gaea軟件15個小時便能完成人類64X的WGS數據所有分析過程。
圖 8 全基因組測序成果
美國能源部和美國國家癌癥研究院的聯合項目CANDLE(CANcer Distributed Learning Environment)旨在實現面向疾病精準醫療職能的E級深度學習和模擬。目前此項目正在評估頂級社區開發的深度學習系統(Argonne的Theta,Oak Ridge的Summit早期訪問系統和LLNL的Sierra早期訪問系統),并在此基礎上解決癌癥的三個問題:RAS途徑問題——是了解在30%的癌癥中存在的RAS/RAF途徑中關鍵蛋白質相互作用的分子基礎;藥物反應問題——開發用于藥物反應的預測模型,可用于優化臨床前藥物篩查并推動針對癌癥患者的精確醫學治療;治療策略問題——自動分析和提取數百萬癌癥患者記錄中的信息,以確定一系列患者生活方式、環境因素、癌癥類型和醫療保健系統的最佳癌癥治療策略[1]。
由ORNL(橡樹嶺國家實驗室)計算生物學家Dan Jacobson領導的一個研究小組利用ORNL的Summit發現植物細胞壁的關鍵調節基因,這些基因可被操作以增強生物燃料和生物產品。該團隊的研究結果發表于2018年5月的《Frontiers in Energy Research》(能源研究前沿)。
ORNL用時也與美國退伍軍人事務部之間展開戰略合作項目,該項目的目標是將臨床和基因組數據與機器學習和Summit的先進架構相結合,以更好地了解導致心血管疾病、前列腺癌、自殺心理、阿爾茨海默病、藥物成癮等疾病的遺傳因素[2]。
3 工程仿真與航天器研發
工程仿真CAE(Computer Aided Engineering),即計算機輔助工程技術,是計算機和工程分析相結合形成的新興技術,利用計算機輔助求解力學性能的分析計算結果、進行結構性能優化設計,是一種近似數值分析方法。其核心思想是結構離散化,將實際結構離散為有限數目的規則單元組合體,通過對離散體進行分析求解,得出滿足工程精度的近似結果,替代對實際結構的分析,可以解決很多實際工程需要解決,而理論分析和實驗驗證又無法解決的復雜問題。
案例:在航空發動機研制中,氣動穩定性是最重要的技術標準之一,需使用工程仿真技術對氣壓機以及渦輪的效率、渦輪葉片冷卻效果等進行分析模擬,通過編制包含穩態及動態過程在內的程序,輸入初始參數后,計算得到發動機各截面的氣動參數和性能參數,透過航空發動機復雜的設計,直接模擬和觀察到其工作特性和結構特性,進行結構設計優化。為達到航空發動機研發的精度要求,需要進行500-3000萬網格以上的精細計算。通過超級計算機,可避免航空發動機臺架試驗的難度和危險性,將設計效果驗證深度、廣度增加,產品設計周期縮短(單個部件的分析時間可從一周縮短為5小時),大幅降低設計及試驗驗證成本,快速提升航空發動機整體創新水平。
圖 9某型航空發動機內部三維流動工程仿真效果圖
基于“神威·太湖之光”的超級計算機,對“天宮一號”飛行器兩艙簡化外形(長度10余米、橫截面直徑接近3.5米)隕落飛行(H=65km、62km、Ma=13)繞流狀態進行大規模并行模擬,使用16,384個處理器在20天內便完成常規需要12個月的計算任務,計算結果與風洞試驗結果吻合較好,為“天宮一號”飛行試驗提供重要數據支持。
圖 10 大規模并行模擬“天宮一號”兩艙繞流狀態
4 天氣預報與霧霾預警
數值天氣預報(Numerical Weather Prediction)是用數學方法構建方程,將氣象數據和邊界參數導入方程求解,從而預測大氣變化和狀態的科學。業務流程大致為:氣象數據收集和預處理、數值天氣預報流程、綜合數值天氣預報、天氣學與統計學等輸出預報結果。它是典型的計算密集型應用(Computing-Intensive),要求建立一個較好的反映預報時段的(短期的、中期的)數值預報模式和誤差較小、計算穩定并相對運算較快的計算方法;其次,由于數值天氣預報要利用各種手段(常規觀測、雷達觀測、船舶觀測、衛星觀測等)獲取氣象資料,因此必須恰當地對氣象資料做調整、處理和客觀分析;再者,由于數值天氣預報的計算數據量非常之大,很難用手工或小型計算機去完成,因此,開展數值天氣預報必須依賴超級計算機極強的計算能力。
案例:國家超級計算長沙中心為中部某省氣象局提供了數值天氣預報計算的平臺支持,以提高天氣預報、氣候預測的及時性、準確性、可靠性和精細化,更早的對災害性天氣進行預警,更好地分析災害天氣情況的規律,更有效地形成防御災害天氣的對策。業務化運營后,該氣象局數值預報能力大幅提升,WRF模式最高水平分辨率從20公里提升為4公里,覆蓋包括該省在內的10*10區域;AREM暴雨模式水平分辨率從37公里提升為15公里;該氣象局內部原有計算平臺對中小尺度系統和強對流發展演變情況無法清晰模擬,但提高模式分辨率又難以滿足時效性要求,超級計算平臺解決了該省數值模式業務運算能力不足的問題,為省級數值模式預報業務發展創造了良好的運算環境,并進一步提高了天氣預報預警服務質量和水平。
圖 11 2015年4月2日08時~3日08時暴雨過程模式預報圖
圖 12 2015年4月2日08時-4月3日08時暴雨過程實況圖
2016年,“神威·太湖之光”的“千萬億次八百五十萬核可擴展非靜力大氣動力全隱求解器”,由中科院軟件所、清華大學、北京師范大學等單位共同研發。項目發展了適應異構眾核體架構的隱式求解算法與優化技術,使模擬的性能達到0.8億億次,與相同優化的顯式求解算法相比計算速度提升近兩個數量級,可支持500米大氣動力模擬,是國際上領先的研究成果,將其嵌入到大氣模式中,對我國解決高精度氣象問題具有重要作用。
圖 13 大氣模擬中不同kernel的數據劃分和任務調度
5 海洋環境工程
從海洋環流數值模擬到空氣質量實時監測,再到海洋災害預報等,高性能計算正在以強大計算力幫助人類實現對環境生態的深入洞察,實現海洋環境數值預報的精確性,為我國海洋資源開發以及海洋環境保護提供技術保障。
廣州市香港科大霍英東研究院建立的CMOMS數值模擬系統,對中國近海環流、生態及碳循環動力系統的調控機理等前沿科學問題進行數值模擬,并在氣候變化、全球變暖的背景下,對未來100年西太平洋-中國海區域的碳收支、循環及其變異等進行數值預測,為應對中國海域及其附近海域的氣候變化提供參考與支持。
“神威·太湖之光”超級計算機實現了MASNUM海浪數值模擬的(1/60)°高分辨率的全球海洋模式,通過眾核加速以及負載均衡、通信重疊和指令流水等優化手段,模式成功擴展到8,519,680核數,達到最高30.07 Pflops的峰值性能。該模式基于波數譜空間下能量平衡方程,以海浪譜直接模擬為目標。“神威·太湖之光”使其獲得了優異的擴展性與并行效率。
圖 14 利用“神威·太湖之光“模擬的全球(a)與區域(b)重要海浪高度分布
6 建筑信息模型
建筑信息模型(Building Information Modeling,簡稱BIM)是一項將建筑與信息相結合的綜合技術,通過高性能計算機系統對建筑過程中產生的主要數據進行存儲處理,可對建筑的規劃、設計、施工、運營管理的全生命周期進行信息化管理,優化設計、控制成本、協助管理、提高工程效率與質量,為推動智慧城市的建設與發展起到重要作用。
圖 15 遠程可視化建模
案例:天津濱海新區天河建筑云產業園的建設就是以天河BIM云平臺為基礎的工程項目。天河BIM云平臺以工程仿真系統、大數據平臺和云平臺為依托,為產業園建設提供四類服務:
①BIM遠程可視化建模平臺,用戶本地無需采購高性能圖形工作站、無需安裝BIM建模軟件,只需使用普通配置的主機連接到天河BIM云平臺提供的桌面或應用程序,即可進行BIM遠程可視化建模。
②BIM協同設計服務,以業主為核心,有效管控設計過程,減少設計風險,提高管控質量和效率,實現不同參與方、不同專業的多地點、實時協同工作。
③BIM仿真模擬,基于天河工程仿真設計平臺,為建筑設計提供結構力學分析、流體力學分析和有限元分析等基礎環境,如為建筑結構的強度及抗震分析,建筑單體與整體園區的室內外空氣流通性等。
④BIM協同施工管理平臺,支持多平臺的BIM模型瀏覽。通過二維碼實現BIM數據與現場信息高效而有序地交互和材料跟蹤管理,記錄狀態信息并同步至BIM模型中。現場問題可即時在移動端以照片、文字記錄至云平臺,方便現場質量管理。計劃任務、采集的完成時間與BIM結合,形成真實的可視化4D進度模擬,輔助進度管理。項目資料(圖紙、文檔、圖片、視頻等)分類管理,可與BIM構建關聯,形成BIM資料庫。
7 基礎科學研究
隨著計算機技術和應用的迅猛發展,利用高性能計算模擬已經成為基礎科學研究中不可缺少的重要手段。
在過去幾十年中,科研人員在化學、材料科學、生命科學、固體物理、生物物理、生物化學、藥物研究等微觀領域的研究中,基于量子力學方法發展了大量而可靠的非相對論薛定諤方程和相對論迪拉克方程的近似解法,用來模擬微觀世界中原子和分子的相互作用和行為。
例如,①使用并行程序進行密度泛函理論(DFT)計算已經成為材料科學、固體物理、計算化學、計算生物學等領域內必不可少的研究手段之一;②并行實現的高精度耦合簇理論(CC)和組態相互作用(CI)方法被許多量子化學計算程序采用,成為計算化學的主要工具;③基于牛頓力學并結合了量子力學的分子動力學計算的并行實現,是生命科學、生物物理、生物化學、藥物研究等領域的主要模擬手段。
江蘇無錫的國家超級計算中心已利用新研發的“神威·太湖之光”超算進行算法庫swDNN的深度學習。基于“神威·太湖之光”的異構眾核處理器,已開發出針對卷積、矩陣乘等深度學習核心計算模塊的算法庫swDNN,通過采用計算任務劃分、計算通信重疊、寄存器通信等優化技術,計算模塊的計算效率可達到60%。相比于K40m圖形處理器(graphics processing unit,GPU)上的cuDNN算法庫,swDNN具有1.91-9.75倍的雙精度浮點數性能優勢。這一算法庫可為人工智能開發開辟道路,目前國家無錫超算中心與中國電子學會、北京郵電大學合作,開展了以深度學習為核心的圍棋人工智能項目。目前已完成軟件開發優化,開始進入訓練階段,目標是利用“神威·太湖之光”這一超算平臺,實現中國自己的專業級圍棋人工智能[3]。
隨著具備更強大計算能力的超級計算機的出現,人們可以模擬越來越大規模的微觀系統、越來越長時間的微觀過程、越來越精細的微觀現象,從而極大地增強了對自然的認知能力。時至今日,高性能計算已在基礎科學研究、工業工程、公益事業、國防安全等各個領域廣泛應用,解決了一些重大、關鍵、具有挑戰性的重要科學和工程問題,對支持科技創新、推動經濟發展起到了重要作用。
如需獲取人工智能最新前沿信息 ,關注微信公眾號“學術頭條”,
還可在菜單欄直接免費下載研究報告《超級計算機研究報告》PPT版和word版:
PPT版本報告:https://static.aminer.cn/misc/article/sc-p.pdf
word版本報告:https://static.aminer.cn/misc/article/sc.pdf
(自動駕駛 機器翻譯 行為經濟學 區塊鏈 通信 機器人 自然語言處理 計算機圖形學 )。