科研智能-人工智能驅(qū)動的研發(fā)新范式2024_第1頁
科研智能-人工智能驅(qū)動的研發(fā)新范式2024_第2頁
科研智能-人工智能驅(qū)動的研發(fā)新范式2024_第3頁
科研智能-人工智能驅(qū)動的研發(fā)新范式2024_第4頁
科研智能-人工智能驅(qū)動的研發(fā)新范式2024_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

科研智能(AI4R&D)——人工智能驅(qū)動的研發(fā)新范式中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)科學(xué)智能(AI4S)工作組版權(quán)聲明本報告版權(quán)屬于中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟,并受法律保護。轉(zhuǎn)載、摘編或利用其它方式使用本報告文字或者反上述聲明者,本聯(lián)盟將追究其相關(guān)法律責(zé)任。編制說明本報告主要是在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟指導(dǎo)和組織下起草編寫,主要參編單位包括中國信息通信研究院、華為技術(shù)有限公司、北京百度網(wǎng)訊科技有限公司、北京深勢科技有限公司、之江實驗室、阿里云計算有限公司、北京航空航天大學(xué)、國網(wǎng)智能電網(wǎng)研究院有限公司、中冶京誠數(shù)字科技(北京)有限公司、中國科學(xué)院沈陽自動化研究所、中國華能集團清潔能源技術(shù)研究院有限公司、深圳華大生命科學(xué)研究院、同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司、上海和今信息科技有限公司、北京科技大學(xué)、北京市商湯科技開發(fā)有限公司、東方財富信息股份有限公司、北京新數(shù)科技有限公司。胡曉光、孫佩源、劉會師、劉大鵬、貢金鵬、李振廷、王忠新、蒙貴云、張艷博、周原野、楊康、王錦海。 1 2 2 4 7 5 科研智能(AI4R&D)—人工智能驅(qū)動1人工智能賦能科學(xué)研究及產(chǎn)業(yè)研發(fā))是科學(xué)智能(AIforScience,AI4S)概念的延伸和擴展,主要包括兩方面內(nèi)涵,一是聚焦人工智能加速基礎(chǔ)科學(xué)研究,拓展研究思路,加速研究進程;二是強調(diào)人工智能在應(yīng)用研究和產(chǎn)業(yè)研發(fā)中的重要作用,全面提升工程技術(shù)創(chuàng)新的效率??蒲兄悄艽砹丝萍紕?chuàng)新的新范式和新動能,有望全面加速基礎(chǔ)研究和產(chǎn)業(yè)研發(fā)的進程,并縮短兩者之間的轉(zhuǎn)化周期,推動科技成果在工業(yè)界的產(chǎn)業(yè)化和規(guī)模應(yīng)用。科研智能正在全球范圍內(nèi)加速發(fā)展。從戰(zhàn)略層面看,各國相繼發(fā)布政策構(gòu)筑科研智能發(fā)展環(huán)境。2023年12月,歐盟委員會發(fā)布政策簡報《人工智能在科學(xué)中的應(yīng)用》,倡導(dǎo)為歐洲量身制定一項政策,促進人工智能在科學(xué)領(lǐng)域的應(yīng)用。2023年5月,美國新建7家國家人工智能研究所,推動年8月,我國發(fā)布《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》,支持探索人工智能技術(shù)用于重大科學(xué)研究和技術(shù)開發(fā)的應(yīng)用場景。從賦能層面看,一方面AI持續(xù)拓展科學(xué)領(lǐng)域問題解決的能力,圍繞生命科學(xué)、物理等領(lǐng)域,形成了如Alphafold3等代表性成果。另一方面AI不斷加速產(chǎn)業(yè)研發(fā)進程,在材料研發(fā)、氣象預(yù)測、工業(yè)設(shè)計等領(lǐng)域相繼取得技術(shù)突破??蒲兄悄茏鳛橐粋€新興的交叉領(lǐng)域,目前尚處于發(fā)展的早期階段,但已經(jīng)展現(xiàn)出巨大的發(fā)展?jié)摿蛷V闊的應(yīng)用場景,中國信息通2信研究院(以下簡稱“中國信通院”)持續(xù)跟蹤科研智能技術(shù)和產(chǎn)業(yè)動態(tài),于2024年發(fā)布報告《科研智能(AI4R&D)—人工智能驅(qū)動定產(chǎn)業(yè)政策、指導(dǎo)項目布局提供參考,為研究機構(gòu)、科技企業(yè)把握技術(shù)方向、開拓應(yīng)用場景提供借鑒,加速該領(lǐng)域的技術(shù)創(chuàng)新和應(yīng)用實踐,為我國在該領(lǐng)域搶占發(fā)展先機提供助力。未來,中國信通院將關(guān)注全球科研智能發(fā)展動向,深化對關(guān)鍵技術(shù)和產(chǎn)業(yè)趨勢的研判,加強與科研機構(gòu)、高校、企業(yè)等產(chǎn)學(xué)研各界的交流合作,共同推進科研智能生態(tài)體系建設(shè),為科技強國和創(chuàng)新型國家建設(shè)提供有力支科研算力與科研數(shù)據(jù)的深度融合為AI4R&D奠定了堅實基礎(chǔ)。由AI框架、算法庫、開發(fā)套件及領(lǐng)域模型組成的開發(fā)工具鏈極大提升了科研效率,促進了跨學(xué)科、跨領(lǐng)域的協(xié)同創(chuàng)新與融合,深刻改變了科學(xué)研究范式。(一)科研算力—賦能科研智能高效運行科研算力是指結(jié)合智能算力與超算算力的計算能力,通過異構(gòu)計算架構(gòu)滿足高精度計算和AI模型訓(xùn)練推理需求。智能算力基于GPU(圖形處理器)、TPU(張量處理單元)、NPU(神經(jīng)網(wǎng)絡(luò)處理單元)等AI芯片,提供高度并行計算能力,適用于人工智能的訓(xùn)練和推理計算。超算算力依托超級計算機集群,實現(xiàn)大規(guī)??茖W(xué)計算和模擬,能夠處理復(fù)雜的科學(xué)計算問題,廣泛應(yīng)用于如行星模擬、科研智能(AI4R&D)—人工智能驅(qū)動3藥物分子設(shè)計、基因分析等場景。而科研智能算力整合了AI計算和科學(xué)計算兩種方式,采用異構(gòu)計算架構(gòu),結(jié)合多種計算單元,以滿足高精度科學(xué)計算和人工智能模型訓(xùn)練、推理的雙重需求??蒲兄悄艿难芯可婕按罅繌?fù)雜的計算任務(wù),包括大規(guī)模數(shù)據(jù)處理、深度學(xué)習(xí)模型訓(xùn)練和高精度科學(xué)模擬等,這些任務(wù)均需要充足的算力支撐。在多數(shù)場景下,為滿足科學(xué)研究和工程應(yīng)用的需求,如蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold2取得了突破性進展,能夠以原子級精度預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),其預(yù)測效果可以與實驗結(jié)果媲美,解決了生物學(xué)界長達50年的重大挑戰(zhàn),該成就被Science雜志評為2021年度十大科學(xué)突破成果的第一位。這一進展也在很大程度上依賴于大規(guī)模的計算資源支持,在AlphaFold2的研發(fā)過程中,DeepMind團隊投入了大量的算力資源,訓(xùn)練階段使用了約128個TPUv3,歷時11天才能完成1。當(dāng)前業(yè)界提供科研智能算力服務(wù)的方式主要有三種:一是云服務(wù)企業(yè)以公有云模式提供智能算力服務(wù)。云服務(wù)企業(yè)以智能算力平臺的形式提供計算資源,如阿里云靈駿智算平臺、百度智能云AIStudio、華為昇騰云等,面向基礎(chǔ)科研、新藥研發(fā)、工程仿真等場景提供一站式算力服務(wù)。二是由政府、企業(yè)建設(shè)并對外提供服務(wù)的人工智能算力中心。西安的未來人工智能計算中心已成功孵化出多個智能科研領(lǐng)域的大模型,如全球首個面向雷達遙感場景的“秦嶺·西電遙感腦大模型”,以及全球首個面向計算流體力學(xué)場景的“秦嶺·翱1《HighlyaccurateproteinstructurepredictionwithAlphaFold》科研智能(AI4R&D)—人工智能驅(qū)動4翔大模型”。三是以一體機形式交付的科研智能算力。一體機通過將專用硬件、軟件和服務(wù)集成在一個系統(tǒng)中,打造便捷、高性能的科研智能系統(tǒng)。如深勢盒子是面向分子動力學(xué)模擬設(shè)計場景推出一體機,硬件層面以定制加速卡與CPU結(jié)合的方式提供計算能力,軟件層面預(yù)裝分子動力學(xué)專業(yè)模擬軟件。我國科研智能算力面臨多項挑戰(zhàn),亟需建立普惠的科研算力保障體系。挑戰(zhàn)層面,一是高端AI芯片的生產(chǎn)和購買受限,影響算力供給。二是國內(nèi)智能算力的技術(shù)產(chǎn)業(yè)生態(tài)較弱,應(yīng)用門檻高。三是智能算力資源主要集中于頭部科技類企業(yè),高校、科研機構(gòu)和大量行業(yè)企業(yè)算力儲備相對有限。建議層面,一是建立針對高校、科研機構(gòu)和行業(yè)企業(yè)的算力資源保障機制,實現(xiàn)算力資源的合理供給、動態(tài)分配與高效利用,保障科研智能領(lǐng)域計算需求。二是構(gòu)建跨地區(qū)、跨機構(gòu)的科研算力資源共享平臺,促進科研機構(gòu)與產(chǎn)業(yè)界的協(xié)同創(chuàng)新。三是實施科研算力成本效益評估,優(yōu)化資源投入與產(chǎn)出,加速科技成果的產(chǎn)業(yè)轉(zhuǎn)化。(二)科研數(shù)據(jù)—驅(qū)動科研智能創(chuàng)新發(fā)現(xiàn)科研數(shù)據(jù)是指科學(xué)研究和產(chǎn)業(yè)研發(fā)活動產(chǎn)生的原始數(shù)據(jù)、中間數(shù)據(jù)、結(jié)果數(shù)據(jù)和分析數(shù)據(jù)等,主要包括觀測數(shù)據(jù)、實驗數(shù)據(jù)、記錄數(shù)據(jù)、調(diào)查數(shù)據(jù)、模擬數(shù)據(jù)及科研文獻等內(nèi)容。高質(zhì)量的科研數(shù)據(jù)是科研智能的基礎(chǔ),規(guī)范的科研數(shù)據(jù)管理是科研智能開展的前提??蒲兄悄軘?shù)據(jù)相較于傳統(tǒng)的行業(yè)數(shù)據(jù),有如下特點。一是數(shù)據(jù)來源和類型更加多樣。數(shù)據(jù)來自儀器設(shè)備、傳感器、仿真模擬、文獻等,5數(shù)據(jù)格式和語義差別較大。二是數(shù)據(jù)質(zhì)量要求高。數(shù)據(jù)的客觀性、準(zhǔn)確性、完備性、分辨率等質(zhì)量要求很高,這會直接影響到計算結(jié)果的可信度。三是數(shù)據(jù)量更大。實驗觀測數(shù)據(jù)、仿真模擬數(shù)據(jù)等不僅規(guī)模巨大且增長快速,遠超普通商業(yè)化數(shù)據(jù)。四是維度更高。例如氣象、地理、生物數(shù)據(jù)涉及時間、空間、物種等多個維度,結(jié)構(gòu)更加復(fù)雜。在科研數(shù)據(jù)領(lǐng)域,公開數(shù)據(jù)集對于推動科研創(chuàng)新具有重要意義。國外方面,公開數(shù)據(jù)集資源豐富、體系成熟,已成為全球科研工作者開展研究的重要基礎(chǔ)設(shè)施。美國通過一系列項目推動科研領(lǐng)域公共數(shù)據(jù)集的建設(shè)、共享及應(yīng)用,如美國國家生物信息中心(NCBI)成為全球醫(yī)療AI研究人員的首選數(shù)據(jù)源,其數(shù)據(jù)可在亞馬遜云平臺和谷歌云平臺上便捷訪問。在氣象領(lǐng)域,美國國家海洋和大氣管理局(NOAA)的數(shù)據(jù)是氣象大模型研發(fā)的重要支撐。材料科學(xué)方面,“材料項目”(TheMaterialsProject)經(jīng)過三十年發(fā)展,已成為該領(lǐng)域的標(biāo)桿性數(shù)據(jù)庫。數(shù)據(jù)資源的長期積累為科技突破奠定了重要基礎(chǔ),如AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的成功很大程度上得益于蛋白質(zhì)數(shù)據(jù)庫(PDB)的長期數(shù)據(jù)積累。我國方面,近年來在科研數(shù)據(jù)建設(shè)及共享方面也取得了顯著進展。全國已建成50多個國家級行業(yè)科技數(shù)據(jù)中心和200多個地方科技數(shù)據(jù)中心,形成覆蓋多領(lǐng)域的科學(xué)數(shù)據(jù)中心體系。在材料、天文、電磁、流體、氣象、生命科學(xué)等領(lǐng)域已具備一定規(guī)模的公開數(shù)據(jù)集。6領(lǐng)域數(shù)據(jù)持有單位(EMBL)及(NIST)(ECMWF)//7/我國公開數(shù)據(jù)集建設(shè)不足,優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)未能得到有效利用。一方面領(lǐng)域覆蓋度有限,數(shù)據(jù)集建設(shè)不完善且質(zhì)量有待提升。例如,盤古、風(fēng)烏、伏羲等國內(nèi)氣象大模型的研發(fā)均依賴國外公開數(shù)據(jù)集,而非國內(nèi)數(shù)據(jù)集。另一方面在科研機構(gòu)與行業(yè)企業(yè)中已積累的大量領(lǐng)域數(shù)據(jù)公開意愿不高,導(dǎo)致大量的優(yōu)質(zhì)數(shù)據(jù)資源處于“靜默”狀態(tài)。我國需加強數(shù)據(jù)集建設(shè)與共享,推動科研智能產(chǎn)業(yè)高效發(fā)展。我國需建立自己的科研數(shù)據(jù)戰(zhàn)略,系統(tǒng)規(guī)劃科研領(lǐng)域數(shù)據(jù)建設(shè)計劃,推動以國家重點實驗室、重點行業(yè)企業(yè)為代表的機構(gòu),積極開放共享數(shù)據(jù)。一是圍繞公開數(shù)據(jù)集建設(shè)進行戰(zhàn)略布局。建立健全科研領(lǐng)域公開數(shù)據(jù)集體系,在時空、區(qū)域氣象等新興和特色領(lǐng)域進行系統(tǒng)布局。二是建立科研數(shù)據(jù)共享激勵機制,讓數(shù)據(jù)貢獻成為研究貢獻的一部分。通過合理的措施,鼓勵機構(gòu)以及個人將共享數(shù)據(jù),持續(xù)豐富公開數(shù)據(jù)集的資源。同時加強對數(shù)據(jù)的安全保護,避免濫用。三是構(gòu)建統(tǒng)一的科研數(shù)據(jù)空間,匯聚數(shù)據(jù)促進數(shù)據(jù)共享。促進跨機構(gòu)、跨領(lǐng)域的數(shù)據(jù)整合與優(yōu)化,為科研工作者和技術(shù)開發(fā)者提供更加便捷、高效的數(shù)據(jù)服務(wù)。(三)開發(fā)工具鏈—全鏈路打造科研智能開發(fā)工具從人工智能框架的構(gòu)建到算法的集成,再到開發(fā)套件與領(lǐng)域模型的推出,科研智能開發(fā)工具鏈的逐步完善,為科研人員提供了全流程支持。這些工具不僅降低科研門檻,提高研發(fā)效率,還加速科研成果的轉(zhuǎn)化與應(yīng)用。通過持續(xù)優(yōu)化與創(chuàng)新,科研智能開發(fā)工具鏈8正逐步成為推動該領(lǐng)域發(fā)展的核心引擎。AI框架是一組用于開發(fā)、訓(xùn)練和部署人工智能模型的工具、庫和接口,它提供了一個結(jié)構(gòu)化的環(huán)境,使開發(fā)者能夠更加高效地構(gòu)建、測試和優(yōu)化AI算法和應(yīng)用,當(dāng)前主流的AI框架主要有TensorFlow、PyTorch、PaddlePaddle和MindSpore。為更有效地支持科研智能(AI4R&D傳統(tǒng)AI框架需要具備高效求解科學(xué)計算任務(wù)的基礎(chǔ)能力。一是支持科研智能算子庫,通過提供標(biāo)準(zhǔn)化接口和高度優(yōu)化共性數(shù)學(xué)運算單元,如高階微分、傅里葉變換、分數(shù)階微分、積分、線性代數(shù)、復(fù)數(shù)運算等科研智能專用算子,降低科研計算程序的復(fù)雜度。二是提供科研智能計算庫,通過實現(xiàn)跨領(lǐng)域共性基礎(chǔ)計算庫,如微分方程求解計算庫、幾何形狀定義計算庫、方程符號化定義計算庫、物理信息神經(jīng)網(wǎng)絡(luò)PINN求解方法計算庫等,提升跨學(xué)科多領(lǐng)域典型數(shù)理方程求解效率。三是面向科研智能的作業(yè)調(diào)度優(yōu)化,通過高階自動微分變換和編譯優(yōu)化技術(shù),實現(xiàn)異構(gòu)混合架構(gòu)靈活高效計算,整體提升科研計算任務(wù)計算速度。當(dāng)前PyTorch和TensorFlow已經(jīng)成為全球范圍最主流的AI框架。PyTorch基于動態(tài)計算圖且接口簡潔易用,適合科研探索的快速原型開發(fā)及頻繁迭代,在學(xué)術(shù)界廣受歡迎。TensorFlow具備強大的分布式計算能力和完善的工具生態(tài)系統(tǒng),當(dāng)前在工業(yè)界廣泛應(yīng)用,支持成熟的部署解決方案。兩者均提供科研智能算子庫、科研智能計算庫和科研智能計算加速等相關(guān)能力。此外,谷歌推出的JAX框架具9備自動矢量化和即時編譯等先進特性,計算性能出色,適用于科學(xué)計算和機器學(xué)習(xí)任務(wù),且支持高階自動微分,有利于科研智能領(lǐng)域的模型開發(fā)。國內(nèi)PaddlePaddle和MindSpore作為領(lǐng)先的人工智能框架,均將科研智能作為重點方向進行了適配和優(yōu)化,目前已具備豐富的算子庫和高階自動微分等能力?,F(xiàn)有AI框架未能完全適配科研智能需求。PyTorch在大規(guī)模部署時運行效率相對較低,工業(yè)級部署支持相對較弱。TensorFlow缺少基礎(chǔ)算子體系,科學(xué)計算所需的高階自動微分功能可擴展性不足。JAX處于發(fā)展初期,尚未形成成熟生態(tài)。國內(nèi)框架對算子支持不完全,尚無法滿足科研智能發(fā)展的需求。為推動科研智能的深入發(fā)展,我國需構(gòu)建更高效、統(tǒng)一的科研智能AI框架。一是高性能計算優(yōu)化??蚣苄枰嫒莶煌愋偷膰a(chǎn)化硬件資源,如GPU、NPU等不同類型的AI芯片,提供高效計算解決方案。同時,提升分布式計算能力以支持大規(guī)模計算任務(wù)。二是支持跨領(lǐng)域算法和應(yīng)用??蚣軕?yīng)支持特定領(lǐng)域(如地球科學(xué)、材料科學(xué)等)的算法庫和開發(fā)工具,為各領(lǐng)域科研人員提供通用的開發(fā)和應(yīng)用環(huán)境,提供靈活的接口和擴展能力,支持跨學(xué)科的協(xié)同研究及應(yīng)用。三是豐富生態(tài)系統(tǒng)建設(shè)。擴展生態(tài)系統(tǒng),提供第三方庫和工具,以及融合已有科學(xué)計算領(lǐng)域的算法庫和工具,滿足更廣泛的科研需求。建設(shè)活躍的社區(qū),促進科研工作者交流分享,推動技術(shù)創(chuàng)新和進步??蒲兄悄芩惴◣焓侵该嫦蛱囟I(lǐng)域科學(xué)計算問題,基于AI框架算子能力開發(fā)的一系列高效、穩(wěn)定的算法集合。算法庫注重易用性、性能及可拓展性,其核心價值主要體現(xiàn)在以下兩方面:一是聚焦對領(lǐng)域單點問題的改進和固化。使用算法庫中經(jīng)過優(yōu)化的算法,科研人員能夠更加高效地解決復(fù)雜科學(xué)計算問題,推動科研成果的產(chǎn)出。二是強調(diào)提供最優(yōu)算法選擇。通過收錄該領(lǐng)域最頂尖的算法,強調(diào)提供最優(yōu)的算法選擇,為科研人員提供便捷、高效的工具,助力科研工作的深入開展。高校、科研院所及企業(yè)紛紛推出面向多個各領(lǐng)域的科研智能算法庫。國外方面,布朗大學(xué)、麻省理工學(xué)院紛紛推出算法庫支持科研智能底層算法的實現(xiàn)。如DeepXDE充分利用數(shù)據(jù)和物理知識雙驅(qū)動,解決傳統(tǒng)方法難以求解的復(fù)雜問題,支持物理信息神經(jīng)網(wǎng)絡(luò)(PINN)和深度算子網(wǎng)絡(luò)(DeepONet)等方法。國內(nèi)方面,深勢科技、之江實驗室等研究機構(gòu)專注于算法庫的研發(fā),聚焦分子動力學(xué)、量子力學(xué)、空氣動力學(xué)等特定領(lǐng)域的研究,解決該領(lǐng)域計算求解問題。如DeePMD基于神經(jīng)網(wǎng)絡(luò)擬合第一原理數(shù)據(jù)的多體勢能表示和分子動力學(xué)深度學(xué)習(xí),支持DeepPotential(DP)系列模型,可用于多體勢能表示和分子動力學(xué)模擬。算法庫介紹開發(fā)者NeuralUQ學(xué)NeuralPDE我國在科研智能算法庫領(lǐng)域也面臨著原創(chuàng)不足等挑戰(zhàn)。我國在基礎(chǔ)理論創(chuàng)新方面存在不足,物理信息神經(jīng)網(wǎng)絡(luò)(PINN)、傅里葉神經(jīng)算子(FNO)和深度算子網(wǎng)絡(luò)(DeepONet)等經(jīng)典的底層算法多由國外研究機構(gòu)提出。我國算法庫的數(shù)量較少且影響力不足,國內(nèi)深勢科技、之江實驗室等機構(gòu)在特定領(lǐng)域(如分子動力學(xué)、量子力學(xué)、空氣動力學(xué)等)積極開展研究,并開發(fā)出DeePMD、NeuralUQ等算法庫,但與國際先進水平相比仍有明顯差距。因此,我國仍需進一步鼓勵算法原始創(chuàng)新,提升我國科研智能算法庫的自主性和核心競爭力。科研智能開發(fā)套件是指針對特定科研領(lǐng)域,基于AI框架開發(fā)的端到端工具集。開發(fā)套件提供標(biāo)準(zhǔn)化接口和用戶界面,覆蓋模型開發(fā)全流程,能夠快速用于解決科研問題。相較于科研智能算法庫,開發(fā)套件的產(chǎn)品化程度更高。一方面,開發(fā)套件通過全流程整合有效提升了科研效率??蒲腥藛T無需在多個工具間切換,使用開發(fā)套件可一站式完成數(shù)據(jù)處理、模型開發(fā)、評估及部署等工作,縮短研發(fā)周期,加速成果產(chǎn)出。另一方面,開發(fā)套件降低了科研人員對計算機專業(yè)知識的依賴。開發(fā)套件提供操作界面及案例資源,降低了非計算機背景科研人員的使用門檻。科研人員可以更加聚焦科研問題本身,無需花費大量時間精力在人工智能模型調(diào)參等技術(shù)環(huán)節(jié)。國內(nèi)外已形成一系列成熟的科研開發(fā)套件。國外方面,形成了相對活躍的開源社區(qū)生態(tài)。高校、研究機構(gòu)及企業(yè)以PyTorch為基礎(chǔ),貢獻了針對特定科學(xué)領(lǐng)域的開源套件,如英偉達推出用于流體仿真的Modulus和用于氣象預(yù)測Earth2Studio,上述工具成熟度較高且已被廣泛應(yīng)用。國內(nèi)方面,形成了相對自給自足的生態(tài)系統(tǒng)。國內(nèi)開發(fā)套件通常由AI框架企業(yè)提供,如百度和華為基于自身AI框架能力,向各領(lǐng)域延伸形成工具套件,已覆蓋生物計算、量子計算、流體仿真、地球科學(xué)、電磁仿真、化學(xué)仿真等領(lǐng)域。領(lǐng)域套件名稱公司功能描述基于飛槳深度學(xué)習(xí)框架的科學(xué)計支持多體系(有機/無機/復(fù)合材料成/預(yù)測、宏觀反應(yīng)優(yōu)化)的化學(xué)開發(fā)套件存在易用性低、功能覆蓋不全等問題。一是使用門檻仍舊較高,用戶需要具備較強的領(lǐng)域知識和編程能力,進而限制了套件的廣泛使用。二是功能覆蓋不全面。一方面覆蓋場景有限,開發(fā)套件處于發(fā)展初期,往往針對具體科學(xué)問題設(shè)計,支持的場景較為有限。另一方面覆蓋環(huán)節(jié)不足,存在功能欠缺。如針對高溫合金材料研發(fā)的套件,僅提供合金成分設(shè)計與性能預(yù)測環(huán)節(jié),缺少特定工藝條件下的合金行為模擬、疲勞壽命預(yù)測等能力,這會限制套件在實際工程項目的使用。三是標(biāo)準(zhǔn)化程度低,開發(fā)套件之間缺乏統(tǒng)一的接口和數(shù)據(jù)格式標(biāo)準(zhǔn),增加了用戶遷移和比較的成本,不利于科研工作的連續(xù)性和數(shù)據(jù)共享。領(lǐng)域的模型主要分為兩大類,一類是領(lǐng)域?qū)S媚P停槍μ囟茖W(xué)問題設(shè)計和優(yōu)化;另一類是基于大語言模型(LLM)的科研模型,利用自然語言處理能力輔助科研工作、完善自動化流程。產(chǎn)學(xué)界已經(jīng)研發(fā)出面向多個領(lǐng)域解決特定問題的專用模型。材料科學(xué)領(lǐng)域,AI技術(shù)結(jié)合高通量計算,打破尺度和計算模擬限制,加速材料篩選,促進靶向設(shè)計新材料,完成材料和器件的全鏈條優(yōu)化,為新能源、環(huán)境保護、信息技術(shù)等產(chǎn)業(yè)提供了強大的材料基礎(chǔ)。氣象領(lǐng)域,通過AI技術(shù)對大量氣象觀測和模擬數(shù)據(jù)進行分析,識別復(fù)雜大氣模式,提升天氣預(yù)報精度與效率,加強對臺風(fēng)、暴雨等極端天氣事件的預(yù)測能力,輔助氣候變化研究。流體仿真領(lǐng)域,AI提升了復(fù)雜流體動力學(xué)問題的模擬和求解效率,對湍流、液體混合等復(fù)雜流體進行流動模擬優(yōu)化、實時仿真,廣泛應(yīng)用于航空航天、汽車制造等領(lǐng)域。電磁仿真領(lǐng)域,AI模型能夠快速模擬和優(yōu)化復(fù)雜電磁場分布,提升仿真和設(shè)計效率。以電磁兼容性分析為例,AI能夠預(yù)測和識別潛在干擾問題,優(yōu)化電路設(shè)計,確保電磁設(shè)備的性能和可靠性。生命科學(xué)領(lǐng)域,AI模型能夠分析復(fù)雜的生物數(shù)據(jù),如蛋白質(zhì)結(jié)構(gòu)預(yù)測、基因組分析等,加速新藥發(fā)現(xiàn)和個性化醫(yī)療方案的制定,解決傳統(tǒng)方法耗時長、成本高的問題。業(yè)內(nèi)典型領(lǐng)域?qū)I(yè)模型詳見附錄一。大語言模型為科研領(lǐng)域帶來新的輔助手段。大語言模型與科研相融合正在成為新方向,目前大語言模型主要應(yīng)用于科研助手和流程自動化。科研助手方面,大語言模型結(jié)合領(lǐng)域知識,不僅可以提供研究假設(shè)、科研方向供科研人員參考,還可以作為科研知識助手,為科研人員提供即時的信息查詢和解答。流程自動化方面,大語言模型可以幫助提高實驗效率、減少人為誤差,實現(xiàn)更精準(zhǔn)、可重復(fù)的實驗管理。典型場景包括輔助決策和實驗設(shè)計、任務(wù)調(diào)度智能加速和實驗室管理等。大語言模型與領(lǐng)域?qū)I(yè)模型的深度融合正推動科研領(lǐng)域?qū)崿F(xiàn)重大突破。大型語言模型擅長發(fā)現(xiàn)并整理科學(xué)領(lǐng)域的難點問題,領(lǐng)域?qū)I(yè)模型則負責(zé)完成復(fù)雜的計算任務(wù),兩者結(jié)合可有效提升人機交互能力,加速科學(xué)研究的進程,有望在特定領(lǐng)域取得突破性進展。例如,卡耐基梅隆大學(xué)研發(fā)的AI系統(tǒng)Coscientist能夠自主完成從信息檢索到實驗執(zhí)行和數(shù)據(jù)分析的整個流程,該系統(tǒng)成功設(shè)計并合成了阿司匹林、對乙酰氨基酚和布洛芬等常見藥物分子。同時,Coscientist在不到四分鐘內(nèi)成功設(shè)計鈀催化交叉偶聯(lián)反應(yīng)的實驗方案,并成功復(fù)現(xiàn)了這一重要的復(fù)雜化學(xué)反應(yīng),該研究曾獲諾貝爾化學(xué)獎?;A(chǔ)科學(xué)研究領(lǐng)域,AI技術(shù)的應(yīng)用促進了新理論、新算法的發(fā)現(xiàn)與驗證,逐步拓展科學(xué)研究的邊界。產(chǎn)業(yè)研發(fā)創(chuàng)新領(lǐng)域,AI技術(shù)通過加速新藥研發(fā)、優(yōu)化材料篩選、提升工業(yè)設(shè)計效率等方式,提升產(chǎn)品研發(fā)效率為產(chǎn)業(yè)升級與變革提供強有力的技術(shù)支撐。(一)基礎(chǔ)科學(xué)研究—開展前沿探索,推動科學(xué)邊界科研智能在基礎(chǔ)科學(xué)領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。目前,國內(nèi)外高校和科研機構(gòu)都在積極探索AI與科學(xué)研究的深度融合,在過去5年,AI+科學(xué)研究的相關(guān)成果連續(xù)入選《Science》雜志評選的十大突破。AI賦能科學(xué)研究主要體現(xiàn)在以下四個方面:一是AI輔助科學(xué)文獻研究??蒲腥藛T借助AI能夠高效地分析和挖掘海量的科學(xué)文獻,提取關(guān)鍵信息,識別研究趨勢。例如,北京國際科技創(chuàng)新中心使用知網(wǎng)華知大模型打造了開放科學(xué)平臺,集成了知網(wǎng)智研助手、學(xué)術(shù)問答、智能寫作三大AI工具,為學(xué)術(shù)和技術(shù)創(chuàng)新人員提供了全方位的知識服務(wù)。二是AI指導(dǎo)和加速科學(xué)實驗。通過數(shù)據(jù)分析和機器學(xué)習(xí),AI能夠優(yōu)化實驗設(shè)計,減少不必要的實驗次數(shù),顯著提高實驗效率。如DeepMind通過深度強化學(xué)習(xí)技術(shù)對托卡馬克等離子體進行精準(zhǔn)磁控,將等離子體控制精度提升至65%,為核聚變研究帶來了重要突破。三是AI啟發(fā)新理論和算法發(fā)現(xiàn)。AI的模式識別和預(yù)測能力有助于科研人員發(fā)現(xiàn)新的科學(xué)規(guī)律,提出創(chuàng)新性的理論。如物理學(xué)家利用神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)了質(zhì)子中隱性內(nèi)含粲夸克的存在證據(jù),這一發(fā)現(xiàn)可能會引發(fā)量子色動力學(xué)理論的重大更新。四是AI優(yōu)化和加速科學(xué)計算。傳統(tǒng)數(shù)據(jù)處理海量數(shù)據(jù)時會遭遇“維度災(zāi)難”問題,AI技術(shù)可以提高復(fù)雜科學(xué)計算的效率,解決傳統(tǒng)方法難以處理的問題。如DeepMind發(fā)布的AlphaFold3可預(yù)測地球所有生物分子結(jié)構(gòu),準(zhǔn)確率比現(xiàn)有方法高50%,成為首個在生物分子結(jié)構(gòu)預(yù)測方面超越基于物理工具方法的AI系統(tǒng)。構(gòu)展人“面對面”“精英控制員”毒權(quán)”菌良族歧視,支持人類DNA“缺失環(huán)節(jié)”“洞察”號首縫”望臨(二)產(chǎn)業(yè)研發(fā)創(chuàng)新—構(gòu)建核心驅(qū)動力,加速產(chǎn)業(yè)升級變革科研智能在多個產(chǎn)業(yè)領(lǐng)域中取得了顯著成效。新藥研發(fā)領(lǐng)域,AI可加速藥物發(fā)現(xiàn)和研發(fā)過程。如西安交通大學(xué)第一附屬醫(yī)院基于盤古藥物分子大模型,研發(fā)出超級抗菌藥肉桂酰菌素。AI減少了人工對小分子化合物的篩選計算量,加快了藥物分子的篩選過程,突破了醫(yī)藥研發(fā)“雙十定律”的瓶頸,使先導(dǎo)藥的研發(fā)周期從數(shù)年縮短至數(shù)月,研發(fā)成本降低約70%。電池材料研發(fā)領(lǐng)域,AI可輔助篩選和預(yù)測高性能材料。通過多尺度模擬預(yù)測材料性能,優(yōu)化實驗設(shè)計,提升實驗效率。如深勢科技在電解液材料研發(fā)領(lǐng)域,通過正向設(shè)計與篩選優(yōu)化的方法,有效提升金羽新能開發(fā)高能量密度電池電解液的效率,研發(fā)周期由原來的14個月縮短至6個月。航空航天仿真測試領(lǐng)域,AI助力評估航空器設(shè)計方案的可行性和性能。如中國商飛上海飛機設(shè)計研究院基于昇騰AI開發(fā)了業(yè)界首個三維超臨界機翼流體仿真大模型“東方·翼風(fēng)”,能高精度模擬大飛機全場景飛行狀況,用時僅為原來的千分之一。電磁仿真領(lǐng)域,AI可實現(xiàn)高效手機電磁仿真。如華為聯(lián)合東南大學(xué)打造了金陵·電磁腦基礎(chǔ)模型,基于AI方法進行大規(guī)模陣列天線電磁仿真,將仿真效率平均提升10倍以上。工業(yè)設(shè)計領(lǐng)域,AI可提升設(shè)計效率并降低成本。中國科學(xué)院沈陽自動化研究所與上汽大眾合作開發(fā)了“基于AI和知識圖譜的焊裝夾具智能設(shè)計軟件”,通過知識圖譜和生成式AI提升設(shè)計效率80%以上,設(shè)計成本降低至原來的一半,實現(xiàn)需求到制造的一站式交付服務(wù)。工業(yè)制造領(lǐng)域,AI可提升生產(chǎn)效率與產(chǎn)品質(zhì)量。如中冶京誠推出“鋼智通”專家系統(tǒng)通過大語言模型提煉智能決策進行生產(chǎn)流程優(yōu)化,能耗降低1%,廢品率降低0.1%,整體管控效率提升10%。隨著人工智能與科學(xué)研究、產(chǎn)業(yè)研發(fā)的深度融合,產(chǎn)業(yè)界與學(xué)術(shù)界也逐漸形成日益緊密的合作,逐步構(gòu)建起多元化產(chǎn)業(yè)生態(tài)體系,為科研智能的健康發(fā)展提供了有力支撐。(一)產(chǎn)業(yè)組織工作組”,為產(chǎn)學(xué)研用各界搭建開放的交流合作平臺,前期已組織案例征集、供需對接、報告編制等工作,后續(xù)會重點圍繞新材料、地球科學(xué)等重點領(lǐng)域開展工作。(二)社區(qū)建設(shè)華為在科研智能領(lǐng)域積極構(gòu)建了一系列專業(yè)且富有活力的社區(qū),旨在推動AI技術(shù)的廣泛應(yīng)用與深入發(fā)展。MindFlowSIG社區(qū)專注于昇思MindFlow為科研人員、教師及學(xué)生提供了高效易用的AI計算流體仿真套件。MindEarthSIG社區(qū)聚焦于昇思MindEarth,為廣大用戶帶來高效便捷的AI地球科學(xué)套件。MindElecSIG社區(qū)緊密圍繞實際生產(chǎn)中的各類電磁應(yīng)用場景,在昇思MindSpore框架下積極探索和研究基于AI的電磁正問題及反問題,致力于開發(fā)高效精準(zhǔn)的AI電磁模型。MindSPONGESIG充分利用昇思MindSpore的優(yōu)勢。聚焦AI計算生物領(lǐng)域,在為科研人員、教師及學(xué)生提供高效易用的AI計算生物軟件。深勢科技的DeepModeling開源社區(qū)提供開源的科學(xué)智能廣場(AIS-Square)共創(chuàng)平臺,支持科學(xué)計算、數(shù)據(jù)、軟件模型和工作流的開發(fā)。百度飛槳星河社區(qū)匯集豐富的AI原生應(yīng)用,提供零門檻的開發(fā)工具,促進全球科研人員的合作。中山大學(xué)牽頭,北京航空航天大學(xué)、華為、百度等單位配合,共同建設(shè)AI科學(xué)智算群智協(xié)作社區(qū),整合多方資源,建數(shù)據(jù)庫與課程,促開放協(xié)作,為科學(xué)智算發(fā)展助力。(三)科研賽事百度持續(xù)推出飛槳黑客松、AI4S共創(chuàng)計劃、大灣區(qū)杯—百度賽道等科學(xué)智能賽事,聚焦AI4S前沿模型復(fù)現(xiàn),貢獻AI4S模型或案例50余個。深勢科技提供真實的科學(xué)場景和數(shù)據(jù)舉辦AI4SCup系列比賽。華為舉辦“開源之夏”賽事聚焦科研智能,推出基于圖像深度學(xué)習(xí)的無線電信號識別項目,旨在推動AI與無線電技術(shù)融合,培育科研智能創(chuàng)新人才。中山大學(xué)牽頭舉辦了首屆“大灣區(qū)杯”粵港澳AI4S科技競賽,北京航空航天大學(xué)、浙江大學(xué)、百度、華為等單位整體協(xié)同,針對人工智能科學(xué)計算問題設(shè)置3個賽道與24個賽題,分子、金融、社會學(xué)、電磁、化學(xué)、交通等多個領(lǐng)域的典型應(yīng)用。和鯨科

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論