




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
Q/LB.□XXXXX-XXXXT/XXXXXXX—XXXX醫(yī)療大模型語料一體機應用指南范圍本文件規(guī)定了醫(yī)療大模型語料一體機的能力要求,包括系統(tǒng)框架、應用場景能力、軟硬件配置、語料配置等內(nèi)容。本文件適用于醫(yī)療大模型語料一體機的研發(fā)、配置、維護、采購等工作。規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T41867-2022信息技術(shù)人工智能術(shù)語術(shù)語和定義GB/T41867-2022界定的術(shù)語和定義適用于本文件。醫(yī)療大模型語料一體機medical
largemodelintegratedmachine專門為醫(yī)療領域設計的高性能計算設備,以一體機服務器形式存在。醫(yī)療大模型largemedicalmodel基于深度學習等AI技術(shù),針對醫(yī)療領域特定問題(如疾病診斷、藥物研發(fā)等)訓練而成的大型神經(jīng)網(wǎng)絡模型,具備處理和分析復雜醫(yī)療數(shù)據(jù),提供精準醫(yī)療決策支持等能力。醫(yī)療語料庫medicalCorpus醫(yī)療領域相關(guān)文本、圖片、音頻、視頻等數(shù)據(jù)的集合,可用于訓練和優(yōu)化醫(yī)療大模型,以提升其在醫(yī)療領域的應用效果。臨床決策支持clinicaldecisionsupport基于大量患者數(shù)據(jù),使用醫(yī)療大模型,為醫(yī)生提供診斷和治療建議的智能代理,旨在輔助醫(yī)生作出更加精準和科學的醫(yī)療決策。算力動態(tài)分配DynamicComputingPowerAllocation根據(jù)醫(yī)療大模型的實時需求和系統(tǒng)負載情況,動態(tài)調(diào)整算力資源分配的智能化策略,以確保系統(tǒng)在高負載情況下仍能穩(wěn)定運行,并可優(yōu)先處理關(guān)鍵任務。縮略語AEs:醫(yī)療不良事件(AdverseEvents)AI:人工智能(ArtificialIntelligence)API:應用程序編程接口(ApplicationProgrammingInterface)ASR
:自動語音識別(AutomaticSpeechRecognition)DICOM:醫(yī)學數(shù)字成像和通信(DigitalImagingandCommunicationsinMedicine)FPS:每秒幀數(shù)(FramesPerSecond)GPU:圖形處理單元(GraphicsProcessingUnit)IDE:集成開發(fā)環(huán)境(IntegratedDevelopmentEnvironment)NIfTI:神經(jīng)影像信息學技術(shù)倡議(NeuroimagingInformaticsTechnologyInitiative)NPU:神經(jīng)網(wǎng)絡處理單元(NeuralProcessingUnit)SAEs:嚴重不良事件(SeverityAdverseEvents)TOPS:每秒萬億次操作(TeraOperationsPerSecond)TPU:張量處理單元(TensorProcessingUnit)系統(tǒng)框架醫(yī)療大模型語料一體機通過集成醫(yī)療應用區(qū)、醫(yī)療模型區(qū)、算力區(qū)、醫(yī)療語料區(qū)、智能體引擎區(qū)以及醫(yī)療一體機操作系統(tǒng)等關(guān)鍵功能模塊,實現(xiàn)醫(yī)療資源的優(yōu)化配置和醫(yī)療服務的高效提供。系統(tǒng)遵循實用性、可靠性、安全性、可擴展性原則,確保設備安全、網(wǎng)絡安全及數(shù)據(jù)安全,并通過定時數(shù)據(jù)備份保障系統(tǒng)穩(wěn)定運行。一體機總體功能宜按照“1+5”架構(gòu)部署,包括1個一體機操作系統(tǒng),醫(yī)療應用區(qū)、模型區(qū)、智能體區(qū)、醫(yī)療語料區(qū)、算力區(qū)等5個功能區(qū),具體內(nèi)容如下圖所示:圖1醫(yī)療大模型語料一體機架構(gòu)圖一體機功能概述具體如下:醫(yī)療應用區(qū):提供一系列與醫(yī)療相關(guān)的功能模塊,包括但不限于常見疾病/慢性疾病診斷、醫(yī)學知識科普、康復養(yǎng)老輔助、復雜疾病輔助診斷、診療流程優(yōu)化、藥物作用分析、疾病監(jiān)控與分析、醫(yī)學知識圖譜、文獻綜述生成等。模型區(qū):包含基礎模型、垂類模型。算力區(qū):配置多種AI加速卡及其適配引擎。智能體區(qū):集成規(guī)劃引擎、工具引擎、執(zhí)行引擎、記憶引擎等關(guān)鍵組件。醫(yī)療語料區(qū):包括多個醫(yī)療語料庫、向量數(shù)據(jù)庫以及語料清洗、標注工具。醫(yī)療一體機操作系統(tǒng):包括醫(yī)療模型管理、引擎調(diào)度、智能體管理、應用管理、語料管理、算力調(diào)度管理及集群管理等模塊。應用分類和能力要求參考國家衛(wèi)健委《衛(wèi)生健康行業(yè)人工智能應用場景參考指引》的內(nèi)容,以及醫(yī)療應用本身復雜程度,將醫(yī)療大模型語料一體機的應用分為一類應用、二類應用以及三類應用,本章對應用的能力要求進行解釋。一類應用6.1.1診療輔助應具備根據(jù)患者癥狀、體檢結(jié)果和實驗室數(shù)據(jù)提供初步診斷的能力;應具備輔助醫(yī)生制定個性化治療方案的能力;應具備實時更新醫(yī)學知識,以提供最新的診療建議。6.1.2醫(yī)院管理應具備輔助優(yōu)化醫(yī)院資源分配,提高醫(yī)療服務效率的能力;應具備根據(jù)醫(yī)院運營數(shù)據(jù)輔助決策制定的能力;應具備提供改善患者就醫(yī)流程建議的能力。6.1.3健康管理應具備跟蹤個人健康數(shù)據(jù),提供健康風險評估的能力;應具備根據(jù)個人健康狀況提供定制化的健康建議和干預措施。6.1.4養(yǎng)老托育服務應具備為老年人和兒童提供個性化護理計劃的能力;應具備根據(jù)老年人和兒童的健康狀況數(shù)據(jù),及時預警健康風險;應具備提供心理支持和社交互動,增強老年人和兒童的生活質(zhì)量。二類應用二類應用包括臨床專病輔助決策、基層全科醫(yī)生輔助決策、公共衛(wèi)生服務、臨床用藥輔助、藥物研發(fā)、中醫(yī)中藥輔助等應用。6.2.1臨床專病輔助決策應具備針對特定疾病提供深入的臨床知識支持的能力;應具備輔助醫(yī)生進行復雜病例分析和治療方案選擇的能力。6.2.2基層全科醫(yī)生輔助決策應具備提供全面的基層醫(yī)療服務知識的能力;應具備輔助全科醫(yī)生進行常見病和多發(fā)病的診斷和治療建議。6.2.3公共衛(wèi)生服務應具備根據(jù)公共衛(wèi)生數(shù)據(jù)預測疾病流行趨勢的能力;應具備制定和實施公共衛(wèi)生干預措施的能力;應具備提供公共衛(wèi)生教育和健康促進知識的能力。6.2.4臨床用藥輔助應具備藥物信息查詢和藥物相互作用分析的能力;應具備輔助醫(yī)生進行藥物劑量調(diào)整和用藥指導的能力;應具備根據(jù)患者用藥反應及時調(diào)整治療方案的能力。6.2.5藥物研發(fā)應具備藥物設計和篩選的輔助能力;應具備藥物效果預測和副作用評估的能力;應具備臨床試驗設計和數(shù)據(jù)分析的能力。6.2.6中醫(yī)中藥輔助應具備中醫(yī)理論學習和應用的能力;應具備中藥方劑配伍和調(diào)整建議的能力;應具備中醫(yī)診斷和治療建議的能力。三類應用三類應用包括醫(yī)學影像輔助診斷、手術(shù)輔助規(guī)劃、醫(yī)學教學、醫(yī)學科研等應用。6.3.1醫(yī)學影像輔助診斷應具備醫(yī)學影像的輔助識別和分析能力;應具備輔助醫(yī)生進行疾病診斷和病情評估的能力;6.3.2手術(shù)輔助規(guī)劃應具備輔助手術(shù)方案設計和風險評估的能力;應具備手術(shù)過程中的實時輔助和建議能力;應具備制定術(shù)后恢復和并發(fā)癥預防規(guī)劃的能力。6.3.3醫(yī)學教學應具備提供醫(yī)學教育資源和模擬訓練的能力;應具備輔助醫(yī)學生和醫(yī)生進行專業(yè)知識學習的能力;應具備評估學習效果和提供個性化教學建議的能力。6.3.4醫(yī)學科研應具備醫(yī)學文獻檢索和分析的能力。應具備輔助科研設計和實驗方法建議的能力。模型要求基礎模型選型要求本節(jié)對醫(yī)療大模型語料一體機大模型選型進行要求,包括性能與指標、自然語言處理、知識儲備、價值對齊、安全與可靠性等方面。7.1.1模型基礎能力要求模型應具備自然語言理解、知識推理、文本生成、跨語言處理、跨模態(tài)理解、跨模態(tài)生成等方面能力,其能力宜通過行業(yè)公認的測評集測試;7.1.2長文本處理能力要求模型應能處理8k以上的文本輸入,宜能夠處理32k的連續(xù)文本輸入。7.1.3多模態(tài)數(shù)據(jù)處理能力要求模型應能同時處理圖像數(shù)據(jù)(X射線圖像、CT圖像、MRI圖像、超聲圖像、病理切片圖像等)、文本數(shù)據(jù)(電子病歷、醫(yī)生診斷報告、醫(yī)學文獻等)、實驗室檢查數(shù)據(jù)、基因數(shù)據(jù)、音頻數(shù)據(jù)(醫(yī)患溝通音頻、心音、肺音等)、視頻數(shù)據(jù)等多模態(tài)數(shù)據(jù)。7.1.4參數(shù)規(guī)模要求一類應用宜使用不大于13B參數(shù)的稠密模型或使用混合專家模型激活總參數(shù)在13B及以下;二類應用宜使用13B-30B參數(shù)的稠密模型或使用混合專家模型激活總參數(shù)在13B-30B;三類應用宜使用30B-72B參數(shù)的稠密模型或使用混合專家模型激活總參數(shù)在30B-72B;7.1.5性能與指標要求在標準硬件配置下平均響應時間應小于500ms;在標準硬件配置下文本生成速度不小于10tokens/s;垂類模型選型要求7.2.1專業(yè)性要求行業(yè)大模型應根據(jù)醫(yī)療領域設計,具備醫(yī)療知識問答、醫(yī)學文本分類、醫(yī)學信息抽取、醫(yī)學自然語言推理、醫(yī)學內(nèi)容生成、醫(yī)學多模態(tài)數(shù)據(jù)處理等能力,其能力宜通過行業(yè)公認的測評集測試;7.2.2精準性要求針對于醫(yī)療場景下的問題,行業(yè)大模型應提供更精準的問題解決方案,準確率不低于95%;在醫(yī)療任務上的處理效率應高于基礎大模型;應能理解醫(yī)療行業(yè)特有術(shù)語和上下文;7.2.3知識庫更新要求應支持根據(jù)具體業(yè)務需求進行調(diào)整和優(yōu)化;應該支持持續(xù)學習,隨行業(yè)發(fā)展不斷更新知識庫;7.2.4價值對齊要求生成的內(nèi)容應符合公認的醫(yī)療道德倫理規(guī)范和法律規(guī)定;生成的內(nèi)容應符合社會主流價值觀,不得對某些社會群體產(chǎn)生不利影響;智能體要求智能體區(qū)應具備智能體引擎和智能體開發(fā)功能,要求如下:智能體引擎:應具備規(guī)劃引擎、工具引擎、執(zhí)行引擎、記憶引擎功能。記憶引擎應支持向量數(shù)據(jù)庫及外部數(shù)據(jù)訪問;智能體開發(fā):應支持低代碼或無代碼開發(fā)智能體功能。語料要求語料對象與范疇醫(yī)療大模型語料一體機語料應包含醫(yī)療通識語料、醫(yī)療行業(yè)知識語料、醫(yī)療臨床數(shù)據(jù)三部分,補充內(nèi)容可參見附錄。醫(yī)療通識語料要求醫(yī)療通識語料應包括醫(yī)療領域的相關(guān)知識,包括基礎醫(yī)學、臨床醫(yī)學、保健醫(yī)學、康復醫(yī)學、理療學、麻醉學、內(nèi)科學等,具體醫(yī)療領域詳見附錄A。醫(yī)療通識語料應包含但不限于如下部分內(nèi)容,部分數(shù)據(jù)源詳見附錄B:書籍:包括國內(nèi)外權(quán)威出版社獲取的醫(yī)療健康領域教科書,及其他高質(zhì)量生命健康相關(guān)書籍。期刊論文:包括國內(nèi)外知名期刊或者從權(quán)威數(shù)字出版平臺獲取的醫(yī)療健康領域的學術(shù)論文。數(shù)據(jù)庫:包括從醫(yī)學數(shù)據(jù)庫獲取的臨床試驗、人類疾病、基因序列、蛋白質(zhì)序列和功能信息、藥物藥理藥效等數(shù)據(jù)。知識庫:包括從醫(yī)學知識庫中獲取的生物、疾病和基因等多維度之間的關(guān)聯(lián)知識數(shù)據(jù)。專利:包括從專利搜索引擎檢索得到的醫(yī)療健康領域的專利正文。循證醫(yī)學知識庫:包括用于支持臨床決策、疾病預防、治療方案選擇和健康管理等信息,通過整合和分析大量的醫(yī)學研究數(shù)據(jù)和臨床實踐經(jīng)驗構(gòu)建的循證醫(yī)學結(jié)構(gòu)化知識庫。臨床指南:包括官方機構(gòu)發(fā)布的關(guān)于某個疾病和??祁I域內(nèi)容有關(guān)診斷、管理和治療的決策標準的文檔。藥品數(shù)據(jù)庫:包括藥品的名稱、成分、適應癥、用法用量、不良反應、藥物間相互作用、注意事項等信息的數(shù)據(jù)庫。醫(yī)療器械資料:如醫(yī)療設備的使用說明書、操作手冊等,包括常見的診斷設備(如心電圖機、血糖儀等)和治療設備(如呼吸機、除顫儀等)的相關(guān)資料。專家共識:包括由特定領域具有專業(yè)知識和經(jīng)驗的專家共同討論、協(xié)商達成的統(tǒng)一意見或建議,一般發(fā)表于高水平的期刊論文中。中醫(yī)學典籍:包括中醫(yī)領域的經(jīng)典著作。藥材藥方:包括經(jīng)典中藥書籍中記錄的歷代中醫(yī)方劑,包括方劑的組成、用法、主治病癥等。相關(guān)法律法規(guī):收集國家和地方關(guān)于社區(qū)醫(yī)療的政策、指南和標準,尤其是一些涉及醫(yī)療報銷方面的信息。健康宣教材料:涵蓋各類健康教育和預防知識,如疾病預防、健康生活方式等。其他結(jié)構(gòu)化數(shù)據(jù):包括疾病對應的癥狀列表、疾病對應的藥品列表、藥品通用名說明書、癥狀的通俗叫法,同義詞等。醫(yī)療行業(yè)知識語料要求醫(yī)療行業(yè)知識語料應包含但不限于如下部分內(nèi)容:??茖2?shù)據(jù):結(jié)合醫(yī)療管理部門重點監(jiān)測的單病種(單病種清單詳見附錄C)形成的人工智能基地的行業(yè)??茖2≌Z料集,賦能后續(xù)的臨床研究、臨床決策支持、醫(yī)院運營管理和患者管理等方面。醫(yī)學數(shù)據(jù)庫:包含了海量的醫(yī)學文獻資源的權(quán)威醫(yī)學數(shù)據(jù)庫。醫(yī)學知識圖譜:醫(yī)學知識圖譜以圖結(jié)構(gòu)的形式表示醫(yī)學領域的知識,包括疾病、癥狀、藥物、治療等實體以及它們之間的關(guān)系。醫(yī)療臨床數(shù)據(jù)要求醫(yī)療臨床數(shù)據(jù)應包含但不限于如下部分內(nèi)容:電子病歷:包括針對個體的醫(yī)院門診、住院形成的電子病歷,含診斷、實驗室檢驗數(shù)據(jù)、影像檢查報告、治療方案等內(nèi)容。醫(yī)療住院數(shù)據(jù):包含入出院業(yè)務、轉(zhuǎn)科記錄業(yè)務、藥品醫(yī)囑業(yè)務、住院非藥品醫(yī)囑業(yè)務、住院費用業(yè)務、住院費用分類業(yè)務、住院發(fā)票業(yè)務、住院退藥記錄等內(nèi)容。研發(fā)階段臨床試驗數(shù)據(jù):記錄受試者在接受藥物治療期間發(fā)生的任何不良事件(AEs),以及嚴重不良事件(SAEs)。評估藥物達到預定療效指標的情況,如緩解率、生存期延長等。藥物在體內(nèi)吸收、分布、代謝和排泄的過程,以及藥物對機體的作用強度隨時間變化的關(guān)系。語料管理要求醫(yī)療通識語料應至少每年更新一次;醫(yī)療行業(yè)知識語料至少半年更新一次;醫(yī)療臨床語料至少每月更新一次;語料庫應存在定期審核和更新機制,可移除已被證偽的信息,保證語料庫的準確性和完整性;語料數(shù)據(jù)應以知識塊、知識對、三元組、知識圖譜等的方式存在;語料數(shù)據(jù)應具有規(guī)范性、一致性、完整性、及時性、準確性、有效性和及時性;語料數(shù)據(jù)應遵從數(shù)據(jù)安全管理的相關(guān)法律法規(guī)、標準以及合同約定等,并不得損害國家利益、社會公共利益和他人合法權(quán)益;語料數(shù)據(jù)應具有正確的價值導向,符合科技倫理和社會道德。語料工具鏈選型要求語料工具鏈選型要根據(jù)工具功能的不同屬性,分為清洗工具選型規(guī)范與標注工具選型規(guī)范兩部分。9.6.1清洗工具選型要求9.6.1.1文本數(shù)據(jù)清洗工具文本數(shù)據(jù)清洗工具功能要求如下:應具備對醫(yī)療文檔進行格式標準化處理的能力;應具備獲取醫(yī)療文檔基本信息,并進行標簽記錄的能力;應具備識別醫(yī)療文檔語言類型并進行標記的功能;應具備清除轉(zhuǎn)換后醫(yī)療文本中無關(guān)信息的能力;應具備檢測醫(yī)療文檔敏感數(shù)據(jù),并確保其符合隱私保護標準的能力。9.6.1.2視頻數(shù)據(jù)清洗工具視頻數(shù)據(jù)清洗工具功能要求如下:應具備自動獲取醫(yī)療視頻文件的幀率(fps)、時長(duration)等信息的功能;應具備使用算法模型自動根據(jù)參數(shù)切分醫(yī)療視頻鏡頭的功能;應具備使用算法與模型抽取醫(yī)療視頻文字信息,并提取音頻內(nèi)容轉(zhuǎn)換為文字信息的功能;應支持自動抽取醫(yī)療視頻中的關(guān)鍵幀,或根據(jù)邏輯判定抽取關(guān)鍵幀的功能;應支持自動識別醫(yī)療視頻中的單幀水印,并在相應的幀數(shù)上進行標記記錄的功能。9.6.1.3圖片數(shù)據(jù)清洗工具圖片數(shù)據(jù)清洗工具功能要求如下:應具備使用算法與模型抽取醫(yī)療圖片文字信息,或?qū)D片進行醫(yī)療領域描述;應具備使用深度學習模型對醫(yī)療圖像進行分類,以區(qū)分不同的疾病類型;應具備使用算法與模型,在醫(yī)學圖像中識別并分割出所需區(qū)域的功能。9.6.1.4音頻數(shù)據(jù)清洗工具音頻數(shù)據(jù)清洗工具功能要求如下:應具備對醫(yī)療音頻進行ASR處理,并生成文本數(shù)據(jù)的能力;應具備獲取醫(yī)療音頻基本信息,并進行標簽記錄的能力;應具備識別醫(yī)療音頻語言類型并進行標記的功能;應具備清除轉(zhuǎn)換后醫(yī)療音頻中無關(guān)信息的能力;應具備檢測醫(yī)療文檔敏感數(shù)據(jù),并確保其符合隱私保護標準的能力。9.6.2標注工具能力要求標注工具應當具備以下人工標注能力:應提供針對各個數(shù)據(jù)模態(tài)的數(shù)據(jù)標注功能,包括文本、圖片、音頻、視頻等;宜提供標注工具支持醫(yī)療領域的特殊數(shù)據(jù)要求,包括DICOM、NIfTI等格式。9.6.2.1文本數(shù)據(jù)標注工具文本數(shù)據(jù)標注工具應具備文選區(qū)、工具區(qū)、標簽區(qū)。標注工具功能要求如下::支持針對醫(yī)療文本的主題分類預標注、情感傾向預標注、關(guān)鍵詞提取預標注、實體鏈接預標注、語義角色預標注等功能;支持多語種;數(shù)據(jù)導出格式多樣;支持基于插件的擴展性(可選項)。9.6.2.2圖像數(shù)據(jù)標注工具圖像數(shù)據(jù)標注工具應具備畫選區(qū)、工具區(qū)、標簽區(qū);標注工具應支持針對醫(yī)療圖片的目標檢測預標注、場景識別預標注、圖像質(zhì)量評估預標注等功能。9.6.2.3視頻數(shù)據(jù)標注工具視頻數(shù)據(jù)標注工具應具備視頻選區(qū)、工具區(qū)、標簽區(qū);標注工具應支持針對醫(yī)療視頻的鏡頭分割預標注、關(guān)鍵幀提取預標注、行為識別預標注等功能。9.6.2.4音頻數(shù)據(jù)標注工具音頻數(shù)據(jù)標注工具應具備音頻選區(qū)、工具區(qū)、標簽區(qū)標注工具應具備支持針對醫(yī)療音頻的聲音事件檢測預標注、語音識別預標注(方言)、語音識別預標注(外語)、音頻信號源分離預標注、語調(diào)模式識別預標注等功能。向量數(shù)據(jù)庫選型要求向量數(shù)據(jù)庫提供語料向量形式存儲,要求如下:應支持多種向量類型,能夠存儲和處理多種類型的向量數(shù)據(jù);應具備向量索引機制,應支持快速的相似性檢索和范圍查詢;應提供查詢功能;應提供API接口,支持多種編程語言和框架;應提供數(shù)據(jù)加密功能與訪問控制機制;數(shù)據(jù)庫應提供數(shù)據(jù)備份和恢復機制。應支持不少于100W向量規(guī)模;應提供不多于300ms返回速度。算力要求一體機硬件配置要求可分為智能算力配置要求、普通算力配置要求以及算力分配和調(diào)度要求。具體分類如下圖所示:智能算力配置要求智能算力提供AI加速能力,包括GPU、NPU、TPU等架構(gòu),其配置要求如下:(a)使用稠密模型參數(shù)在13B及以下或使用混合專家模型激活總參數(shù)在13B及以下,并發(fā)請求數(shù)不大于5,F(xiàn)P16浮點總算力宜不低于280(TFlops/s),AI加速卡總內(nèi)存宜不低于64GB,配置4張AI加速卡情況下,單卡FP16浮點總算力配置宜不低于70(TFlops/s),單卡內(nèi)存宜不低于16GB。 (b)使用稠密模型參數(shù)在13B以上30B及以下或使用混合專家模型激活總參數(shù)在13B以上30B及以下,并發(fā)請求數(shù)不大于10,F(xiàn)P16浮點總算力宜不低于640(TFlops/s),AI加速卡總內(nèi)存宜不低于96GB,配置4張AI加速卡情況下,單卡FP16浮點總算力配置宜不低于160(TFlops/s),單卡內(nèi)存宜不低于24GB。(c)使用稠密模型參數(shù)在30B以上72B及以下或使用混合專家模型激活總參數(shù)在30B以上72B及以下,并發(fā)請求數(shù)不大于15,F(xiàn)P16浮點總算力宜不低于1600(TFlops/s),AI加速卡總內(nèi)存宜不低于192GB,配置8張AI加速卡情況下,單卡FP16浮點總算力配置宜不低于200(TFlops/s),單卡內(nèi)存宜不低于24GB。普通算力配置要求普通算力提供通用的CPU算力,其配置要求如下:當AI加速卡在4卡及以下時,CPU核心數(shù)不宜少于24,內(nèi)存宜按照CPU核心數(shù)進行1:4適配。當AI加速卡在8卡及以上時,CPU核心數(shù)宜不低于64,內(nèi)存宜按照CPU核心數(shù)進行1:4適配。表1普通算力配置要求表一體機卡數(shù)配置要求4卡及以下8卡及以上CPU核心數(shù)宜不少于24宜不少于64內(nèi)存按照核心數(shù)進行1:4適配一體機操作系統(tǒng)要求一體機操作系統(tǒng)應配置提供對整體資源管理和調(diào)度。具體參考要求如下:應用管理:應支持應用的安裝部署、啟用、停止、升級、卸載。智能體管理:應支持智能體及引擎的安裝、升級、啟用、停用、卸載。模型管理:應支持模型、推理引擎和微調(diào)引擎的裝載、加載、卸載。語料管理:應支持提示詞、微調(diào)數(shù)據(jù)集、知識庫數(shù)據(jù)集、測評數(shù)據(jù)集的存儲、啟用、更新、備份、刪除功能,應支持向量數(shù)據(jù)庫的安裝部署、啟用、停止、升級、卸載、備份。算力管理:應支持對AI加速卡的資源分配、回收、搶占等調(diào)度功能,可依據(jù)醫(yī)療大模型的實時需求進行動態(tài)分配,以適應工作負載的變化和不同的服務優(yōu)先級。高可用性能力:醫(yī)療大模型的算力分配和調(diào)度系統(tǒng)應采用高可用性架構(gòu)。容錯能力:系統(tǒng)應集成容錯機制。故障處理能力:系統(tǒng)應在AI加速卡單點故障發(fā)生時,對應資源隔離。監(jiān)控能力:系統(tǒng)應配備監(jiān)控系統(tǒng),可實時跟蹤算力資源的使用情況和系統(tǒng)性能指標。運維能力:應包含定期維護和更新機制。部署環(huán)境要求機房及類機房環(huán)境部署要求工作溫度應保持在5℃至35℃之間。應控制環(huán)境溫度變化率不超過20℃/小時。工作濕度應維持在8%至90%的相對濕度范圍內(nèi)。宜控制環(huán)境濕度變化率不超過20%/小時。應保持機房內(nèi)空氣清潔,無腐蝕性氣體和過多塵埃。宜定期清潔機房,使用空氣凈化設備。應提供穩(wěn)定、符合設備規(guī)格的電源供應,并確保良好接地。宜配備UPS和/或發(fā)電機作為備用電源。非機房及非類機房環(huán)境部署要求工作溫度應保持在5℃至35℃之間。應控制環(huán)境溫度變化率不超過20℃/小時。工作濕度應維持在8%至90%的相對濕度范圍內(nèi)。宜控制環(huán)境濕度變化率不超過20%/小時。應保持環(huán)境通風良好,減少有害物質(zhì)積聚。應定期清潔設備周圍區(qū)域,減少塵埃和污垢。應提供穩(wěn)定、可靠的電源供應,并確保良好接地。
參考文獻T/SAIAS015—2024語料庫建設導則《衛(wèi)生健康行業(yè)人工智能應用場景參考指引》
附錄A(資料性附錄)醫(yī)療通識語料醫(yī)療領域醫(yī)療通識語料應包括醫(yī)療領域的相關(guān)知識,包括但不限于如下領域知識:基礎醫(yī)學、臨床醫(yī)學、保健醫(yī)學、康復醫(yī)學、理療學、麻醉學、內(nèi)科學、外科學、婦產(chǎn)科學、兒科學、眼科學、耳鼻咽喉科學、口腔醫(yī)學、皮膚病學、性醫(yī)學、神經(jīng)病學、精神病學、急診醫(yī)學、核醫(yī)學、腫瘤學、護理學、預防醫(yī)學與衛(wèi)生學、藥學、中醫(yī)學、民族醫(yī)學、中西醫(yī)結(jié)合醫(yī)學、生物學、生理學、遺傳學、放射生物學、分子生物學、生態(tài)學、神經(jīng)生物學、植物學、昆蟲學、動物學、微生物學、病毒學、人類學、生物工程、心理學;
附錄B(資料性附錄)語料數(shù)據(jù)源范圍醫(yī)療通識語料部分數(shù)據(jù)源選取參考如下:書籍包括但不限于從人民衛(wèi)生出版社、高等教育出版社、科學出版社、Elsevier、Springer等國內(nèi)外出版社獲取的醫(yī)療健康領域教科書,及其他高質(zhì)量生命健康相關(guān)書籍;期刊論文包括但不限于《中華醫(yī)學雜志》《中國藥學雜志》《中國公共衛(wèi)生》
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院病房安全自查報告與整改措施
- 初中數(shù)學教案講解課件
- 家居裝修工程進度安排與調(diào)整措施
- 2025小學六年級班主任班主任培訓計劃
- 2025校園餐飲安全檢查工作總結(jié)
- 五星級酒店安全管理培訓計劃
- 三年級數(shù)學跨學科教學計劃
- 2025年小學語文下冊教學資源整合計劃
- 制造業(yè)設備保養(yǎng)與售后服務計劃
- 服務行業(yè)企業(yè)管理部職責與運營模式
- 土地管理法實施條例考試試題
- 真實的PBL真實的挑戰(zhàn):項目式學習設計指南
- 水果批發(fā)市場項目商業(yè)計劃書
- 前庭大腺囊腫護理查房課件
- 高考數(shù)學刷題:全國一模套卷(12套含答案)
- 施工方案塔吊驗收
- 小學校本課程-《11追蹤航空母艦》教學課件設計
- 井下停送電安全工作規(guī)程
- 水利工程污水管道施工監(jiān)理實施細則
- 唐代井鹽產(chǎn)地考
- (完整word版)Word信紙(A4橫條直接打印版)模板
評論
0/150
提交評論