無創(chuàng)型健康評估模型的建立方法及研發(fā)_第1頁
無創(chuàng)型健康評估模型的建立方法及研發(fā)_第2頁
無創(chuàng)型健康評估模型的建立方法及研發(fā)_第3頁
無創(chuàng)型健康評估模型的建立方法及研發(fā)_第4頁
無創(chuàng)型健康評估模型的建立方法及研發(fā)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

本文格式為Word版,下載可任意編輯——無創(chuàng)型健康評估模型的建立方法及研發(fā)無創(chuàng)型健康評估模型的通用建立方法

惠恒集團深圳市天信生物科技有限公司趙紅謝國梁

健康管理過程中,根據(jù)健康信息提供個體化亞健康干預手段是健康評估不可缺少的重要環(huán)節(jié)。本文介紹了基于系統(tǒng)生物信息學,宏觀檢測人體整體系統(tǒng)變量,以流行病學前瞻性模型為示教標準,研發(fā)周期短,經(jīng)濟適用的無創(chuàng)型健康評估模型的方法。并以缺血性心血管病發(fā)病危險因素為例,研發(fā)出無創(chuàng)型人體經(jīng)絡檢測值評估模型,其外推預報結果初步顯示了此方法的應用可行性。

危險性評估;模型;機器學習;經(jīng)絡信息檢測及處理1引言

1.1亞健康檢測和評估現(xiàn)狀

亞健康的檢測和評估是健康管理最終提供個體化的干預手段,是必不可少的先決條件。由于絕大多數(shù)被市場“炒〞作起來的亞健康檢測與評估“產(chǎn)品〞均沒有經(jīng)過科學系統(tǒng)的應用研究和實施數(shù)據(jù)支持,因而只呈曇花一現(xiàn)便無影無蹤。

1.2現(xiàn)存的一些商業(yè)化亞健康檢測評估手段分類

1.2.1以既存疾病驗后診斷案例為基礎的無創(chuàng)型評估模型

盡管此類亞健康檢測評估手段的機理各異,但就其所獲取的信息、所建立的評估模型而言,并非疾病預警意義上的嚴格的前瞻性健康風險評估。由于其模型建立機制實質上是通過檢測數(shù)據(jù),歸納現(xiàn)存已產(chǎn)生疾病屬性的回想性提醒(盡管此類檢測評估系統(tǒng)的商業(yè)宣傳稱其對疾病具有早期提醒作用)。檢測信息從既存疾病的非亞健康人群中獲取,然后采用數(shù)據(jù)處理進行歸納,得出的結論實為既存疾病屬性的標示。因此,此類評估模型的方法論規(guī)律的建立比較含混,不同于亞健康狀態(tài)下,具有疾病預警意義的前瞻性健康風險評估。

為解決以上弊端,有必要采用基于亞健康疾病時間序列趨勢統(tǒng)計分析,具有較嚴格的前瞻預報意義的有創(chuàng)型流行病學評估模型。

1.2.2以亞健康疾病時間序列趨勢統(tǒng)計分析為基礎的有創(chuàng)型流行病學評估模型任何一種慢性疾病都有其特有的生理病理變化,盡管這些變化是繁雜的,但是很小的變

[1]

化都會在生物標記上有所表達。這里的生物標記群不只是考慮單一指標的測量值,而是包括全面觀測到的眾多有意義的生物醫(yī)學指標及其它指標,是對人身體健康狀況的整體評估。因此,假使在疾病發(fā)生前測得其生物標記模式,并連續(xù)觀測疾病發(fā)展過程中時間序列趨勢下生物標記的變化狀況,采用流行病學統(tǒng)計分析方法,如Cox比例風險模型等,建立評估模型,就可發(fā)現(xiàn)導致疾病發(fā)生及發(fā)展的關鍵因素,也就是在亞健康人群檢測評估中真正有意義的前瞻性健康風險評估的檢測信息判據(jù)。將某個體的生物標記群錄入計算機,基于評估模型的預計軟件系統(tǒng)就會自動將錄入信息與軟件的預計模式進行比較分析,確定該個體發(fā)生疾病的趨勢及可能性,此過程為采取有效的預防措施創(chuàng)造了條件。

這種檢測評估手段的惋惜之處是必需包括有創(chuàng)性血生化指標,因而增加了諸多不便。2交織綜合評估方法

通過綜合評估的手段使以上兩類機制不同的檢測評估模型“雜交〞,揚棄各自的優(yōu)缺點是必要的。由于所構造的新模型來源于兩類產(chǎn)活力制全然不同的源模型的“雜交〞,因此新模型不可能通過兩類模型算法的合成來獲取,也不可能借助原來產(chǎn)生兩類模型的臨床案例的會集重新構建,只能通過原創(chuàng)的交織試驗設計積累足夠的臨床案例來獲取。這里筆者提供一個采用系統(tǒng)生物信息學的計算機學習獲取無創(chuàng)型評估模型的交織綜合對照試驗的方案(如圖1),通過有創(chuàng)型基于時間序列的流行病學疾病預報模型作標準,開發(fā)出無創(chuàng)型健康評估(疾病預警)模型。此模型可不斷地伴隨臨床案例的積累而優(yōu)化。下面以缺血性心血管評估模型為對照,簡述基于人體經(jīng)絡檢測值無創(chuàng)型評估模型的開發(fā)過程,并對初步應用結果進行分析。

[4]

[3]

[2]

圖1

獲取無創(chuàng)性評估模型的交織綜合對照方案

健康評估個體

有創(chuàng)檢測屬性無創(chuàng)檢測屬性

有創(chuàng)流行病學評估模型

再學習

評估結果

機器學習訓練案例

機器學習

無創(chuàng)評估模型

3以人體經(jīng)絡檢測為基礎,建立缺血性心血管病發(fā)病危險無創(chuàng)型評估模型3.1經(jīng)絡檢測原理

采用經(jīng)絡測量信息作為亞健康狀態(tài)主要連續(xù)量生物標記之一。根據(jù)國內(nèi)外電生理學試驗發(fā)現(xiàn),如經(jīng)穴處存在Ca,F(xiàn)e元素和Ca離子的富聚,以及經(jīng)絡循經(jīng)傳導線上與經(jīng)穴點有關線粒三磷(ATP)較多的細胞集聚等實證結果

[5-12]

,Ca離子作為細胞間質中第一、其次信使,

參與細胞生長發(fā)育重要過程,在人體生命過程中扮演著重要的角色,因此經(jīng)絡測量可能成為采集生命科學信息的重要手段。在血生化數(shù)值等診斷指標變化前,經(jīng)絡信息

[13]

與其他“生物

-心理-社會〞的綜合標記群的合參綜合可能會更確鑿地透露一些生命現(xiàn)象的量化本質,如亞健康狀態(tài)。本研究正是通過宏觀電子檢測多處經(jīng)絡穴位點的皮膚表面電阻值,經(jīng)系統(tǒng)生物信

息學的計算機學習(supervisorbasedlearning),獲取模式發(fā)現(xiàn)(patterndiscovery),綜合挖掘提取機體功能狀況特征信息,深刻透露經(jīng)絡信息表達的微觀生命科學本質。與其他商業(yè)化的無創(chuàng)型檢測手段相比,經(jīng)絡皮膚表面電阻檢測具有較為經(jīng)濟簡便的優(yōu)越性。

3.2示教標準源模型——缺血性心血管病發(fā)病危險的評估模型

中國醫(yī)學科學院阜外心血管病醫(yī)院流行病學研究室武陽豐教授研究認為,缺血性心血管病發(fā)病危險的評估模型能較好地反映發(fā)生心血管病的綜合危險,預計個體未來十年內(nèi)罹患缺血性心血管病(ischemiccardiovasculardiseases,ICVD)的危險等級。此評估模型由年齡、血壓、體重指數(shù)、是否吸煙、血糖與血脂含量六大因素共同決定。其中年齡、是否吸煙通過填寫問卷獲得,血壓通過血壓計測量獲得,體重指數(shù)通過測量身高和體重獲得,只有血糖和血脂含量必需通過有創(chuàng)抽血化驗才能獲得。

3.3利用神經(jīng)元網(wǎng)絡算法,建立有示教的計算機機器學習,獲取無創(chuàng)型評估模型由圖1所示,計算機機器學習獲取無創(chuàng)型評估模型的交織綜合對照試驗方案,通過以上有創(chuàng)型ICVD流行病學疾病預報模型作為示教標準,選取神經(jīng)元網(wǎng)絡算法實現(xiàn)計算機機器學習,開發(fā)出無創(chuàng)性健康評估(疾病預警)模型,由于神經(jīng)元網(wǎng)絡算法十分適合處理含繁雜噪聲的傳感器數(shù)據(jù),如經(jīng)絡皮膚表面電阻檢測值。

在此實現(xiàn)過程中,我們以297個例行體檢中獲取的經(jīng)絡受檢者的數(shù)據(jù)作為神經(jīng)元網(wǎng)絡機器學習的訓練集,而以另外227個數(shù)據(jù)作為測試集用于測試所建模型的預報精度。由于訓練集和測試集來自于取樣時間和地點完全不同的群體,因此在統(tǒng)計上是完全獨立的。

這些檢測者的數(shù)據(jù)包括年齡、性別、血壓、身高、體重、血糖血脂含量、吸煙與否以及人體皮膚表面24個主要穴位的經(jīng)絡電阻等詳細信息。根據(jù)心血管疾病評估模型中的計算方法(參見圖2和圖3),我們可以計算出每個檢測者未來十年ICVD發(fā)病危險(%)。通過與同性別、同年齡段人群未來十年ICVD發(fā)病平均危險(%)進行對比,我們把未來十年ICVD發(fā)病危險(%)超過同性別、同年齡段的人群定義為心血管疾病高危傾向者。為此,我們在模型中引進了一個目標變量“是否高危〞,對未來十年ICVD發(fā)病危險(%)超過同性別、同年齡段的人群,目標變量取值1(高危),否則為0(非高危)。如在缺血性心血管病發(fā)病危險的有創(chuàng)評估模型(示教標準源模型)中代入297個數(shù)據(jù)訓練集例行體檢獲取的相應信息,可得出197個數(shù)據(jù)取值0,100個數(shù)據(jù)取值1為示教標準,運用神經(jīng)網(wǎng)絡算法

[14]

[4]

[4]

訓練得到模型,

再把模型結果運用到測試集上進行預報,以檢驗模型的預計精度。

神經(jīng)網(wǎng)絡模型可以大致表述為如下函數(shù):

某個體心血管疾病預報風險“是否高危〞=f(年齡、性別、收縮壓、體重指數(shù)、吸煙與否、及人體皮膚表面24個主要穴位的經(jīng)絡電阻值)

由此可知,此模型為不包含血糖及血脂的無創(chuàng)型模型。227數(shù)據(jù)測試集的預計結果如下:

1.用原來297個數(shù)據(jù)做訓練集得到模型,再用該模型對227個數(shù)據(jù)進行預計;實際預計|0|1|總計+++0|153|14|167+++1|12|48|60+++總計16562227

從以上混淆矩陣看出,227個數(shù)據(jù)中,實際取值為“0〞的167個數(shù)據(jù)通過模型預報后153個仍為“0〞,14個誤報為“1〞,實際取值為“1〞的60個數(shù)據(jù)通過模型預報后48個仍為“1〞,12個誤報為“0〞。其中有201個數(shù)據(jù)模型預報值與實際值吻合,26個數(shù)據(jù)不吻合,模型的預計確鑿率為88.55%。

2.因訓練數(shù)據(jù)集和測試數(shù)據(jù)集的統(tǒng)計分布差異會導致模型外推預報精度降低,為了戰(zhàn)勝這一點,基于集群表決理論

[15]

,對原來的297個數(shù)據(jù)的訓練

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論