版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2010年全國(guó)研究生數(shù)學(xué)建模競(jìng)賽A題確定腫瘤的重要基因信息 提取基因圖譜信息方法的研究癌癥起源于正常組織在物理或化學(xué)致癌物的誘導(dǎo)下,基因組發(fā)生的突變,即基因在結(jié)構(gòu)上發(fā)生堿基對(duì)的組成或排列順序的改變,因而改變了基因原來(lái)的正常分布(即所包含基因的種類和各類基因以該基因轉(zhuǎn)錄的mRNA的多少來(lái)衡量的表達(dá)水平)。所以探討基因分布的改變與癌癥發(fā)生之間的關(guān)系具有深遠(yuǎn)的意義。DNA微陣列(DNA microarray),也叫基因芯片,是最近數(shù)年發(fā)展起來(lái)的一種能快速、高效檢測(cè)DNA片段序列、基因表達(dá)水平的新技術(shù)。它將數(shù)目從幾百個(gè)到上百萬(wàn)個(gè)不等的稱之為探針的核苷酸序
2、列固定在小的(約1)玻璃或硅片等固體基片或膜上,該固定有探針的基片就稱之為DNA微陣列。根據(jù)核苷酸分子在形成雙鏈時(shí)遵循堿基互補(bǔ)原則,就可以檢測(cè)出樣本中與探針陣列中互補(bǔ)的核苷酸片段,從而得到樣本中關(guān)于基因表達(dá)的信息,這就是基因表達(dá)譜,因此基因表達(dá)譜可以用一個(gè)矩陣或一個(gè)向量來(lái)表示,矩陣或向量元素的數(shù)值大小即該基因的表達(dá)水平(見(jiàn)附件)。隨著大規(guī)?;虮磉_(dá)譜 ( Gene expression profile ,或稱為基因表達(dá)分布圖) 技術(shù)的發(fā)展,人類各種組織的正常的基因表達(dá)已經(jīng)獲得,各類病人的基因表達(dá)分布圖都有了參考的基準(zhǔn),因此基因表達(dá)數(shù)據(jù)的分析與建模已經(jīng)成
3、為生物信息學(xué)研究領(lǐng)域中的重要課題。如果可以在分子水平上利用基因表達(dá)分布圖準(zhǔn)確地進(jìn)行腫瘤亞型的識(shí)別,對(duì)診斷和治療腫瘤具有重要意義。因?yàn)槊恳环N腫瘤都有其基因的特征表達(dá)譜(見(jiàn)附圖)。從DNA 芯片所測(cè)量的成千上萬(wàn)個(gè)基因中,找出決定樣本類別的一組基因“標(biāo)簽”,即“信息基因” (informative genes )是正確識(shí)別腫瘤類型、給出可靠診斷和簡(jiǎn)化實(shí)驗(yàn)分析的關(guān)鍵所在,同時(shí)也為抗癌藥物的研制提供了捷徑。通常由于基因數(shù)目很大,在判斷腫瘤基因標(biāo)簽的過(guò)程中,需要剔除掉大量“無(wú)關(guān)基因”,從而大大縮小需要搜索的致癌基因范圍。事實(shí)上,在基因表達(dá)譜中,一些基因的表達(dá)水平在所有樣本中都非常接近。
4、例如,不少基因在急性白血病亞型(ALL,AML)兩個(gè)類別中的分布無(wú)論其均值還是方差均無(wú)明顯差別,可以認(rèn)為這些基因與樣本類別無(wú)關(guān),沒(méi)有對(duì)樣本類型的判別提供有用信息,反而增加信息基因搜索的計(jì)算復(fù)雜度。因此,必須對(duì)這些“無(wú)關(guān)基因”進(jìn)行剔除。1999 年Science發(fā)表了Golub 等針對(duì)上述急性白血病亞型識(shí)別與信息基因選取問(wèn)題的研究結(jié)果1 。Golub 等以“信噪比”(Signal to noise ratio) 指標(biāo)作為衡量基因?qū)颖痉诸愗暙I(xiàn)大小的量度,采用加權(quán)投票的方法進(jìn)行亞型的識(shí)別,僅根據(jù)72個(gè)樣本就從7 129 個(gè)基因中選出了50 個(gè)可能與亞型分類相關(guān)的信息基因。Golub 的工作大大縮小
5、了決定急性白血病亞型差異的基因范圍,給出了亞型識(shí)別的基因依據(jù),富有創(chuàng)造性。Guyon 等則利用支持向量機(jī)的方法再?gòu)闹羞x出了8個(gè)可能的信息基因2。但信噪比肯定不是衡量基因?qū)颖痉诸愗暙I(xiàn)大小的唯一標(biāo)準(zhǔn),腫瘤是致癌基因、抑癌基因、促癌基因和蛋白質(zhì)通過(guò)多種方式作用的結(jié)果,在確定某種腫瘤的基因標(biāo)簽時(shí),應(yīng)該設(shè)法充分利用其他有價(jià)值的信息。有專家認(rèn)為3在基因分類研究中忽略基因低水平表達(dá)、差異不大的表達(dá)的傾向應(yīng)該被糾正,與臨床問(wèn)題相關(guān)的主要生理學(xué)信息(見(jiàn)問(wèn)題4)應(yīng)該融合到基因分類研究中。 面對(duì)提取基因圖譜信息這樣前沿性課題,命題人根據(jù)自己科學(xué)研究的經(jīng)歷和思考,猜測(cè)以下幾點(diǎn)是解決前沿性課題的有價(jià)值的工作。這種猜測(cè)
6、是科學(xué)研究中的重要環(huán)節(jié),當(dāng)然猜測(cè)不會(huì)總是可行的,更不一定總是正確的。但不探索就不能前進(jìn),如果能夠通過(guò)數(shù)學(xué)建模,得到的部分結(jié)果可以佐證你們的猜測(cè)或?yàn)樾绿剿魈峁┤舾梢罁?jù),就很有價(jià)值。我們的目的只是給研究生以啟發(fā),鼓勵(lì)研究生培養(yǎng)這樣的創(chuàng)造性發(fā)現(xiàn)的能力。所以研究生完全可以獨(dú)立設(shè)計(jì)自己的技術(shù)路線,只要能夠有效提取附件的基因圖譜信息就行。(1) 由于基因表示之間存在著很強(qiáng)的相關(guān)性,所以對(duì)于某種特定的腫瘤,似乎會(huì)有大量的基因都與該腫瘤類型識(shí)別相關(guān),但一般認(rèn)為與一種腫瘤直接相關(guān)的突變基因數(shù)目很少。對(duì)于給定的數(shù)據(jù)(見(jiàn)附件),如何從上述觀點(diǎn)出發(fā),選擇最好的分類因素?(2) 相對(duì)于基因數(shù)目,樣本往往很小,如果直接用
7、于分類會(huì)造成小樣本的學(xué)習(xí)問(wèn)題,如何減少用于分類識(shí)別的基因特征是分類問(wèn)題的核心,事實(shí)上只有當(dāng)這種特征較少時(shí),分類的效果才更好些。對(duì)于給定的結(jié)腸癌數(shù)據(jù)如何從分類的角度確定相應(yīng)的基因“標(biāo)簽”? (3) 基因表達(dá)譜中不可避免地含有噪聲(見(jiàn)1999 年Golub在Science發(fā)表的文章),有的噪聲強(qiáng)度甚至較大,對(duì)含有噪聲的基因表達(dá)譜提取信息時(shí)會(huì)產(chǎn)生偏差。通過(guò)建立噪聲模型,分析給定數(shù)據(jù)中的噪聲能否對(duì)確定基因標(biāo)簽產(chǎn)生有利的影響?(4) 在腫瘤研究領(lǐng)域通常會(huì)已知若干個(gè)信息基因與某種癌癥的關(guān)系密切,建立融入了這些有助于診斷腫瘤信息的確定基因“標(biāo)簽”的數(shù)學(xué)模型。比如臨床有下面的生理學(xué)信息:大約90%結(jié)腸癌在早期
8、有5號(hào)染色體長(zhǎng)臂APC基因的失活,而只有40%50%的ras相關(guān)基因突變。1.參考文獻(xiàn):1T. R. Golub, et al. Monitoring and Class Prediction by Gene Expression,Science, Vol. 286, pp.531-537 (1999);2Guyon I , Weston J , Barnhill S , et al . Gene selection for cancer classification using support vector machines J . Machine Learning ,2000 ,46(13) :389 - 422.3 Z. Sun, P. Yang, Gene expression profiling on lung cancer Outcome Prediction: Present Clinical Value and Future Premise, Cancer Epidemiology Biomarkers & Prevention, 2006, 15(11): 2063-20684李穎新,劉全金,阮曉鋼,急性白血病的基因表
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度旅游旺季臨時(shí)導(dǎo)游勞務(wù)合同范本4篇
- 2025年度個(gè)人果園綠色種植與農(nóng)產(chǎn)品溯源服務(wù)合同4篇
- 2025年度木工產(chǎn)品包裝設(shè)計(jì)與印刷合同3篇
- 二零二五年度室內(nèi)木門(mén)翻新與維修服務(wù)合同范本4篇
- 2025版煤炭行業(yè)人力資源培訓(xùn)與合作合同4篇
- 2025年度美發(fā)行業(yè)技師技能認(rèn)證與培訓(xùn)合同4篇
- 二零二五年度木飾面原材料質(zhì)量控制與認(rèn)證合同3篇
- 2025年臨時(shí)企業(yè)靈活勞務(wù)外包協(xié)議
- 2025年家族遺產(chǎn)繼承公約規(guī)劃協(xié)議
- 2025年合同追償協(xié)議
- 醫(yī)學(xué)脂質(zhì)的構(gòu)成功能及分析專題課件
- 高技能人才培養(yǎng)的策略創(chuàng)新與實(shí)踐路徑
- 2024年湖北省知名中小學(xué)教聯(lián)體聯(lián)盟中考語(yǔ)文一模試卷
- 2024年湖北省中考數(shù)學(xué)試卷(含答案)
- 油煙機(jī)清洗安全合同協(xié)議書(shū)
- 2024年云南省中考數(shù)學(xué)試題(原卷版)
- 污水土地處理系統(tǒng)中雙酚A和雌激素的去除及微生物研究
- 氣胸病人的護(hù)理幻燈片
- 《地下建筑結(jié)構(gòu)》第二版(朱合華)中文(2)課件
- JB T 7946.1-2017鑄造鋁合金金相
- 包裝過(guò)程質(zhì)量控制
評(píng)論
0/150
提交評(píng)論