




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第七章基因芯片數(shù)據(jù)分析MicroarrayDataAnalysis第一節(jié)芯片平臺及數(shù)據(jù)庫(GeneralMicroarrayPlatformandDatabase)一、cDNA微陣列芯片寡核苷酸芯片類似于cDNA芯片,但是在探針的設計上優(yōu)于cDNA芯片,它的探針并不是來源于cDNA克隆,而是預先設計并合成的代表每個基因特異片段的約50mer左右長度的序列,然后將其點樣到特定的基質(zhì)上制備成芯片,從而克服了探針序列太長導致的非特異性交叉雜交和由于探針雜交條件變化巨大導致的數(shù)據(jù)結果的不可靠。二、寡核苷酸芯片
五、基因表達倉庫GeneExpressionOmnibus,GEO六、斯坦福微陣列數(shù)據(jù)庫TheStanfordMicroarrayDatabase,SMD第二節(jié)基因芯片數(shù)據(jù)預處理
(GeneralMicroarrayDataTypeandDatabase)一、基因芯片數(shù)據(jù)提取與過濾(一)
cDNA微陣列芯片(二)
Affymetrix公司的原位合成芯片定性信息提?。篜/A/M(Present/Absent/Marginal)定量信息提?。夯谔结樇瘏R總后的基因水平的熒光信號強度值數(shù)據(jù)過濾
數(shù)據(jù)過濾的目的是去除表達水平是負值或很小的數(shù)據(jù)、或者明顯的噪聲數(shù)據(jù)。過閃耀現(xiàn)象物理因素導致的信號污染雜交效能低點樣問題其它二、數(shù)據(jù)補缺(一)數(shù)據(jù)缺失類型非隨機缺失基因表達豐度過高或過低隨機缺失與基因表達豐度無關,數(shù)據(jù)補缺主要針對隨機缺失情況(二)數(shù)據(jù)補缺方法1、簡單補缺法missingvalues=0expressionmissingvalues=1expression(arbitrarysignal)missingvalues=row(gene)averagemissingvalues=column(array)average2、K近鄰法選擇與具有缺失值基因的k個鄰居基因用鄰居基因的加權平均估計缺失值參數(shù):鄰居個數(shù)距離函數(shù)3、回歸法三、數(shù)據(jù)標準化(一)為什么要進行數(shù)據(jù)標準化存在不同來源的系統(tǒng)誤差染料物理特性差異(熱和光敏感性,半衰期等)染料連接效能點樣針差異數(shù)據(jù)收集過程中掃描設施不同芯片差異實驗條件差異(二)運用哪些基因進行標準化處理芯片上大部分基因(假設芯片上大部分基因在不同條件下表達量相同)不同條件間穩(wěn)定表達的基因(如持家基因)控制序列(spikedcontrol)合成DNA序列或外源的DNA序列,在不同條件下表達水平相同。1、片內(nèi)標化(Within-slidenormalization)
(1)全局標化(Globalnormalization)(三)cDNA芯片數(shù)據(jù)標準化處理假設:R=k*G方法:C=log2k:中值或均值
(2)熒光強度依賴的標化(Intensitydependentnormalization)為什么方法:scatter-plotsmootherlowess擬合c(A)為MvsA的擬合函數(shù)標化后的數(shù)據(jù)
(3)點樣針依賴的標化(Within-print-tip-groupnormalization)
為什么一張芯片的不同區(qū)域運用不同的點樣針點樣,從而引入點樣針帶來的系統(tǒng)誤差。method(4)尺度調(diào)整(Scaleadjustment)為什么調(diào)整不同柵格(grids)間的數(shù)據(jù)離散度方法:計算不同柵格的尺度因子
2、片間標化(Multiple-slidenormalization)線性標化法(Linearscalingmethods)與芯片內(nèi)標化的尺度調(diào)整(Scaleadjustment)方法類似非線性標化法(non-linearmethods)分位數(shù)標化法(Quantilenormalization)兩張芯片的表達數(shù)據(jù)的分位數(shù)標化至相同,即分布于對角線上。3、染色互換實驗(dye-swapexperiment)的標化
實驗組對照組芯片1cy5(R)cy3(G’)芯片2cy3(G)cy5(R’)前提假設:c︽c’方法:
1、提取定性信號(1)對每個探針對計算R
R=(PM-MM)/(PM+MM)(2)比較R與定義的閾值Tau(小的正值,默認值為0.015).(3)單側(cè)的Wilcoxon’sSignedRanktest產(chǎn)生p值,根據(jù)p值定義定量信號值PresentcallMarginalcallAbsentcall(四)Affymetrix芯片數(shù)據(jù)標準化2、提具取定量降信號(1)各分析步若驟獲取探矛針水平不數(shù)據(jù)背景值效輝正標準化吳處理探針特異劫背景值效音正探針集閥信號的榜匯總(2)養(yǎng)分析方貧法M=唱lo扒g2R-運log2GA=案(log2R+踐lo欲g2G)/束2前面提及楚的標準化螺方法僅效久正了數(shù)據(jù)錢分布的中架心,在不統(tǒng)同的柵格童間log該-Rat面ios裹的方差也槍不同。第三節(jié)移差異培表達分合析(An繡aly竹sis積of響Di輪ffe用ren撿tia鴨lly派Ex濱pre感ssi羊on遺Gen膨e)一、倍數(shù)愁法實驗條傾件下的斯表達值對照條那件下的付表達值通常以致2倍差高異為閾呢值,判遭斷基因娛是否差練異表達二、統(tǒng)旁計學方唱法1、t檢標驗法運用t檢茫驗法可以前判斷基因恨在兩不同盯條件下的聰表達差異紛是否具有址顯著性2、方私差分析方差分擺析可用岡于基因無在兩種擠或多種計條件間辰的表達哄量的比弱較,它疏將基因襪在樣本暫之間的振總變異傻分解為糊組間變擔異和組構內(nèi)變異叼兩部分沸。通過宰方差分株析的假基設檢驗稈判斷組斥間變異怪是否存標在,如柴果存在秒則表明亭基因在晴不同條醬件下的龍表達有粘差異。三、S瓶AM豈(S森ign頑ifi沙can呆ce看Ana糖lys篇is擦of余Mic篩roa陰rra鑒ys)(一)兵多重蘭假設檢沙驗問題Ⅰ型錯撈誤(假腎陽性)渴即在假甘設檢驗廈作推斷君結論時抓,拒絕故了實際砍上正確掠的檢驗騰假設,傘即將無討差異表裂達的基眼因判斷錘為差異辯表達。Ⅱ型錯誤色(假陰性獨)即不拒叢絕實際上慈不正確的齒,即將有莫差異表達彩的基因判順斷為無差托異表達。在進行差禁異基因挑遮選時,整狡個差異基爸因篩選過占程需要做戒成千上萬城次假設檢共驗,導致乒假陽性率咳的累積增敗大。對于賢這種多重菠假設檢驗供帶來的放媽大的假陽敘性率,需咽要進行糾鄙正。常用贊的糾正策裂略有Bo流nfer露roni萍效正,控緊制FDR悄(Fal四seD歪isco本very榴Rat閉e)值等。(二)柱分析丘步驟計算統(tǒng)計錫量擾動實驗兼條件,計智算擾動后險的基因表刷達的相對棚差異統(tǒng)計澇量計算擾動鼓后的平均那相對差異諷統(tǒng)計量確定差異斤表達基因鼠閾值:以殖最小的正值和坐最大的負峽值作為統(tǒng)此計閾值,運用詳該閾值,踏統(tǒng)計在值學中超過該閾曉值的假仗陽性基捉因個數(shù)遙,估計假陽性昆發(fā)現(xiàn)率F爭DR值。通過調(diào)整聚FDR值菜的大小得蠶到差異表達基望因。四、信故息熵運用信孔息熵進淚行差異貸基因挑勞選時,癥不需要竄用到樣策本的類網(wǎng)別信息鳴,所以宰運用信蕩息熵找宗到的差墳異基因飼是指在氧所有條衡件下表察達波動輕比較大叢的基因飼。第四節(jié)基因芯片溉數(shù)據(jù)的聚奸類分析(Cl球ust異er扶Ana技lys往is臨of既Mic盾roa當rra劑yD允ata枯)(一)相勸似性測度幾何距漂離線性相脹關系數(shù)非線性秒相關系戰(zhàn)數(shù)互信息其它(二)層次聚類層次聚薄類算法秧將研究網(wǎng)對象按泥照它們斬的相似典性關系汪用樹形蒸圖進行陳呈現(xiàn),廈進行層篩次聚類輛時不需楚要預先住設定類方別個數(shù)榮,樹狀花的聚類扒結構可環(huán)以展示遭嵌套式寒的類別偷關系。在對含鉤非單獨若對象的罪類進行竹合并或剖分裂時岡,常用醫(yī)的類間貴度量方前法(三)硬k均值飲聚類基本思想(四)自暢組織映射食聚類基本思想蒙:在不斷父的學習過簽程中,輸令出層的神流經(jīng)元根據(jù)裳輸入樣本妹的特點進浮行權重調(diào)尼整,最后怎拓樸結構柴發(fā)生了改嬸變第五節(jié)紋基因犯芯片數(shù)洗據(jù)的分而類分析(Cl念ass譜ifi遷cat袖ion華of乓Mi針cro習arr到ay綠Dat狠a)一、線性縱判別分類謊器二、k近江鄰分類法基本思想三、決策衛(wèi)樹(一)綠基本思抵想決策樹又躁稱為多級腥分類器,臂利用決策綱樹分類可殺以把一個挑復雜的多淺類別分類弱問題轉(zhuǎn)化寨為若干個喊簡單的分賄類問題來賄解決決策樹匆的結構鍵:一個潤樹性的佛結構,肆內(nèi)部節(jié)博點上選不用一個紫屬性進母行分割抗,每個歡分叉都染是分割斤的一個螞部分,村葉子節(jié)全點表示買一個分挺布(二)膛分析步宰驟:提稀取分類舉規(guī)則,醉進行分怒類預測在構造躍決策樹厭的過程多中最重題要的一蘇點是在防每一個焦分裂節(jié)嬌點確定振用那個舍屬性來袍分類(菜或分裂扯)這就涉溪及到關片于使用侵什么準闖則來衡崗量使用蛇A屬性貫比使用坦B屬性膛更合理決策樹分類算法output訓練集決策樹input(三)宴衡量準些則信息增吧益——怪Inf稿orm評ati仆on每gai促n基尼指數(shù)丘——Gi乞nii杯ndex第六節(jié)勸常用背的表達清譜分析歡軟件(Ge惕ner服al壤Mic披roa漏rra掛yA抄nal歡ysi療sS浪oft夢war腳e)Arra領yToo悄lsDCh御ip(右DNA勢-Ch殃ip富Ana要lyz壤er)SAMR語言貞和Bi柏oCo桐ndu供cto低r:輪aff鐘y、m殼arr立ay、侄lim稈maMatl肌ab:悉Bioi鮮nfor鏟mati杯csT緩oolb護
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 網(wǎng)絡游戲虛擬貨幣發(fā)行與游戲角色扮演服務合同
- 東南亞倉儲庫存盤點與倉儲設備租賃合同
- 兒童綜合保障計劃退保服務協(xié)議
- 游戲美術資源制作設計師勞務合同
- 互聯(lián)網(wǎng)金融服務反欺詐補充合同
- 數(shù)字出版物區(qū)域獨家代理權轉(zhuǎn)讓合同
- 工業(yè)自動化軟件許可及市場推廣合作協(xié)議
- 太陽能電池技術升級補充協(xié)議
- 跨國公司員工離職保密協(xié)議及全球競業(yè)限制條款
- 保險業(yè)務審核補充合同
- 高考語文作文素材:《典籍里的中國》課件33張
- 六年級下冊數(shù)學課件 整理和復習6.5比和比例 人教版 (共14張PPT)
- 隧道施工安全教育培訓
- 2022年道路交通安全防汛工作應急預案
- (完整)《神經(jīng)病學》考試題庫及答案
- 國網(wǎng)北京市電力公司授權委托書(用電)
- 邊坡支護之錨桿施工技術ppt版(共35頁)
- 黃芩常見的病蟲害癥狀及防治措施
- 思政課社會實踐報告1500字6篇
- GB∕T 25119-2021 軌道交通 機車車輛電子裝置
- 電池PCBA規(guī)格書
評論
0/150
提交評論