![結(jié)構(gòu)生物信息學(xué)_第1頁(yè)](http://file4.renrendoc.com/view/194881ef8acc923d5f556015890a9729/194881ef8acc923d5f556015890a97291.gif)
![結(jié)構(gòu)生物信息學(xué)_第2頁(yè)](http://file4.renrendoc.com/view/194881ef8acc923d5f556015890a9729/194881ef8acc923d5f556015890a97292.gif)
![結(jié)構(gòu)生物信息學(xué)_第3頁(yè)](http://file4.renrendoc.com/view/194881ef8acc923d5f556015890a9729/194881ef8acc923d5f556015890a97293.gif)
![結(jié)構(gòu)生物信息學(xué)_第4頁(yè)](http://file4.renrendoc.com/view/194881ef8acc923d5f556015890a9729/194881ef8acc923d5f556015890a97294.gif)
![結(jié)構(gòu)生物信息學(xué)_第5頁(yè)](http://file4.renrendoc.com/view/194881ef8acc923d5f556015890a9729/194881ef8acc923d5f556015890a97295.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
結(jié)構(gòu)生物信息學(xué)演示文稿現(xiàn)在是1頁(yè)\一共有55頁(yè)\編輯于星期四結(jié)構(gòu)生物信息學(xué)現(xiàn)在是2頁(yè)\一共有55頁(yè)\編輯于星期四本章內(nèi)容提要1.Microarray簡(jiǎn)介2.圖像處理與數(shù)據(jù)標(biāo)準(zhǔn)化3.基因芯片的數(shù)據(jù)分析4.Microarray:工具&數(shù)據(jù)庫(kù)現(xiàn)在是3頁(yè)\一共有55頁(yè)\編輯于星期四基因芯片1.基因芯片(1987)2.根據(jù)免疫測(cè)定的(immunoassay)的方法予以改進(jìn)3.高通量、點(diǎn)陣以及Northern雜交同時(shí)測(cè)定細(xì)胞內(nèi)數(shù)千個(gè)基因的表達(dá)情況將mRNA反轉(zhuǎn)錄成cDNA與芯片上的探針雜交4.芯片的體積非常?。何⒘繕悠返臋z測(cè)5.基因表達(dá)情況的定量分析6.其他類(lèi)型的芯片:組織芯片蛋白質(zhì)芯片現(xiàn)在是4頁(yè)\一共有55頁(yè)\編輯于星期四基因芯片的密度:100-1millionDNA探針/1cm2將樣品中的DNA/RNA表上熒光標(biāo)記,則可以定量檢驗(yàn)基因的表達(dá)水平堿基互補(bǔ)現(xiàn)在是5頁(yè)\一共有55頁(yè)\編輯于星期四基因表達(dá)情況的定量測(cè)定1.發(fā)現(xiàn)在特定生長(zhǎng)時(shí)期,或者隨著環(huán)境變化,那些基因的表達(dá)收到誘導(dǎo)或者抑制2.在相同條件下,上調(diào)或者下調(diào)變化規(guī)律相似的基因,可能具有功能上的關(guān)聯(lián)3.可以從共表達(dá)的基因中尋找調(diào)控模體4.基因表達(dá)的模式可以用來(lái)表征異常的細(xì)胞調(diào)控,例如,癌癥的診斷現(xiàn)在是6頁(yè)\一共有55頁(yè)\編輯于星期四基因芯片技術(shù)的類(lèi)型按技術(shù)手段、探針類(lèi)型分類(lèi)1.Shortoligonucleotidearrays(Affymetrix)2.cDNAarrays(Brown/Botstein)3.Longoligoarrays(Agilent)4.Serialanalysisofgeneexpression(SAGE)按實(shí)驗(yàn)要求分類(lèi)1.單通道(SingleChannel):一次檢驗(yàn)一種狀態(tài)2.雙通道(DualChannel):差異表達(dá)基因的篩選現(xiàn)在是7頁(yè)\一共有55頁(yè)\編輯于星期四兩類(lèi)主流的DNA芯片1.cDNAmicroarrays:將500~5,000bp的cDNA固載到介質(zhì)上(例如玻璃),Stanford開(kāi)發(fā)設(shè)計(jì),通常為雙通道2.DNAchips:將寡核苷酸探針(20~80-mer)合成到芯片上,Affymetrix開(kāi)發(fā)設(shè)計(jì),通常為單通道現(xiàn)在是8頁(yè)\一共有55頁(yè)\編輯于星期四(1)cDNAmicroarrayscDNAclones現(xiàn)在是9頁(yè)\一共有55頁(yè)\編輯于星期四Robotspotter普通的蓋玻片cDNAmicroarrays的制備現(xiàn)在是10頁(yè)\一共有55頁(yè)\編輯于星期四差異表達(dá)基因的篩選Treatment/controlNormal
/tumortissueBrain/liver…現(xiàn)在是11頁(yè)\一共有55頁(yè)\編輯于星期四點(diǎn)樣后的cDNAMicroarrays現(xiàn)在是12頁(yè)\一共有55頁(yè)\編輯于星期四GenesmRNAsamplesGeneexpressionlevelofgeneiinmRNAsamplej=Log(Redintensity/Greenintensity)Log(Avg.PM-Avg.MM)
sample1 sample2 sample3 sample4 sample5 …1 0.46 0.30 0.80 1.51 0.90 ...2 -0.10 0.49 0.24 0.06 0.46 ...3 0.15 0.74 0.04 0.10 0.20 ...4 -0.45 -1.03 -0.79 -0.56 -0.32 ...5 -0.06 1.06 1.35 1.09 -1.09 ...基因表達(dá)的數(shù)據(jù)現(xiàn)在是13頁(yè)\一共有55頁(yè)\編輯于星期四(1)DNAchips現(xiàn)在是14頁(yè)\一共有55頁(yè)\編輯于星期四現(xiàn)在是15頁(yè)\一共有55頁(yè)\編輯于星期四DNAchips的制備:
Affymetrixphotolitography探針長(zhǎng)度:25bp每個(gè)基因:22-40個(gè)探針PerfectMatch(PM)vs.MisMatch(MM)probes現(xiàn)在是16頁(yè)\一共有55頁(yè)\編輯于星期四點(diǎn)樣后的Genechip現(xiàn)在是17頁(yè)\一共有55頁(yè)\編輯于星期四總結(jié)現(xiàn)在是18頁(yè)\一共有55頁(yè)\編輯于星期四基因芯片的實(shí)驗(yàn)流程現(xiàn)在是19頁(yè)\一共有55頁(yè)\編輯于星期四2.圖像處理與數(shù)據(jù)標(biāo)準(zhǔn)化單通道基因芯片
white(veryhigh)
red(high)
Yellow(alittlehigh)green(medium)blue(low)black(no)現(xiàn)在是20頁(yè)\一共有55頁(yè)\編輯于星期四圖像處理植根區(qū)域生長(zhǎng)法(SRG)FixedCircle柵格化:確定點(diǎn)的位置圖象分割(Segmentation):將點(diǎn)從背景中分離出來(lái)。抽提亮度:各個(gè)像素亮度的平均值(mean)或中位數(shù)(median)背景校正:局部或全局現(xiàn)在是21頁(yè)\一共有55頁(yè)\編輯于星期四基因表達(dá)量的定量對(duì)于每個(gè)點(diǎn),我們可以計(jì)算Redintensity=Rfg-Rbgfg=foreground,bg=background,andGreenintensity=Gfg-Gbgandcombinetheminthelog(base2)ratioLog2(
Redintensity/Greenintensity)
Greenintensity(medium):~1現(xiàn)在是22頁(yè)\一共有55頁(yè)\編輯于星期四Microarray:誤差的來(lái)源系統(tǒng)的隨機(jī)的
log
signalintensity
logRNAabundance現(xiàn)在是23頁(yè)\一共有55頁(yè)\編輯于星期四Microarray:誤差的來(lái)源1.圖像分析2.掃描3.DNA雜交過(guò)程(溫度、時(shí)間、混合均勻程度等)4.探針的標(biāo)記5.RNA的抽提6.加樣7.其他現(xiàn)在是24頁(yè)\一共有55頁(yè)\編輯于星期四Red/green比值存在亮度的傾向M=log2R/G=log2R-log2G=(log2R+log2G)/2Valuesshouldscatteraboutzero.現(xiàn)在是25頁(yè)\一共有55頁(yè)\編輯于星期四數(shù)據(jù)標(biāo)準(zhǔn)化beforeafter現(xiàn)在是26頁(yè)\一共有55頁(yè)\編輯于星期四3.基因芯片的數(shù)據(jù)分析(1)差異表達(dá)基因的分析(2)基因共表達(dá)分析(3)基因表達(dá)數(shù)據(jù)的聚類(lèi)(4)基因表達(dá)數(shù)據(jù)的分類(lèi)(5)MaptoGO(6)Generegulatorynetwork現(xiàn)在是27頁(yè)\一共有55頁(yè)\編輯于星期四(1)差異表達(dá)基因的分析1.差異表達(dá)基因的分析:尋找處理前后表達(dá)上調(diào)或者下調(diào)的基因2.Arethetreatmentsdifferent?3.使用標(biāo)準(zhǔn)的統(tǒng)計(jì)學(xué)方法檢驗(yàn)(t-testorf-test),發(fā)現(xiàn)統(tǒng)計(jì)顯著性差異表達(dá)的基因,4.如果處理本身并不顯著,則結(jié)果無(wú)意義現(xiàn)在是28頁(yè)\一共有55頁(yè)\編輯于星期四統(tǒng)計(jì)學(xué)分析1.Foldchange,一般2-foldincreaseordecrease(平行實(shí)驗(yàn)的樣本較少)2.p-value(平行實(shí)驗(yàn)的樣本較多)under-expressedover-expressed/2/2現(xiàn)在是29頁(yè)\一共有55頁(yè)\編輯于星期四P-value:學(xué)生分布1.T-test:學(xué)生分布2.Excel函數(shù):TTEST(array1,array2,tails,type)Array1為第一個(gè)數(shù)據(jù)集Array2為第二個(gè)數(shù)據(jù)集Tails指示分布曲線的尾數(shù)。如果tails=1,函數(shù)TTEST使用單尾分布。如果tails=2,函數(shù)TTEST使用雙尾分布Type為t檢驗(yàn)的類(lèi)型1成對(duì)2等方差雙樣本檢驗(yàn)3異方差雙樣本檢驗(yàn)現(xiàn)在是30頁(yè)\一共有55頁(yè)\編輯于星期四P-value:學(xué)生分布1.一般選擇雙尾分布2.異方差雙樣本檢驗(yàn)3.Excel函數(shù):=TTEST(B2:D2,E2:G2,2,3)
4.C:對(duì)照組;T:實(shí)驗(yàn)組C1C2C3T1T2T3TTESTGene11.3221.6761.4573.5264.2343.8790.001988現(xiàn)在是31頁(yè)\一共有55頁(yè)\編輯于星期四MultipleComparisons1.在基因芯片的實(shí)驗(yàn)中,每一個(gè)基因/探針,都是一個(gè)獨(dú)立的實(shí)驗(yàn)2.基因芯片:高通量,>1,000個(gè)基因/探針3.因此,無(wú)論怎么比較,總會(huì)有一些基因會(huì)是統(tǒng)計(jì)顯著性差異表的——可能是隨機(jī)產(chǎn)生的4.如何評(píng)估表達(dá)差異基因預(yù)測(cè)的有效性?5.例:1,000個(gè)探針的雙通道芯片,以p-value<0.01為域值,發(fā)現(xiàn)7個(gè)上調(diào)基因,5個(gè)下調(diào)基因,分析結(jié)果是否具有統(tǒng)計(jì)學(xué)意義?現(xiàn)在是32頁(yè)\一共有55頁(yè)\編輯于星期四FalseDiscoveryRate(FDR)1.Falsepositiveprediction:“Type1error"or"FalseDiscovery"2.FalseDiscoveyRate(FDR)=p-value*No.ofGenes上例:FDR=0.01*1,000=10(隨機(jī))7個(gè)上調(diào)基因,5個(gè)下調(diào)基因<10因此上例計(jì)算的結(jié)果無(wú)統(tǒng)計(jì)學(xué)意義3.FDR必須遠(yuǎn)小于發(fā)現(xiàn)的差異表達(dá)基因數(shù)目實(shí)驗(yàn)的有效性p-value的選擇現(xiàn)在是33頁(yè)\一共有55頁(yè)\編輯于星期四(2)基因共表達(dá)分析1.在N個(gè)不同的條件下(時(shí)間序列的芯片數(shù)據(jù)),考察基因X和Y的表達(dá)是否相似2.Gene1#是否與Gene2#、Gene3#和Gene4#共表達(dá)?3.共表達(dá):正相關(guān):相似的表達(dá)譜,可能存在正關(guān)聯(lián)負(fù)相關(guān):相反的表達(dá)譜,可能存在負(fù)調(diào)控EisenMB,etal.,(1998)PNAS95:14863-14868GeneNameT1T2T3T4T5T6Gene1#123456Gene2#100200300400550610Gene3#660540430320210101Gene4#150421535725451670998現(xiàn)在是34頁(yè)\一共有55頁(yè)\編輯于星期四沒(méi)有相關(guān)性?現(xiàn)在是35頁(yè)\一共有55頁(yè)\編輯于星期四基因相關(guān)性分析1.Spearmanrankcorrelation2.Kendall'stau3.Euclideandistance4.Pearsoncorrelationcoefficient:-1~1Excel函數(shù):=PEARSON(array1,array2)EisenMB,etal.,(1998)PNAS95:14863-14868現(xiàn)在是36頁(yè)\一共有55頁(yè)\編輯于星期四Pearson相關(guān)系數(shù)1.r~[-1,1]r~1,正相關(guān)r~-1,負(fù)相關(guān)Gene1#Gene2#Gene3#Gene1#Gene2#0.996368Gene3#-0.99988-0.99611Gene4#0.2452920.254855-0.2395結(jié)論:Gene1#與Gene2#表達(dá)正相關(guān),與Gene3#表達(dá)負(fù)相關(guān),與Gene4#無(wú)關(guān)聯(lián)現(xiàn)在是37頁(yè)\一共有55頁(yè)\編輯于星期四(3)基因表達(dá)數(shù)據(jù)的聚類(lèi)1.將表達(dá)譜相似的基因聚類(lèi)在一起2.無(wú)督導(dǎo)學(xué)習(xí)(unsupervisedlearning)3.Patternfinding:發(fā)現(xiàn)新的模式4.聚類(lèi)方法:A.HierarchicalclusteringB.K-meansclusteringHierarchicalClustering現(xiàn)在是38頁(yè)\一共有55頁(yè)\編輯于星期四Hierarchicalclustering1.用樹(shù)狀結(jié)構(gòu)來(lái)表征基因表達(dá)之間的相似性/相關(guān)性2.優(yōu)點(diǎn):不需要指定結(jié)果有多少類(lèi)Object123451223654109459853DistancematrixDistanceCluster01,2,3,4,52(1,2),3,4,53(1,2),3,(4,5)4(1,2),(3,4,5)5(1,2,3,4,5)現(xiàn)在是39頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering1.對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)2.必須給定結(jié)果分成多少類(lèi)!3.假設(shè),該例中,指定為聚成5類(lèi)現(xiàn)在是40頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering1.隨便選取5個(gè)點(diǎn),作為每一個(gè)類(lèi)的中心點(diǎn)現(xiàn)在是41頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering2.計(jì)算其他點(diǎn)與這5個(gè)中心點(diǎn)的距離距離:歐氏距離馬氏距離皮爾孫相關(guān)系數(shù)…點(diǎn)的歸類(lèi):離哪個(gè)中心點(diǎn)近,歸哪個(gè)類(lèi)現(xiàn)在是42頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering3.針對(duì)每一類(lèi)中的每一個(gè)點(diǎn),計(jì)算其與其他點(diǎn)的距離,加和,除以該類(lèi)點(diǎn)的數(shù)目;找到新的中心點(diǎn),即改點(diǎn)到該類(lèi)中其他點(diǎn)的平均值最??;確定新的5個(gè)中心點(diǎn)!現(xiàn)在是43頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering4.重復(fù)2,3,直到結(jié)果收斂實(shí)際操作時(shí),因結(jié)果完全收斂時(shí)間過(guò)長(zhǎng),一般指定迭代的次數(shù),如1,000次現(xiàn)在是44頁(yè)\一共有55頁(yè)\編輯于星期四K-meansclustering5.最終結(jié)果:所有基因芯片數(shù)據(jù)被聚成5類(lèi)軟件:Cluster3.0,MichaelEissen,Stanford現(xiàn)在是45頁(yè)\一共有55頁(yè)\編輯于星期四(4)基因表達(dá)數(shù)據(jù)的分類(lèi)1.根據(jù)基因表達(dá)的數(shù)據(jù)將樣本分成兩類(lèi)或多類(lèi);2.督導(dǎo)學(xué)習(xí)(supervisedlearning):根據(jù)發(fā)現(xiàn)的pattern進(jìn)行預(yù)測(cè)3.應(yīng)用:癌癥vs.正常組織癌癥的亞型、不同階段(良性的vs.惡性的)對(duì)藥物的敏感性(tamoxifenforbreastcancer)現(xiàn)在是46頁(yè)\一共有55頁(yè)\編輯于星
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 委托擔(dān)保合同協(xié)議書(shū)范本
- 金融科技外包服務(wù)合同
- 采購(gòu)合同會(huì)議室桌椅采購(gòu)合同
- 臨時(shí)工勞務(wù)派遣合同協(xié)議
- 2025加工承攬合同的簡(jiǎn)單模板
- 2025奧美代理合同范本
- 游戲化教學(xué)與小學(xué)語(yǔ)文教材的有機(jī)結(jié)合
- 教育心理學(xué)在家庭教育中的實(shí)踐案例
- 提升學(xué)術(shù)研究質(zhì)量技巧與策略
- 2025年龍巖道路貨運(yùn)從業(yè)資格證模擬考試
- 【人教版化學(xué)】必修1 知識(shí)點(diǎn)默寫(xiě)小紙條(答案背誦版)
- 江蘇省無(wú)錫市2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 全國(guó)第三屆職業(yè)技能大賽(無(wú)人機(jī)駕駛(植保)項(xiàng)目)選拔賽理論考試題庫(kù)(含答案)
- 對(duì)口升學(xué)語(yǔ)文模擬試卷(10)-江西?。ń馕霭妫?/a>
- 《奧特萊斯業(yè)態(tài)淺析》課件
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 養(yǎng)殖場(chǎng)獸醫(yī)服務(wù)合同
- HR六大板塊+三支柱體系
- 慢性病患者門(mén)診身份管理方案
- 變壓器更換施工方案
- 安徽新宸新材料有限公司年產(chǎn)6000噸鋰離子電池材料雙氟磺酰亞胺鋰項(xiàng)目環(huán)境影響報(bào)告書(shū)
評(píng)論
0/150
提交評(píng)論