芯片數(shù)據(jù)的基本處理和分析演示文稿_第1頁(yè)
芯片數(shù)據(jù)的基本處理和分析演示文稿_第2頁(yè)
芯片數(shù)據(jù)的基本處理和分析演示文稿_第3頁(yè)
芯片數(shù)據(jù)的基本處理和分析演示文稿_第4頁(yè)
芯片數(shù)據(jù)的基本處理和分析演示文稿_第5頁(yè)
已閱讀5頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

芯片數(shù)據(jù)的基本處理和分析演示文稿目前一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)(優(yōu)選)芯片數(shù)據(jù)的基本處理和分析目前二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)芯片數(shù)據(jù)分析的一般流程:芯片雜交實(shí)驗(yàn),芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理數(shù)據(jù)提交公共數(shù)據(jù)庫(kù)數(shù)據(jù)生物信息學(xué)分析

目前三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)實(shí)習(xí)內(nèi)容:TIGRTM4軟件的介紹和使用GenMAPP軟件的介紹和使用GEO數(shù)據(jù)庫(kù)的介紹目前四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Cy3Cy5Cy5-cDNACy3-cDNARTRTcDNAarray樣本mRNA對(duì)照mRNATIF掃描圖常見(jiàn)的雙通道(dualchannel)實(shí)驗(yàn)流程:對(duì)照基因(referencegene):綠色熒光標(biāo)記(G)樣本基因(samplegene):紅色熒光標(biāo)記(R)目前五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)區(qū)塊(block)目前六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)非飽和區(qū)域飽和區(qū)域信號(hào)雜交的一些概念背景探針區(qū)域目前七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)ApackageofOpenSourcesoftwareprogramsforMicroarrayanalysis

芯片數(shù)據(jù)采集(讀取掃描圖)數(shù)據(jù)基本處理存儲(chǔ)整理芯片數(shù)據(jù)(數(shù)據(jù)庫(kù))芯片數(shù)據(jù)分析結(jié)果的圖形顯示(

)TIGRTM4:目前八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)GenePix格式(.gpr)目前九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Agilent格式(.txt):目前十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MEV文件:MEV格式的芯片數(shù)據(jù)目前十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)ExpressConverter:芯片數(shù)據(jù)的格式轉(zhuǎn)換下載地址:;下載后,解壓安裝即可。“開(kāi)始”->“所有程序”處打開(kāi)。需要先安裝Java,Java下載地址:;目前十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)ExpressConverter主界面:目前十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)ExpressConverter使用方法:選擇“InputFormat→GenPix”,指定輸入的文件格式;

選擇“File→Selectinputfiles”,選定一個(gè)或多個(gè)需要轉(zhuǎn)換的文件;選擇“File→Startconverting”,格式開(kāi)始轉(zhuǎn)換。待狀態(tài)欄顯示“Convertingissuccessful”后,格式轉(zhuǎn)換完成。此時(shí)在原genepix存放的文件夾中會(huì)出現(xiàn)文件名相同但擴(kuò)展名不同的.mev和.ann的文件。

目前十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)inputoutput目前十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)程序運(yùn)行前程序運(yùn)行結(jié)果目前十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MEV文件:MEV格式的芯片數(shù)據(jù)目前十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MEV注釋文件(后綴名為.ann)目前十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)課堂練習(xí)使用ExpressConverter將testdata.gpr轉(zhuǎn)換成testdata.mev和testdata.ann。用記事本查看testdata.gpr,testdata.mev和testdata.ann。ExpressConverter快捷方式:“開(kāi)始”→“所有程序”testdata.gpr:C:\ProgramFiles\ExpressConverter\samples\目前十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MIDAS:數(shù)據(jù)基本處理下載地址是:此程序不用安裝下載后解壓就可以使用。(需要先安裝Java)進(jìn)入文件夾,雙擊打開(kāi)Midas.bat文件,會(huì)出現(xiàn)后臺(tái)運(yùn)行窗口和圖形界面窗口。目前二十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)低質(zhì)量數(shù)據(jù)過(guò)濾根據(jù)Flag過(guò)濾根據(jù)信號(hào)和背景值過(guò)濾目前二十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MEV文件:MEV格式的芯片數(shù)據(jù)目前二十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)FlagsinMevfile:A–0non-saturatedpixelsinthespotB–0-50non-saturatedpixelsinthespotC–50ormorenon-saturatedpixelsinthespotX–spotisrejected,duetospotshapeandintensityrelativetobackgroundY–backgroundishigherthanspotintensityZ–spotnotdetectedbySpotfindergood目前二十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡等因素,需對(duì)cy3和cy5的原始提取信號(hào)進(jìn)行均衡和修正才能進(jìn)一步分析實(shí)驗(yàn)數(shù)據(jù),Normalization正是基于此種目的。芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization)目前二十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MIDAS可選的數(shù)據(jù)處理方法

標(biāo)準(zhǔn)化處理方法TotalIntensitynormalization

低質(zhì)量數(shù)據(jù)過(guò)濾方法Invalid-intensitycheckingLOWESS(Locfit)normalizationIterativelinearregressionnormalizationIterativelogmeancenteringnormalizationRatioStatisticsnormalizationLowintensityfilterStandarddeviationregularizationSliceanalysis(non-statistical)In-slidereplicatesanalysisFlip-dyeconsistencycheckingRatioStatisticsconfidenceintervalcheckingSignal/NoisecheckingCross-file-trimSpotQCflagcheckingMA-ANOVACross-slidereplicatest-test(statistical)Cross-slideone-classSAM(statistical)

差異表達(dá)基因識(shí)別方法目前二十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)芯片內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)化(Normalization)AAMAplotInmanymicroarraygeneexpressionexperiments,thegeneralassumptionisthatmostofthegeneswouldnotseeanychangeintheirexpression.Thereforethemajorityofthepointsontheyaxis(M)wouldbelocatedat0,sincelog(1)is0.M=log2(R/G)A=log2√R*G目前二十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)區(qū)塊間均一化處理目前二十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)用MIDAS處理單張雙色芯片的基本流程芯片數(shù)據(jù)的讀入;低質(zhì)量數(shù)據(jù)的過(guò)濾;標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化);結(jié)果文件的輸出。目前二十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MIDAS程序主界面可選的數(shù)據(jù)處理步驟數(shù)據(jù)分析流程設(shè)計(jì)各個(gè)處理步驟的相應(yīng)參數(shù)程序運(yùn)行狀況顯示目前二十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step1:芯片數(shù)據(jù)的讀入目前三十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step2:低質(zhì)量數(shù)據(jù)的過(guò)濾目前三十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step3:標(biāo)準(zhǔn)化(包括區(qū)塊間的均一化)目前三十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step4:結(jié)果文件的輸出目前三十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)目前三十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)MIDAS統(tǒng)計(jì)作圖(MIDASInvestigation窗口查看)log-ratioshistogram(.his)Boxplot(.box)Intensityplot(.ity)R-I(.prc)Intensityplot(.lty)目前三十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)課堂練習(xí)使用MIDAS處理testdata.mev,并查看結(jié)果文件;MIDAS程序位置:C:\zcni\shiyan3\MIDAS2_19,雙擊Midas.bat打開(kāi)程序;輸入文件testdata.mev由ExpressConverter產(chǎn)生,在C:\ProgramFiles\ExpressConverter\Samples\。目前三十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)芯片數(shù)據(jù)聚類(lèi)分析和差異表達(dá)基因篩選基因表達(dá)研究中通常假設(shè)表達(dá)水平相似的基因可能參與相同或相似的生物學(xué)過(guò)程,因而它們具有相似的基因表達(dá)譜。例:在臨床或診斷學(xué)等領(lǐng)域中,為研究某些疾病的發(fā)生機(jī)制,通常對(duì)正常組織和腫瘤組織細(xì)胞間的基因表達(dá)情況作比較分析,從中篩選出具有顯著差異的表達(dá)基因。目前三十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)下載地址:

。此程序不用安裝下載后解壓就可以使用(需要先安裝Java)進(jìn)入軟件所在的文件夾(免安裝),雙擊打開(kāi)TMEV.bat文件,會(huì)出現(xiàn)后臺(tái)運(yùn)行窗口和圖形界面窗口。目前三十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)支持的文件格式MIDASMEV,TAV格式表格格式GEO格式Affymetrix格式GPR格式Agilent格式目前三十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)程序主界面常用工具欄導(dǎo)航欄結(jié)果界面目前四十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)芯片數(shù)據(jù)聚類(lèi)分析和差異表達(dá)基因篩選1表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化2系統(tǒng)聚類(lèi)法對(duì)基因和樣本聚類(lèi)3使用SAM(significanceanalysisformicroarrays)查找差異表達(dá)基因目前四十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)1表格格式數(shù)據(jù)的讀入與轉(zhuǎn)化①1選擇“File→LoadData”彈出導(dǎo)入數(shù)據(jù)對(duì)話框目前四十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)②③④目前四十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)⑤⑥目前四十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)數(shù)據(jù)起始位置目前四十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)不同顏色表示相對(duì)表達(dá)量樣本名基因名Heatmap

View目前四十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)2系統(tǒng)聚類(lèi)法對(duì)基因和樣本聚類(lèi)①②目前四十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)聚類(lèi)分析結(jié)果圖:目前四十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)存儲(chǔ)和注釋感興趣的分類(lèi):①單擊鼠標(biāo)左鍵選中目標(biāo)分類(lèi)使其高亮化;②右鍵選擇菜單中的StoreCluster,并設(shè)置注釋的名稱(chēng)和顏色等信息。目前四十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)目前五十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)3使用SAM查找差異表達(dá)基因①目前五十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)不同實(shí)驗(yàn)類(lèi)型樣本分組②③④目前五十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)⑤目前五十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)SAM結(jié)果:ExpressionImages目前五十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)SAM結(jié)果:CentroidGraphs目前五十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)SAM結(jié)果:ExpressionGraphs目前五十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)SAM結(jié)果:TableViews目前五十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)課堂練習(xí)使用MeV處理TDMS_format_sample.txt

,并查看結(jié)果文件;MEV程序位置:C:\zcni\shiyan3\MeV_4_6,雙擊TMEV.bat打開(kāi)程序;輸入文件TDMS_format_sample.txt位于:C:\zcni\shiyan3\MeV_4_3\data\。目前五十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)GenMAPP

一款將芯片數(shù)據(jù)和代謝途徑結(jié)合起來(lái)的圖形化顯示工具目前五十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)WhyPathwayAnalysis?IntuitivetoBiologistsProvideabiologicalcontextforresultsMoreefficientthansearchingdatabasesgene-by-geneIntuitivedatadisplayforsharingdataComputationonPathwayContentAnalyzeover-representationofchangedgenesonpathwaysandontologiesGenerateandcomparepathwaysignaturesbetweenmodels目前六十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)下載地址:;雙擊安裝文件安裝GenMAPP;打開(kāi)GenMAPP程序,從菜單“Data→DownloadDatafromGenMAPP.org”下載自己感興趣物種的MAPP文件和GeneDatabase。

GenMAPP安裝和更新目前六十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)GenMAPP基本概念MAPP:描述了模式生物的代謝途徑圖。目前MAPP數(shù)據(jù)庫(kù)中包含了人(H.sapiens)、小鼠(M.musculus)、大鼠(R.norvegicus)、酵母(S.cerevisiae)、線蟲(chóng)(C.elegans)、狗(C.familiaris)、雞(G.gallus)、牛(B.taurus)、果蠅(D.melanogaster)和斑馬魚(yú)(D.rerio)等模式生物。

目前六十二頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)SupportedSpeciesFruitflyHumanMouseRatWormYeastZebrafishChicken

DogCowMosquitoByrequest:AnyEnsemblspeciesDatabasesbyothergroups:FissionyeastE.coliSoon:Arabidopsis目前六十三頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)心肌炎患者數(shù)據(jù)------脂肪酸降解途徑目前六十四頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)GenMAPP基本概念Genedatabase:包含了上述物種所含基因的注釋及其基因標(biāo)識(shí)號(hào)(ID)。對(duì)于每個(gè)基因,GeneDatabase會(huì)建立它在各個(gè)geneIDsystem中的對(duì)應(yīng)關(guān)系。比如,Trp53基因在MGI(小鼠基因組數(shù)據(jù)庫(kù))中的標(biāo)識(shí)號(hào)為MGI:98834,而在UniGene數(shù)據(jù)庫(kù)中標(biāo)識(shí)號(hào)為Mm.222,在Ensembl數(shù)據(jù)庫(kù)中標(biāo)識(shí)號(hào)為ENSMUSG00000059552。目前六十五頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)IDSystem(Species)SystemCodeAffymetrixProbeSetIDXPDBPdEMBLEmPfamPfEnsemblEnRefSeqQEntrezGeneLRGD(R.norvegicus)RFlyBase(D.melanogaster)FSGD(S.cerevisiae)DGeneOntologyTUniProt/TrEMBLSHUGOHUniGeneUInterProIWormBase(C.elegans)WMGI(M.musculus)MZFIN(D.rerio)ZOMIMOmOtherO目前六十六頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step1:打開(kāi)“GenMAPP2”程序。選擇菜單“Data→ChooseGeneDatabase”按照實(shí)驗(yàn)物種選擇合適的基因庫(kù)。目前六十七頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step2:從菜單“File→Open”打開(kāi)相應(yīng)的MAPP文件。目前六十八頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step3:從菜單“Data→ChooseExpressionDataset”打開(kāi)表達(dá)量文件(.gex)并選擇相應(yīng)的顏色集。目前六十九頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)Step4:點(diǎn)擊感興趣的基因查看注釋目前七十頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)如何制作.gex表達(dá)量文件?將芯片數(shù)據(jù)用Excel按一定格式整理目前七十一頁(yè)\總數(shù)七十八頁(yè)\編于十九點(diǎn)2.將Excel另存為文本文件(txt后綴名或csv后綴名),可在Data菜單“ExpressionDatasets→Newdataset”導(dǎo)入該文本文件。此時(shí),程序會(huì)向用戶(hù)提問(wèn)文件中的數(shù)據(jù)是數(shù)值型還是文本型,對(duì)文本文件要在圖示框中選勾,點(diǎn)擊“OK”即可,一般

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論