生物醫(yī)學(xué)大數(shù)據(jù)挖掘及生物信息學(xué)案例分析系列課程第五講 生物醫(yī)學(xué)數(shù)據(jù)挖掘案例分析與探討_第1頁(yè)
生物醫(yī)學(xué)大數(shù)據(jù)挖掘及生物信息學(xué)案例分析系列課程第五講 生物醫(yī)學(xué)數(shù)據(jù)挖掘案例分析與探討_第2頁(yè)
生物醫(yī)學(xué)大數(shù)據(jù)挖掘及生物信息學(xué)案例分析系列課程第五講 生物醫(yī)學(xué)數(shù)據(jù)挖掘案例分析與探討_第3頁(yè)
生物醫(yī)學(xué)大數(shù)據(jù)挖掘及生物信息學(xué)案例分析系列課程第五講 生物醫(yī)學(xué)數(shù)據(jù)挖掘案例分析與探討_第4頁(yè)
生物醫(yī)學(xué)大數(shù)據(jù)挖掘及生物信息學(xué)案例分析系列課程第五講 生物醫(yī)學(xué)數(shù)據(jù)挖掘案例分析與探討_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五講生物醫(yī)學(xué)數(shù)據(jù)挖掘案例探討與分享1.案例:應(yīng)用分類與聚類進(jìn)行全基因組DNA甲基化數(shù)據(jù)分析2.案例:應(yīng)用關(guān)聯(lián)規(guī)則從基因?qū)用嫣接懽悦庖呒膊〉南嚓P(guān)性3.案例:應(yīng)用貝葉斯網(wǎng)絡(luò)探討慢性阻塞性肺疾病基因與環(huán)境的互作4.案例:生物數(shù)據(jù)與臨床數(shù)據(jù)的整合分析思路5.一個(gè)實(shí)用的TCGA數(shù)據(jù)庫(kù)挖掘網(wǎng)站6.如何回答reviewer問(wèn)題的一點(diǎn)建議案例1SCI論文發(fā)表——基于聚類的突眼癥全基因組甲基化數(shù)據(jù)分析

統(tǒng)計(jì)分析1差異表達(dá)的甲基化基因篩選2單因素Logistic回歸分析批量作Logistic回歸read.table("d:\\logit.csv",header=TRUE,sep=",")->aresult<-array(0,dim=c(39,4))for(iin1:39){logr<-glm(group~sex+age+duration+a[,i+4],data=a,family="binomial")result[i,1]<-exp(summary(logr)$coefficients[5,1])result[i,2]<-exp(summary(logr)$coefficients[5,1]-1.96*summary(logr)$coefficients[5,2])result[i,3]<-exp(summary(logr)$coefficients[5,1]+1.96*summary(logr)$coefficients[5,2])result[i,4]<-summary(logr)$coefficients[5,4]}result(設(shè)置4列:分別放入OR值,OR值置信區(qū)間的上下限,P值)運(yùn)行結(jié)果如下:4列分別為第1列:OR值第2列:OR值置信區(qū)間的上限第3列:OR值置信區(qū)間的下限第4列:P值兩組比較有顯著差異3應(yīng)用聚類獲得樣本分類(疾病亞型)4主成分分析5GO功能分析6突眼癥與甲基化水平的相關(guān)性分析統(tǒng)計(jì)方法批處理的R程序批量作卡方檢驗(yàn)單個(gè)SNP的卡方檢驗(yàn)SNPcasecontrolTotal06032921231538Total8347130可以采用plink軟件實(shí)現(xiàn)read.table("d:\\chisq.csv",header=TRUE,sep=",")->afor(iin1:20){x<-a[,i]dim(x)<-c(2,2)print(chisq.test(x,correct=FALSE))}輸出結(jié)果批量作線性回歸作6-11列與年齡的線性回歸單次線性回歸Estimate:回歸系數(shù)Std.Error:回歸系數(shù)的標(biāo)準(zhǔn)誤tvalue:回歸系數(shù)的檢驗(yàn)統(tǒng)計(jì)量Pr(>|t|):回歸系數(shù)的P值批量作線性回歸read.table("d:\\data.csv",header=TRUE,sep=",")->aage<-a[,1]result<-array(0,dim=c(6,3))for(iin1:6){linear<-lm(a[,i+5]~age)result[i,1]<-summary(linear)$coefficients[2,1]result[i,2]<-summary(linear)$coefficients[2,3]result[i,3]<-summary(linear)$coefficients[2,4]}result輸出結(jié)果3列分別為第1列:回歸系數(shù)第2列:回歸系數(shù)檢驗(yàn)的t統(tǒng)計(jì)量第3列:回歸系數(shù)的P值批量作Cox回歸library(survival)read.table("d:\\coxnew.csv",header=TRUE,sep=",")->datapvalue<-array(0,dim=c(252,1))for(iin1:252){fit<-coxph(Surv(time,status)~data[,i+2],data=data)pvalue[i,1]<-summary(fit)$coefficients[,'Pr(>|z|)']}pvalue輸出結(jié)果:案例2:SCI論文發(fā)表——————基于關(guān)聯(lián)規(guī)則的自免疫疾病關(guān)聯(lián)

糖尿病和類風(fēng)濕病的關(guān)聯(lián)

系統(tǒng)性紅斑狼瘡和類風(fēng)濕病的關(guān)聯(lián)如果結(jié)合數(shù)據(jù)庫(kù)將SNP分為惡性突變和溫和突變,那么又可以將SNP分為兩類,再次做關(guān)聯(lián)規(guī)則,并進(jìn)行比較,是不是又是一個(gè)方案呢?案例3SCI論文發(fā)表——————基于貝葉斯網(wǎng)絡(luò)的基因-環(huán)境互作1應(yīng)用數(shù)據(jù)庫(kù)篩選功能SNP生物信息學(xué)分析建議結(jié)合多種數(shù)據(jù)庫(kù),以增加結(jié)果的可靠性。SNP功能分析和表型相關(guān)的貝葉斯網(wǎng)絡(luò)2構(gòu)建與表型相關(guān)的貝葉斯網(wǎng)絡(luò)3個(gè)惡性突變的非同義SNP5個(gè)顯著的SNP(P<0.01)和數(shù)量性狀FEV1相關(guān)的貝葉斯網(wǎng)絡(luò)3構(gòu)建與數(shù)量性狀FEV1相關(guān)的貝葉斯網(wǎng)絡(luò)分類模型最好的是環(huán)境變量+貝葉斯網(wǎng)絡(luò)提取的非同義SNP4應(yīng)用Logistic回歸驗(yàn)證貝葉斯網(wǎng)絡(luò)提取的非同義SNP5非同義SNP的各分類器比較

生物信息學(xué)數(shù)據(jù)分析整合思路綜合案例分析差異表達(dá)基因篩選聚類,主成分分析分類分析(決策樹(shù),隨機(jī)森林)GO,KEGG富集分析蛋白質(zhì)互作網(wǎng)絡(luò),轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)……..關(guān)聯(lián)分析(卡方檢驗(yàn),Logistic回歸…..)互作分析(決策樹(shù),多因子降維,關(guān)聯(lián)規(guī)則…….)分類分析(決策樹(shù),主成分,隨機(jī)森林……)GO,KEGG富集分析(映射到基因)蛋白質(zhì)互作網(wǎng)絡(luò),轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)……增益或缺失結(jié)合臨床表型案例:SCI論文發(fā)表——基于隨機(jī)森林的代謝通路分析隨機(jī)森林篩選風(fēng)險(xiǎn)通路

隨機(jī)森林分類樣本隨機(jī)森林法篩選出的兩條重要代謝通路WntsignalingpathwayLeukocyteadhesionpathway案例:SCI論文發(fā)表——基于組學(xué)數(shù)據(jù)整合的前列腺癌分層多組學(xué)數(shù)據(jù)的可視化R軟件的caOmicsVLinHuaetal.RiskStratificationforProstateCancerviaTheIntegrationofOmicsDataofTCGA,TranslationalCancerResearch,2018案例:SCI論文發(fā)表——miRNA-mRNA雙重表達(dá)譜分析思路1PrioritizingbreastcancersubtyperelatedmiRNAsmiRNA-mRNAdysregulatednetworkIdentifybreastcancersubtyperelatedmiRNAsReference:LinHuaetal.PrioritizingbreastcancersubtyperelatedmiRNAsusingmiRNA-mRNAdysregulatedrelationshipsextractedfromtheirdualexpressionprofiling,Journaloftheoreticalbiology,331,pp1-11,20132IdentifyingbreastcancersubtyperelatedmiRNAsfromtwoconstructedmiRNAsinteractionnetworksinSilicomethod主成分分析Reference:LinHuaetal.IdentifyingBreastCancerSubtypeRelatedmiRNAsfromTwo

ConstructedmiRNAsInteractionNetworksinSilicoMethod,BioMedResearchInternational,2013,pp.1-13

聚類分析

一個(gè)實(shí)用的TCGA數(shù)據(jù)庫(kù)挖掘網(wǎng)站UALCAN:/index.html腫瘤類型按基因搜索按基因集團(tuán)搜索按基因搜索表達(dá)生存數(shù)據(jù)庫(kù)點(diǎn)擊GExprofile按照性別,年齡,腫瘤亞型,腫瘤分期等繪制箱式圖點(diǎn)擊Survivalprofile按基因類別紅色表示CDK2在該腫瘤中顯著上調(diào),邊框紅色表示總生存期顯著。鏈接的各個(gè)數(shù)據(jù)庫(kù)差異表達(dá)和生存預(yù)后鏈接到HPRD數(shù)據(jù)庫(kù)如何回答reviewer問(wèn)題的一點(diǎn)建議論文的四種狀態(tài):(1)Accept:論文直接接收,無(wú)需任何修改:這種情況機(jī)率不大,但是也不是沒(méi)有。

(2)minorrevision:評(píng)審意見(jiàn)一般都是說(shuō)某部分過(guò)于簡(jiǎn)單了沒(méi)有說(shuō)清楚,或者說(shuō)文獻(xiàn)不夠之類。根據(jù)評(píng)審意見(jiàn)進(jìn)行修改之后就應(yīng)該可以接收了。

(3)Majorrevision:如果兩個(gè)評(píng)委,一般情況是一個(gè)覺(jué)得好一個(gè)覺(jué)得不好。三個(gè)評(píng)委中可能會(huì)出現(xiàn)三種情況:i)一個(gè)說(shuō)好一個(gè)說(shuō)一般一個(gè)不同意;ii)兩個(gè)說(shuō)好一個(gè)說(shuō)不好和iii)兩個(gè)覺(jué)得不怎么樣,但一個(gè)說(shuō)好。以上三種情況編輯都可能給你機(jī)會(huì)修改重投。此時(shí)你需要用你的實(shí)際行動(dòng)(修改和回復(fù))來(lái)讓這些評(píng)委改變主意,的確是一件具有挑戰(zhàn)性的問(wèn)題?;卮鹕杂胁缓?,那就失去機(jī)會(huì)了。(4)Reject:沒(méi)有修改的機(jī)會(huì)了,只能轉(zhuǎn)投他刊。

一審后論文的狀態(tài)

如何應(yīng)對(duì)Majorrevision首先,要擺正心態(tài)。應(yīng)該意識(shí)到,文章沒(méi)有直接被拒就是一件非常高興的事情了,起碼說(shuō)明你的工作還是有人承認(rèn)的。這個(gè)時(shí)候,就需要好好分析評(píng)委的意見(jiàn),找出問(wèn)題的所在。對(duì)于所有的評(píng)委,只要是評(píng)審意見(jiàn),都需要一條一條地回復(fù)。1)要有禮貌,尊重審稿人

每條回復(fù)都有這樣的話:“Thanksforyoursuggestion,”;

“Thanksforyourcomment,thatisthereviewer’scorrectobservation…….”“Thanksforthereviewer’ssuggestion,thissuggestionisveryhelpful…….”“Iamverygratefultoyourcommentsforthemanuscript…….”2)遇到審稿人提的問(wèn)題不對(duì)怎么辦?我的經(jīng)驗(yàn)是盡量不要argue;而是explain

What'stheallelefrequenciesfortheseSNPsincontinentalpopulations(AFR,AMR,EUR,etc.)?ThebestmodelsderivedfromHanpopulationremainthesameordifferentforotherpopulation?Response:

Thanksforthereviewer.Thatisthereviewer’scorrectobservation.Infact,someMetaanalysisrelatedstudieshavefoundthatgeneticassociationtodiseasedisplayedobviousvarietiesindifferentpopulations,suggestingthatthegeographicisolationandnaturalselectionduringhumanexpansionmayinfluencethegeneticcontributiontodisease.Unfortunately,ononehand,thestudiesaboutgene-geneinteractionscontributingtoquantitativetraitsforotherpopulationsareabsent.Andontheotherhand,wecannotgettheoriginalquantitativetraitsdataandgenotypedatafocusingonthesefourgenesofcontinentalpopulations;wethuscannotperformthesimilaranalysis.However,wefeelthereviewer’ssuggestionisveryhelpful,wethuscitedsomereferencesaboutgene-geneinteractionscontributingtoCOPDorCOPD-relatedphenotypesbasedonthedifferentpopulationsinthisrevisedmanuscript.3)遇到審稿人提的問(wèn)題無(wú)法在限定的時(shí)間解決怎么辦(如補(bǔ)充實(shí)驗(yàn),增加樣本等)?ArecentstudyshowsMulti-QMDR(/pubmed/26201702)canimprovetheperformanceofQMDR,canauthorsalsocomparetheirresultswithMulti-QMDR?(2016)Response:Thanksforthereviewerverymuch.Theliteratureprovidedbythereviewerisveryuseful.Wereadthispapercarefully.

Unfortunately,wecannotfindthesoftwareorsourceprogramcodingorlinkwebaddresstoperformtheMulti-QMDRanalysis,andwecannotwritetheprogramscriptinaveryshorttime.

Instead,weusedGMDRmethodtoperformthecorrespondinganalysisandcomparedQMDRresultswithGMDR.Wefoundtheresultsaresimilar.Multi-QMDRcanperformbetterthanQMDRandGMDRwhenanalyzinginteractionsamongagreaternumberofSNPs(genes).Therefore,foranalyzinginteractionsamong44SNPs,QMDRandGMDRareappropriate.Thanksforthereviewertogiveusanillumination,wewillsupplementouranalysisincludingusingMulti-QMDRtodetectgene-geneinteractionsinfutureworks.Inthisrevisedmanuscript,weaddedthecorrespondingtextinDiscussionsection.Impactfactor:3.54)在給審稿人的回復(fù)中,最好將論文修改的部分加上Comment#4:Itisnecessarythatauthorsprovideagraphtheoreticdefinitionfor“nestedcommunitiesofgenes”.Response:Thanksforthereviewerverymuch.…….Wekindlyacceptthereviewer’ssuggestion,andprovidedagraphdefinitionfor“neste

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論