生物信息在臨床遺傳的運(yùn)用課件_第1頁
生物信息在臨床遺傳的運(yùn)用課件_第2頁
生物信息在臨床遺傳的運(yùn)用課件_第3頁
生物信息在臨床遺傳的運(yùn)用課件_第4頁
生物信息在臨床遺傳的運(yùn)用課件_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息在

臨床遺傳的運(yùn)用1概要如何繪制家系圖?如何獲得疾病的遺傳信息?如何讀測(cè)序結(jié)果?如何確定序列改變性質(zhì)?如何確定突變與疾病的關(guān)系?2一、如何繪制家系圖?3Cyrillic2特征:Viewupto9familiesindifferentWindowsCutandpastefamiliesorpartsoffamiliesToolbaricons,statusbarandtooltipsguidenewusersSwitchbetweentreeandcirculardisplayMaximumof10,000individualsperfamilyand250markersperchromosomeToolsforspeed-drawingofnewfamiliesSpacedrawingsevenly4Cyrillic2特征(續(xù)):ColorhaplotypebarstoshowinheritanceandmultiplecrossoversCrossoverscalculatedfromphenotypedataManynewinputandoutputformatsAnnotationtool:entertextandmovetoanypositionandsettoanyfont,sizeorcolorPrintpreviewMultiple‘undomove’and‘undodelete’toolCalculatekinshipandinbreedingcoefficientsAutomaticrecognitionofconsanguinity5一個(gè)遺傳病家系圖67891011121314151617181920212223242526*.FAM文件只能用cyrillic打開并修改;建議家系圖繪制完成后,同時(shí)以圖片格式復(fù)制到WORD中,保存。2728二、如何獲得疾病的遺傳信息?OMIM以PKU為例介紹PubMed核酸序列數(shù)據(jù)庫GenBank291.OMIM(OnlineMendelianInheritancein

Man,聯(lián)機(jī)人類孟德爾遺傳)30

OMIM提供了兩種檢索方式:①根據(jù)字符串檢索,可以關(guān)鍵詞對(duì)數(shù)據(jù)庫進(jìn)行查詢;②根據(jù)基因定位檢索,可根據(jù)疾病或基因所處的染色體位置,如1p21等對(duì)數(shù)據(jù)庫進(jìn)行查詢。FTP上可以下載疾病圖,基因圖以及全部OMIM數(shù)據(jù)313233OMIM條目第一個(gè)數(shù)字代表的意義1(100000-)Autosomaldominant(entriescreatedbeforeMay15,1994)2(200000-)Autosomalrecessive(entriescreatedbeforeMay15,1994)3(300000-)X-linkedlociorphenotypes4(400000-)Y-linkedlociorphenotypes5(500000-)Mitochondriallociorphenotypes6(600000-)Autosomallociorphenotypes(entriescreatedafterMay15,1994)34每個(gè)條目組成部分包括標(biāo)題(包括同義詞)表型,基因產(chǎn)物與基因的描述疾病缺陷的性質(zhì),包括發(fā)病機(jī)理與病理生理遺傳學(xué),包括定位疾病的診斷與處理等位變異體(表型變異體,主要是疾病的分子基礎(chǔ))文獻(xiàn)3536372.PubMed3839PKU4041一個(gè)數(shù)據(jù)庫記錄(entry)一般由兩部分組成:原始序列數(shù)據(jù)和描述這些數(shù)據(jù)生物學(xué)信息的注釋(annotation)。注釋中包含的信息與相應(yīng)的序列數(shù)據(jù)同樣重要和有應(yīng)用價(jià)值。

3.核酸序列數(shù)據(jù)庫42目前國際上有3個(gè)主要的DNA序列數(shù)據(jù)庫GenBank—NCBI維護(hù)EMBL:EuropeanMolecularBiologyLaboratory—EBI維護(hù)DDBJ:DNA

DatabankofJapan—日本國立遺傳學(xué)研究所維護(hù)434445來自于70,000多種生物的核苷酸序列數(shù)據(jù)庫;GenBank序列格式與DDBJ相同,EMBL則不同;序列提交與更改:用戶可以向GenBank,EMBL,DDBJ其中任意一個(gè)實(shí)驗(yàn)室提交序列及提交更改;GenBank序列提交工具:BankIt(少數(shù)序列;基于Web)、Sequin(多、長序列,完整基因組等;獨(dú)立使用)。46GenBank格式可以分為三個(gè)部分:頭部,包含關(guān)于整個(gè)記錄的信息(描述符)特征表部分,包含了注釋這一記錄的特性第三部分,核苷酸序列自身所有的核苷酸數(shù)據(jù)庫記錄(DDBJ/EMBL/GenBank)都在最后一行以//結(jié)尾471)頭部LOCUS行

DEFINITIONACCESSIONVERSIONREFERENCEKEYWORDSSOURCE

ORGANISMAUTHORSTITLEJOURNALMEDLINEPUBMEDREMARK482)特征表特征表它直接表達(dá)了記錄的生物背景知識(shí)source是唯一一個(gè)必須在所有GenBank記錄中出現(xiàn)的特征geneCDSCodingSequencevariationmisc-feature……493)序列50附:FASTA格式FASTA格式廣泛應(yīng)用于分子生物學(xué)軟件包中大于號(hào)(>)表示一個(gè)新序列的開始,后面緊跟序列的標(biāo)記符,另起一行頂頭為序列,序列是連續(xù)的,無空格等515253目前GenBank分為多個(gè)分?jǐn)?shù)據(jù)庫:nr,dbEST,dbSTS,dbGSS和dbHTGS等。(1)nr(non-redudant)是非冗余的核酸數(shù)據(jù)庫,存貯已知的基因全長或部分序列數(shù)據(jù),以及完成了的基因組序列。大多序列已具有相應(yīng)的基因結(jié)構(gòu)分析,如編碼區(qū)、調(diào)控區(qū)、重復(fù)序列等。(2)dbEST是EST數(shù)據(jù)庫,EST是表達(dá)基因中的部分序列,因EST(ExpressedSequenceTags)項(xiàng)目本身的特點(diǎn),所有EST序列都是一次測(cè)序的結(jié)果,存在較大的誤差。序列較短,多為400bp以下。雖來自于表達(dá)基因,但編碼情況未知。54(3)dbSTS是STS數(shù)據(jù)庫,STS是基因組標(biāo)記序列數(shù)據(jù)庫,作為基因作圖、基因定位的重要工具,STS(SequenceTaggedSite)為基因組DNA序列,且提供染色體定位信息。與EST相同之處是,序列較短且不提供基因功能信息。(4)dbGSS是基因組序列數(shù)據(jù)庫,源于基因組DNA克隆的一次性部分測(cè)序得到的序列。它也具有序列較短、有較大的誤差,不提供基因功能和定位信息。(5)dbHTGS存貯的是處理未完成階段的基因組測(cè)序數(shù)據(jù)?;径际荁AC測(cè)序的結(jié)果。553.PubMed56575859三、如何讀測(cè)序結(jié)果?DNAStarhttp://是關(guān)于DNA和蛋白質(zhì)結(jié)構(gòu)與功能分析的軟件包,與Wisconsin軟件包相比,它帶有識(shí)別內(nèi)含子、外顯子的程序Genequest,并且能夠顯示測(cè)序的Trace圖。6061EditSeq–Includedwithallsystems,convertssequenceformatsandallowseditingGeneQuest–DiscoveryandannotationofgenesMegAlign-AlignmentofDNAandproteinsequencesProtean–ProteinStructurepredictionPrimerSelect–PrimerdesignandcomparisonanalysisMapDraw–RestrictionSiteLocatorSeqman–Assembleintoacontig62EditSeq轉(zhuǎn)化數(shù)據(jù)格式為DNASTAR所有模塊識(shí)別的格式可以導(dǎo)入的數(shù)據(jù)格式:Textfiles、FastAfiles、Genbankflantfiles、Tracefiles、GCGfiles等;輸出的數(shù)據(jù)格式:FastAfiles、Genbankflantfiles、GCGfiles;DNA序列編輯:大小寫轉(zhuǎn)化;查找堿基、ORF;編輯序列特征;提供反向互補(bǔ)和反向序列;翻譯;堿基統(tǒng)計(jì)氨基酸序列編輯:大小寫轉(zhuǎn)化;查找氨基酸;編輯序列特征;逆翻譯氨基酸為DNA;氨基酸統(tǒng)計(jì)新的版本增加有連線Blast和序列搜索功能

63EditSeq輸出文件格式:*.SEQ646566Seqman做序列組裝(Assembly)、Alignment看測(cè)序圖按6種閱讀框翻譯輸入、編輯和輸出PhrapAssemblies過濾掉載體序列、質(zhì)量低的測(cè)序序列67輸入文件格式為:*.SEQ*.ABI輸出文件格式為:*.sqd

68697071727374Ctrl+D75767778四、如何確定序列改變性質(zhì)?(SNPorMutation)dbSNP:NCBI維護(hù),啟動(dòng)最早,收集數(shù)據(jù)最多的公共數(shù)據(jù)庫;包括SNPs,小的缺失/插入,微衛(wèi)星變異等;

ss編號(hào):所有研究者提交SNP時(shí)生成ID

rs編號(hào):已有數(shù)據(jù)比較后,獨(dú)特的798081五、如何確定突變與疾病的關(guān)系?

HGMD(HumanGenomeMutationDatabase)

位于英國Cardiff醫(yī)學(xué)遺傳學(xué)研究所,主要收錄人類遺傳病的致病基因;已合并在Celera公司的CDS(CeleraDiscoverySystem)中。828384

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論