生物信息學題庫7268_第1頁
生物信息學題庫7268_第2頁
生物信息學題庫7268_第3頁
生物信息學題庫7268_第4頁
生物信息學題庫7268_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

A.嗜極生物A.嗜極生物B.病毒■胞內(nèi)細菌D.桿菌#/15腸桿菌、酵母、線蟲、小鼠等)基因組的作圖和測序,以及信息系統(tǒng)的建立。作圖和測序是基本的任務(wù),在此基礎(chǔ)上解讀和破譯生物體生老病死以及和疾病相關(guān)的遺傳信息。3、蛋白質(zhì)的一級結(jié)構(gòu):指多肽鏈中氨基酸的序列4、基因:有遺傳效應(yīng)的DNA片斷,是控制生物性狀的基本遺傳單位。5、中心法則:是指遺傳信息從DNA傳遞給RNA,再從RNA傳遞給蛋白質(zhì),即完成遺傳信息的轉(zhuǎn)錄和翻譯的過程。也可以從DNA傳遞給DNA,即完成DNA的復(fù)制過程。這是所有有細胞結(jié)構(gòu)的生物所遵循的法則。6、DNA序列比較序列比較的根本任務(wù)是:(1)發(fā)現(xiàn)序列之間的相似性;(2)辨別序列之間的差異目的:(1)相似序列?相似的結(jié)構(gòu),相似的功能(2)判別序列之間的同源性(3)推測序列之間的進化關(guān)系7、一級數(shù)據(jù)庫:數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋8、基因識別:基因識別,是生物信息學的一個重要分支,使用生物學實驗或計算機等手段識別DNA序列上的具有生物學特征的片段?;蜃R別的對象主要是蛋白質(zhì)編碼基因,也包括其他具有一定生物學功能的因子,如RNA基因和調(diào)控因子。9、系統(tǒng)發(fā)生學:研究物種之間的進化關(guān)系。10、基因芯片(genechip):又稱DNA微陣列(microarray),是由大量cDNA或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是通過雜交檢測信息。問答題生物信息學的大體定義是什么?其發(fā)展歷程如何?(1)利用應(yīng)用數(shù)學、信息學、統(tǒng)計學和計算機科學的方法研究生物學的問題。目前的生物信息學基本上只是分子生物學與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。生物信息學的研究材料和結(jié)果就是各種各樣的生物學數(shù)據(jù),其研究工具是計算機,研究方法包括對生物學數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。目前主要的研究方向有:序列比對、基因識別、基因重組、蛋白質(zhì)結(jié)構(gòu)預(yù)測、基因表達、蛋白質(zhì)反應(yīng)的預(yù)測,以及建立進化模型。(2)發(fā)展歷程:①20世紀50年代,生物信息學開始孕育。②20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯(lián)系起來。③20世紀70年代,生物信息學的真正開端。④20世紀70年代到80年代初期,出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法。⑤20世紀80年代以后,出現(xiàn)一批生物信息服務(wù)機構(gòu)和生物信息數(shù)據(jù)庫。⑥20世紀90年代后,HGP促進生物信息學的迅速發(fā)展請論述生物信息學的研究內(nèi)容有哪些?1)生物分子數(shù)據(jù)的收集與管理:①基因組數(shù)據(jù)庫(EMBL、GenBank、DDBJ)②蛋白質(zhì)序列數(shù)據(jù)庫(SWTSS-PROT、PIR)③蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(PDB)2)數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列:①序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述。②多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。3)基因組序列分析:①遺傳語言分析一一天書②基因組結(jié)構(gòu)分析③基因識別④基因功能注釋⑤基因調(diào)控信息分析⑥基因組比較4)基因表達數(shù)據(jù)的分析與處理:基因表達數(shù)據(jù)分析是目前生物信息學研究的熱點和重點。目前對基因表達數(shù)據(jù)的處理主要是進行聚類分析,將表達模式相似的基因聚為一類,在此基礎(chǔ)上尋找相關(guān)基因,分析基因的功能。所用方法主要有:①相關(guān)分析方法②模式識別技術(shù)中的層次式聚類方法③人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)④主元分析方法5)蛋白質(zhì)結(jié)構(gòu)預(yù)測。蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑。蛋白質(zhì)結(jié)構(gòu)預(yù)測分為:(1)二級結(jié)構(gòu)預(yù)測:在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題。在二級結(jié)構(gòu)預(yù)測方面主要方法有:立體化學方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學方法、人工神經(jīng)網(wǎng)絡(luò)方法。預(yù)測準確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)。(2)空間結(jié)構(gòu)預(yù)測:在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法。該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu),運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作。請敘述構(gòu)建系統(tǒng)進化樹的一般步驟。[1]序列選擇:從那些可以輸出FASTA格式的數(shù)據(jù)庫中選擇[2]多序列比對[3]替代模型的選擇[4]生成樹:方式:distance-based;character-based:maximumparsimony;character-andmodel-based:maximumlikelihood;character-andmodel-based:Bayesian基于距離的樹生成軟件:MEGA和PAUPMEGA應(yīng)用算法:UPGMA,基于距離的算法。[5]結(jié)果評估:原則(一致性、效率、和魯棒性);檢測方法:最為常見的方法是引導(dǎo)檢測的分析方法。引導(dǎo)檢測法:簡單地講就是把序列的位點都重排,重排后的序列再用相同的辦法構(gòu)樹,如果原來樹的分枝在重排后構(gòu)的樹中也出現(xiàn)了,就給這個分枝打上一分,如果沒出現(xiàn)就給0分,這樣經(jīng)過你給定的repetitions次(至少1000次)重排構(gòu)樹打分后,每個分枝就都得出分值,計算機會給你換算成bootstrap值。重排的序列有很多組合,值越小說明分枝的可信度越低,最好根據(jù)數(shù)據(jù)的情況選用不同的構(gòu)樹方法和模型。歸納前面所講,下面幾點可以幫助我們解釋進化樹:(1)從根節(jié)點到任何一個節(jié)點的惟一路徑和方向代表了進化時間;(2)根是樹中所有物種的共同祖先;(3)根節(jié)點上的物種我們認為比樹中其他所有的物種分化更早。如果無法確定根節(jié)點的物種,就使用無根樹進行分析。NCBI的Entrez檢索包含了哪些方面的信息。Entrez是NCBI為用戶提供整合的訪問序列、定位、分類及結(jié)構(gòu)數(shù)據(jù)的搜索和檢索的系統(tǒng),是一個用以整合NCBI數(shù)據(jù)庫中信息的搜尋和檢索的工具,包括核酸序列、蛋白質(zhì)序列、蛋白質(zhì)三維結(jié)構(gòu)、基因組圖譜和通過PubMed檢索的MEDLINE。其中,Entrez可以整合檢索的序列數(shù)據(jù)庫包括GenBank、EMBI—DDBJ、RefSeq、PIR-International、PRF、Swiss—Prot和PDB等。Entrez有兩個顯著的特點:第一是對每個數(shù)據(jù)庫中的記錄都預(yù)先做相似性比較,產(chǎn)生一個列表,包括序列、結(jié)構(gòu)和MEDLINE文獻記錄等信息;第二是對某個數(shù)據(jù)庫的記錄與其他數(shù)據(jù)庫的相關(guān)記錄做了鏈接,使對不同數(shù)據(jù)庫的訪問得以整合。所以Entrez是通過相近性和硬連接來提供集成的信息檢索。Entrez可以用很廣泛的文本方式搜索,比如作者名字、雜志名字、基因或蛋白名、物種、單一的檢索號(如:accessionnumber、序列ID、PubMedID、MEDLNEUID)和其他的術(shù)語,因此,Entrez是一個強大的檢索相關(guān)序列、結(jié)構(gòu)和參考文獻的信息檢索工具。BLAST系列軟件分別用哪些數(shù)據(jù)搜索何種數(shù)據(jù)庫?

協(xié)索庁列窯注ProteanProlceini匕規(guī)豪基祗序列叮生n使70阪處矩階"樣扳直旳夭峯"K4rSEGtriastnNucleotideNudcoticle1K用扳直分血的匹nd*刈飯遠的X系不*適刪fcrfa&tzxNudeotideProtein?■.ifc」一的六雜栄片所怡総欣弟#TflJ■搠的DMA序列和ESTs^^lFr,-d傳mbiosifcnRrotninN加1d技蔽如庫#汝如海連刈菱碼-d毬曄*tiW序序列Ik牧恢嚴丿弄列和轉(zhuǎn)啞丿廬態(tài)険晩再丄茯耒兮舉徒弟蜒索丿狂列幻藏倨真核基因結(jié)構(gòu)注釋包括哪些內(nèi)容?相關(guān)的軟件所依據(jù)的理論基礎(chǔ)是什么?基因預(yù)測川放謹碼艇CJKINSCAIN<Jcmiini4=N?zanOI^TATMTCK基因結(jié)構(gòu)分析INtMJcncZS|>i?l<ryKroSplicca-Spidcy轉(zhuǎn)錄調(diào)控序列心動了上其駅題蛤位點Ki>nC.'ister分析CpGFlg糠於終11:4.序列紐分分析*介迄限制和核假內(nèi)切fife信點NKUcuUcrr密碼ri^Tn^jij<?<H|?nWGENSCAN是美國麻省理工大學的ChrisBurge于1997年開發(fā)成功的人類(或脊椎動物)基因預(yù)測軟件,它根據(jù)基因的整體結(jié)構(gòu)進行基因預(yù)測,不依賴于已有的蛋白庫,是一種從頭預(yù)測軟件;用于ORF識別。通過對特征序列(GT-AG)的分析進行直接的預(yù)測基因預(yù)測軟件(NetGene2),內(nèi)含子/外顯子剪切位點識別。與相應(yīng)的基因組序列比對,分析比對片段的分布位置(Spidey),用于mRNA剪切位點識別。選擇性剪切數(shù)據(jù)庫:ProSplicer。啟動子結(jié)合位點分析:Cister。限制性酶切位點分析:NEBcutter。密碼子使用偏好性分析:CodonW。請概述基因組注釋的大體流程。(1)基因組注釋(Genomeannotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點?;蚪M注釋的研究內(nèi)容包括基因識別和基因功能注釋兩個方面?;蜃R別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預(yù)測新基因,現(xiàn)階段主要是3種方法的結(jié)合:⑴分析mRNA和EST數(shù)據(jù)以直接得到結(jié)果;⑵通過相似性比對從已知基因和蛋白質(zhì)序列得到間接證據(jù);(3)基于各種統(tǒng)計模型和算法從頭預(yù)測。對預(yù)測出的基因進行高通量功能注釋可以借助于以下方法,利用已知功能基因的注釋信息為新基因注釋:(1)序列數(shù)據(jù)庫相似性搜索;⑵序列模體(Motif)搜索;⑶直系同源序列聚類分析(Clusteroforthologousgroup,COG).(2)基因組注釋系統(tǒng)是MGAP的核心,整合了許多常用的基因識別和蛋白質(zhì)功能預(yù)測軟件,包括GeneMarks、IPRsearch、BLASTPGP和FASTA3等,以及多個數(shù)據(jù)庫,如非冗余蛋白質(zhì)序列數(shù)據(jù)庫(Nonredundant,NR)、已知三維空間結(jié)構(gòu)的蛋白質(zhì)序列數(shù)據(jù)庫(PDBSeq)、國際蛋白質(zhì)資源信息系統(tǒng)(InterPro)和直系同源蛋白質(zhì)家族數(shù)據(jù)庫(Clusteroforthologousgroups,COG)等,編寫了相應(yīng)的模塊進行自動操作,并把每一步注釋結(jié)果導(dǎo)入數(shù)據(jù)庫中。MGAP整合的一般模塊,可以被其他任何一種微生物基因組直接使用。綜合題(共60分)1?生物信息學分析的數(shù)據(jù)對象主要有哪幾種?這些數(shù)據(jù)之間存在著什么關(guān)系?其研究重點主要落實在核酸和蛋白質(zhì)兩個方面,包括它們的序列、結(jié)構(gòu)和功能。生物信息學以基因組DNA序列信息分析作為出發(fā)點,破譯遺傳語言,認識遺傳信息的組織規(guī)律,辨別隱藏在DNA序列中的基因,掌握基因調(diào)控信息,對蛋白質(zhì)空間結(jié)構(gòu)進行模擬和預(yù)測,依據(jù)蛋白質(zhì)結(jié)構(gòu)和功能的關(guān)系進行藥物分子設(shè)計。2?生物信息學的主要研究任務(wù)是什么?目前生物信息學的主要研究內(nèi)容是什么?A.收集和管理生物分子數(shù)據(jù);數(shù)據(jù)分析和挖掘;開發(fā)分析工具和實用軟件:生物分子序列比較工具、基因識別工具、生物分子結(jié)構(gòu)預(yù)測工具、基因表達數(shù)據(jù)分析工具。B.(1)生物分子數(shù)據(jù)的收集與管理;(2)數(shù)據(jù)庫搜索及序列比較;(3)基因組序列分析;(4)基因表達數(shù)據(jù)的分析與處理;(5)蛋白質(zhì)結(jié)構(gòu)預(yù)測。5?在基因組序列分析方面,科學家關(guān)注哪些信息?就人類基因組而言,編碼區(qū)域在人類基因組所占的比例不超過3%。其余97%是非編碼序列。對于非編碼序列,人們了解得比較少,尚不清楚其含義或功能。然而,非編碼區(qū)域?qū)τ谏顒泳哂兄匾囊饬x。這部分序列主要包括內(nèi)含子、簡單重復(fù)序列、移動元件(mobileelement)及其遺留物、偽基因(pseudogene)等。6?掌握蛋白質(zhì)結(jié)構(gòu)有什么意義?為什么要進行蛋白質(zhì)結(jié)構(gòu)預(yù)測?研究蛋白質(zhì)的結(jié)構(gòu)意義重大,分析蛋白質(zhì)結(jié)構(gòu)、功能及其關(guān)系是蛋白質(zhì)組計劃中的一個重要組成部分。研究蛋白質(zhì)結(jié)構(gòu),有助于了解蛋白質(zhì)的作用,了解蛋白質(zhì)如何行使其生物功能,認識蛋白質(zhì)與蛋白質(zhì)(或其它分子)之間的相互作用,這無論是對于生物學還是對于醫(yī)學和藥學,都是非常重要的。對于未知功能或者新發(fā)現(xiàn)的蛋白質(zhì)分子,通過結(jié)構(gòu)分析,可以進行功能注釋,指導(dǎo)設(shè)計進行功能確認的生物學實驗。通過分析蛋白質(zhì)的結(jié)構(gòu),確認功能單位或者結(jié)構(gòu)域,可以為遺傳操作提供目標,為設(shè)計新的蛋白質(zhì)或改造已有蛋白質(zhì)提供可靠的依據(jù),同時為新的藥物分子設(shè)計提供合理的靶分子結(jié)構(gòu)。7、簡述分子生物學中的“中心法則”?!爸行姆▌t”的核心是什么?(1)DNA是遺傳物質(zhì),是攜帶遺傳信息的載體。信息從基因的核苷酸序列中被提取出,用來指導(dǎo)蛋白質(zhì)合成的過程對地球上的所有生物都是相同的,分子生物學家稱之為中心法則(centraldogma)。(2)“中心法則”的核心:DNA分子中的遺傳信息轉(zhuǎn)錄(transcription)到RNA分子中(即RNA聚合酶以DNA為模板合成RNA),再由RNA翻譯(translation)生成體內(nèi)各種蛋白質(zhì),行使特定的生物功能。8、簡要介紹GenBank中的DNA序列格式。答:GenBank數(shù)據(jù)庫(包括NCBI核酸和蛋白質(zhì)序列數(shù)據(jù)庫)中條目格式如下:給出描述每一個序列的信息,包括文獻參考、序列的功能信息、mRNA和編碼區(qū)域的位置,以及重要突變的位置。這些序列信息以字段的形式進行組織,每一行最前端都有一個標識符。在某些條目中,標識符可能縮寫成兩個字母(例如RF代表reference),某些字段可能還有次級字段。計算機程序中的序列條目位于標識符“ORIGIN”和“//”之間。9、PCR引物設(shè)計的原則?答:引物與模板的序列要緊密互補。引物與引物之間避免形成穩(wěn)定的二聚體或發(fā)夾結(jié)構(gòu)。引物不能在模板的非目的位點引發(fā)DNA聚合反應(yīng)(即錯配)。引物的長度一般為15-30bp,常用的是18-24bp,但不應(yīng)大于38。對引物的修飾一般是在5'端增加酶切位點。盡可能少的引物二聚體。引物序列的GC含量一般為40-60%。10、為什么要進行序列片段組裝?在進行序列片段組裝時會遇到哪些問題?大規(guī)?;蚪M測序得到待測序列的一系列序列片段,這些序列片段覆蓋待測序列,序列片段之間也存在著相互覆蓋或者重疊。遇到的問題:堿基標識錯誤;不知道片段的方向;存在重復(fù)區(qū)域;缺少覆蓋。11、國際上有哪幾個著名的核酸序列數(shù)據(jù)庫?(1)歐洲分子生物學實驗室的EMBL。(2)美國生物技術(shù)信息中心的GenBank。(3)日本遺傳研究所的DDBJ12、生物信息學研究意義何在?答:1)認識生物本質(zhì):了解生物分子信息的組織和結(jié)構(gòu),破譯基因組信息,闡明生物信息之間的關(guān)系。2)改變生物學的研究方式:變傳統(tǒng)研究方式,引進現(xiàn)代信息學方法。3)在醫(yī)學上的重要意義:為疾病的診斷和治療提供依據(jù),為設(shè)計新藥提供依據(jù)。三、論述題(兩個小題,共20分)1、簡述人類基因組計劃與生物信息學之間的相互促進關(guān)系。人類基因組計劃(HumanGenomeProject,HGP)是美國在1990年提出實施的一項偉大的科學計劃,與阿波羅登月計劃、曼哈頓原子彈計劃同稱為人類自然科學史上的三大計劃。自實施以來,該計劃在世界各國引起了很大反響。在人類基因組計劃中,人們準備用15年時間,投入30億美元,完成人類全部24條染色體中3X109個堿基對(bp,basepair)的序列測定,其主要任務(wù)包括作圖(遺傳圖譜、物理圖譜的建立及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別,還包括模式生物(如大腸桿菌、酵母、線蟲、小鼠等)基因組的作圖和測序,以及信息系統(tǒng)的建立。隨著人類基因組計劃的提出和實施,實驗數(shù)據(jù)和可利用信息急劇增加,人類基因組計劃提供了以往不可想象的巨量的生物學信息資源?;蚪M信息的收集、儲存、分發(fā)、分析顯得越來越緊迫和重要,信息的管理和分析成為人類基因組計劃實施過程中的一項重要工作,人類基因組計劃向信息學提出了巨大的挑戰(zhàn)。值得慶幸的是,人類基因組計劃一開始就與計算機技術(shù)、信息高速公路同步發(fā)展,信息技術(shù)為生物信息學的發(fā)展提供了非常好的條件,為生物信息學的研究和應(yīng)用提供了非常好的支撐。生物信息學與人類基因組計劃緊密結(jié)合,互相滲透,生物信息學成為基因組計劃不可分割的一部分。事實證明,人類基因組計劃在生物信息學的支持下,前進步伐大大加快,已經(jīng)提前完成計劃,功能基因組研究也已經(jīng)全面展開。而人類基因組計劃反過來又大大促進了生物信息學的發(fā)展,HGP豐富了生物信息學的研究內(nèi)容,促進生物信息學新思想、新方法的產(chǎn)生,生物信息學在最近10年迅速發(fā)展的歷程證明了這一點。1、生物序列相似性搜索的blast程序blastn、blastp、blastx、Tblastn、Tblastx各自有何區(qū)別和用途?答:程序名檢測序列數(shù)據(jù)庫類型方法Blastp蛋白質(zhì)蛋白質(zhì)用檢測序列蛋白質(zhì)搜索蛋白質(zhì)序列數(shù)據(jù)庫Blastn核酸核酸用檢測序列核酸搜索核酸序列數(shù)據(jù)庫Blastx核酸蛋白質(zhì)將核酸序列按6條鏈翻譯成蛋白質(zhì)序列后搜索蛋白質(zhì)序列數(shù)據(jù)庫Tblastn蛋白質(zhì)核酸用檢測序列蛋白質(zhì)搜索由核酸序列數(shù)據(jù)庫按6條鏈翻譯成的蛋白質(zhì)序列數(shù)據(jù)庫Tblastx核酸核酸將核酸序列按6條鏈翻譯成蛋白質(zhì)序列后搜索由核酸序列數(shù)據(jù)庫按6條鏈翻譯成的蛋白質(zhì)序列數(shù)據(jù)庫2000年6月26日,被譽為生命阿波羅計劃的人類基因組計劃,經(jīng)過美、英、日、法、德和中國科學家的艱苦努力,終于完成了工作草圖,這是人類科學世上又一個里程碑式的事件。1977年Sanger研究小組完成了第一個噬菌體全基因組的測序,并發(fā)現(xiàn)內(nèi)含子。1997年,國內(nèi)第一個生物信息中心北京大學生物信息學中心成立,從此,我國生物信息學研究得到蓬勃發(fā)展。生物信息學可以理解為生物學(或生命科學)和信息學(或計算機科學與應(yīng)用)的交叉學科。生物信息學所倡導(dǎo)的全球范圍的資源共享將對整個自然科學,乃至整個人類發(fā)展產(chǎn)生深遠的影響。“第三次技術(shù)革命基因組革命時代,目前它處于初級階段,一場與工業(yè)革命和以計算機為基礎(chǔ)的革命有相同影響力的變化正在開始?!鄙镄畔W產(chǎn)生和迅猛發(fā)展的主要推動力來自于新一代測序等高通量技術(shù)在生命科學領(lǐng)域越來越廣泛的應(yīng)用。生物信息學:生物信息學是一門交叉科學,它包含了生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面,它綜合運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學意義。根據(jù)數(shù)據(jù)庫存儲的具體內(nèi)容可分為一級數(shù)據(jù)庫和二級數(shù)據(jù)庫兩種類型。根據(jù)數(shù)據(jù)庫存放數(shù)據(jù)類型的不同,可以分為序列數(shù)據(jù)庫、結(jié)構(gòu)數(shù)據(jù)庫、文獻數(shù)據(jù)庫、序列特征數(shù)據(jù)庫、基因組圖譜數(shù)據(jù)庫、表達譜數(shù)據(jù)庫等等。11?核酸序列數(shù)據(jù)庫常用的有NCBI、EMBL、DDBJ.常用的蛋白結(jié)構(gòu)數(shù)據(jù)庫有PDB、SCCOP、GO(geneontology)語義分分子功能(MolecularFunction)、生物學過程(BiologicalProcess)、細胞組件(CellularComponent)三大類。常見的功能注釋數(shù)據(jù)庫GO、IPR和KEGG。序列比對的常用工具:FASTA、BLAST。序列比對的常用算法:dotplot、動態(tài)規(guī)劃算法、BLAST算法。打分矩陣的構(gòu)建,是基于遠距離進化過程中觀察到的殘基替換率,并用不同的打分值表征不同殘基之間相似程度。常用的打分矩陣:PAM矩陣(Dayhoff突變數(shù)據(jù)矩陣)、BLOSUM矩陣序列比對:是運用某種特定的數(shù)學模型和算法,找出兩個或多個序列之間最大的匹配堿基或殘基數(shù)目,比對結(jié)果反映了算法的多大程度上提供序列之間的相似性關(guān)系及它們的生物學特征。序列比對所使用的參數(shù)都有哪些?序列比對的目的是什么?序列比對(1)發(fā)現(xiàn)序列之間的相似性;(2)辨別序列之間的差異參數(shù)包括:分值(打分矩陣)、相似性(%)、同一性(%)、E值目的:相似序列推測相似的結(jié)構(gòu),相似的功能判別序列之間的同源性推測序列之間的進化關(guān)系同一性:P47相似性:P47蛋白質(zhì)序列分析主要內(nèi)容包括蛋白質(zhì)一級序列、蛋白質(zhì)二級結(jié)構(gòu)、蛋白質(zhì)超二級結(jié)構(gòu)、蛋白質(zhì)三級結(jié)構(gòu)、蛋白質(zhì)分類。蛋白質(zhì)的基本性質(zhì):相對分子質(zhì)量、氨基酸組成、等電點(PI)、消光系數(shù)、半衰期、不穩(wěn)定系數(shù)、總平均親水性。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的分析流程:1D序列預(yù)測、序列基序識別、二硫鍵識別、無序結(jié)構(gòu)識別、折疊子識別、殘基接觸預(yù)測、結(jié)構(gòu)域預(yù)測、結(jié)構(gòu)表面識別。蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測方法:同源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論