生物信息學題庫

上傳人：1*** IP屬地：湖北上傳時間：2023-11-05 格式：DOC 頁數(shù)：15 大小：235.50KB 積分：6 舉報 版權申訴

已閱讀5頁，還剩10頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

2/243.UTR的含義是（B）。A.編碼區(qū)B.非編碼區(qū)C.低復雜度區(qū)域D.開放閱讀框44.motif的含義是（D）。A.基序B.跨疊克隆群C.堿基對D.結(jié)構域45.algorithm的含義是（B）。A.登錄號B.算法C.比對D.類推46、RGP是（D）。A.在線人類孟德爾遺傳數(shù)據(jù)B.國家核酸數(shù)據(jù)庫C.人類基因組計劃D.水稻基因組計劃47、下列Fasta格式正確的是（B）。A.seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactcccttaB.>seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactcccttaC.seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactcccttaD.>seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta48、如果我們試圖做蛋白質(zhì)亞細胞定位分析，應使用（D）。A.NDB數(shù)據(jù)庫B.PDB數(shù)據(jù)庫C.GenBank數(shù)據(jù)庫D.SWISS-PROT數(shù)據(jù)庫49、Bioinformatics的含義是（A）。A.生物信息學B.基因組學C.蛋白質(zhì)組學D.表觀遺傳學50、GenBank中分類碼PLN表示是（D）。A.哺乳類序列B.細菌序列C.噬菌體序列D.植物、真菌和藻類序列51、ortholog的含義是（A）。A.直系同源B.旁系同源C.直接進化D.間接進化52、從cDNA文庫中獲得的短序列是（D）。A.STSB.UTRC.CDSD.EST53、contig的含義是（B）。A.基序B.跨疊克隆群C.堿基對D.結(jié)構域54、TAIR（AtDB）數(shù)據(jù)庫是（C）。A.線蟲基因組B.果蠅基因組C.擬南芥數(shù)據(jù)庫D.大腸桿菌基因組55、ORF的含義是（D）。A.調(diào)控區(qū)B.非編碼C.低復雜度區(qū)域D.開放閱讀框56、mRNA5′端有(A)結(jié)構。A.帽子B.尾巴C.帽子和尾巴D.多聚核苷酸57、利用中國知網(wǎng)文獻數(shù)據(jù)庫（中國知網(wǎng)）查找論文題目是“擴張蛋白家族蛋白序列分析”發(fā)表在期刊“生物信息學”2008年第7卷第3期上（C）。A.第3-5頁B.第93-95頁C.第193-195頁D.第293-295頁58、目前應用于基因芯片表達數(shù)據(jù)統(tǒng)計分析的主要方法是（C）。A.卡方檢驗B.相關分析C.聚類分析D.正態(tài)性分布檢驗59、SAGE的含義是（A）。A.基因表達連續(xù)分析B.聚丙烯酰胺凝膠電泳C.基因組分析D.雙向電泳分析60、domain的含義是（D）。A.基序B.跨疊克隆群C.堿基對D.結(jié)構域61、mRNA3′端有(B)結(jié)構。A.帽子B.尾巴C.帽子和尾巴D.多聚胞嘧啶62、NCBI中人類無冗余基因數(shù)據(jù)庫是（A）。A.UniGeneB.UniProC.UniRefD.URF63、alignment的含義是（C）。A.登錄號B.算法C.比對D.類推64、Entrez使用幾種邏輯運算符對檢索關鍵詞做最基本的限制？（C）A.1種B.2種C.3種D.4種65、微衛(wèi)星標記是（C）。A.RFLPB.SNPC.SSRD.RAPD66、提交序列到GenBank中，使用的程序可以是（D）。A.EntrezB.SRSC.MedlineD.BankIt67、PDB是蛋白質(zhì)的（B）。A.分類數(shù)據(jù)庫B.結(jié)構數(shù)據(jù)庫C.模體數(shù)據(jù)庫D.結(jié)構域數(shù)據(jù)庫68、限制性片段長度多態(tài)性標記是（A）。A.RFLPB.SNPC.SSRD.RAPD69、CDS的含義是（A）。A.編碼區(qū)B.非編碼區(qū)C.低復雜度區(qū)域D.非調(diào)控區(qū)70、構建進化樹工具是（C）。A.BLASTB.ClustalWC.MegaD.GCG71、analogy的含義是（D）。A.登錄號B.算法C.比對D.類推72、在真核生物中，一個基因cDNA的5′端起始密碼子AUG的前后序列符合（A）規(guī)則。A.KozakB.AU…AGC.SDD.Poly(A)n73、將核酸序列按照6條鏈翻譯成蛋白質(zhì)序列后搜索蛋白質(zhì)序列數(shù)據(jù)庫使用的程序是（B）。A.blastpB.blastxC.tblastnD.tblastx74、利用PubMed文獻數(shù)據(jù)查找論文“TransgenicplantsofPetuniahybridaharboringtheCYP2E1geneefficientlyremovebenzeneandtoluenepollutantsandimproveresistancetoformaldehyde”的第一作者是（D）。A.XiangTB.BaoLC.LiPD.ZhangD75、基本局部比對搜素工具是（C）。A.MegaB.ClustalWC.BLASTD.GCG76、被譽為“生物信息學之父”的科學家是（D）。A.DulbeccoB.SangerC.吳瑞D.林華安77、DDBJ的含義是（C）。A.美國國家生物信息中心B.歐洲分子生物學實驗室C.日本DNA數(shù)據(jù)庫D.中國基因組研究中心78、利用PubMed文獻數(shù)據(jù)查找發(fā)表在“Nature,2012,487(7405):43-45”上論文題目（D）。A.Amapofthecis-regulatorysequencesinthemousegenomeB.ThehumanCSTcomplexisaterminatoroftelomeraseactivityC.Tumours:LesslactationmayexplaincancerriseD.Stemcells:asporadicsuperstate79、利用PubMed文獻數(shù)據(jù)查找論文“Cancerepigenetics:frommechanismtotherapy”作者的單位是（C）。A.UniversityofCaliforniaB.UniversityofColumbiaC.UniversityofCambridgeD.UniversityofChicago80、單核苷酸標記是（A）。A.RFLPB.SNPC.SSRD.RAPD81、GenBank數(shù)據(jù)庫的基本信息單位是（B）。A.FASTAB.GBFFC.GCGD.ASN.182、OMIM是（A）。A.在線人類孟德爾遺傳數(shù)據(jù)庫B.國家核酸數(shù)據(jù)庫C.人類基因組計劃D.水稻基因組計劃83、多序列比對工具是（B）。A.BLASTB.ClustalWC.MegaD.GCG84、EMBL的含義是（B）。A.美國國家生物信息中心B.歐洲分子生物學實驗室C.日本DNA數(shù)據(jù)庫D.中國國家基因組研究中心85、accessionnumber的含義是（A）。A.登錄號B.算法C.比對D.類推86、EST的含義是（A）。A.表達序列標簽B.序列標簽位點C.高通量基因組序列D.人工合成序列87、利用中國知網(wǎng)文獻數(shù)據(jù)庫（中國知網(wǎng)）查找論文題目是“黃瓜對不同溫度逆境的抗性研究”作者的單位是（A）。A.天津市黃瓜研究所B.中國農(nóng)業(yè)科學院C.中國科學院D.中國農(nóng)業(yè)大學88、沒有直接參與完成人類基因組計劃的國家是（C）。A.英國B.中國C.俄羅斯D.德國89、Blast結(jié)果中HSP的含義是（D）。A.空位B.期望值C.過濾D.高分配對片段90、GenBank登錄號為SCU49845的序列，其DNA產(chǎn)度是（D）。A.1028bpB.3028bpC.4028bpD.5028bp91、GenBank數(shù)據(jù)庫中的登錄號AAR19268是（A）。A.水稻的DNA序列B.水稻的蛋白質(zhì)序列C.人類的DNA序列D.人類的蛋白質(zhì)序列92、在真核生物的一個基因內(nèi)含子兩端，即外顯子/內(nèi)含子拼接邊界處，其符合（B）規(guī)則。A.KozakB.AU…AGC.SDD.Poly(A)n93、蛋白質(zhì)信號肽的預測工具有（D）。A.nnpredictB.PredictProteinC.SingalDD.SingalP94、basepair的含義是（C）。A.基序B.跨疊克隆群C.堿基對D.結(jié)構域95、Proteomics的含義是（C）。A.生物信息學B.基因組學C.蛋白質(zhì)組學D.表觀遺傳學96、根據(jù)大量EST具有相互重疊的性質(zhì)，通過計算機算法獲得cDNA全長序列，這種克隆基因的方法是（B）。A.重疊克隆B.電子克隆C.基因步移D.基因重組97、隱馬爾科夫模型的代號是（A）。A.HMMB.CDDC.HTGSD.GSS98、Entrez數(shù)據(jù)庫中的剪貼板的容量是（A）。A.500條記錄B.1000條記錄C.5000條記錄D.10000條記錄99、GenBank是（B）。A.在線人類孟德爾遺傳數(shù)據(jù)B.國際核酸數(shù)據(jù)庫C.人類基因組計劃D.水稻基因組計劃100、利用中國知網(wǎng)文獻數(shù)據(jù)庫（中國知網(wǎng)）查找論文題目是“黃瓜無毛突變體葉片葉綠體超微結(jié)構與光合特性”第一作者是（A）。A.曹辰興B.張松C.郭紅蕓D.郭延奎101、根據(jù)研究發(fā)現(xiàn)，人類基因組中真正編碼蛋白質(zhì)的區(qū)域僅占DNA序列的（B）。A.1-2%B.3-5%C.5-10%D.10-20%102、LCR的含義是（C）。A.編碼區(qū)B.非編碼區(qū)C.低復雜度區(qū)域D.開放閱讀框103、如果我們試圖做蛋白質(zhì)亞細胞定位分析，應使用（D）。A.NDB數(shù)據(jù)庫B.PDB數(shù)據(jù)庫C.GenBank數(shù)據(jù)庫D.SWISS-PROT數(shù)據(jù)庫104、利用PubMed文獻數(shù)據(jù)查找論文“Awhole-cellcomputationalmodelpredictsphenotypefromgenotype”發(fā)表在Cell期刊的（C）。A.第50卷第1期第389-391頁B.第50卷第1期第389-401頁C.第150卷第2期第389-401頁D.第125卷第2期第389-391頁105、蛋白質(zhì)基序（motif）中[ST]的含義是（C）。A.氨基酸為STB.氨基酸為S和TC.氨基酸為S或TD.除掉S和T之外的任意氨基酸106、構建系統(tǒng)發(fā)生樹，應使用（C）。A.BLASTB.FASTAC.UPGMAD.FTP107、PIR是（D）。A.核酸數(shù)據(jù)庫B.mRNA數(shù)據(jù)庫C.啟動子數(shù)據(jù)庫D.蛋白質(zhì)數(shù)據(jù)庫108、生物芯片分析中使用的聚類分析輸出圖形主要以下列哪種方式表現(xiàn)？（A）A.以彩色小方塊陣列表示B.以蜂窩形狀表示C.以黑白圓點表示D.以彩色線條表示109、以下哪一項不屬于啟動子研究范圍？（A）A.CpG島預測B.轉(zhuǎn)錄起始點預測C.糖基化修飾D.甲基化檢測110、生物信息學主要是利用哪種工具實現(xiàn)對生命科學研究中生物信息的存儲、檢索和分析的？（A）A.計算機B.iPhoneC.人造衛(wèi)星D.手機111、HTGS的含義是（C）。A.表達序列標簽B.序列標簽位C.高通量基因組序列D.人工合成序列112、STS的含義是（B）。A.表達序列標簽B.序列標簽位點C.高通量基因組序列D.人工合成序列113、利用中國知網(wǎng)文獻數(shù)據(jù)庫（中國知網(wǎng)）查找論文題目是“日光溫室光溫因子對黃瓜葉綠體超微結(jié)構及其功能的影響”發(fā)表的期刊是（B）。A.園藝學報B.應用生態(tài)學報C.生態(tài)學報D.遺傳學報114、利用PubMed文獻數(shù)據(jù)查找論文“Enhancingphytoremediationthroughtheuseoftransgenicsandendophytes”發(fā)表的期刊是（A）。A.NewPhytolB.GeneC.NatureD.PlantPhsiol115、HGP是（C）。A.在線人類孟德爾遺傳數(shù)據(jù)B.國家核酸數(shù)據(jù)庫C.人類基因組計劃D.水稻基因組計劃116、DNA中Tm值與(B)含量成正比。A.G+AB.G+CC.T+CD.A+T名詞辨析（每題5分，共20分）1、基因與基因組：

Gene

基因：遺傳功能的單位。它是一種DNA序列，在有些病毒中則是一種RNA序列，它編碼功能性蛋白質(zhì)或RNA分子。

Genome

基因組：染色體組，一個生物體、細胞器或病毒的整套基因；例如，細胞核基因組，葉綠體基因組，噬菌體基因組。

2、相似性與同源性：

所謂同源序列，簡單地說，是指從某一共同祖先經(jīng)趨異進化而形成的不同序列。同源性可以用來描述染色體—“同源染色體”、基因—“同源基因”和基因組的一個片斷—“同源片斷”必須指出，相似性(similarity)和同源性(homology)是兩個完全不同的概念。相似性是指序列比對過程中用來描述檢測序列和目標序列之間相同DNA堿基或氨基酸殘基順序所占比例的高低。相似性本身的含義，并不要求與進化起源是否同一、與親緣關系的遠近、甚至于結(jié)構與功能有什么聯(lián)系。

3、CDS與cDNA：

cDNA序列：互補DNA序列，指的是mRNA為在逆轉(zhuǎn)錄酶的作用下將形成DNA的過程。CDS序列：編碼序列,從起始密碼子到終止密碼子的所有序列。

4、數(shù)據(jù)庫搜索和數(shù)據(jù)庫查詢：

數(shù)據(jù)庫查詢：對序列、結(jié)構以及各種二次數(shù)據(jù)庫中的注釋信息進行關鍵詞匹配查找（又稱數(shù)據(jù)庫檢索）。

數(shù)據(jù)庫搜索：通過特定的序列相似性比對算法，找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫中與檢測序列具有一定程度相似性的序列。搜索對象不是數(shù)據(jù)庫的注釋信息，而是序列信息。是指生物種族的進化歷史，亦即生物體在整個進化譜在研究\o"生物"生物進化和系統(tǒng)分類中，常用一種類似樹狀分支的圖形來概括各種（類）生物之間的親緣關系，這種樹狀分支的圖形成為系統(tǒng)發(fā)育樹(phylogenetictree)。生物信息學的大體定義是什么？其發(fā)展歷程如何？利用應用數(shù)學、信息學、統(tǒng)計學和計算機科學的方法研究生物學的問題。目前的生物信息學基本上只是分子生物學與信息技術（尤其是互聯(lián)網(wǎng)技術）的結(jié)合體。生物信息學的研究材料和結(jié)果就是各種各樣的生物學數(shù)據(jù)，其研究工具是計算機，研究方法包括對生物學數(shù)據(jù)的搜索（收集和篩選）、處理（編輯、整理、管理和顯示）及利用（計算、模擬）。目前主要的研究方向有：序列比對、基因識別、基因重組、蛋白質(zhì)結(jié)構預測、基因表達、蛋白質(zhì)反應的預測，以及建立進化模型。發(fā)展歷程：20世紀50年代，生物信息學開始孕育。20世紀60年代，生物分子信息在概念上將計算生物學和計算機科學聯(lián)系起來。20世紀70年代，生物信息學的真正開端。④20世紀70年代到80年代初期，出現(xiàn)了一系列著名的序列比較方法和生物信息分析方法。⑤20世紀80年代以后，出現(xiàn)一批生物信息服務機構和生物信息數(shù)據(jù)庫。⑥20世紀90年代后，HGP促進生物信息學的迅速發(fā)展請論述生物信息學的研究內(nèi)容有哪些？生物分子數(shù)據(jù)的收集與管理：①基因組數(shù)據(jù)庫（EMBL、GenBank、DDBJ）②蛋白質(zhì)序列數(shù)據(jù)庫（SWTSS-PROT、PIR）③蛋白質(zhì)結(jié)構數(shù)據(jù)庫（PDB）數(shù)據(jù)庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列：①序列比較的一個基本操作就是比對（Alignment），即將兩個序列的各個字符（代表核苷酸或者氨基酸殘基）按照對應等同或者置換關系進行對比排列，其結(jié)果是兩個序列共有的排列順序，這是序列相似程度的一種定性描述。②多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域，也可用于研究一組蛋白質(zhì)之間的進化關系。基因組序列分析:①遺傳語言分析——天書②基因組結(jié)構分析③基因識別④基因功能注釋⑤基因調(diào)控信息分析⑥基因組比較基因表達數(shù)據(jù)的分析與處理:基因表達數(shù)據(jù)分析是目前生物信息學研究的熱點和重點。目前對基因表達數(shù)據(jù)的處理主要是進行聚類分析，將表達模式相似的基因聚為一類，在此基礎上尋找相關基因，分析基因的功能。所用方法主要有：①相關分析方法②模式識別技術中的層次式聚類方法③人工智能中的自組織映射神經(jīng)網(wǎng)絡④主元分析方法5）蛋白質(zhì)結(jié)構預測。蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構所決定，蛋白質(zhì)結(jié)構預測成為了解蛋白質(zhì)功能的重要途徑。

蛋白質(zhì)結(jié)構預測分為:（1）二級結(jié)構預測:在一定程度上二級結(jié)構的預測可以歸結(jié)為模式識別問題。在二級結(jié)構預測方面主要方法有：立體化學方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學方法、人工神經(jīng)網(wǎng)絡方法。預測準確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡的PHD系統(tǒng)。（2）空間結(jié)構預測：在空間結(jié)構預測方面，比較成功的理論方法是同源模型法。該方法的依據(jù)是：相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構,運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)構預測工作。請敘述構建系統(tǒng)進化樹的一般步驟。[1]序列選擇：從那些可以輸出FASTA格式的數(shù)據(jù)庫中選擇[2]多序列比對[3]替代模型的選擇[4]生成樹：方式：distance-based；character-based:maximumparsimony；character-andmodel-based:maximumlikelihood；character-andmodel-based:Bayesian基于距離的樹生成軟件：MEGA和PAUPMEGA應用算法：UPGMA，基于距離的算法。[5]結(jié)果評估:原則（一致性、效率、和魯棒性）；檢測方法：最為常見的方法是引導檢測的分析方法。引導檢測法：簡單地講就是把序列的位點都重排，重排后的序列再用相同的辦法構樹，如果原來樹的分枝在重排后構的樹中也出現(xiàn)了，就給這個分枝打上一分，如果沒出現(xiàn)就給0分，這樣經(jīng)過你給定的repetitions次（至少1000次）重排構樹打分后，每個分枝就都得出分值，計算機會給你換算成bootstrap值。重排的序列有很多組合，值越小說明分枝的可信度越低，最好根據(jù)數(shù)據(jù)的情況選用不同的構樹方法和模型。歸納前面所講，下面幾點可以幫助我們解釋進化樹：(1)從根節(jié)點到任何一個節(jié)點的惟一路徑和方向代表了進化時間；(2)根是樹中所有物種的共同祖先；(3)根節(jié)點上的物種我們認為比樹中其他所有的物種分化更早。如果無法確定根節(jié)點的物種，就使用無根樹進行分析。NCBI的Entrez檢索包含了哪些方面的信息。Entrez是NCBI為用戶提供整合的訪問序列、定位、分類及結(jié)構數(shù)據(jù)的搜索和檢索的系統(tǒng)，是一個用以整合NCBI數(shù)據(jù)庫中信息的搜尋和檢索的工具，包括核酸序列、蛋白質(zhì)序列、蛋白質(zhì)三維結(jié)構、基因組圖譜和通過PubMed檢索的MEDLINE。其中，Entrez可以整合檢索的序列數(shù)據(jù)庫包括GenBank、EMBI—DDBJ、RefSeq、PIR-International、PRF、Swiss—Prot和PDB等。Entrez有兩個顯著的特點：第一是對每個數(shù)據(jù)庫中的記錄都預先做相似性比較，產(chǎn)生一個列表，包括序列、結(jié)構和MEDLINE文獻記錄等信息；第二是對某個數(shù)據(jù)庫的記錄與其他數(shù)據(jù)庫的相關記錄做了鏈接，使對不同數(shù)據(jù)庫的訪問得以整合。所以Entrez是通過相近性和硬連接來提供集成的信息檢索。Entrez可以用很廣泛的文本方式搜索，比如作者名字、雜志名字、基因或蛋白名、物種、單一的檢索號(如：accessionnumber、序列ID、PubMedID、MEDLNEUID)和其他的術語，因此，Entrez是一個強大的檢索相關序列、結(jié)構和參考文獻的信息檢索工具。BLAST系列軟件分別用哪些數(shù)據(jù)搜索何種數(shù)據(jù)庫？真核基因結(jié)構注釋包括哪些內(nèi)容？相關的軟件所依據(jù)的理論基礎是什么？GENSCAN是美國麻省理工大學的ChrisBurge于1997年開發(fā)成功的人類（或脊椎動物）基因預測軟件，它根據(jù)基因的整體結(jié)構進行基因預測，不依賴于已有的蛋白庫，是一種"從頭預測"軟件；用于ORF識別。通過對特征序列(GT-AG)的分析進行直接的預測基因預測軟件（NetGene2），內(nèi)含子/外顯子剪切位點識別。與相應的基因組序列比對，分析比對片段的分布位置（Spidey），用于mRNA剪切位點識別。選擇性剪切數(shù)據(jù)庫：ProSplicer。啟動子結(jié)合位點分析：Cister。限制性酶切位點分析：NEBcutter。密碼子使用偏好性分析：CodonW。請概述基因組注釋的大體流程。（1）基因組注釋(Genomeannotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點。基因組注釋的研究內(nèi)容包括基因識別和基因功能注釋兩個方面。基因識別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預測新基因,現(xiàn)階段主要是3種方法的結(jié)合:(1)分析mRNA和EST數(shù)據(jù)以直接得到結(jié)果;(2)通過相似性比對從已知基因和蛋白質(zhì)序列得到間接證據(jù);(3)基于各種統(tǒng)計模型和算法從頭預測。對預測出的基因進行高通量功能注釋可以借助于以下方法,利用已知功能基因的注釋信息為新基因注釋:(1)序列數(shù)據(jù)庫相似性搜索;(2)序列模體(Motif)搜索;(3)直系同源序列聚類分析(Clusteroforthologousgroup,COG).(2)基因組注釋系統(tǒng)是MGAP的核心,整合了許多常用的基因識別和蛋白質(zhì)功能預測軟件,包括GeneMarks、IPRsearch、BLASTPGP和FASTA3等,以及多個數(shù)據(jù)庫,如非冗余蛋白質(zhì)序列數(shù)據(jù)庫(Nonredundant,NR)、已知三維空間結(jié)構的蛋白質(zhì)序列數(shù)據(jù)庫(PDBSeq)、國際蛋白質(zhì)資源信息系統(tǒng)(InterPro)和直系同源蛋白質(zhì)家族數(shù)據(jù)庫(Clusteroforthologousgroups,COG)等,編寫了相應的模塊進行自動操作,并把每一步注釋結(jié)果導入數(shù)據(jù)庫中。MGAP整合的一般模塊,可以被其他任何一種微生物基因組直接使用。綜合題(共60分)1?生物信息學分析的數(shù)據(jù)對象主要有哪幾種？這些數(shù)據(jù)之間存在著什么關系？其研究重點主要落實在核酸和蛋白質(zhì)兩個方面，包括它們的序列、結(jié)構和功能。生物信息學以基因組DNA序列信息分析作為出發(fā)點，破譯遺傳語言，認識遺傳信息的組織規(guī)律，辨別隱藏在DNA序列中的基因，掌握基因調(diào)控信息，對蛋白質(zhì)空間結(jié)構進行模擬和預測，依據(jù)蛋白質(zhì)結(jié)構和功能的關系進行藥物分子設計。2?生物信息學的主要研究任務是什么？目前生物信息學的主要研究內(nèi)容是什么？A．收集和管理生物分子數(shù)據(jù)；數(shù)據(jù)分析和挖掘；開發(fā)分析工具和實用軟件：生物分子序列比較工具、基因識別工具、生物分子結(jié)構預測工具、基因表達數(shù)據(jù)分析工具。B．（1）生物分子數(shù)據(jù)的收集與管理；（2）數(shù)據(jù)庫搜索及序列比較；（3）基因組序列分析；（4）基因表達數(shù)據(jù)的分析與處理；（5）蛋白質(zhì)結(jié)構預測。5?在基因組序列分析方面，科學家關注哪些信息？就人類基因組而言，編碼區(qū)域在人類基因組所占的比例不超過3%。其余97%是非編碼序列。對于非編碼序列，人們了解得比較少，尚不清楚其含義或功能。然而，非編碼區(qū)域?qū)τ谏顒泳哂兄匾囊饬x。這部分序列主要包括內(nèi)含子、簡單重復序列、移動元件（mobileelement）及其遺留物、偽基因（pseudogene）等。6?掌握蛋白質(zhì)結(jié)構有什么意義？為什么要進行蛋白質(zhì)結(jié)構預測？（1）研究蛋白質(zhì)的結(jié)構意義重大，分析蛋白質(zhì)結(jié)構、功能及其關系是蛋白質(zhì)組計劃中的一個重要組成部分。研究蛋白質(zhì)結(jié)構，有助于了解蛋白質(zhì)的作用，了解蛋白質(zhì)如何行使其生物功能，認識蛋白質(zhì)與蛋白質(zhì)（或其它分子）之間的相互作用，這無論是對于生物學還是對于醫(yī)學和藥學，都是非常重要的。（2）對于未知功能或者新發(fā)現(xiàn)的蛋白質(zhì)分子，通過結(jié)構分析，可以進行功能注釋，指導設計進行功能確認的生物學實驗。通過分析蛋白質(zhì)的結(jié)構，確認功能單位或者結(jié)構域，可以為遺傳操作提供目標，為設計新的蛋白質(zhì)或改造已有蛋白質(zhì)提供可靠的依據(jù)，同時為新的藥物分子設計提供合理的靶分子結(jié)構。7、簡述分子生物學中的“中心法則”?！爸行姆▌t”的核心是什么？（1）DNA是遺傳物質(zhì)，是攜帶遺傳信息的載體。信息從基因的核苷酸序列中被提取出，用來指導蛋白質(zhì)合成的過程對地球上的所有生物都是相同的，分子生物學家稱之為中心法則(centraldogma)。（2）“中心法則”的核心：DNA分子中的遺傳信息轉(zhuǎn)錄（transcription）到RNA分子中（即RNA聚合酶以DNA為模板合成RNA），再由RNA翻譯（translation）生成體內(nèi)各種蛋白質(zhì)，行使特定的生物功能。8、簡要介紹GenBank中的DNA序列格式。答：GenBank數(shù)據(jù)庫(包括NCBI核酸和蛋白質(zhì)序列數(shù)據(jù)庫)中條目格式如下：給出描述每一個序列的信息，包括文獻參考、序列的功能信息、mRNA和編碼區(qū)域的位置，以及重要突變的位置。這些序列信息以字段的形式進行組織，每一行最前端都有一個標識符。在某些條目中，標識符可能縮寫成兩個字母(例如RF代表reference)，某些字段可能還有次級字段。計算機程序中的序列條目位于標識符“ORIGIN”和“//”之間。9、PCR引物設計的原則？答：引物與模板的序列要緊密互補。引物與引物之間避免形成穩(wěn)定的二聚體或發(fā)夾結(jié)構。引物不能在模板的非目的位點引發(fā)DNA聚合反應(即錯配)。引物的長度一般為15-30bp，常用的是18-24bp，但不應大于38。對引物的修飾一般是在5’端增加酶切位點。盡可能少的引物二聚體。引物序列的GC含量一般為40-60%。10、為什么要進行序列片段組裝？在進行序列片段組裝時會遇到哪些問題？大規(guī)?；蚪M測序得到待測序列的一系列序列片段，這些序列片段覆蓋待測序列，序列片段之間也存在著相互覆蓋或者重疊。遇到的問題：堿基標識錯誤；不知道片段的方向；存在重復區(qū)域；缺少覆蓋。11、國際上有哪幾個著名的核酸序列數(shù)據(jù)庫？（1）歐洲分子生物學實驗室的EMBL。（2）美國生物技術信息中心的GenBank。（3）日本遺傳研究所的DDBJ12、生物信息學研究意義何在？答：1）認識生物本質(zhì)：了解生物分子信息的組織和結(jié)構，破譯基因組信息，闡明生物信息之間的關系。2）改變生物學的研究方式：變傳統(tǒng)研究方式，引進現(xiàn)代信息學方法。3）在醫(yī)學上的重要意義：為疾病的診斷和治療提供依據(jù)，為設計新藥提供依據(jù)。三、論述題(兩個小題,共20分)1、簡述人類基因組計劃與生物信息學之間的相互促進關系。人類基因組計劃(HumanGenomeProject,HGP)是美國在1990年提出實施的一項偉大的科學計劃，與阿波羅登月計劃、曼哈頓原子彈計劃同稱為人類自然科學史上的三大計劃。自實施以來，該計劃在世界各國引起了很大反響。在人類基因組計劃中，人們準備用15年時間，投入30億美元，完成人類全部24條染色體中3×109個堿基對(bp，basepair)的序列測定，其主要任務包括作圖(遺傳圖譜、物理圖譜的建立及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別，還包括模式生物(如大腸桿菌、酵母、線蟲、小鼠等)基因組的作圖和測序，以及信息系統(tǒng)的建立。隨著人類基因組計劃的提出和實施，實驗數(shù)據(jù)和可利用信息急劇增加，人類基因組計劃提供了以往不可想象的巨量的生物學信息資源。基因組信息的收集、儲存、分發(fā)、分析顯得越來越緊迫和重要，信息的管理和分析成為人類基因組計劃實施過程中的一項重要工作，人類基因組計劃向信息學提出了巨大的挑戰(zhàn)。值得慶幸的是，人類基因組計劃一開始就與計算機技術、信息高速公路同步發(fā)展，信息技術為生物信息學的發(fā)展提供了非常好的條件，為生物信息學的研究和應用提供了非常好的支撐。生物信息學與人類基因組計劃緊密結(jié)合，互相滲透，生物信息學成為基因組計劃不可分割的一部分。事實證明，人類基因組計劃在生物信息學的支持下，前進步伐大大加快，已經(jīng)提前完成計劃，功能基因組研究也已經(jīng)全面展開。而人類基因組計劃反過來又大大促進了生物信息學的發(fā)展，HGP豐富了生物信息學的研究內(nèi)容，促進生物信息學新思想、新方法的產(chǎn)生，生物信息學在最近10年迅速發(fā)展的歷程證明了這一點。1、生物序列相似性搜索的blast程序blastn、blastp、blastx、Tblastn、Tblastx各自有何區(qū)別和用途？答：程序名檢測序列數(shù)據(jù)庫類型方法Blastp蛋白質(zhì)蛋白質(zhì)用檢測序列蛋白質(zhì)搜索蛋白質(zhì)序列數(shù)據(jù)庫Blastn核酸核酸用檢測序列核酸搜索核酸序列數(shù)據(jù)庫Blastx核酸蛋白質(zhì)將核酸序列按6條鏈翻譯成蛋白質(zhì)序列后搜索蛋白質(zhì)序列數(shù)據(jù)庫Tblastn蛋白質(zhì)核酸用檢測序列蛋白質(zhì)搜索由核酸序列數(shù)據(jù)庫按6條鏈翻譯成的蛋白質(zhì)序列數(shù)據(jù)庫Tblastx核酸核酸將核酸序列按6條鏈翻譯成蛋白質(zhì)序列后搜索由核酸序列數(shù)據(jù)庫按6條鏈翻譯成的蛋白質(zhì)序列數(shù)據(jù)庫2000年6月26日，被譽為生命"阿波羅計劃"的人類基因組計劃，經(jīng)過美、英、日、法、德和中國科學家的艱苦努力，終于完成了工作草圖，這是人類科學世上又一個里程碑式的事件。1977年Sanger研究小組完成了第一個噬菌體全基因組的測序，并發(fā)現(xiàn)內(nèi)含子。1997年，國內(nèi)第一個生物信息中心北京大學生物信息學中心成立，從此，我國生物信息學研究得到蓬勃發(fā)展。生物信息學可以理解為生物學（或生命科學）和信息學(或計算機科學與應用)的交叉學科。生物信息學所倡導的全球范圍的資源共享將對整個自然科學，乃至整個人類發(fā)展產(chǎn)生深遠的影響?！暗谌渭夹g革命基因組革命時代，目前它處于初級階段，一場與工業(yè)革命和以計算機為基礎的革命有相同影響力的變化正在開始?！鄙镄畔W產(chǎn)生和迅猛發(fā)展的主要推動力來自于新一代測序等高通量技術在生命科學領域越來越廣泛的應用。生物信息學：生物信息學是一門交叉科學，它包含了生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面，它綜合運用數(shù)學、計算機科學和生物學的各種工具，來闡明和理解大量數(shù)據(jù)所包含的生物學意義。根據(jù)數(shù)據(jù)庫存儲的具體內(nèi)容可分為一級數(shù)據(jù)庫和二級數(shù)據(jù)庫兩種類型。根據(jù)數(shù)據(jù)庫存放數(shù)據(jù)類型的不同，可以分為序列數(shù)據(jù)庫、結(jié)構數(shù)據(jù)庫、文獻數(shù)據(jù)庫、序列特征數(shù)據(jù)庫、基因組圖譜數(shù)據(jù)庫、表達譜數(shù)據(jù)庫等等。核酸序列數(shù)據(jù)庫常用的有NCBI、EMBL、DDBJ.常用的蛋白結(jié)構數(shù)據(jù)庫有PDB、SCCOP、GO（geneontology）語義分分子功能(MolecularFunction)、生物學過程(BiologicalProcess)、細胞組件(CellularComponent)三大類。常見的功能注釋數(shù)據(jù)庫GO、IPR和KEGG。序列比對的常用工具：FASTA、BLA

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

生物信息學題庫

文檔簡介

溫馨提示

最新文檔

評論

生物信息學題庫

文檔簡介

溫馨提示

最新文檔

評論

相關文檔