




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、微生物基因組學微生物基因組研究概況微生物基因組的特點微生物基因組研究的意義微生物基因組學微生物基因組研究概況微生物基因組重要紀事年限 事件1994年美國DOE啟動MGP1995年Science發(fā)表了第一株細菌-流感嗜血桿 菌全基因組1995年發(fā)表了集胞藻菌株PCC6803的測序和注釋1996年Science發(fā)表了第一個完成的古細菌-詹 氏甲烷球菌全基因組序列1996年酵母基因組序列發(fā)表1997年大腸桿菌K-12基因組序列發(fā)表 截至2011年4月24日,NCBI上記錄了1534個細菌基因組, 包括了103個古細菌和1431個真細菌, 其中中國科學家完成了44個 PubMed檢索到的有關基因組學和
2、轉錄組學的文獻數(shù)The literature number retrieved in PubMed database using “Genomics” and “Transcriptomics” as keywords年份Year基因組學文章Articles about Genomics基因組學綜述Reviews about Genomics轉錄組學文章Articles about Transcriptomics轉錄組學綜述Reviews about Transcriptomics200015433832020012072559422002268982618720033570984231320
3、0448101238562320056109141788522006690515591054920077295161313355200881191603162592009855115792347520108986148729670研究現(xiàn)況及內容細菌 研究內容 代表菌株病原菌 毒力因子、致病島、耐藥基因、耐藥機制以及與寄主的關系等 肺炎鏈球菌、致病性大腸桿菌、沙門氏菌等極端環(huán)境生長的細菌 極端環(huán)境下的生存機制,如嗜熱菌的熱穩(wěn)定性 詹氏甲烷球菌、熱自養(yǎng)甲烷桿菌、甲烷嗜熱菌、騰沖嗜熱菌等工業(yè)和環(huán)境有影響的細菌 CO2固定、固氮、硫氧化 和氫代謝等 單細胞藍細菌、絲狀藍細菌、原綠藻等原核生物基因組的大
4、小原核生物基因組的編碼序列(CDS/ORF)原核生物染色體結構GC 含量重復序列DNA鏈組成的非對稱性微生物基因組的特點微生物基因組的特點類別特征染色體結構多為一條環(huán)狀閉合雙鏈DNA基因組大小從0.16-13Mb編碼序列占基因組總長度的90%,平均為1Kb左右GC含量16.6%-74.9%DNA鏈組成的非對稱分布GCskew、ATskew、基因方向性偏好、密碼子使用偏好Circular representation of the genome of T. tengcongensis MB4原核生物基因組的編碼序列 占原核生物基因組總序列的90 基因的平均大小為1kb ORF原核生物基因組的編碼
5、序列 不同生物編碼序列的比較Organism Genome (kb) ORFs ORF size Coding Sequence(%)Buchnera sp 640 583 988 90Aquifex aeolicus 1,551 1,512 956 93Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizosaccharomyces pombe 14,000 4,820 2,033 70 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25
6、,498 460 29Homo sapiens 3,000,000 30,000 1,340 2 原核生物基因組的編碼序列 核生物(高溫菌)基因組的內含子Sulfolobus solfataricus P2: 18個tRNA基因含有單個內含子 一個胱氨酸t(yī)RNA基因含有2個內含子A.pernix tRNA基因中 發(fā)現(xiàn) 14個內含子 Staphylothermus marinus和運動脫硫球菌 23S rRNA基因中也發(fā)現(xiàn)內含子 染色體結構大多數(shù)原核生物:一條環(huán)狀閉合雙鏈DNABrucella suis 1330:兩條環(huán)狀閉合雙鏈DNA 2,107,792 bp (Chr I) 1,207,38
7、1bp (Chr II) Vibrio cholerae: 兩條環(huán)狀閉合雙鏈DNA 2,961,146 bp (Chr I) 1,072,314 bp(Chr II) Borrelia burgdorferi B31: 910,725 bp ( linear Chromosome) 21 linear and circular plasmidsTreponema pallidum:一條環(huán)狀閉合雙鏈DNA 1,138,006 bp GC 含量原核生物基因組GC含量為:16.6-74.9 %嗜溫菌基因組GC含量與 rRNA、tRNA的GC含量成正比嗜熱菌rRNA、tRNA的GC含量與 基因組GC含
8、量不成正比,但與OGT(最適生長溫度)成正比tRNA GC含量總是大于rRNA的GC含量嗜溫菌基因組G + C content (%)Organism Genome rRNA tRNA Xfas 52.7 53.1 59.8 Tpal 52.8 53.1 57.2 Mlep 57.8 55.7 61.6 Atum 59.4 54.6 58.4 Smel 62.7 54.5 61.5 Mlot 62.7 56.3 60.5 Mtub 65.6 58.0 62.0 Paer 66.6 53.1 60.1 Drad 67.0 56.5 58.8 Ccre 67.2 55.0 61.2 Hbsp 67
9、.9 58.1 62.4 linear regression 0.88 0.80嗜熱菌最適生長溫度(OGT)與GC含量的關系OrganismOGT() Genome rRNA tRNA Pabyssi 103 0.45 0.670.70 Pyro 98 0.42 0.63 0.71Aero 95 0.56 0.680.73Mjan 85 0.31 0.61 0.66 Aquae 85 0.43 0.650.68 Aful 83 0.49 0.63 0.68 Ssol 80 0.36 0.62 0.67 Tmar 80 0.46 0.63 0.65Tten 75 0.38 0.590.60 Mt
10、he 65 0.50 0.57 0.62 Tvol 60 0.40 0.53 0.61 Tacid 59 0.46 0.530.61 linear regression 0.01 0.92 0.90基因組非編碼序列的注釋非編碼區(qū)的注釋 各類重復序列 基因表達的調控序列 信號序列等 DNA鏈組成的非對稱性 GC分布不對稱 (GC skew) AT分布不對稱(AT skew)前導鏈含有較多的G(A) 而后隨鏈含有較多的C(T) 計算公式為(nG-nC)/(nG+nC) (nA-nT)/(nA+nT) 累計skew (cumulative skew)用于復制起點和終點的定位GC skew of T.
11、 tengcongensis genomeDNA鏈組成的非對稱性(真細菌) 基因方向性偏好 基因方向性偏好 (gene orientation bias) 先導鏈上編碼的基因總是多于后隨鏈 Jean R.Lobry Microbiology Today Vol 26DNA鏈組成的非對稱性 碼子使用偏好(codon usage bias) 先導鏈和后隨鏈密碼子的不同 在先導鏈,以G或T開頭或結尾的密碼子顯著地多于后隨鏈,常見的有GTG、GCG和GAG 在后隨鏈以C或A開頭或結尾的密碼子多于先導鏈,如CTC、GCC、CCC、ATC和ACC DNA鏈組成的非對稱性 基因密度和密碼子使用的差別 高度表
12、達基因: 核蛋白體蛋白基因,與翻譯和轉錄有關的因子基因,分子伴侶基因和與主要的能量代謝相關的基因 大多編碼于前導鏈通常都有密碼子偏好(核蛋白體蛋白基因密碼子的第三位多為G )快速生長的細菌(大腸桿菌、霍亂弧菌、枯草芽孢桿菌和流感嗜血桿菌) 主要的糖酵解和三羧酸循環(huán)基因為高度表達基因產甲烷菌,與甲烷代謝有關的基因為高度表達基因 高度表達基因: 那些在密碼子使用上與一般基因相差很大,與核蛋白體蛋白基因,翻譯和轉錄相關基因,伴侶-降解蛋白基因等在密碼子使用上高度相似的基因為高度表達基因。 微生物測序及分析流程圖數(shù)據(jù)分析軟件序列拼接組裝: Newbler, AMOScmp, Velvet, Phred
13、/Phrap/Consed, Oligo 6復制起始位點: ori-finder + GC skew基因注釋: Glimmer, GenemarkS, Prodigal, BLAST基因起始位點:ZCURVE翻譯起始位點:GS-FindertRNA: tRNAscan-SErRNA: RNAmmerSmall RNA: Rfam重復序列: Tandem repeat Finder, IS finderCRISPR序列:CRISPR finder數(shù)據(jù)分析軟件Prophages: Prophage finderVirulence-associated factors: VFDB databaseS
14、ignal peptides: SignalP跨膜結構:TMHMMOperon: OperonDBGenome island: IslandViewer, MobilomeFINDER致病島:PAIDB膜轉運蛋白: TCDB抗菌素抗性基因: ARDB可變遺傳因子: ACLAME必需基因:DEG database數(shù)據(jù)分析軟件Overlap基因、假基因: Mciobial Genome Submission Check功能注釋 : COG, KEGG進化樹: Clustal W, CVTree比較基因組分析: Mauve, MUMmer, ACT, MicrobesOnline, mGenomeS
15、ubtracton, xBASEFinishing階段Finishing階段Finishing階段 多重PCR結果,引自Tettelin H.等文章 Finishing階段短片段文庫構建填補二級結構區(qū)示意圖,摘自Amanda A等文章 Finishing階段 基于轉座子技術來完成重復序列區(qū)的測序,摘自Scott E等文章 微生物基因組測序策略-高通量測序技術454 長reads 測序Solexa Pair-end測序組合長reads和短reads測序Sanger法finish微生物基因組測序策略副血鏈球菌FW213基因組基本特征 Genome size(bp)2171616G+C conten
16、t(%)41.62Average CDS length(bp) 932Protein coding2059Protein with known or predicted fuction 1496(72.7%)Conserved hypothetical proteins 461(22.4%)Hypothetical proteins 102(4.9%)tRNAs61rRNA operons4副血鏈球菌FW213基因組基本特征副血鏈球菌比對結果蛋白質數(shù)據(jù)庫比對最相似基因數(shù)分布基因組名稱最相似的基因數(shù)血鏈球菌(Streptococcus sanguinis SK36)557肺炎鏈球菌(Strept
17、ococcus pneumoniae) 552戈登鏈球菌(Streptococcus gordonii str. Challis substr. CH1)233嗜熱鏈球菌(Streptococcus thermophilus)149豬鏈球菌(Streptococcus suis) 68變型鏈球菌(Streptococcus mutans UA159)42無乳鏈球菌(Streptococcus agalactiae)31化膿鏈球菌(Streptococcus pyogenes)21COG分類COG分類圖,JKL編碼信息加工和儲存的蛋白質的基因;DVTMNUO代表細胞加工和信息處理基因;CGEFH
18、IPQ是與代謝相關的基因;RS為功能未知的基因代謝途徑代謝途徑728691bp 735072bp 精氨酸操縱子示意圖,精氨酸脫亞氨酶(arginine deiminase,arcA), 鳥氨酸氨基甲酰轉移酶(ornithine carbamyltransferase,arcB), 氨甲基酶(carbamate kinase,arcC), 逆向運輸?shù)鞍?(arginine-ornithine antiporter,arcD), 二肽酶(dipeptidase,arcT)和調控蛋白(regulator,arcR) 比較基因組分析副血鏈球菌基因組和血鏈球菌基因組比對的全部MUM點陣圖。橫坐標,副血鏈
19、球菌,2171616bp; 縱坐標, 血鏈球菌。對角線代表可以對齊區(qū)域,斜率-1的對角線代表大規(guī)模的染色體倒位比較基因組分析副血鏈球菌基因組和其他六株細菌全基因組比對結果圖。a,和肺炎鏈球菌CGSP14比對的結果;b,戈登氏鏈球菌;c,變異鏈球菌;d,化膿性鏈球菌;第e,豬鏈球菌;f,嗜熱鏈球菌 比較基因組分析進化分析毒力基因基因組小島(fwislet1)基因組島(fwisland)抗藥性二元信號轉導系統(tǒng)宏基因組學和宏轉錄組數(shù)據(jù)分析流程三 微生物基因組研究的意義基因組研究在醫(yī)學的應用 基因組研究的生物技術應用 微生物的進化 A 基因組研究在醫(yī)學的應用 致病相關基因的鑒定 設計特異的實驗診斷方法
20、疫苗的研究 新型抗生素的開發(fā) 1. 致病相關基因的鑒定 通過基因組比較鑒定病原相關基因流感桿菌: 7種內毒素(脂多糖)基因25種新基因 細胞表面定居的粘附分子重復序列1. 致病相關基因的鑒定 致病相關基因的預測致病物質多為病原體細胞壁成分、 表面蛋白和一些分泌性蛋白質 PHD預測基因組的跨膜蛋白 SIGNALP預測分泌性蛋白質 1. 致病相關基因的鑒定 致病相關基因的預測(續(xù))功能相同的蛋白質往往相鄰并受共同的調控序列調控 operon同一菌種的致病菌株與非致病菌株的基因組進行比較 E. coli K12 MG 1655 4.1 + 0.53 M (528genes) E. coli O157
21、:H7 EDL 933 4.1 + 1.34 M (1387genes)2. 設計特異的實驗診斷方法尋找高度特異的核酸序列 實驗技術 PCR 雜交技術(Microarray,DNA chip) 應用 鑒定病原種類進行臨床診斷 病原分型的流行病學研究 預測疾病進展及臨床療效3. 疫苗的研究通過全基因組序列的同源性比較,尋找致病菌的屬特異、群特異、種特異、型特異、甚至亞型特異的抗原 Pizza等和Tettelin等對血清型B腦膜炎奈瑟菌近350種抗原的研究Wizemann等對肺炎鏈球菌的基因組的抗原性蛋白研究 4. 新型抗生素的開發(fā) 藥靶的特征:藥靶應是病原生物必需的,在進化上是保守的可作為藥靶的
22、微生物基因或蛋白質: 毒力基因、必需基因、菌種專一基因、獨特酶類、膜轉運蛋白等 毒力基因作為靶位毒力基因的發(fā)現(xiàn):非致病菌(E.coli K12)與致病菌( E.coli O157, 沙門氏菌,耶爾森氏菌)基因組的比較致病島(Pathogenicity islands)編碼的功能已知蛋白作為藥靶必需基因作為藥靶尋找必需基因的方法: 比較基因組:在不同進化階段保守的基因 往往是必需基因 缺失致死或轉座子插入 轉座子插入PCR尋找流感嗜血桿菌, 肺炎鏈球菌必需基因 致病菌特殊且必需的蛋白作為靶位 菌種專一基因作為藥靶尋找菌種專一基因的方法: 比較基因組方法病原生物基因組中存在但 近緣種屬中缺少的基因
23、可能是致病關鍵基因幽門螺桿菌(與大腸桿菌和流感桿菌比較)找到594個特有基因,73個編碼種專一蛋白,如丙酮酸:鐵氧還蛋白氧化還原酶,可作為靶位獨特酶類作為藥靶所有細菌獨特酶類均可作為靶位: 如: 參與細胞壁合成的酶類 葉酸合成酶類 核酸合成酶類膜轉運蛋白作為靶位衣原體和立克次體的ATP/ADP轉位酶是致病菌必需,而只有植物葉綠體、線粒體具有類似酶細菌多藥運輸?shù)鞍祝ū茫┬滦涂股氐拈_發(fā)藥靶的種類共有藥靶菌種或某菌種的致病菌株的特異性藥靶 某一部位常見致病菌的共同藥靶 新型抗生素的開發(fā)Timothy等的研究:肺炎鏈球菌,流感嗜血桿菌,腦膜炎奈瑟菌 共有基因32個 其中2個甲硫氨酸亞砜還原酶基因 疑
24、是毒力決定子 B 基因組研究的生物技術應用 生物降解作用酶工業(yè)食品生物技術抗生物質生物降解作用Deinococcus radiodurans:抵御放射性物質Thermotoga maritima:降解單體或復合植物 聚合物, 如木聚糖和纖維素Dehalococcoides ethenogenes:降解四氯乙烯Pseudomonas putida:降解多種毒性有機廢料, 包括多種芳香族化合物酶工業(yè)Thermotoga maritima:耐熱Aquifex aeolicus:耐熱Methanogenium frigidum:耐寒Halobacterium:耐鹽,降解塑料Pseudomonas pu
25、tida:降解塑料食品生物技術Lactococcus latis: 生產發(fā)酵食品,微生物營養(yǎng)添加劑抗生物質Streptomyces coelicolor: 生產抗生素,用于人類,獸醫(yī)和農業(yè)Photorhabdus luminescens: Bacillus thuringiensis Xenorhabdus nematophilus 產生殺昆蟲毒素蛋白 轉基因抗昆蟲植物C 微生物的進化 基于16S rDNA的系統(tǒng)進化樹: Woese等的生物 三域 真細菌域、古生菌域和真核生物域 單個基因的進化并不等同于物種的進化 基因的水平轉移 基因的水平轉移 的意義研究微生物的進化史研究菌種新功能的來源研究
26、微生物的生命過程預測基因功能基因水平轉移的方式轉化接合轉導鑒定基因水平轉移的方法 鑒定基因組區(qū)段的組成 比較不同基因的系統(tǒng)發(fā)生 最大相似性分析 基因在生物的分布譜 易被水平轉移的基因難被轉移的基因:informational genes 進化核心基因易被轉移的基因:operational genes 氨酰tRNA合成酶基因 剪切因子 重組酶 DNA聚合酶原核生物轉錄組學研究The transcriptomes of prokaryotic have been largely overlooked. It is primary advance in prokaryotic transcriptomics through new sequen-cing technologies in combination with mRNA enrichment and tilling array.原核轉錄組-mRNA en
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024教師個人師德工作計劃10
- 特許金融分析師考試知識積累試題及答案
- 旅游景點介紹及使用指南
- 幼兒水果繪本課件
- 2025屆安徽省江南十校聯(lián)考高三下學期一模歷史試題(含解析)
- 特許金融分析師必考知識試題及答案
- 2024年特許金融分析師考試備考日程及答案
- 數(shù)據(jù)分析與CFA試題及答案
- 2025年四川省成都市高考英語二診試卷
- 2024年CFA金融考試試題及答案
- 液壓與氣壓傳動全書ppt課件匯總(完整版)
- 中學生樂團組建與訓練分析
- DB62∕T 25-3103-2015 公路隧道防火涂料施工質量驗收規(guī)程
- pantone色卡電子版U面
- DB44∕T 581-2009 廣東城市綠化工程施工和驗收規(guī)范
- 大氣簡約深藍色商務匯報總結PPT模板課件
- 人教版一年級下冊數(shù)學 6.100以內數(shù)的組成專項卷
- 中小學教育懲戒規(guī)則(試行)全文解讀ppt課件
- 布魯克納操作手冊
- ncstudiov5_4編程手冊
- 建坐標系解立體幾何(含解析)
評論
0/150
提交評論