版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、人類群體遺傳學(xué)基本原理和分析方法,中科院-馬普學(xué)會計(jì)算生物學(xué)伙伴研究所,中國科學(xué)院上海生命科學(xué)研究院研究生課程 人類群體遺傳學(xué),徐書華 金 力,20082009學(xué)年第二學(xué)期人類群體遺傳學(xué)分析方法課程表 上課時(shí)間:每周四上午10:00-11:50 上課地點(diǎn):中科大廈4樓403室第7教室,第一講 Hardy-Weinberg平衡檢驗(yàn)及其應(yīng)用,Hardy-Weinberg Equilibrium (HWE)定律 HWE的偏離(固定指數(shù)) HWE的偏離( Wahlund定律) HWE在單基因遺傳疾病研究中的應(yīng)用 HWE在多基因復(fù)雜疾病研究中的應(yīng)用 檢驗(yàn)HWE的常用方法和軟件 全基因組數(shù)據(jù)中的HWE檢驗(yàn)
2、問題,Why do students need to know Hardy-Weinberg Equilibrium?,As Thomas Merten (1992) states: If you have ever been asked questions such as the ones that follow, you begin to see why studying population genetics might be useful: 1. Im confused! How can O be the most common of the blood types if it is
3、a recessive trait? 2. If Huntingtons disease is a dominant trait, shouldnt three-fourths of the population have Huntingtons while one-fourth have the normal phenotype? 3. Shouldnt recessive traits be gradually swamped out so they disappear from the population?,基本概念,突變(mutation) 遺傳多態(tài)性(genetic polymor
4、phism) 遺傳座位(locus) 等位基因(allele) 核苷酸位點(diǎn)(nucleotide) 序列(sequence) 位點(diǎn)(site) 分離位點(diǎn)(segregating site),基本概念,單倍體(haploid)、二倍體(diploid) 基因型(genotype) 雜合子(heterozygote)、純合子(homozygotye) 等位基因頻率(allele frequency) 基因型頻率(genotype frequency),一個群體由N個個體組成,其中有一對常染色體等位基因A, a,其頻率分別以p、q表示 。 可能的基因型為AA,Aa,aa三種,其頻率分別以D、H、R表
5、示,其中D+H+R=1。,若群體中有,n1 AA n2 Aa n3 aa N=n1+n2+n3,合計(jì),1,計(jì)算基因型頻率,等位基因A的頻率,等位基因a的頻率,其中,p+q=D+H/2+H/2+R=1,計(jì)算等位基因頻率,精 子 A(p) a(q) 卵 A(p) AA(p2) Aa(pq) 子 a(q) Aa(pq) aa(q2) 由表可見子代基因型組成:p2+2pq+q2=1 這里基因型AA的頻率為p2,基因型aa的頻率為 q2,基因型Aa的頻率為2pq。 AA:Aa:aa= p2:2pq:q2,子一代向下一代提供的配子中兩種基因頻率分別是: A=p2+1/2(2pq)=p2+pq=p(p+q)
6、=p a=q2+ 1/2(2pq)=q2+pq=q(p+q)=q 由此可見,子代基因A的頻率仍然是p,基因a的頻率仍然是q,而且將以這種頻率在所有世代傳遞下去,這就是遺傳平衡。,p2 2pq q2,Hardy-Weinberg平衡定律,Hardy-Weinberg平衡定律,群體中的等位基因頻率以及基因型頻率并不隨世代的推移而變化。,保持群體HWE的理論條件,Random mating No differential fertility of the genotypes Equal genotype frequencies in the two sexes No mutation No immi
7、gration No differential emigration No differential viability Infinite population size,人類進(jìn)化中的5個基本動力元素,突變(mutation) 婚配 (random mating) 選擇 (selection) 漂變 (drift) 遷移 (migration),現(xiàn)代人群是一個HWE群體嗎?,有趣的是,對于一個特定的地理群體,絕大部分基因組區(qū)域處于HWE狀態(tài)。,HWE平衡群體的性質(zhì)(1),雜合體的比例為H=2pq,H的最大值為1/2,當(dāng)q=1/2,p=1/2時(shí),H取最大值1/2,HWE平衡群體的性質(zhì)(2),Aa
8、Aa的交配頻率永遠(yuǎn)為AAaa交配頻率的2倍 AaAa=H2=4p2q2 AAaa=2DR=2p2q2,因此,隱性基因“a”在群體中不易消失,總是保持一定頻率。當(dāng)一般群體中隱性個體稀少的時(shí)候,其中大多數(shù)為AaAa交配的后代。,例如 人類白化病被認(rèn)為是一個簡單的隱性性狀,某地白化病的嬰兒的發(fā)病率q2 (aa)=1/10000 , q(a)=1/100 但群體中,雜合子的比例要大得多,其中由AaAa得到的aa個體占,當(dāng)q很小時(shí),p=1,則H-Ws law取得一種極限形式,H=2q 差不多所有的隱性基因都處于雜合狀態(tài)中,雜合子個體的比例約為隱性基因頻率的兩倍。上述白化病 q=0.01,一般q2可看作發(fā)
9、病率,雜合子的頻率=2,HWE平衡群體的性質(zhì)(3),HWE在單基因遺傳疾病研究中的應(yīng)用,計(jì)算基因型頻率 隨機(jī)交配時(shí)純合子(基因型)的頻率可用配子(基因)頻率平方求得 ; 雜合子頻率=2x隱性等位基因頻率(如前所述). 計(jì)算隱性性狀的發(fā)病率(出生前死亡) 計(jì)算等位基因頻率,計(jì)算等位基因頻率(隱性),如已知某種常染色體隱性遺傳病(白化?。┰谝惶囟ㄈ巳褐蓄l率,就能計(jì)算這個異?;虻臄y帶者和基因頻率。白化病發(fā)?。╝a)(q2)的頻率為110000,即其基因型頻率,則致病基因(a)頻率1/100= 0.01;基因A的頻率10.01=0.99;而雜合子攜帶者的頻率為2pq=2991001100150。因此
10、,在比例中,每個受累的個體將有200個左右在臨床上無癥狀的攜帶者。,計(jì)算等位基因頻率(顯性),常染色體顯性遺傳病,如并指癥,在一個群體多為雜合子(Aa)發(fā)病。 雜合子(H)的頻率為2pq,由于q值大,近于1,故H2p,p=1/2H。因此,只要知道雜合子發(fā)病率,就易求得基因A的頻率。如并指癥的發(fā)病率為 11000,H12000,p=1/2H=1/4000,即致病基因A的頻率為0.000025。,在已知某一性狀頻率的群體中,確定等位基因頻率和雜合子攜帶者頻率。,例如:已知白化病的發(fā)病率為1/20000,求白化病致病基因頻率q和攜帶者頻率。 白化病為AR遺傳病,患者為致病基因的純合子,因此: 發(fā)病率
11、(aa) = q2 = 1/20000 a= q =0.007 A=p = 1 q =0.993 攜帶者頻率(Aa) = 2pq = 2 0.993 0.007 = 0.0139 這提示人群中有1.4%為白化病致病基因攜帶者,對于遺傳咨詢很重要。,對于一種罕見的AD遺傳病 致病基因頻率p很低,p2可以忽略,因此: 2pq p2 + 2pq 患者幾乎都以雜合子形式出現(xiàn),=1, 對于一種罕見的XD遺傳病 致病基因頻率p很低,正?;蝾l率q1 男性患者 = 致病基因頻率 = p 女性患者 = p2 + 2pq = 2p 男性患者 女性患者 女性患病率是男性患病率的2倍,= 1/2, 對于一種罕見的A
12、R遺傳病 致病基因頻率q很低,正?;蝾l率p1 : 雜合攜帶者頻率 = 2pq =2q 即雜合攜帶者頻率約為致病基因頻率的2倍。 雜合攜帶者 2pq 2 純合患者 q2 q 提示: 致病基因頻率q越低,致病基因在群體中主要以雜合攜帶者形式存在。,=,=, 對于一種罕見的XR遺傳病 致病基因頻率q很低, 男性患者 = 致病基因頻率 = q 女性患者 = 致病基因頻率的平方 = q2 男性患者 q 1 女性患者 q2 q 提示:疾病越罕見,q越低,女性患者越罕見。,=,=,HWE的偏離(固定指數(shù)),固定指數(shù)(F): 如果一個座位上有兩個等位基因,Hardy-Weinberg比率的任何偏差可以由參量
13、F來度量,F(xiàn)稱為固定指數(shù),則基因型頻率可以由下式給出:,由以上第二式可得:,固定指數(shù)F可正可負(fù),視情況而定。 可以看出,當(dāng)h0小于h時(shí),F(xiàn)取正值;當(dāng)h0大于h時(shí),F(xiàn)取負(fù)值。在近親交配時(shí),雜合子頻率的觀察值減小,F(xiàn)就取正值。,隨機(jī)交配(h)情況下雜合子的預(yù)期頻率,群體(h0)中下雜合子的觀察頻率,上式可寫成,亞群體(sub-population),以上考慮的是一個簡單的群體,不論其是否近親交配。 然而,實(shí)際上大多數(shù)的自然群體可被再分為許多不同的繁殖單位或亞群體(sub-population),盡管這些群體并不是完全隔離的。這種情況下,研究群體內(nèi)和群體間的遺傳變異就顯得十分重要。,可再分群體中的基
14、因型頻率,假定一個群體可分為s個亞群體,每一個亞群體都滿足Hardy-Weiberg平衡。設(shè)xk為第k個亞群體中等位基因A1的頻率,則基因型A1A1,A1A2,A2A2的頻率分別為,我們用wk來表示第k個亞群體的相對大小,且總和為1。則A1A1,A1A2,A2A2在整個群體中的頻率為:,其中,和,是亞群體中等位基因頻率的均值和方差。,可再分群體中的固定指數(shù),比較,我們知道,,因此,表明如果一個群體被分為多個交配單位,純合子的頻率要高于Hardy-Weinberg比率。這個性質(zhì)首先由Wahlund(1928)發(fā)現(xiàn),被稱為Wahlund定律,也稱Wahlund現(xiàn)象。 當(dāng)?shù)任换蝾l率在所有亞群體中一
15、致時(shí),F(xiàn)為0;而當(dāng)每個亞群體都被固定為某一個等位基因時(shí),F(xiàn)為1。,HWE的偏離(Wahlund定律),Wahlund現(xiàn)象的啟示,群體結(jié)構(gòu)(population structure)的存在! 反之,當(dāng)F為負(fù)值的時(shí)候,,雜合子頻率比Hardy-Weinberg平衡時(shí)預(yù)期的要高,意味著雜合優(yōu)勢,某種程度的自然選擇發(fā)生。,雜合優(yōu)勢與平衡選擇(后面“自然選擇”章節(jié)細(xì)談),檢驗(yàn)HWE的常用方法,X2-test,觀察值,期望值,實(shí)例,例 MN血型基因頻率的計(jì)算,結(jié)論:三個基因型頻率的觀察值與HWE定律所期望的頻率沒有顯著差異。,精確檢驗(yàn),Am.J.Hum.Genet 2005, 76:887-893,HWE
16、在復(fù)雜疾病遺傳研究中的應(yīng)用,數(shù)據(jù)分析中,檢測可能的數(shù)據(jù)質(zhì)量問題(typing error)。 Case-control study 一般要求所有檢測位點(diǎn)在control中處于HWE。 多個位點(diǎn)處于HWD暗示近親婚配或群體結(jié)構(gòu)的存在。 在排除其他可能的因素以后,篩選可能受到自然選擇的基因。,全基因組數(shù)據(jù)中的HWE檢驗(yàn)問題,Affymetrix 500K, Illumina 650K 多重檢驗(yàn)(multiple testing)問題 If you have 10,000 genes in your genome, and perform a statistical analysis, a p-va
17、lue cutoff of 0.05 allows a 5% chance of error. That means that 500 genes out of 10,000 could be found to be significant by chance alone.,多重檢驗(yàn)校正方法,Bonferroni correction Bonferroni Step-down (Holm) correction Westfall and Young Permutation Benjamini and Hochberg False Discovery Rate,Bonferroni correc
18、tion,The p-value of each gene is multiplied by the number of genes in the gene list. If the corrected p-value is still below the error rate, the gene will be significant: Corrected P-value= p-value * n (number of genes in test) 0.05 As a consequence, if testing 1000 genes at a time, the highest acce
19、pted individual p-value is 0.00005, making the correction very stringent. The expected number of false positives will be 0.05.,Bonferroni Step-down (Holm) correction,This correction is very similar to the Bonferroni, but a little less stringent: 1) The p-value of each gene is ranked from the smalles
20、t to the largest. 2) The first p-value is multiplied by the number of genes present in the gene list; if the end value is less than 0.05, the gene is significant; Corrected P-value= p-value * n 0.05 3) The second p-value is multiplied by the number of genes less 1. Corrected P-value= p-value * n-1 0
21、.05 4) The third p-value is multiplied by the number of genes less 2. Corrected P-value= p-value * n-2 0.05 It follows that sequence until no gene is found to be significant.,Westfall and Young Permutation,The Westfall and Young permutation follows a step-down procedure similar to the Holm method, c
22、ombined with a bootstrapping method to compute the p-value distribution: 1) P-values are calculated for each gene based on the original data set and ranked. 2) The permutation method creates a pseudo-data set by dividing the data into artificial treatment and control groups. 3) P-values for all gene
23、s are computed on the pseudo-data set. 4) The successive minima of the new p-values are retained and compared to the original ones. 5) This process is repeated a large number of times, and the roportion of resampled data sets where the minimum pseudo-p-value is less than the original p-value is the adjusted p-value. Because of the permutations, the method is very slow.,Benjamini and Hochberg False Discovery Rate,This correction is the least stringent of all 4 options, and therefo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肇慶學(xué)院《管理會計(jì)模擬實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 企業(yè)員工績效質(zhì)量個人貢獻(xiàn)度評價(jià)體系
- 保險(xiǎn)行業(yè)投資分析模板
- 20XX年度績效總結(jié)模板
- 房地產(chǎn)經(jīng)紀(jì)操作實(shí)務(wù)-2019年房地產(chǎn)經(jīng)紀(jì)人協(xié)理《房地產(chǎn)經(jīng)紀(jì)操作實(shí)務(wù)》真題匯編
- 人資行政崗位述職報(bào)告模板
- 有關(guān)保護(hù)環(huán)境的調(diào)查報(bào)告
- 二零二五版帶利息支付的商業(yè)匯票貼現(xiàn)合同樣本3篇
- 陜西省西安市部分學(xué)校2024-2025學(xué)年高一上學(xué)期第四次階段性檢測化學(xué)試卷(含答案)
- 二零二五年度高速公路鋼筋材料供應(yīng)協(xié)議3篇
- 2025寒假散學(xué)典禮(休業(yè)式)上校長精彩講話:以董宇輝的創(chuàng)新、羅振宇的堅(jiān)持、馬龍的熱愛啟迪未來
- 安徽省示范高中2024-2025學(xué)年高一(上)期末綜合測試物理試卷(含答案)
- 安徽省合肥市包河區(qū)2023-2024學(xué)年九年級上學(xué)期期末化學(xué)試題
- 《酸堿罐區(qū)設(shè)計(jì)規(guī)范》編制說明
- PMC主管年終總結(jié)報(bào)告
- 售樓部保安管理培訓(xùn)
- 倉儲培訓(xùn)課件模板
- 2025屆高考地理一輪復(fù)習(xí)第七講水循環(huán)與洋流自主練含解析
- GB/T 44914-2024和田玉分級
- 2024年度企業(yè)入駐跨境電商孵化基地合作協(xié)議3篇
- Art285 中國視覺藝術(shù)史
評論
0/150
提交評論