重測序bsa分析項(xiàng)目結(jié)題報(bào)告大基因組_第1頁
重測序bsa分析項(xiàng)目結(jié)題報(bào)告大基因組_第2頁
重測序bsa分析項(xiàng)目結(jié)題報(bào)告大基因組_第3頁
重測序bsa分析項(xiàng)目結(jié)題報(bào)告大基因組_第4頁
重測序bsa分析項(xiàng)目結(jié)題報(bào)告大基因組_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

項(xiàng)目概 合同關(guān)鍵指 項(xiàng)目基本信 項(xiàng)目執(zhí)行情 項(xiàng)目結(jié)果概 項(xiàng)目流 實(shí)驗(yàn)流 信息分析流 生物信息學(xué)分 3.1數(shù)據(jù)質(zhì) 原始數(shù)據(jù)介 堿基質(zhì)量分 堿基類型分 低質(zhì)量數(shù)據(jù)過 數(shù)據(jù)統(tǒng) 與參考組比對統(tǒng) 比對結(jié)果統(tǒng) 插入片段分布統(tǒng) 深度分布統(tǒng) SNP檢測與注 樣品與參考組間SNP的檢 樣品之間SNP的檢 SNP結(jié)果注 SmallInDel檢測與注 樣品與參考組間SmallInDel的檢 樣品之間SmallInDel檢 SmallInDel的注 關(guān)聯(lián)分 高質(zhì)量SNP篩 SNP-index方法關(guān)聯(lián)結(jié) ED方法關(guān)聯(lián)結(jié) 候選區(qū)域篩 候選區(qū)域的功能注 候選區(qū)域的SNP注 候選區(qū)域的注 候選區(qū)域內(nèi)的GO富集分 候選區(qū)域內(nèi)的KEGG富集分 候選區(qū)域內(nèi)COG分類統(tǒng) 結(jié)果可視 數(shù)據(jù)..................................................................................................................結(jié)果文件查看說 參考文 合同關(guān)鍵指完成4個(gè)樣品的重,共產(chǎn)生240GbpCleanData,保證Q30達(dá)到80%數(shù)據(jù)評估:數(shù)據(jù)量,數(shù)據(jù)質(zhì)量和GC含量的統(tǒng)計(jì)與組比對:比對效率,組覆蓋度,組覆蓋深度統(tǒng)計(jì)關(guān)聯(lián)分析:通過計(jì)算兩個(gè)混池間等位的型頻率確定與目標(biāo)性狀關(guān)候選SNPSNP候選注釋對關(guān)聯(lián)區(qū)域內(nèi)的進(jìn)行GOKEGGCOGNRSwissProt項(xiàng)目基本信樣品信息樣品編 BMK編 混池 混池 參考組信息根據(jù)向日葵的組大小以及GC含量等信息,最終選取向日葵組作為參考組。物種信息:向日葵(Helianthus版本號為HanXRQr1.0,向日葵(HelianthusannuusL.)組項(xiàng)目執(zhí)行情88。。樣品檢測合格時(shí)間為項(xiàng)目啟動時(shí)間為2018項(xiàng)目分析完成時(shí)間為2018 共獲得240.20Gbp數(shù)據(jù)量,過濾后得到的CleanBases為236.92Gbp,Q30達(dá)到80%。樣品與參考組平均比對效率為97.61%,平均覆蓋深度為18.50X,基因組覆蓋度為91.93%(至少一個(gè)堿基覆蓋)。SNP檢測:親本之間共獲得5,253,185個(gè)SNP,其中非同義突變的SNP共InDel檢測:親本之間共獲得963,013個(gè)SmallInDel;混池之間共獲得356,710個(gè)SmallInDel。域,總長度為28.88Mb;ED關(guān)聯(lián)算法,共得到12個(gè)與性狀相關(guān)的區(qū)域,總長度為61.31Mb,兩種方法取交集得到11個(gè)與性狀相關(guān)的區(qū)域,總長度為28.88InDel結(jié)果:InDel-index關(guān)聯(lián)算法,共得到18個(gè)與性狀相關(guān)的區(qū)域,總長度兩種方法取交集得到19個(gè)與性狀相關(guān)的區(qū)域,總長度為28.84Mb。義突變244個(gè),移碼突變69個(gè)。實(shí)驗(yàn)流文庫質(zhì)量檢測和上機(jī),具體流程如下:經(jīng)質(zhì)檢合格后通過IlluminaHiSeqTM進(jìn)序。信息分析流信息分析的內(nèi)容包括:數(shù)據(jù)質(zhì)控(去除接頭和低質(zhì)量數(shù)據(jù))、與參考組比對、變異檢測與注釋(SNP、InDel)、關(guān)聯(lián)分析、候選SNP及候選的注釋。重BSA生物信息分析具體流程如下圖所示數(shù)據(jù)質(zhì)原始數(shù)據(jù)介Data或RawReads,結(jié)果以FASTQ(簡稱為fq)文件格式,其中包含序。(Reads)的序列信息以及其對應(yīng)的質(zhì)量信息樣品中真實(shí)數(shù)據(jù)隨機(jī)截取。 :110:C3B41ACXX:4:1101:1401:21631:N:0:TAAGGCFASTQ格式文件中每個(gè)Read由四行描述,其中第一行以“@”開頭,隨后為Illumina識別符(SequenceIdentifiers)和描述文字(選擇性部分);第二行是是對應(yīng)序列的質(zhì)量。Illumina識別符(SequenceIdentifiers)詳細(xì)信息見如下Illumina標(biāo)識詳細(xì)信 Uniqueinstrument Run Flowcell Flowcell Tilenumberwithintheflowcell 'x'-coordinateoftheclusterwithinthe 'y'-coordinateoftheclusterwithinthe Memberofapair,1or2(paired-endormate-pairreadsonly) Yifthereadfailsfilter(readisbad),Notherwise 0whennoneofthecontrolbitsareon,otherwiseitisaneven Index的質(zhì)量值。如果錯(cuò)誤率用e表示,Illunima的堿基質(zhì)量值用Qphred表示,則Qphred=-IllunimaCasava1.8版本錯(cuò)誤率與質(zhì)量值簡明對應(yīng)關(guān)系如下表所示.5?I堿基識別(BaseCalling)分析軟件:IllunimaCasava1.8版本參數(shù):雙端(Pairedend,PE)堿基質(zhì)量分每個(gè)堿基錯(cuò)誤率是通過Phred數(shù)值(Phredscore,Qphred)得到,而在,模板固定到上,在固定DNA模板的過程中,每個(gè)DNA分子會形成一個(gè)簇,一個(gè)簇就是一個(gè)位點(diǎn)在進(jìn)行固定過程中極少量的簇與簇之間物理位置會發(fā)生,在時(shí)軟件通過前4個(gè)堿基對這些的點(diǎn)進(jìn)行分析和識別將這些點(diǎn)位置分開,保證每個(gè)點(diǎn)測到的是一個(gè)DNA分子,因此序列5′端前幾個(gè)堿基的錯(cuò)誤率相對較高。另外錯(cuò)誤率會隨著序列(SequencedReads)的長度的增加而升高,這是由于過程中化學(xué)試劑的消耗而導(dǎo)致的。因此在進(jìn)行堿基質(zhì)量分布分析時(shí)樣品的堿基質(zhì)量分布4個(gè)堿基和后十幾個(gè)堿基的質(zhì)量值會低于中間,堿基,但其質(zhì)量值都高于Q30,根據(jù)質(zhì)量值和錯(cuò)誤率的關(guān)系,質(zhì)量值轉(zhuǎn)注:橫坐標(biāo)為reads的堿基位置,縱坐標(biāo)為單堿基錯(cuò)誤率,前151bp為雙端序列的第一端reads的錯(cuò)誤率分布情況,后151bp為另一端reads的錯(cuò)誤率分布情況。堿基類型AT、GC分離現(xiàn)象,這種分離現(xiàn)象可能是建庫過程中差異擴(kuò)增引起的,直接影響到后續(xù)的分析。高通量的序列為組隨機(jī)打斷后的DNA片段,位點(diǎn)在整個(gè)組的分布是近似均勻的,同時(shí)根據(jù)堿基互補(bǔ)配對的原則,A與T和C與G的含量分別是一致的。由于儀器本身的局限性,A/T和C/G含量可能存在著一定波動。列的第一端reads的堿基分布,后151bp為另一端reads的堿基分布。每個(gè)cycle代表的每個(gè)堿基,如第一即表示該項(xiàng)目所有在第一個(gè)堿基的 該圖的結(jié)果顯示AT、CG堿本不發(fā)生分離,且曲線較平緩,說明結(jié)果低質(zhì)量數(shù)據(jù)過得到的原始序列(SequencedReads)或者RawReads,里面含有帶接該P(yáng)air-endreads。 PM注:BMKID:百邁客對項(xiàng)目樣品的統(tǒng)一編號;Raw_Reads:原始reads數(shù);Adapter_Related:含接頭被過濾數(shù)據(jù)各樣 產(chǎn)出數(shù)據(jù)評估結(jié)果如下表所示PM 與參考組比對統(tǒng)重獲得的reads需要重新定位到參考組上,才可以進(jìn)行后續(xù)變異分析。bwa[2]軟件主要用于二代高通量(如Illunima等平臺)得到的短序列與參考組的比對。通過比對定位CleanReads在參考組上的位置,統(tǒng)計(jì)各樣品的深度、組覆蓋度等信息,并進(jìn)行變異的檢測。比對結(jié)果統(tǒng)樣品的比對結(jié)果見下表BMK 注:BMKID:百邁客對項(xiàng)目樣品的統(tǒng)一編號;Total_Reads:Total_Reads數(shù),雙端分別統(tǒng)計(jì),即read1和read2記為2條reads;Mapped(%):定位到參考組的CleanReads數(shù)占所有CleanReads數(shù)的百分比;Properlymapped:雙端序列均定位到參考組上且距離符合片段的長度分布。此項(xiàng)目樣品的平均比對效率均在90%以上,說明樣品正常插入片段分布的片段的實(shí)際大小,即插入片段大小(InsertSize),是信息分析時(shí)的一個(gè)重要參每個(gè)樣品數(shù)據(jù)插入片段大小分布的分析使用picard軟件工具包由上圖可知插入片段長度分布符合正態(tài)分布說明數(shù)據(jù)文庫構(gòu)建無異常深度分布統(tǒng)Reads定位到參考組后可以統(tǒng)計(jì)參考組上堿基的覆蓋情況參考組上被reads覆蓋到的堿基數(shù)占組的百分比稱為組覆蓋度;堿基上覆蓋的組覆蓋度可以反映參考組上變異檢測的完整性,覆蓋到的區(qū)域越多,可以檢測到的變異位點(diǎn)也越多。覆蓋度主要受深度以及樣品與參考組親緣序列區(qū)),變異檢測的準(zhǔn)確性也越高。另外,若組上堿基的覆蓋深度分布較均勻,也說明隨機(jī)性較好。注:上圖反映了深度分布的基本情況,橫坐標(biāo)為深度,左縱坐標(biāo)為該深度對應(yīng)的堿基所占百分比,對各樣品的平均覆蓋深度和各深度對應(yīng)的組覆蓋比例如下表所示BMKP9M注:BMKID:百邁客對項(xiàng)目樣品的統(tǒng)一編號;Ave-depth:樣品平均覆蓋深度;Cov_ratio:覆蓋深度在給定深 由上表可知此項(xiàng)目組平均覆蓋深度約為18.5×組覆蓋度約為根據(jù)各位點(diǎn)的覆蓋深度情況進(jìn)行作圖,若覆蓋深度在上的分布比較均勻,則可以認(rèn)為隨機(jī)性比較好。樣品的覆蓋深度分布見下圖:由上圖可以看出組被覆蓋的較均勻,說明隨機(jī)性較好。圖上深度不均一的地方可能是由于重復(fù)序列、PCR偏引起的。SNP檢測與注樣品與參考組間SNP的檢SNP的檢測主要使用GATK[3]軟件工具包實(shí)現(xiàn)根據(jù)CleanReads在參考組的Realignment)、堿基質(zhì)量值校正(BaseRecalibration)等預(yù)處理,以保證檢測得到的SNP準(zhǔn)確性,再使用GATK進(jìn)行單核苷酸多態(tài)性(SingleNucleotidePolymorphism,對于BWA比對得到的結(jié)果,使用Picard的MarkDuplicate使用GATK進(jìn)行堿基質(zhì)量值再校準(zhǔn)(BaseRecalibration),對堿基的質(zhì)量值使用GATK進(jìn)行變異檢測(variantcalling),主要包括SNP和InDel變異結(jié)果使用vfvf其中注釋行包含文件數(shù)據(jù)行的IO和FT列中使用的各種標(biāo)識符的意釋,而標(biāo)題行和數(shù)據(jù)行包含各樣品的變異檢測結(jié)果信息,格式如下所示:QUALFILTE .GA [ANNOTATIONS]GT:AD:DP:GQ:PL0.AG [ANNOTATIONS]GT:AD:DP:GQ:PL0.CT [ANNOTATIONS]GT:AD:DP:GQ:PL0.AG [ANNOTATIONS]GT:AD:DP:GQ:PL0 參考序列的名23.4G5A67過濾狀89樣品的型信vcfSNPreadsSNP之間的距離累積圖SNP類型的變異分為轉(zhuǎn)換和顛換兩種,同種類型堿基之間突變稱為轉(zhuǎn)換于二倍體或者多倍體物種,若同源上的某一SNP位點(diǎn)均為同一種堿基,則該SNP位點(diǎn)稱為純合SNP位點(diǎn);若同源上的SNP位點(diǎn)包含不同類型的堿基,則該SNP位點(diǎn)稱為雜合SNP位點(diǎn)。純合SNP數(shù)量越多,則樣品與參考組之間差異樣品之間SNP的檢根據(jù)樣品與參考組的比對結(jié)果,匯總樣品之間所有有差異的變異位點(diǎn),各PMCCTCCGGAGGAATAACNTCCTNCTTCCTCCTTCTT 意 意 AC(aMino GC(Strong AT(Weak GTC(notA)(BcomesafterA) GAT(notC)(DcomesafterC) GA(puRine) ACT(notG)(HcomesafterG) TC GCA(notT,notU)comesafter GT AGCT樣品間SNPSNP結(jié)果注據(jù)變異位點(diǎn)在參考組上的位置以及參考組上的位置信息,可以得到變異位點(diǎn)在組發(fā)生的區(qū)域(間區(qū)、區(qū)或CDS區(qū)等),以及變異產(chǎn)生的影 Amino_Acid_Change|Amino_Acid_Length|Gene_Name|Gene_Coding|Transcript_ID|WARNINGS]|Genotype_Number[||||類 意 Effect 變異影響大?。℉igh,ModerateLowFunctionalClass 功能分類(NONE,SILENT,MISSENSE,NONSENSE) 編碼蛋白(CODING| Exon/Intron 變異的型位 。PvsB1vs 00M和B1vsB2為兩個(gè)樣品間存在的對應(yīng)類型的SNP數(shù)量。 間 非同義的起始子突 起始子丟 終止子獲 終止子丟 同義終止子突 SmallInDel檢測與注樣品與參考組間SmallInDel的檢根據(jù)樣品的CleanReads在參考組上的定位結(jié)果,檢測樣品與參考組之檢測。SmallInDel變異一般比SNP變異少,同樣反映了樣品與參考組之間的差異,并且編碼區(qū)的InDel會引起移碼突變,導(dǎo)致功能上的變化。樣品之間SmallInDel檢根據(jù)樣品與參考組的SmallInDel檢測結(jié)果,提取樣品之間有差異的變異位點(diǎn),即樣品之間的SmallInDel變異位點(diǎn)。部分結(jié)果如下表所示:WA1參考序列的名23C4致;0/1:雜合類型;1/1:純合且與參考樣品間SmallInDelSmallInDel的注根據(jù)樣品檢測得到的SmallInDel位點(diǎn)在參考組上的位置信息,對比參考基因組的、CDS位置等信息(一般在gff文件中),可以注釋InDel位點(diǎn)是否發(fā)生在因間區(qū)、區(qū)或CDS區(qū)、是否為移碼突變等。SmallInDel的注釋通過SnpEff軟件實(shí)現(xiàn)。發(fā)生移碼突變的InDel可能會導(dǎo)致功能的改變,具體注釋結(jié)果見下表:PvsB1vs 12801M和B1vsB2為兩個(gè)樣品間存在的對應(yīng)類型的InDel數(shù)量。 間 下游區(qū)域(5K以內(nèi))

非子邊界上的3的整數(shù)倍的刪除非子邊界上的3的整數(shù)倍的插 起始子丟 終止子獲 終止子丟 關(guān)聯(lián)分高質(zhì)量SNP篩在關(guān)聯(lián)分析前,首先對SNP進(jìn)行過濾,過濾標(biāo)準(zhǔn)如下:首先過濾掉有多個(gè)型的SNP位點(diǎn),其次過濾掉read支持度小于4SNP位點(diǎn),再次過濾掉混池之間型一致的SNP位點(diǎn)以及隱性混池不是來自于隱性親本的SNP位點(diǎn),最終得到高質(zhì)量的可信SNP278,783個(gè)。SNPRead支持度小4的位點(diǎn)高質(zhì)量B1vs SNP-index方法關(guān)聯(lián)結(jié)SNP-index是近年來的一種通過混池間的型頻率差異進(jìn)行標(biāo)記關(guān)聯(lián)分析的方法[7],主要是尋找混池之間型頻率的顯著差異,用Δ(SNP-index)統(tǒng)計(jì)。標(biāo)記SNP與性狀關(guān)聯(lián)度越強(qiáng),Δ(SNP-index)1。Maa表示aa池來源于母本的深度;Paa表示aa池來源于父本的深度;Mabab池來源于母本的深度;Pab表示ab池來源于父本的深度;為了消除假陽性的位點(diǎn),利用標(biāo)記在組上的位置,可對同一條上標(biāo)擬合,取每個(gè)SNP左右距離各2M的SNP的△SNP-index的中值作為該位點(diǎn)擬合后池分別的SNP-index及△SNP-index的分布如下圖所示:SNP-index關(guān)聯(lián)值在上的分注:橫坐標(biāo)為名稱,彩色的點(diǎn)代表計(jì)算出來的SNP-index(或SNP-index)值,黑色的線為擬合后的SNP-index(或SNP-index)值。上圖是B1混池的SNP-index值的分布圖;中圖是B2混池的SNP-index值的0.95的閾值線,綠色的線代表置信度為0.90為了充分利用數(shù)據(jù),將閾值降低以尋找比較可能的定位區(qū)域,利用擬合后Δ含626個(gè),其中非同義突變的共280個(gè)。ChromosomeGene--以Mb為單位;Genenumber:關(guān)聯(lián)區(qū)域內(nèi)的數(shù)量。ED方法關(guān)聯(lián)歐式距離(EuclideanDistance,ED)算法,是利用數(shù)據(jù)尋找混池間存在顯著差異標(biāo)記,并以此評估與性狀關(guān)聯(lián)區(qū)域的方法[9]。理論上,BSAED0。ED方法的計(jì)算公式如下所示,ED值越大表明該標(biāo)記在兩混Amut為A堿基在突變混池中的頻率,Awt為A堿基在野生型混池中的頻率;CmutC堿基在突變混池中的頻率,CwtC堿基在野生型混池中的頻率;Gmut為G堿基在突變混池中的頻率,Gwt為G堿基在野生型混池中的頻率;Tmut為T堿基在突變混池中的頻率,Twt為T堿基在野生型混池中的頻率。在進(jìn)行分析時(shí),利用兩混池間型存在差異的SNP位點(diǎn),統(tǒng)計(jì)各個(gè)堿基在不EDED方處理[9]ED4次方作為關(guān)聯(lián)值以達(dá)到消除背景噪音的功能,然后采用局部線性回歸LOESS方法對ED值進(jìn)行擬合,關(guān)聯(lián)值分布如下圖所示:ED關(guān)聯(lián)值在上的分注:橫坐標(biāo)為名稱,彩色的點(diǎn)代表每個(gè)SNP位點(diǎn)的ED值,黑色的線為擬合后的ED值,紅色的虛線代表顯著性關(guān)聯(lián)閾值,ED值越高,代表該點(diǎn)關(guān)聯(lián)效果越好。median+3SD作為分析的關(guān)聯(lián)閾值[7]0.18。根據(jù)關(guān)聯(lián)閾值判定,共得到12個(gè)區(qū)域,總長度為70.31Mb,共包含1,428個(gè),其中非同義突變SNP位點(diǎn)的共639個(gè)。ChromosomeGene-- 以Mb為單位;Genenumber:關(guān)聯(lián)區(qū)域內(nèi)的數(shù)量候選區(qū)域ChromosomeGene--以Mb為單位;Genenumber:關(guān)聯(lián)區(qū)域內(nèi)的數(shù)量。候選區(qū)域的SNP注本項(xiàng)目樣品間在候選區(qū)域內(nèi)的SNP候選區(qū)域內(nèi)SNPPvsB1vs224732 324400注:Type:SNP所在區(qū)域或類型;PvsM和B1vsB2為兩個(gè)樣品間在關(guān)聯(lián)區(qū)域內(nèi)存在的對應(yīng)類型的SNP數(shù)量據(jù)統(tǒng)計(jì),親本間存在非同義突變的SNP1,236個(gè),混池間存在非同義突變的SNP共1,012個(gè),這些SNP很有可能與性狀直接相關(guān),這些SNP所在的我們稱之為非同義突變。候選區(qū)域的注應(yīng)用BLAST[10]軟件對候選區(qū)間內(nèi)的編碼進(jìn)行多個(gè)數(shù)據(jù)庫(NR[11]、候選。候選區(qū)域內(nèi)共注釋到499個(gè),其中在親本間存在非同義突變共XX個(gè),注釋結(jié)果見下表:AnnotatedGeneNon_SynGeneGeneNum:候選區(qū)域內(nèi)親本間存在非同義突變的數(shù)。候選區(qū)域內(nèi)的GO富集分GO數(shù)據(jù)庫是一個(gè)結(jié)構(gòu)化的標(biāo)準(zhǔn)生物學(xué)注釋系統(tǒng)建立了及其產(chǎn)物功能的標(biāo)表的功能越具體。通過GO分析并按照Cellularcomponent、MolecularFunction、Biologicalprocess對進(jìn)行分類。候選區(qū)域內(nèi)GO分類統(tǒng)計(jì)結(jié)果見下圖候選區(qū)域內(nèi)GO注釋聚類注:橫坐標(biāo)為GO各分類內(nèi)容,縱坐標(biāo)左邊為數(shù)目所占百分比,右邊為數(shù)目。此圖展示的是關(guān)聯(lián)區(qū)域內(nèi)所有背景下GO各二級功能的分類情況。topGO有向無環(huán)圖能直觀展示關(guān)聯(lián)區(qū)域內(nèi)富集的GOterm及其層級關(guān)系。有向無環(huán)圖為關(guān)聯(lián)區(qū)域內(nèi)GO富集分析結(jié)果的圖形化展示方式,分支代表包含候選區(qū)域內(nèi)的Cellularcomponent的topGO有向無環(huán)圖如下(或橢圓)內(nèi)給出了該GO節(jié)點(diǎn)的內(nèi)容描述和富集顯著性值。不同顏色代表不同的富集顯著性,顏色越深,顯候選區(qū)域GO的富集分析結(jié)果見下表ATP2.0e-L-ascorbicacid42.5e-protein3.2e-proteinspecific0naringenin3-dioxygenase74ligase7isomerase1methionine90DEG注釋到該功能的數(shù);Expected:注釋到該功能DEG數(shù)目的期望值;KS:富集節(jié)點(diǎn)的顯著性統(tǒng)計(jì),KS候選區(qū)域內(nèi)的KEGG富集分在生物體內(nèi),不同相互協(xié)調(diào)來行使生物學(xué)功能,不同的間相同的作用通路為一個(gè)Pathway,基于Pathway分析有助于進(jìn)一步解讀的功能。KEGG是關(guān)候選區(qū)域內(nèi)的KEGG注釋結(jié)果按照通路類型進(jìn)行分類,分類圖如下注橫坐標(biāo)為注釋到該通路下的個(gè)數(shù)及其個(gè)數(shù)占被注釋上的總數(shù)的縱坐標(biāo)為KEGG代謝通路的名稱候選區(qū)域內(nèi)的代謝通路結(jié)果見下圖注:紅色框標(biāo)記的為關(guān)聯(lián)區(qū)域內(nèi)的,藍(lán)色框代表該通路所需要的所有的酶,說明對應(yīng)與此酶相關(guān),而 KEGG候選區(qū)域內(nèi)的KEGG富集部分結(jié)ProteinprocessinginendoplasmicFlavonoidPlant-pathogenLimoneneandpinenePorphyrinandchlorophyllTyrosinePyruvate注:Pathway:KEGG通路名稱;KO:KEGG通路編號;Enri 候選區(qū)域內(nèi)COG分類統(tǒng)數(shù)據(jù)庫可以對產(chǎn)物進(jìn)行直系同源分類。關(guān)聯(lián)區(qū)域內(nèi)COG分類統(tǒng)計(jì)結(jié)果見候選區(qū)域內(nèi)COG注釋分類注:橫坐標(biāo)為COG各分類內(nèi)容,縱坐標(biāo)為數(shù)目。在不同的功能類中,所占比例多少反映對應(yīng)時(shí)期和結(jié)果可視件:。親本間的結(jié)果可視化在上的分布見下圖:數(shù)據(jù)上傳中有Readme.txt說明,詳細(xì)介紹了每個(gè)文件所代表的內(nèi)容。上傳的detailxls系統(tǒng)下查看文件,推薦使用Editplus或UltraEdit作為文本瀏覽程序,否則會因文件報(bào)告文件含有SVG格式的文件,SVG是矢量化的文件,可以隨意【參考文獻(xiàn)SequencingProjectInternationalRiceGenome.Themap-basedsequenceofthericegenome.Nature436,793–800(2005).LiH,DurbinR.FastandaccurateshortreadalignmentwithBurrows-WheelerTransform.Bioinformatics,200925:1754-60McKennaA,HannaM,BanksE,SivachenkoA,etal.TheGenomeysisToolkit:aMapReduceframeworkforyzingnext-generationDNAsequencingdata.GenomeRes.201020:1297-303Picard:JokeReumers,PeterDeRijk,etal.Optimizedfilteringreducestheerrorrateindetectinggenomicvariantsbyshort-readsequencing.NatureCingolaniP,PlattsA,WangleL,etal.Aprogramforannotatingandpredictingtheeffectsofsinglenucleotidepolymorphisms,SnpEff:SNPsinthegenomeofDrosophilamelanogasterstrainw1118;iso-2;iso-3.",Fly(Austin).2012Fekih,R.etal.MutMap+:GeneticMapandMutantIdentificationwithout

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論