




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、RNA-Seq名詞解釋l.index測序的標(biāo)簽,用于測定混合樣本,通過每個樣本添加的不同標(biāo)簽進(jìn)行數(shù)據(jù)區(qū)分,鑒別測序樣品。2 .堿基質(zhì)量值(QualityScore或Q-score)是堿基識別(BaseCalling)出錯的概率的整數(shù)映射。堿基質(zhì)量值越高表明堿基識別越可靠,堿基測錯的可能性越小。3.Q30堿基質(zhì)量值為Q30代表堿基的精確度在99.9%。4 .FPKM(FragmentsPerKilobaseoftranscriptperMillionfragmentsmapped)每1百萬個map上的reads中map到外顯子的每1K個堿基上的fragment個數(shù)。計算公式為cDNAFragme
2、ntsFPKM=-MappedReads(Millions)xTranscriptLength(kb)I公式中,cDNAFragments表示比對到某一轉(zhuǎn)錄本上的片段數(shù)目,即雙端Reads數(shù)目;MappedReads(Millions)表示MappedReads總數(shù),以10為單位;TranscriptLength(kb):轉(zhuǎn)錄本長度,以kb個堿基為單位。5 .FC(FoldChange)即差異表達(dá)倍數(shù)。6 .FDR(FalseDiscoveryRate)即錯誤發(fā)現(xiàn)率,定義為在多重假設(shè)檢驗過程中,錯誤拒絕(拒絕真的原(零)假設(shè))的個數(shù)占所有被拒絕的原假設(shè)個數(shù)的比例的期望值。通過控制FDR來決定P
3、值的閾值。7 .P值(P-value)即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計學(xué)根據(jù)顯著性檢驗方法所得到的P值,一般以P0.05為顯著,P0.01為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于0.05或0.01o8 .可變剪接(Alternativesplicing)有些基因的一個mRNA前體通過不同的剪接方式(選擇不同的剪接位點)產(chǎn)生不同的mRNA剪接異構(gòu)體,這一過程稱為可變剪接(或選擇性剪接,alternativesplicing)。可變剪接是調(diào)節(jié)基因表達(dá)和產(chǎn)生蛋白質(zhì)組多樣性的重要機制,是導(dǎo)致真核生物基因和蛋白質(zhì)數(shù)量較大差異的重要原因。在生物體內(nèi),主要存在7種可變剪接類型:A)
4、Exonskipping;B)Intronretention;C)Alternative5splicesite;D)Alternative3splicesite;E)Alternativefirstexon;F)Alternativelastexon;G)Mutuallyexclusiveexon。9 .外顯子跳躍(Exonskipping)外顯子在前體mRNA剪接形成成熟mRNA過程中被跳過,最終沒有出現(xiàn)在某些成熟mRNA上,這種剪接機制被稱為外顯子跳躍。10 .內(nèi)含子保留(Intronretention)前體mRNA在剪接形成成熟mRNA的過程中,部分內(nèi)含子被保留下來,這種剪接機制被稱為內(nèi)
5、含子保留。11 .5或3端可變剪接前體mRNA在剪接形成成熟mRNA的過程中,5端或3端邊界發(fā)生不同方式的剪接,這種剪接機制被稱為5或3端可變剪接。12. 基因結(jié)構(gòu)優(yōu)化由于使用的軟件或數(shù)據(jù)本身的局限性,導(dǎo)致所選參考基因組的注釋往往不夠精確,需要對原有注釋的基因結(jié)構(gòu)進(jìn)行修正,這一過程稱為基因結(jié)構(gòu)優(yōu)化。13. 基因間區(qū)(intergenic)指基因與基因之間的間隔序列,不屬于基因結(jié)構(gòu),不直接決定氨基酸,可能通過轉(zhuǎn)錄后調(diào)控影響性狀的區(qū)域。14. UTR:(UntranslateRegions)非翻譯區(qū)域。是信使RNA(mRNA)分子兩端的非編碼片段。5-UTR從mRNA起點的甲基化鳥嗯吟核昔酸帽延伸
6、至AUG起始密碼子,3-UTR從編碼區(qū)末端的終止密碼子延伸至多聚A尾巴(Poly-A)的前端。15. ORF(openreadingframe)開放閱讀框或開放讀碼框。是結(jié)構(gòu)基因的正常核甘酸序列,從起始密碼子到終止密碼子的閱讀框可編碼完整的多肽鏈,其間不存在使翻譯中斷的終止密碼子。16. CDS(Codingsequence)是編碼一段蛋白產(chǎn)物的序列,是結(jié)構(gòu)基因組學(xué)術(shù)語。DNA轉(zhuǎn)錄成mRNA,mRNA經(jīng)剪接等加工后翻譯出蛋白質(zhì),所謂CDS就是與蛋白質(zhì)序列一一對應(yīng)的DNA序列,且該序列中間不含其它非該蛋白質(zhì)對應(yīng)的序列,不考慮mRNA加工等過程中的序列變化,總之,就是與蛋白質(zhì)的密碼子完全對應(yīng)。17
7、. 插入片段大小(insertsize)通過檢測雙端序列在基因組上的起止位置,可以得到插入片段的實際長度,決定了測序的長度,是信息分析的重要參數(shù)。18. 分子標(biāo)記是遺傳標(biāo)記的一種,直接在DNA分子上檢測遺傳變異。分子標(biāo)記能對不同發(fā)育時期的個體、組織器官甚至細(xì)胞作檢測,數(shù)量極多,遍及整個基因組,多態(tài)性高,遺傳穩(wěn)定,不受環(huán)境及基因表達(dá)與否的影響。目前常見分子標(biāo)記主要有SNP、InDel、SSR等。19. SNP(SingleNucleotidePolymorphism)即單核昔酸多態(tài)性,主要是指在基因組水平上由單個核音酸的變異所引起的DNA序列多態(tài)性。SNP所表現(xiàn)的多態(tài)性只涉及到單個堿基的變異,這
8、種變異可由單個堿基的轉(zhuǎn)換(transition)或顛換(transversion)所引起,也可由堿基的插入或缺失所致。但通常所說的SNP并不包括后兩種情況。20. SSR(SimpleSequenceRepeat,SSR)即簡單重復(fù)序列,又叫微衛(wèi)星序列,指的是基因組中由1-6個核甘酸組成的基本單位重復(fù)多次構(gòu)成的一段DNA,廣泛分布于基因組的不同位置,長度一般在200bp以下。21. 轉(zhuǎn)換(transition)同類型(喋吟和喋吟,或嗑咤和嗑咤)堿基之間的相互替換稱為轉(zhuǎn)換。22. 顛換(transversion)不同類型(喋吟和嗑咤)堿基之間的相互替換稱為顛換。23. RNA編輯(RNAedit
9、ing)是指在mRNA水平上改變遺傳信息的過程。具體來說,指基因轉(zhuǎn)錄產(chǎn)生的mRNA分子中,由于核普酸的缺失,插入或置換,基因轉(zhuǎn)錄物的序列不與編碼序列互補,使翻譯生成的蛋白質(zhì)的氨基酸組成,不同于基因序列中的編碼信息現(xiàn)象。24. 差異表達(dá)轉(zhuǎn)錄本(DifferentiallyExpressedTranscript,DET)指表達(dá)水平存在顯著差異的轉(zhuǎn)錄本。25. 差異表達(dá)基因(DifferentiallyExpressedGene,DEG)指在兩個不同條件(如對照與處理、野生型和突變型、不同時間點、不同組織等)下,表達(dá)水平存在顯著差異的基因,稱之為差異表達(dá)基因。26. 生物學(xué)重復(fù)(Biological
10、Replicates)可以定義為使用來自不同抽提的RNA樣本進(jìn)行雜交,例如,同一來源獨立制備的樣本,或者不同來源的樣本(不同組織或者一個細(xì)胞系的不同培養(yǎng)物)27. 技術(shù)重復(fù)使用同一個抽提的RNA進(jìn)行實驗稱為技術(shù)重復(fù)。與生物學(xué)重復(fù)相比,技術(shù)重復(fù)不是完全獨立的,取平均值不能去除共有的系統(tǒng)偏差。28. 皮爾遜相關(guān)系數(shù)r(PearsonsCorrelationCoefficient)用于度量兩個變量X和丫之間的相關(guān)(線性相關(guān)),其值介于-1與1之間。其中,1表示變量完全正相關(guān),0表示無關(guān),-1表示完全負(fù)相關(guān)。在高通量測序中,將皮爾遜相關(guān)系數(shù)作為生物學(xué)重復(fù)相關(guān)性的評估指標(biāo)。越接近1,說明兩個重復(fù)樣品相關(guān)
11、性越強。29. UnigeneUniqueGene的英文縮寫,意為廣泛通用的基因數(shù)據(jù)庫,通過電腦對相同基因座(Locus)的收集整理集合形成一個非冗余的基因數(shù)據(jù)庫。30. Contig高通量測序中利用軟件將具有一定長度overlap的reads連成更長的片段,這些通過readsoverlap關(guān)系得到的不含N的組裝片段稱之為Contig。31. Scaffold高通量測序中reads經(jīng)過拼接獲得Contigs,Contig經(jīng)過確定先后順序用N連接起來組成Scaffoldc32. ContigN50Reads拼接后會得到長度不同的Contigs。將所有Contigs的長度相加后獲得一個Contig
12、的總長度。之后將所有Contig按照序列長度由短到長進(jìn)行排序,如獲得Contig1,Contig2,Contig3。將Contig按照這個順序一次相加,當(dāng)相加的長度達(dá)到Contig總長度的一半時,最后一個加上的Contig長度即為ContigN50。33. componentTRINITY軟件拼接過程中,由于contig的構(gòu)造方法,使得各個contig之間不可能共享k個以上序列,因此這些inchwormcontigs不能很好的表征各種可變剪切形式和同源基因等情況,軟件中chrysalis這一步驟將那些有重疊的contigs聚類,構(gòu)成ponent就成為一組可變剪切is
13、oform或同源基因可能的表征的集合。34. deBruijngraph使用TRINITY軟件拼接時,在“chrysalis步驟中會將component通過overlap關(guān)系構(gòu)建成deBruijn圖,便于獲取可變剪切的序列。35. 數(shù)字基因表達(dá)譜(DigitalGeneExpressionProfile,DGE)利用新一代高通量測序技術(shù)和高性能的計算分析技術(shù),能夠全面、經(jīng)濟(jì)、快速地檢測某一物種特定組織在特定狀態(tài)下的基因表達(dá)情況O36. smallRNA對長度在18-40bp的短RNA進(jìn)行序列、結(jié)構(gòu)、表達(dá)、功能上的分析,主要進(jìn)行miRNA,siRNA,piRNA幾種類型sRNA的分析;可與mRN
14、A關(guān)聯(lián)分析。37. ncRNA(non-codingRNA)非編碼RNA。指不編碼蛋白質(zhì)的RNA。其中包括rRNA,tRNA,snRNA,snoRNA和microRNA等多種已知功能的RNA,及未知功能的RNAo其共同特點是都能從基因組上轉(zhuǎn)錄而來,不需要翻譯成蛋白即可在RNA水平上行使各自的生物學(xué)功能。38. 降解組測序(DegradomeSequencing)利用高通量測序平臺,針對miRNA介導(dǎo)的剪切降解片段進(jìn)行深度測序,從中篩選miRNA作用的靶基因,并結(jié)合生物信息學(xué)分析確定降解片段與miRNA的精確配對信息。該技術(shù)能從細(xì)胞或組織中準(zhǔn)確高效的篩選出miRNA的靶基因,為研究miRNA與其
15、對應(yīng)的靶基因的相互關(guān)系提供準(zhǔn)確、高效的篩選手段。39. lncRNA(longnoncodingRNA)長鏈非編碼RNAo在長度200-100000nt之間,不具有編碼蛋白功能的轉(zhuǎn)錄本。40. 正鏈/負(fù)鏈(plusstrand/minusstrand)對于一個基因來說,DNA的兩條鏈中有一條鏈作為RNA合成時的模板,這條鏈叫負(fù)鏈,另一條叫正鏈。41. 反義鏈/有義鏈(antisensestrand/sensestrand)在雙鏈DNA中,用來轉(zhuǎn)錄mRNA的DNA鏈稱為模板鏈(templatestrand),不用于轉(zhuǎn)錄的鏈則稱為非模板鏈(nontemplatestrand)。根據(jù)堿基互補配對原則
16、,轉(zhuǎn)錄出的mRNA鏈的堿基序列與非模板鏈的堿基序列一致,惟一不同的是,非模板鏈中的TmRNA鏈中全部置換成了U。正是由于非模板鏈的堿基序列實際上代表了mRNA的堿基序列(只不過在mRNA中T換成了U),因此非模板鏈又被稱為編碼鏈(codingstrand),有義鏈(sensestrand)和克里克鏈(crickstrand),而用來轉(zhuǎn)錄mRNA的DNA鏈被稱為非編碼鏈(anticodingstrand)或反義鏈(antisensestrand)或沃森鏈(watsonstrand)。42. 鏈特異性(strandspecific):鏈特異性建庫,可以確定轉(zhuǎn)錄本來自正鏈還是負(fù)鏈。以便更加準(zhǔn)確的獲得
17、基因的結(jié)構(gòu)以及基因表達(dá)信息。并且可以更好的發(fā)現(xiàn)新的基因。(研究表明:很多基因組區(qū)域具有正負(fù)鏈的轉(zhuǎn)錄本,反義轉(zhuǎn)錄是真核基因的一個特征,是一種重要的調(diào)控方式。對于原核以及低等真核生物的基因組,常常具有重疊基因。43. GO(GeneOntology)基因本體聯(lián)合會(GeneOntologyConsortium)所建立的數(shù)據(jù)庫,旨在建立一個適用于各種物種的,堆積因何蛋白質(zhì)功能進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語言詞匯標(biāo)準(zhǔn)。GO是多種生物本體語言中的一種,提供了三層結(jié)構(gòu)(分子功能、生物學(xué)途徑、細(xì)胞組件)的系統(tǒng)定義方式,用于描述基因產(chǎn)物的功能。網(wǎng)址:http:/www.geneontolog
18、/。44. BSR(BulkedSegregantRNAsequencing)將轉(zhuǎn)錄組測序與集群分離分析相結(jié)合,在轉(zhuǎn)錄組范圍內(nèi)開發(fā)SNPs,篩選與性狀緊密連鎖的SNPs,進(jìn)行功能基因的定位,同時進(jìn)行基因差異表達(dá)分析等轉(zhuǎn)錄組常規(guī)分析的技術(shù)。45. eQTL以一個分離群體中不同個體(基因型)或者是其它有遺傳結(jié)構(gòu)的群體作為樣本,運用QTL分析方法分析特定基因轉(zhuǎn)錄豐度差異而得到的一些遺傳區(qū)域,轉(zhuǎn)錄豐度用于作為個體中基因表達(dá)水平的衡量方式,并且作為一個性狀來分析(eTrait)。46. COG/KOGCOG是ClustersofOrthologousGroupsofproteins的簡稱,KOG為euKaryoticOrthologGroups。這兩個注釋系統(tǒng)都是NCBI中基于基因直系同源關(guān)系的數(shù)據(jù)庫,其中COG針對原核生物,KOG針對真核生物。COG/KOG結(jié)合進(jìn)化關(guān)系將來自不同物種的同源基因分為不同的Ortholog簇,目前COG有4873個分類,KOG有4852個分類。來自同一ortholog的基因具有相同的功能,這樣就可以將功能注釋直接繼承給同一COG/KOG簇的其他成員。詳見http:/w
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)班級管理中學(xué)生合作能力的培養(yǎng)研究論文
- 2025-2030全球及中國汽車?yán)溴懠袠I(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025年小學(xué)語文畢業(yè)升學(xué)考試全真模擬卷(閱讀寫作強化版)-文言文閱讀實戰(zhàn)
- 2025-2030全球及中國智能虛擬助理(IVA)行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球及中國住宅空氣質(zhì)素管制服務(wù)行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球及中國云服務(wù)行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球及中國SDN編排行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 2025-2030全球與中國石墨模壓環(huán)行業(yè)現(xiàn)狀動態(tài)與發(fā)展趨勢研究研究報告
- 普什圖語學(xué)習(xí)者的閱讀能力研究論文
- 2025年FRM金融風(fēng)險管理師考試專業(yè)試卷:金融風(fēng)險管理專業(yè)英語試題
- 浙江省杭州市蕭山區(qū)2022-2023學(xué)年第二學(xué)期四年級科學(xué)期中試題(含答案)
- 2024年黑龍江出版集團(tuán)招聘筆試真題
- 臨時操作平臺施工方案(33頁)
- TCMBA 013-2021 醫(yī)療機構(gòu)管理嵌合抗原受體T細(xì)胞治療產(chǎn)品臨床應(yīng)用的規(guī)范
- GIS軟件工程_01概述
- SF36量表內(nèi)容與計分方法附
- 第一單元到郊外去
- 食堂出入庫明細(xì)表(新)
- 澆注型聚氨酯彈性體生產(chǎn)技術(shù)標(biāo)準(zhǔn)_圖文
- 《大力集團(tuán)大型電動機降補固態(tài)軟起動裝置(PPT 31頁)6.65MB》
- 大學(xué)物理剛體力學(xué)
評論
0/150
提交評論