NCBI上下載基因序列_第1頁(yè)
NCBI上下載基因序列_第2頁(yè)
NCBI上下載基因序列_第3頁(yè)
NCBI上下載基因序列_第4頁(yè)
NCBI上下載基因序列_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一、NCBI上下載基因序列、mRNA、CDS序列的方法1.打開(kāi)NCBI網(wǎng)站,第一個(gè)框選擇 Gene,第二個(gè)框輸入基因名稱(chēng),如 ALK基因,點(diǎn)擊 Search。2.進(jìn)入第二頁(yè)面后,會(huì)看到如下一系列跟ALK基因相關(guān)的信息,根據(jù) description和location的信息,找到自己需要的基因??丈蛑斜硎镜氖俏锓N,我需要的是人類(lèi)的基因,故選擇第一個(gè)。點(diǎn)擊ALK進(jìn)入下一個(gè)頁(yè)面。Search resultsItems" 1 IS 20 ©f 2651Page 卜 | of 133 Next > Last»Oalso 73 discaitiriued山ned its

2、m/Marne/Gene IDascriptionLocatonAliasesMIM ALKanaplastic lyrnphcma receptor tyrosineChromosoniR2 NC 000002.12CD246, KJ6LST3105590ID 238kinase占spigns (human)(29192774. 29921611, complement) Aikanaplastic lymphoma kinase MusChromosome 17 NC_OOOOB3.6CD246 TcrzID: 111Wmil seal us (house mouse)(7186893.7

3、2604648. complement) AikAnaplastic lymphoma kiraseChronnos-oni& 2R NT_033778 4Dmel_CG8250; ALK CG82S0, DAIkID: 53425Drasop/7a me/nogasfer (fruit fly)(1662529116640011, complement)DAIk53. DmelCG825D A, dALK rrili3.進(jìn)入后,會(huì)看到以下關(guān)于 ALK基因的詳細(xì)信息:% NCB【Resources © How T。巨GeneGene 7AdvarcecOfficial Syi

4、nbvl Official Ful NamePrirnaiy 5(?uice Set* rekledGene typeRefSeq stotusOrgdnismLineage Aha known a»SummarySttrid Id.Full R蚪心rt .ALK anaplastic lymphoma receptor tyrosine kinase Homo sapiens (human)Gene ID. 236, updated on -Dec-2015工 SummaryALK JI ;* LyaaplaMi匚 lymprciEE recepL0r Ly'osine k

5、inase i - : . > ,-G3H6NG HGN口 5Ensembl EN3G00000171094 MM 1055so. YegaCJTTHUMGDOOO。152034 protsim codingREV1 匚 WEDHoeq sapt&nEukaryota; MaUzoa; Chordata: Crsniata; Vertebnat9; EuteteQfltQnii; M9rnrnalia; Eutiena; Eu9fgliortogires; Prirnatea; Haplgrrhini; Catarrhini; Hcrninide' HomeCD24

6、63; NBLST3This 9 eno encodoc 3 rocoptof tyrosino kinsse. -Ahien bolcrigs tc the mulin rcco ptor sup orfatn iy This proto in compreflE an oxtraccl uar domain, an hydrophobic slrotch ccrreapondiftg B a ang怛 5aw IrantireiTDran regiorr. and 3n ntrse寓lu3r kinase donam. liplay an important role in int de

7、/olapment of tfie brain srd c-x&rts ite effecis nn cnor-rfi/' na imnc in I1 Ha nonjnd c. cjctcim Thic nn-no 卜 nu hLoan fm mrl in Fin ria srra nnoril mirtatarl nr amnllrficril in: 口 c.crmc nf tnrni"ti ire iinr-lii Hinn dnorhOQtir Hrm roll1這些信息可以略過(guò),往下查看,點(diǎn)擊下圖紅色框中的See ALK in Genome Data Vie

8、wer,進(jìn)入下個(gè)頁(yè)面。Genomic contextlocation: ?p?3 ?-p23 1bxon couni: 201O£currentGRCh3S p7 (OCF,心 1 C三”)NC_300DD2.1; (291974 2S5216113 timplemcrri)previous assemblyGRCI137 p13 心CF 00008405 "NUJlOOCn7 11 pq41 語(yǔ)40 31m44.cwnpgmeM)Anrgtatiion releaseSUtu&AssemblyChr5。前口口4.進(jìn)入后會(huì)看到如下頁(yè)面,三枷n in NCBGenom

9、e Data ViewerHome plenG: GRCh晶Chr i <NC_MM0Mlr 龍一畿M - 99M Rich AiMmbly皿FJBDaDClIIX 罵(JHCh共 的I bLk.Mif tor_ Cw甘 MKS«qU«nE4LOCI£H>nNCJJSraai 122Stm, "* 2kQ21.fr11T«r441-r亡用盡力由stf *hi匕心臆哥wi *5 p22*1 M*pfi XM >19 牌 kH2 NI I qH 2 1I2 事3 qHJ *4工 121,1聲 翼?0NJ 仲 4321/工工1|科耳

10、孤 中中町J寸打二> aCUBHtLI h W -W,。力 食西,麗K為 T«一I 0,也/£ -! *今歸 ,山上 冷,3. 一 |可叫, 一 1N?產(chǎn)界 c.咽 尸.的” , 爐山.K Ezye k /-.e 即,廣飛上. |噢78 , ,一上頭 ,上手吊用產(chǎn)上升"0 k , 尸馬.匕器* 算ET llano mpin fmntnbian R7*” 109PU.41_6歸3£| 3電 qXRFEKTSBSBaiIRnrIFn-15Knm «§3« AQ9- SHMRH q:_二 n ImLEE-L&LitS

11、幻4里息I N*J5»M73將鼠標(biāo)箭頭放在圖中紅色框中的綠色線上2-5秒,不用點(diǎn)擊。會(huì)看到下面的界面:(有些基因會(huì)出現(xiàn)好幾個(gè),根據(jù)自己的要求選擇)ALKHP_0&4295芝 H-H-HHF-一1t4L <*. 1*.<-*4_1*-4-, 4w唾1#*<-OC10192938BRM7SL516P疥!3:弓92呢總ALK艱_9為9”2MRJ.$924 2 >P_pWM1.2 rfl?_2 44?77,4 r«_?399E5>2H I H I H>-I H M 眼 歸 削Gene: ALKTirte: an己plasd匚 hirphi

12、me rec印ter tyrjsne kinaseLocation: coniplemeritf294 92,774.29321,6X1)Length: 728,835Moged features: rp_d(M2952 and N'-i_oo3C4.Download: NP 口042952 NM 304304WLinks & ToolsEnaView GenelD: 2炎View hK>NC: HZ7Viz MTM- inQFlBLAST Genomic: NC 00032.12 ;41女,普皿2三921.6山FSTEft View: NC qQ0E2 J3 (29J宓

13、,77%.及用21 市 14】GenBank View: NC QOQCQZJa (29.192.774,21921 田11】|第一個(gè)紅色框中:NP 004295.2表示蛋白質(zhì)序列,NP代表蛋白質(zhì),004295是編號(hào),后面的.2代表更新?tīng)顟B(tài),數(shù)值越大,版本越新。NM 004304.4表示mRNA序列,NM表示mRNA, 004304是編號(hào),后面的 .4代表更新?tīng)顟B(tài),數(shù)值越大,版本越新。第二個(gè)紅色框中:CCDS33172.1表示CDS序歹U, CCDS表示CDS命名規(guī)則同上。第三個(gè)紅色框中:NC 000002.12(29,192,77429,921,611)表示完整的基因序列,NC表示基因組。括

14、號(hào)中的數(shù)字表示這個(gè)基因的堿基長(zhǎng)度,從29,192,774bp到29,921,611bp。要下載蛋白序列、 mRNA序列、CDS序列、基因序列,直接點(diǎn)擊紅色框中的鏈接即可。5.這里下載基因序列,點(diǎn)擊后出現(xiàn)如下界面:點(diǎn)擊右邊的 Send -Co complete record -file » format (有好幾種格式)一次 Create File。 常用的是FASTA格式和GenBank格式。GenBank格式保存的信息更全面。至此就把ALK基因的序列下載了。二.幾種代號(hào)的意思ACCE55IDH是NCBI序列數(shù)據(jù)中我們常用到編號(hào)(另一個(gè)是Gl ) ( ACCESSION形式為C C

15、# r其中CC為兩個(gè)字母r其不同組合又可以區(qū)分為雷日序列、核酸序列或基因組序 ,而物位數(shù)不等的敖寧;ACCESSION后面又會(huì)加版本號(hào),以CC #札弄形式表示,最后的 尾數(shù)遞增表示序列信息較之前的版本有所修改,這樣ACCE55ION/版本號(hào)就是一個(gè)唯一的表 示"錯(cuò)一個(gè)唯一的序列,而目這個(gè)編號(hào)不會(huì)改變,ACCESSION MOLECULEMETHOD NOTEGenomicMixed一些可洪選擇的注稱(chēng)E1- ii-U UtWi整因組月列主要用來(lái)標(biāo)記病再和原fe:生物作AP_123456Protein Mxed總匚_標(biāo)記序列對(duì)應(yīng)的蛋白產(chǎn)物占|NC_123456 I Genomic Mix

16、ed完整的葬組分子序列,標(biāo)記的變別包括基酶 色體、細(xì)胞器、質(zhì)粒中,染MG23456GenomicMixedNM323456niRM 息Mixed不完整的嗯因組區(qū)博,提供NCBlg肆且迷薜途彳 較宵代裹性有不轉(zhuǎn)錄的加疆因或者那譬f雕自行 釋的基廷朗口強(qiáng)比 此注|轉(zhuǎn)錄聲物序列;或熟mRN碾錄率序列,NNT_12 345678一般來(lái)說(shuō),mRN喇基因組序列是我捫主要的尋找對(duì)象.如單袈找標(biāo)準(zhǔn)序列的話,mRN 磁采用NM開(kāi)頭的,基囚組用NC或者AC開(kāi)頭的口 so eas/ !PrCn后任產(chǎn)糊;主售是仝K轉(zhuǎn)甘氟基酷席研,但也有T 只有部云方白質(zhì)的部分家星鮑尼利.tJP 1234567SQNR 12345RMAMi?電 d十編碼的轉(zhuǎn)錄子.序列-包恁籍惋卬、,保里因祐子

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論