版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
作品校內(nèi)選拔賽作品申報(bào)書作品校內(nèi)選拔賽作品申報(bào)書作品校內(nèi)選拔賽作品申報(bào)書作品校內(nèi)選拔賽作品申報(bào)書編制僅供參考審核批準(zhǔn)生效日期地址:電話:傳真:郵編:序號(hào):編碼:第十一屆“挑戰(zhàn)杯”全國(guó)大學(xué)生課外學(xué)術(shù)科技作品競(jìng)賽華南農(nóng)業(yè)大學(xué)選拔賽作品申報(bào)書作品名稱:DNA壓縮及模式匹配研究平臺(tái)所在學(xué)院:信息學(xué)院申報(bào)者姓名(集體名稱):劉少鵬類別:□自然科學(xué)類學(xué)術(shù)論文□哲學(xué)社會(huì)科學(xué)類社會(huì)調(diào)查報(bào)告和學(xué)術(shù)論文□科技發(fā)明制作A類□科技發(fā)明制作B類
說明1.申報(bào)者應(yīng)在認(rèn)真閱讀此說明各項(xiàng)內(nèi)容后按要求詳細(xì)填寫。2.申報(bào)者在填寫申報(bào)作品情況時(shí)只需根據(jù)個(gè)人項(xiàng)目或集體項(xiàng)目填寫A1或A2表,根據(jù)作品類別(自然科學(xué)類學(xué)術(shù)論文、哲學(xué)社會(huì)科學(xué)類社會(huì)調(diào)查報(bào)告和學(xué)術(shù)論文、科技發(fā)明制作)分別填寫B(tài)1、B2或B3表。所有申報(bào)者可根據(jù)情況填寫C表。3.表內(nèi)項(xiàng)目填寫時(shí)一律用打印,字跡要端正、清楚,此申報(bào)書可復(fù)制。4.序號(hào)、編碼由競(jìng)賽組委會(huì)填寫。5.學(xué)術(shù)論文、社會(huì)調(diào)查報(bào)告及所附的有關(guān)材料必須是中文(若是外文,請(qǐng)附中文本),請(qǐng)用4號(hào)楷體打印在A4紙上,附于申報(bào)書后,字?jǐn)?shù)在8000字以內(nèi),調(diào)查報(bào)告類每篇在15000字以內(nèi)。6.其他參賽事宜請(qǐng)向校團(tuán)委咨詢。聯(lián)系電話:,
A1.申報(bào)者情況(個(gè)人項(xiàng)目)說明:1.必須由申報(bào)者本人按要求填寫,申報(bào)者情況欄內(nèi)必須填寫個(gè)人作品的第一作者(承擔(dān)申報(bào)作品60%以上的工作者);2.本表中的學(xué)籍管理部門簽章視為對(duì)申報(bào)者情況的確認(rèn)。申報(bào)者情況姓名劉少鵬性別男出生年月1984年9月所在學(xué)院信息學(xué)院專業(yè)計(jì)算機(jī)應(yīng)用現(xiàn)學(xué)歷碩士年級(jí)二年級(jí)學(xué)制3年入學(xué)時(shí)間2007年9月作品全稱DNA壓縮及模式匹配研究平臺(tái)畢業(yè)論文題目通訊地址華南農(nóng)業(yè)大學(xué)研究生宿舍6棟904郵政編碼510642單位電話常住地通訊地址廣東省潮州市潮安縣磷溪鎮(zhèn)溪口四村郵政編碼521000住宅電話093合作者情況姓名性別年齡學(xué)歷所在單位資格認(rèn)定學(xué)院學(xué)籍管理部門意見□是□否若是,其學(xué)號(hào)為:19(學(xué)院蓋章)年月日院系負(fù)責(zé)人或?qū)熞庖姳咀髌肥欠駷檎n外學(xué)術(shù)科技或社會(huì)實(shí)踐活動(dòng)成果。□是□否負(fù)責(zé)人簽名:年月日
B3.申報(bào)作品情況(科技發(fā)明制作)說明:1.必須由申報(bào)者本人填寫;2.3.本表必須附有研究報(bào)告,并提供圖表、曲線、試驗(yàn)數(shù)據(jù)、原理結(jié)構(gòu)圖、外觀圖(照片),也可附鑒定證書和應(yīng)用證書;4.作品分類請(qǐng)按照作品發(fā)明點(diǎn)或創(chuàng)新點(diǎn)所在類別填報(bào)。作品全稱DNA壓縮及模式匹配研究平臺(tái)作品分類(B)A.機(jī)械與控制(包括機(jī)械、儀器儀表、自動(dòng)化控制、工程、交通、建筑等)B.信息技術(shù)(包括計(jì)算機(jī)、電信、通訊、電子等)C.?dāng)?shù)理(包括數(shù)學(xué)、物理、地球與空間科學(xué)等)D.生命科學(xué)(包括生物、農(nóng)學(xué)、藥學(xué)、醫(yī)學(xué)、健康、衛(wèi)生、食品等)E.能源化工(包括能源、材料、石油、化學(xué)、化工、生態(tài)、環(huán)保等)作品設(shè)計(jì)、發(fā)明的目的和基本思路,創(chuàng)新點(diǎn),技術(shù)關(guān)鍵和主要技術(shù)指標(biāo)目的二十世紀(jì)末生物信息學(xué)迅速發(fā)展,在信息的數(shù)量和質(zhì)量上都極大的豐富了生物科學(xué)的數(shù)據(jù)資源,包括NCBI,EMBL,GDB等,DNA數(shù)據(jù)庫(kù)的數(shù)據(jù)量在以每年兩到三倍的數(shù)量增加?,F(xiàn)在為存儲(chǔ)DNA數(shù)據(jù)需要越來越大的空間。因此,對(duì)DNA數(shù)據(jù)進(jìn)行壓縮以減少存儲(chǔ)空間將是生物學(xué)家和計(jì)算機(jī)專家面臨的挑戰(zhàn)。由于DNA數(shù)據(jù)的特殊性,即DNA序列數(shù)據(jù)由A、C、G、T四個(gè)字母組成,并且DNA序列長(zhǎng)度可達(dá)到上千萬個(gè)堿基對(duì),使用傳統(tǒng)的數(shù)據(jù)壓縮算法并不理想。于是,必須研究專門針對(duì)DNA序列數(shù)據(jù)的壓縮算法:DNA壓縮算法。在生物學(xué)家對(duì)DNA序列數(shù)據(jù)的使用中,序列比對(duì)是生物信息學(xué)中最基本、最重要的操作之一。從實(shí)現(xiàn)的理論和技術(shù)上講,DNA序列比對(duì)的實(shí)質(zhì)是一種特殊的模式匹配,而直接在壓縮后的DNA數(shù)據(jù)上進(jìn)行序列比對(duì)其實(shí)質(zhì)則是一種特殊的壓縮模式匹配,即DNA壓縮模式匹配。為了更好地研究DNA壓縮算法和DNA壓縮模式匹配算法,我們將建立一個(gè)研究平臺(tái)。該平臺(tái)主要用于管理和增加DNA壓縮算法和DNA壓縮模式匹配算法,存儲(chǔ)DNA序列數(shù)據(jù)、DNA壓縮數(shù)據(jù),能實(shí)現(xiàn)各算法的效果的比較試驗(yàn),驗(yàn)證算法的有效性。思路以Java技術(shù)和二次數(shù)據(jù)庫(kù)技術(shù),建立一個(gè)不依賴具體機(jī)型和操作系統(tǒng)的DNA壓縮和DNA壓縮模式匹配研究的專用平臺(tái);并利用該平臺(tái),結(jié)合DNA序列數(shù)據(jù)的特點(diǎn),研究DNA序列數(shù)據(jù)壓縮現(xiàn)有算法和提出新的算法,以有效減少DNA數(shù)據(jù)所占用的存儲(chǔ)空間;研究出專門針對(duì)DNA壓縮數(shù)據(jù)的壓縮模式匹配算法,以解決在不對(duì)DNA序列壓縮數(shù)據(jù)解壓或最小解壓縮的情況下實(shí)現(xiàn)序列比對(duì)功能。創(chuàng)新點(diǎn)1、可擴(kuò)展利用面向?qū)ο蟮腏ava技術(shù),建立專業(yè)的生物信息學(xué)研究平臺(tái),可持續(xù)地開展DNA壓縮算法和DNA壓縮模式匹配算法的研究。具體地說,平臺(tái)的可擴(kuò)展性體現(xiàn)在兩方面:一是有意義明確的包,尤其是包matching和compress。二是GUI界面都是用Swing組件寫成的,每個(gè)面板的功能都是相當(dāng)明確,其中負(fù)責(zé)壓縮信息處理的CompressPanel和負(fù)責(zé)模式匹配的MatchingPanel就是很好的體現(xiàn)。假如,我們現(xiàn)在的平臺(tái)需要增加一個(gè)新的壓縮算法,那么我們要把這個(gè)壓縮算法設(shè)計(jì)為一個(gè)類,把它放到包c(diǎn)ompress中,再在面板CompressPanel中的樹狀選擇壓縮算法,為用戶增加一個(gè)新的選項(xiàng),即可完成擴(kuò)展。如果現(xiàn)在的平臺(tái)需要增加一個(gè)新的匹配算法,那么我們要把這個(gè)匹配算法設(shè)計(jì)為一個(gè)類,把它放到包matching中,再在面板MatchingPanel中的樹狀選擇匹配算法,為用戶增加一個(gè)新的選項(xiàng),即可完成擴(kuò)展。2、減少DNA序列存儲(chǔ)空間參考文本壓縮算法思想,根據(jù)DNA序列數(shù)據(jù)的特點(diǎn),研究專門用于壓縮DNA序列數(shù)據(jù)的DNA壓縮算法。DNA壓縮算法可以高效地壓縮DNA序列數(shù)據(jù),極大地減少DNA序列數(shù)據(jù)所占用的存儲(chǔ)空間。3、DNA序列比對(duì)研究利用壓縮模式匹配的思想,根據(jù)DNA序列數(shù)據(jù)的特點(diǎn),專門研究在對(duì)DNA序列壓縮數(shù)據(jù)不解壓縮或最小解壓縮的情況下,直接在DNA壓縮數(shù)據(jù)庫(kù)中實(shí)現(xiàn)DNA序列比對(duì)的功能。4、直接使用壓縮DNA數(shù)據(jù)研究不是把DNA序列數(shù)據(jù)壓縮減小存儲(chǔ)空間作為唯一目標(biāo),而是把直接有效地利用DNA序列壓縮數(shù)據(jù)作為更重要的目標(biāo)。技術(shù)關(guān)鍵1、面向?qū)ο蟮腏ava技術(shù)使得該平臺(tái)不依賴操作系統(tǒng)和具體機(jī)型,因此可運(yùn)行在小型機(jī)、高級(jí)服務(wù)器、PC臺(tái)式機(jī)、筆記本電腦和Unix、Solaris、Windows和Linux等環(huán)境。2、多線程技術(shù)在java中,程序通過流控制來執(zhí)行程序流,程序中單個(gè)順序的流控制稱為線程,多線程則指的是在單個(gè)程序中可以同時(shí)運(yùn)行多個(gè)不同的線程,執(zhí)行不同的任務(wù)。多線程意味著一個(gè)程序的多行語(yǔ)句可以看上去幾乎在同一時(shí)間內(nèi)同時(shí)運(yùn)行。3、Swing技術(shù)Swing組件被稱為輕量級(jí)組件(lightweightcomponent),是由純Javacode開發(fā)的,它不需要那些關(guān)于各種平臺(tái)的復(fù)雜的GUI功能,解決了Java因?yàn)榇翱陬惗鵁o法跨平臺(tái)的問題,并且不會(huì)占有太多的系統(tǒng)資源。Swing組件對(duì)比AWT組件具有更大強(qiáng)度的可移植性和靈活性。主要技術(shù)指標(biāo)平臺(tái)可擴(kuò)展性、算法效率、算法比較效果作品的科學(xué)性先進(jìn)性(必須說明與現(xiàn)有技術(shù)相比、該作品是否具有突出的實(shí)質(zhì)性技術(shù)特點(diǎn)和顯著進(jìn)步。請(qǐng)?zhí)峁┘夹g(shù)性分析說明和參考文獻(xiàn)資料)1、采用java面向?qū)ο缶幊碳夹g(shù),具有良好的平臺(tái)無關(guān)性及功能可擴(kuò)展性。2、研究DNA壓縮算法和DNA壓縮模式匹配算法具有重要意義,該平臺(tái)為研究人員的工作提供便捷。利用該平臺(tái),作者已發(fā)表中文核心期刊文章一篇。3、目前針對(duì)DNA壓縮算法和DNA壓縮模式匹配算法的平臺(tái)不多。4、參考文獻(xiàn)很多,主要有DNA壓縮算法和DNA壓縮模式匹配算法等國(guó)內(nèi)國(guó)外論文,請(qǐng)查閱。[1] DonAdjeroh,YongZhang,AmarMukherjee,MattPowell,TimBell,“DNASequenceCompressionUsingtheBurrows-WheelerTransform,”csb,,IEEEComputerSocietyBioinformaticsConference(CSB'02),2002[2] ChenX.,KwongLiM,“AcompressionalgorithmforDNAsequencesanditsapplicationsingenomecomparison”,InProceedings,10thWorkshoponGenomeInformatics(GIW’99),pp.52-61,1999.[4] BurrowsM.andWheeler.,“Ablock-sortinglosslessdatacompressionalgorithm”,TechnicalReport,DigitalEquipmentCorporation,PaloAlto,[5] TaoTao,AmarMukherjee,“PatternMatchinginLZWCompressedFiles,”IEEETransactionsonComputers,vol.54,no.8,pp.929-938,Aug.,2005.[6] T.Bell,M.Powell,A.Mukherjee,andD.Adjeroh,“SearchingBWTCompressedTextwiththeBoyer-MooreAlgorithmandBinarySearch”,Proc.DataCompressionConf.,pp.112-121,.[7] CHENLei,LUShiyong,RAMPatternMatchinginDNASequences:IEEEComputationalSystemsBioinformaticsConference,2004[C].Washington,[8] BOYERRS,MOOREJFastStringSearchingAlgorithm[J].CommunicationsoftheACM,1977,20(10):762–772.[9] Knuth,.,MorrisJr,.,Pratt,.:Fastpatternmatchinginstrings.SIAMJournalonComputing6,323–350(1977)[10] 張麗霞,張義青,林丕源,劉吉平.基于字符和0/1碼的DNA壓縮模式匹配算法.計(jì)算機(jī)應(yīng)用研究,2007,24(9):22-24[11] 林毅申,林丕源.基于WebServices的生物信息解決方案[J].計(jì)算機(jī)應(yīng)用研究,2005,22(6):157-158&164.[12] (英)著,羅靜初等譯.生物信息學(xué)概論.北京:北京大學(xué)出版社,作品在何時(shí)、何地、何種機(jī)構(gòu)舉行的評(píng)審、鑒定、評(píng)比、展示等活動(dòng)中獲獎(jiǎng)及鑒定結(jié)果無。作品所處階段()A實(shí)驗(yàn)室階段B中試階段C生產(chǎn)階段D可初步應(yīng)用,為算法研究提供一定的便利(自填)技術(shù)轉(zhuǎn)讓方式作品可展示的形式□實(shí)物、產(chǎn)品□模型□圖紙□磁盤□現(xiàn)場(chǎng)演示□圖片□錄像□樣品使用說明及該作品的技術(shù)特點(diǎn)和優(yōu)勢(shì),提供該作品的適應(yīng)范圍、推廣前景的技術(shù)性說明、市場(chǎng)分析和經(jīng)濟(jì)效益預(yù)測(cè)由于DNA數(shù)據(jù)庫(kù)的數(shù)據(jù)量在以每年兩到三倍的數(shù)量增加,因此將來使用壓縮的DNA數(shù)據(jù)會(huì)成為必然的趨勢(shì),而要直接使用DNA壓縮數(shù)據(jù),DNA壓縮模式匹配又是必須解決的問題。因此DNA壓縮和DNA壓縮模式匹配就有良好的應(yīng)用前景。DNA壓縮算法及其DNA壓縮模式匹配算法的研究,有助于將DNA序列數(shù)據(jù)從較為高端的工作平臺(tái)(專用的存儲(chǔ)容量較大的服務(wù)器)遷移到更簡(jiǎn)易的工作平臺(tái)(普通的存儲(chǔ)容量較小的計(jì)算機(jī),如筆記本電腦或PDA)上,使得生物學(xué)家可以隨時(shí)隨地開展研究工作;DNA壓縮算法及其DNA壓縮模式匹配算法的研究,還可以為在普通工作平臺(tái)上建立專門的二級(jí)數(shù)據(jù)庫(kù)提供新的方法。專利申報(bào)情況□提出專利申報(bào)申報(bào)號(hào)申報(bào)日期年月日□已獲專利權(quán)批準(zhǔn)批準(zhǔn)號(hào)批準(zhǔn)日期年月日□未提出專利申請(qǐng)科研管理部門簽章年月日
C.當(dāng)前國(guó)內(nèi)外同類課題研究水平概述說明:1.申報(bào)者可根據(jù)作品類別和情況填寫;2.填寫此欄有助于評(píng)審。為了對(duì)DNA數(shù)據(jù)進(jìn)修壓縮,減小DNA數(shù)據(jù)所占用的空間,1993年GrumbachS.和TahiF.從經(jīng)典的基于字典壓縮的LZ系列算法中提出BioCompress算法,從搜索和編碼兩方面針對(duì)DNA序列進(jìn)行改進(jìn)。1999年ChenX.,KwongS.和LiM.的GenCompress算法是對(duì)BioCompress算法的改進(jìn),使序列數(shù)據(jù)壓縮的速度和壓縮率提高到實(shí)用層次。2001年SatoH.,YoshiokaT.,KonagayaA.和ToyodaT.提出Cfect算法,引入后綴樹數(shù)據(jù)結(jié)構(gòu),提高搜索重復(fù)字符串速度,并提高序列數(shù)據(jù)的壓縮率。2002年,ChenX.,LiM.,MaB.和TrompJ.以生物數(shù)據(jù)序列比對(duì)為基礎(chǔ),提出DNACompress算法,獲得了較高數(shù)據(jù)壓縮率。之后,計(jì)算機(jī)專家繼續(xù)不斷地努力,2005年Kordi,G.和Tabus,I.,ShengBao,ShiChen,ZhiqiangJing和RanRen,JieLiu,ShengBao,ZhiqiangJing和ShiChen均嘗試進(jìn)一步改進(jìn)算法,提高DNA數(shù)據(jù)的壓縮率。壓縮模式匹配(Compressedpatternmatching)思想于1992年由Amir和Benson首先提出,即給定文本T,根據(jù)某種壓縮算法進(jìn)行壓縮得到壓縮串Z,給定模式串P,僅僅使用P和Z尋找P在T中的所有出現(xiàn)。不過,關(guān)于模式匹配算法的研究大多數(shù)只是針對(duì)普通的文本數(shù)據(jù)。因?yàn)镈NA序列數(shù)據(jù)及其壓縮算法的特殊性,DNA壓縮模式匹配算法也需要進(jìn)行專門研究,以具有更好的適應(yīng)性。DNA壓縮模式匹配是生物信息學(xué)中一個(gè)新的研究領(lǐng)域,主要致力解決下面的問題:對(duì)給定的壓縮格式的DNA序列文件F和一個(gè)DNA模式P,在不解壓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)如何合法解除勞動(dòng)合同
- 山塘水庫(kù)承包合同樣本(2篇)
- 廣州-PEP-2024年10版小學(xué)3年級(jí)英語(yǔ)第三單元真題試卷
- 探究小學(xué)數(shù)學(xué)教學(xué)中德育教育現(xiàn)狀與解決辦法
- 學(xué)校體育器材購(gòu)銷合同(2篇)
- 淺談園林建筑過程中綠化工程
- 愛情婚姻咨詢合作協(xié)議
- 《企業(yè)員工保險(xiǎn)協(xié)議》
- 在線商城半年銷售工作總結(jié)
- 道路交通工程綠色施工方案
- 混凝土路面工程監(jiān)理實(shí)施細(xì)則
- 煤炭行業(yè)2025年行業(yè)回歸合理盈利估值仍有提升空間
- 期中測(cè)試卷(1-4單元)(試題)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)北師大版
- 5.2 珍惜師生情誼同步課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年級(jí)上冊(cè)
- 人教版2024新版七年級(jí)上冊(cè)數(shù)學(xué)期中模擬測(cè)試卷(含答案解析)
- 專題25 圓的基本性質(zhì)(分層精練)(解析版)
- 2024-2030年中國(guó)電視訪談節(jié)目行業(yè)市場(chǎng)前瞻與未來投資戰(zhàn)略研究報(bào)告
- 手工木工(技師)技能認(rèn)定理論考試題庫(kù)大全-上(單選題)
- 5.2 珍惜師生情誼 課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年 上冊(cè)
- 在初中數(shù)學(xué)教學(xué)中有效開展項(xiàng)目式學(xué)習(xí)的策略
- 行政或后勤崗位招聘筆試題及解答(某大型國(guó)企)2025年
評(píng)論
0/150
提交評(píng)論