




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、PAGE PAGE 33申報(bào)人編號(hào):(123197)2012年度南京領(lǐng)軍型科技創(chuàng)業(yè)人才引進(jìn)計(jì)劃創(chuàng)業(yè)計(jì)劃書(A類)申報(bào)人: 項(xiàng)目名稱:科研大數(shù)據(jù)的管理和分析 第一部分 申報(bào)人及團(tuán)隊(duì)基本情況一、基本信息國內(nèi)最高學(xué)歷/學(xué)位碩士/碩士研究生國外最高學(xué)位碩士目前工作單位Morgridge Institute for Research (UW-Madison)目前工作地點(diǎn)美洲美國 創(chuàng)業(yè)經(jīng)歷創(chuàng)業(yè)企業(yè)名稱創(chuàng)業(yè)地點(diǎn)注冊(cè)時(shí)間公司是否仍在運(yùn)行與原企業(yè)關(guān)系上海來今化工有限公司亞洲,中華人民共和國,上海1996-5是辭職離開二、教育、工作經(jīng)歷學(xué)習(xí)經(jīng)歷時(shí)間學(xué)校專業(yè)學(xué)歷/學(xué)位1981-5至1985-7山西大學(xué)化學(xué)本科198
2、6-9至1990-7河北大學(xué)化學(xué)碩士1996-9至2000-7Marquette University計(jì)算機(jī)科學(xué)碩士工作經(jīng)歷時(shí)間單位任職1993-9至1995-7ECOLAB Chemical LtdDirector1996-9至1998-7Legendary Chemical LtdVice President2000-9至2006-7Medical College of WisconsinDirector2006-9至2012-6Morgridge Institute for ResearchSenior Scientist三、申報(bào)人簡介申報(bào)人介紹(300字之內(nèi)):介紹申報(bào)人的創(chuàng)新意識(shí)、開
3、拓能力、經(jīng)營理念以及在科技、經(jīng)濟(jì)、管理領(lǐng)域取得的主要業(yè)績。聶金福,雙科碩士(化學(xué)碩士,中國河北大學(xué);計(jì)算機(jī)科學(xué)碩士,美國馬凱特大學(xué),Marquette University),現(xiàn)就職于美國莫格里奇研究所(Morgridge Institute for Research)任資深生物信息研究員,同時(shí)也是中國科學(xué)院廣州生物醫(yī)藥與健康研究院研究員。聶金福有長達(dá)十二年的生物信息工作經(jīng)驗(yàn),最近五年更是持續(xù)與美國多家科技公司合作,提供關(guān)鍵性的生物信息咨詢服務(wù)及負(fù)責(zé)生物信息分析工具開發(fā)工作。在美國莫格里奇研究所工作期間,聶金福幫助建設(shè)了一個(gè)功能齊全的生物信息學(xué)研究團(tuán)隊(duì),提供多方面的生物信息科研服務(wù),包括在科學(xué)
4、雜志發(fā)表的iPS細(xì)胞論文中相關(guān)的生物信息分析。聶金福曾任美國威斯康星大學(xué)醫(yī)學(xué)院大鼠基因組數(shù)據(jù)庫生物信息組負(fù)責(zé)人,在利用生物信息數(shù)據(jù)挖掘,分析方面具有很好的經(jīng)驗(yàn)積累。聶金福尤其擅長新一代測序?yàn)榛A(chǔ)的海量數(shù)據(jù)的分析與挖掘,曾發(fā)表過最先進(jìn)的轉(zhuǎn)錄因子聚類算法,開發(fā)過多種新一代測序數(shù)據(jù)分析工具。在高性能計(jì)算領(lǐng)域,對(duì)不同的分布計(jì)算系統(tǒng)有深入的了解,包括LSF,PBS,SGE,Condor and Amazon Cloud等。曾發(fā)表過多篇科學(xué)論文,其中包括科學(xué)等頂級(jí)雜志的論文。聶金福對(duì)中國的企業(yè)管理和運(yùn)作也有非常豐富和直接的經(jīng)驗(yàn)。聶金福曾和合伙人一起創(chuàng)建上海來今化工有限公司(Legendary Chemic
5、al Ltd.)并擔(dān)任副總經(jīng)理。在任職期間,將企業(yè)從初創(chuàng)階段發(fā)展為千萬元營收的國際公司。聶金福也曾擔(dān)任藝康化工有限公司(藝康集團(tuán), ECOLAB Chemical Ltd.)研發(fā)部經(jīng)理,負(fù)責(zé)開發(fā)過300多產(chǎn)品,直接負(fù)責(zé)多個(gè)部門的工作。在聶金福的領(lǐng)導(dǎo)下,企業(yè)曾達(dá)到人均盈利全國排名第三的好成績。四、創(chuàng)業(yè)團(tuán)隊(duì)其他成員創(chuàng)業(yè)團(tuán)隊(duì)其他主要成員列表(限填10人以內(nèi))姓名出生日期畢業(yè)院校學(xué)歷/學(xué)位角色是否全職張新民1975-01-14Columbia University博士首席運(yùn)營官及市場部總監(jiān)是趙沁1969-08-02University of Wisconsin-Madison博士中國市場部經(jīng)理是趙國燕
6、1972-12-25Washington University博士高級(jí)技術(shù)專家否吳稷1972-02-12Columbia University博士國際市場部經(jīng)理否團(tuán)隊(duì)其他成員介紹(1000字之內(nèi)):核心團(tuán)隊(duì)包括擬任總經(jīng)理、分管技術(shù)、市場、財(cái)務(wù)等方面的副總經(jīng)理和同類職務(wù)的人員,介紹每一成員的受教育背景、能力與專長、工作業(yè)績等。首席運(yùn)營官及市場部總監(jiān):張新民,博士本科畢業(yè)于北京大學(xué)生物系,并獲得美國哥倫比亞大學(xué)(Columbia University)生物學(xué)博士學(xué)位。 張新民博士有十多年的生物技術(shù)開發(fā)經(jīng)驗(yàn),曾在羅氏(Roche)公司擔(dān)任全球高級(jí)產(chǎn)品開發(fā)和市場部經(jīng)理,以及科研市場總監(jiān)的職位。張新民博
7、士領(lǐng)導(dǎo)開發(fā)過多種生物芯片及第二代高通量測序技術(shù)產(chǎn)品,并領(lǐng)導(dǎo)商務(wù)團(tuán)隊(duì)快速將產(chǎn)品推向市場,取得過銷售額逐年翻番的驕人業(yè)績。在羅氏公司,張新民博士直接負(fù)責(zé)的產(chǎn)品年銷售額超過數(shù)千萬美元,多個(gè)主要產(chǎn)品在全球市場占有率遙遙領(lǐng)先。張新民博士在為羅氏新測序產(chǎn)品打開中國市場過程中做出過重要貢獻(xiàn),他協(xié)同中國團(tuán)隊(duì)和華大基因,上海交大等多個(gè)重點(diǎn)客戶建立密切聯(lián)系,開拓出逾千萬人民幣的新市場。中國市場部經(jīng)理:趙沁,博士趙沁本科畢業(yè)于南開大學(xué),在美國威斯康星大學(xué)獲得了生物化學(xué)博士。趙沁博士擁有近二十年生物化學(xué)科研經(jīng)驗(yàn),發(fā)表過近30篇科研文獻(xiàn)。在美國威斯康星大學(xué)博士后工作期間,趙沁博士參與了美國NIH第一階段的大型蛋白質(zhì)結(jié)構(gòu)
8、組學(xué)(PSI-1),由于成績突出,于一年內(nèi)被提升為研究員。趙沁博士后來在著名的美國生物試劑公司Promega任職高級(jí)研究員。趙沁博士擁有七年以上的工業(yè)界生物試劑研發(fā)和生產(chǎn)的經(jīng)驗(yàn),主導(dǎo)和參與了十多個(gè)生物試劑產(chǎn)品的研發(fā)和生產(chǎn),并獲得了自己的專利。趙沁博士在工作期間,多次參與市場部工作,并代表公司在大型國際會(huì)議上每年至少做一次科研報(bào)告。在最近一年,趙沁博士回到中國,帶領(lǐng)一家業(yè)界領(lǐng)先的生物CRO公司的服務(wù)和生物試劑的市場部上游業(yè)務(wù)團(tuán)隊(duì),領(lǐng)導(dǎo)和制定的公司營銷計(jì)劃,在一年內(nèi)上市了二十多個(gè)新服務(wù)和產(chǎn)品,并成功地實(shí)施了十幾個(gè)業(yè)務(wù)拓展,產(chǎn)品營銷和促銷計(jì)劃,一年內(nèi)將公司的客戶流量和產(chǎn)值提升了近30%。趙沁博士帶領(lǐng)
9、的市場部上游業(yè)務(wù)團(tuán)隊(duì),管理公司的近5000種產(chǎn)品在全球范圍內(nèi)的營銷,負(fù)責(zé)近30家全球范圍內(nèi)經(jīng)銷商的管理,以及主導(dǎo)公司兩個(gè)獨(dú)立網(wǎng)站的建立和運(yùn)營。高級(jí)技術(shù)專家:趙國燕,博士本科畢業(yè)于北京大學(xué)生物系,在華盛頓大學(xué)獲得分子細(xì)胞生物學(xué)博士學(xué)位,在博士后期間接受過專業(yè)生物信息學(xué)培訓(xùn),有八年生物信息學(xué)研究經(jīng)驗(yàn)。趙國燕博士目前是美國Washington University(St Louis)助理教授,是該校病原發(fā)現(xiàn)中心的創(chuàng)始人兼總監(jiān)。趙國燕博士擅長新一代測序數(shù)據(jù)分析(454,Illumna等),有多年 RNA-Seq及基因組數(shù)據(jù)的分析經(jīng)驗(yàn)以及分析工具開發(fā)經(jīng)驗(yàn)。在國際頂級(jí)科學(xué)雜志上發(fā)表過多篇科研論文。精通多種
10、計(jì)算機(jī)編程語言,生物信息學(xué)工具及數(shù)據(jù)庫。國際市場部經(jīng)理:吳稷:博士武漢大學(xué)本科,協(xié)和醫(yī)科大學(xué)碩士,并獲得美國哥倫比亞大學(xué)生物學(xué)博士學(xué)位。吳稷博士對(duì)生物技術(shù)產(chǎn)品在全球市場的營銷有豐富的經(jīng)驗(yàn),有超過十年的生物制藥市場管理及營銷的成功記錄。吳稷曾在美國英杰生命技術(shù)有限公司(Invitrogen),Epicentre Biotechnologies,及Covance擔(dān)任過高級(jí)產(chǎn)品經(jīng)理及市場營銷主管,負(fù)責(zé)超過上千種產(chǎn)品的營銷,年銷售額超過6000萬美元。財(cái)務(wù)總監(jiān)及企業(yè)發(fā)展總監(jiān):葉正義,博士, 工商管理碩士, 注冊(cè)金融分析師(聯(lián)系中)葉正義擁有工商管理碩士(MBA, University of Calif
11、ornia, Irvine) ,生物醫(yī)學(xué)博士(University of California, San Diego),注冊(cè)金融分析師(CFA)等學(xué)歷,也是美國KaJo Investments LLC出資人和首席投資官,及Morgan Stanley投資財(cái)務(wù)顧問。葉正義博士是商業(yè)專業(yè)人士和創(chuàng)業(yè)者,具有廣泛生物醫(yī)學(xué),金融和市場運(yùn)銷的的經(jīng)驗(yàn)。葉正義博士對(duì)生物醫(yī)學(xué)研發(fā)有深刻的理解,有很強(qiáng)的客戶培養(yǎng),資產(chǎn)組合管理,風(fēng)險(xiǎn)管理和金融建模能力。五、團(tuán)隊(duì)創(chuàng)業(yè)能力開發(fā)能力(200字之內(nèi)):介紹團(tuán)隊(duì)的研發(fā)隊(duì)伍和資金投入以及項(xiàng)目已取得的研究開發(fā)成果。核心團(tuán)隊(duì)成員在科研行業(yè)、信息技術(shù)、產(chǎn)品開發(fā)、國內(nèi)國際營銷等方面有非
12、常豐富的經(jīng)驗(yàn)。這種能力和經(jīng)驗(yàn)互補(bǔ)的團(tuán)隊(duì)組成保證我們能夠把握市場機(jī)會(huì)、理解科研客戶的需求、開發(fā)適合科研客戶的產(chǎn)品、保證產(chǎn)品具備科研行業(yè)領(lǐng)先的技術(shù)、并配合市場營銷確保產(chǎn)品具備市場潛力。這些成員的具體科研成果、相關(guān)的技術(shù)水平和產(chǎn)品開發(fā)能力、大公司的工作經(jīng)驗(yàn)、工作業(yè)績等在他們的簡歷有詳細(xì)描述。和本項(xiàng)目直接相關(guān)的科研成果大部分已發(fā)表,總科研經(jīng)費(fèi)從美國國立衛(wèi)生研究院的統(tǒng)計(jì)來看已在千萬美元級(jí)別。我們的團(tuán)隊(duì)成員在工作中已積累了豐富的經(jīng)驗(yàn)并建立了自己的專有技術(shù),其中的直接科研成果包括獨(dú)有的大數(shù)據(jù)管理平臺(tái)及分析系統(tǒng)。這些科研成果已經(jīng)在實(shí)際工作中得到了廣泛的測試,并被數(shù)百家美國和歐洲的科研院所使用。我們?cè)谥袊墓?/p>
13、雖然剛剛成立,但根據(jù)計(jì)劃,很快將會(huì)增資到幾百萬至千萬級(jí)別。所以這些進(jìn)展使我們確信我們的團(tuán)隊(duì)具有行業(yè)領(lǐng)先的產(chǎn)品開發(fā)能力和市場營銷能力。營銷能力(200字之內(nèi)):介紹團(tuán)隊(duì)的經(jīng)營模式和市場策劃能力、銷售渠道等。我們的市場營銷專家具有豐富的國內(nèi)國際市場營銷經(jīng)驗(yàn),在業(yè)界領(lǐng)先的大公司中都有多年的工作經(jīng)歷和成功業(yè)績。他們能夠理解客戶需求,有能力選擇高效的市場營銷手段,制定可行的目標(biāo)并保證營銷業(yè)績。同時(shí),他們還能夠把握市場機(jī)會(huì),積極提供反饋,配合產(chǎn)品開發(fā),并保證客戶服務(wù)質(zhì)量等。我們的團(tuán)隊(duì)熟悉直接銷售,子公司,代理等多種渠道,并擅長靈活應(yīng)用這些渠道取得科研市場最高的占有率。總之,我們的核心團(tuán)隊(duì)在市場營銷方面已經(jīng)
14、做好了充分的準(zhǔn)備。融資能力(200字之內(nèi)):介紹團(tuán)隊(duì)的融資策劃能力、融資渠道等。我們的核心團(tuán)隊(duì)成員有豐富的人脈關(guān)系,這些人脈關(guān)系能夠確保我們?cè)谛枰谫Y時(shí)有充分的資源。我們的團(tuán)隊(duì)成員都有在國內(nèi)、國際名牌大學(xué)的學(xué)習(xí)經(jīng)歷,也有在業(yè)界大公司的工作經(jīng)驗(yàn),他們不僅已經(jīng)經(jīng)歷過各種融資事件(工作期間有融資、上市、并購等事件),他們也都有很多同學(xué)、同事現(xiàn)在涉及創(chuàng)業(yè)、投融資等事業(yè)。我們正在聯(lián)系具有財(cái)務(wù)、融資、工商管理等背景的人才加入團(tuán)隊(duì)。我們正在聯(lián)系葉正義,一位潛在的財(cái)務(wù)總監(jiān)及企業(yè)發(fā)展總監(jiān)。葉正義不僅是生物醫(yī)藥博士,而且也是工商管理碩士和注冊(cè)金融分析師。葉博士在財(cái)務(wù)管理、融資等方面具有豐富的經(jīng)驗(yàn)。我們相信我們團(tuán)隊(duì)
15、在需要時(shí)能夠展示他們特有的財(cái)務(wù)和融資能力。其他特殊能力(100字之內(nèi)):介紹創(chuàng)業(yè)項(xiàng)目已獲得的特殊資格認(rèn)證或證明等。我們的核心團(tuán)隊(duì)成員有堅(jiān)實(shí)的科研大數(shù)據(jù)管理和分析經(jīng)驗(yàn)。他們?cè)谙鄳?yīng)領(lǐng)域都有多年的工作和豐富的科研成果,從他們的簡歷可以看出他們已經(jīng)取得了同行們的認(rèn)可。因?yàn)檫@個(gè)行業(yè)的人才非常緊缺,我們非常有幸能聯(lián)合這些有共同理想的同行一起創(chuàng)業(yè)。第二部分 項(xiàng)目概述一、創(chuàng)業(yè)項(xiàng)目概述創(chuàng)業(yè)項(xiàng)目概述(500字之內(nèi)):對(duì)項(xiàng)目總體情況的描述,包括采用的關(guān)鍵技術(shù)、技術(shù)的創(chuàng)新點(diǎn)、權(quán)威部門的技術(shù)鑒定情況、環(huán)保評(píng)價(jià)等內(nèi)容。本項(xiàng)目產(chǎn)品將為生物醫(yī)學(xué)科研人員提供基于云計(jì)算的生命科學(xué)大數(shù)據(jù)解決方案,產(chǎn)品主要為科研大數(shù)據(jù)的存儲(chǔ),檢索和
16、分析系統(tǒng)?;谠朴?jì)算的軟件服務(wù)給研究者提供了存儲(chǔ)和分析數(shù)據(jù)的高效能平臺(tái),使用戶不再需要自己搭建計(jì)算機(jī)集群即可按需完成海量數(shù)據(jù)的處理。本項(xiàng)目的關(guān)鍵技術(shù)包括專有的科研應(yīng)用開發(fā)平臺(tái)、科研大數(shù)據(jù)管理系統(tǒng)及一系列科研大數(shù)據(jù)分析工具。這些平臺(tái)、系統(tǒng)及工具在理念上居于世界領(lǐng)先地位,在中國還基本是空白。相關(guān)的專有技術(shù)正在準(zhǔn)備作技術(shù)鑒定并申請(qǐng)知識(shí)產(chǎn)權(quán)。本項(xiàng)目的創(chuàng)新要點(diǎn)包括1)云計(jì)算大數(shù)據(jù)解決方案相對(duì)傳統(tǒng)技術(shù)的低成本,高效,易交流的優(yōu)勢。傳統(tǒng)技術(shù)依賴大規(guī)模電腦服務(wù)器中心和專業(yè)生物信息人員來管理生物醫(yī)學(xué)的大量數(shù)據(jù),成本昂貴,效率低下,結(jié)果不容易交流。2)適用于科研行業(yè)大數(shù)據(jù)的應(yīng)用開發(fā)平臺(tái)。目前國家及大型企業(yè)的“云計(jì)
17、算”重點(diǎn)在基礎(chǔ)設(shè)施服務(wù)、平臺(tái)服務(wù)和通用軟件服務(wù)上。只有很少的企業(yè)開始將云計(jì)算應(yīng)用在科研領(lǐng)域里。3)高端生命科學(xué)大數(shù)據(jù)分析系統(tǒng)。每一個(gè)分析工具都整合了最新的算法,具有最尖端的分析能力,以及最易于接受的用戶界面和服務(wù)形式。在過去幾年里,我們的團(tuán)隊(duì)成員已經(jīng)向眾多國際知名科研院所的實(shí)驗(yàn)室提供了相關(guān)的服務(wù),包括美國的威斯康星大學(xué),哈佛大學(xué),斯坦福大學(xué),索爾克(Salk)研究所,加利福尼亞大學(xué)(UCSD,UCLA,.)等。這些服務(wù)不僅驗(yàn)證了相關(guān)技術(shù)的可靠性,也明確展示了廣闊的市場前景。二、創(chuàng)業(yè)機(jī)會(huì)概述創(chuàng)業(yè)機(jī)會(huì)概述(300字之內(nèi)):要從項(xiàng)目產(chǎn)品的先進(jìn)性及應(yīng)用發(fā)展前景、進(jìn)入市場機(jī)會(huì)(如:市場現(xiàn)實(shí)需求處于萌芽、
18、起步、成長、成熟、飽和、衰退階段)及市場發(fā)展空間、團(tuán)隊(duì)實(shí)施項(xiàng)目的現(xiàn)有能力和發(fā)展?jié)摿Φ确矫婷枋鰟?chuàng)業(yè)機(jī)會(huì)?,F(xiàn)代社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代。據(jù)市場研究公司IDC預(yù)測,未來10年全球數(shù)據(jù)量將增長近50倍。如何充分利用數(shù)據(jù)資產(chǎn)是每個(gè)行業(yè)面臨的一個(gè)核心議題。生物醫(yī)學(xué)領(lǐng)域由于高通量基因組技術(shù)的高速發(fā)展,大數(shù)據(jù)爆炸帶來的機(jī)遇和挑戰(zhàn)尤其明顯。如何有效,實(shí)用地管理和分析生物醫(yī)學(xué)領(lǐng)域的大數(shù)據(jù)是生命科學(xué)研究的一個(gè)難題。生命科學(xué)大數(shù)據(jù)已經(jīng)發(fā)展到了一個(gè)新的臨界點(diǎn),數(shù)據(jù)分析成本開始超過產(chǎn)生數(shù)據(jù)的成本,傳統(tǒng)數(shù)據(jù)管理方案遇到了嚴(yán)重瓶頸。近年云計(jì)算的興起對(duì)大數(shù)據(jù)問題提供了創(chuàng)新的解決思路,科研領(lǐng)域采用基于云計(jì)算的解決方案是大勢所趨,前
19、景廣闊。此方向的突破具有巨大的市場潛力,并將促進(jìn)生命科學(xué)和醫(yī)學(xué)研究的革命。生命科學(xué)大數(shù)據(jù)的主要來源是生物芯片(2012年全球市場9.8億美元)和高通量測序(2012年全球市場9.2億美元)。其中高通量測序市場每年有超過20%的增長率,是繼互聯(lián)網(wǎng)之后的又一個(gè)經(jīng)濟(jì)增長亮點(diǎn)。目前只有很少的企業(yè)和機(jī)構(gòu)開始將云計(jì)算應(yīng)用在科研領(lǐng)域里。本項(xiàng)目產(chǎn)品會(huì)填補(bǔ)國內(nèi)科研領(lǐng)域的一個(gè)空白,在數(shù)億人民幣的大數(shù)據(jù)管理市場上帶來可觀的經(jīng)濟(jì)效益。更重要的是,由于我們領(lǐng)先的技術(shù)和先進(jìn)的科研理念,以及團(tuán)隊(duì)在北美和歐洲生物醫(yī)學(xué)市場寶貴的營銷經(jīng)驗(yàn),產(chǎn)品將會(huì)順利打入國際知名科研院所,在幾十億美元全球生命科學(xué)大數(shù)據(jù)管理市場站穩(wěn)領(lǐng)先地位。我們
20、的技術(shù)不僅在概念上超越所有其他公司,而且已開發(fā)的平臺(tái)和系統(tǒng)已確保新公司擁有領(lǐng)先的市場競爭優(yōu)勢。三、擬辦(已創(chuàng)辦)企業(yè)情況企業(yè)名稱南京云蔚谷信息科技有限公司已辦企業(yè)注冊(cè)時(shí)間2012-5企業(yè)注冊(cè)地址南京市鼓樓區(qū)華僑路街道明華新村3-3號(hào)所在區(qū)縣(開發(fā)區(qū)) 南京市鼓樓區(qū)申報(bào)人擔(dān)任的職務(wù)是 其他:副總經(jīng)理企業(yè)人數(shù) 6博士 2碩士 1本科 3企業(yè)性質(zhì)內(nèi)資注冊(cè)資本10 萬元是否為高新技術(shù)企業(yè)否 企業(yè)獲得的資格認(rèn)定、產(chǎn)品鑒定等產(chǎn)業(yè)領(lǐng)域生物和醫(yī)藥承擔(dān)市級(jí)以上科技項(xiàng)目項(xiàng)目名稱及編號(hào)立項(xiàng)批準(zhǔn)部門資助額度獲得的各級(jí)政府支持項(xiàng)目名稱支持部門資助額度股本構(gòu)成(萬元)內(nèi)容貨幣出資無形資產(chǎn)作價(jià)有形資產(chǎn)作價(jià)技術(shù)作價(jià)其他無形資
21、產(chǎn)作價(jià)申報(bào)人200(正在增資) 400(正在評(píng)估) 團(tuán)隊(duì)其他成員 風(fēng)險(xiǎn)投資 其他資金 合計(jì) 申報(bào)人個(gè)人投入占股百分比:99 %注:南京云蔚谷信息科技有限公司正在準(zhǔn)備增資手續(xù)并積極尋求融資。根據(jù)股東協(xié)議,股東將在9月30日前增資到200萬元人民幣以上。四、嫁接企業(yè)情況N/A第三部分 項(xiàng)目技術(shù)與產(chǎn)品(服務(wù))實(shí)現(xiàn)第一章 項(xiàng)目技術(shù)方案一、項(xiàng)目總體技術(shù)概述(一)總體技術(shù)方案項(xiàng)目所依據(jù)的技術(shù)原理(1000字之內(nèi)):在現(xiàn)代生物醫(yī)學(xué)領(lǐng)域,如何有效,實(shí)用地管理和分析高通量技術(shù)革命所帶來的大數(shù)據(jù)是一個(gè)核心議題。根據(jù)美國國立衛(wèi)生研究院提供的數(shù)據(jù),每一百萬堿基測序的成本在2001年大約是五千美元;到2011年底,應(yīng)用
22、高通量測序技術(shù),產(chǎn)生同樣數(shù)據(jù)只需要0.1美元。高通量測序技術(shù)的飛速發(fā)展帶來生物醫(yī)學(xué)數(shù)據(jù)的爆炸性增長,科學(xué)家們面臨的問題不再是怎么產(chǎn)生數(shù)據(jù),而是如何有效的管理分析大數(shù)據(jù)以獲得有用信息。傳統(tǒng)技術(shù)無法充分解決這個(gè)問題。云計(jì)算技術(shù)的快速發(fā)展使人們有可能開發(fā)出一個(gè)這樣的解決方案。云計(jì)算是基于互聯(lián)網(wǎng)、通過虛擬化方式共享資源的計(jì)算模式,使計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、軟件等資源,按照用戶的動(dòng)態(tài)需要,以服務(wù)的方式提供。雖然云計(jì)算技術(shù)已經(jīng)在全世界范圍內(nèi)流行,國家和地方也已在大力發(fā)展云計(jì)算基礎(chǔ)設(shè)施目前,還沒有一個(gè)專門針對(duì)科研大數(shù)據(jù)的應(yīng)用系統(tǒng)。我們采用最新的網(wǎng)絡(luò)技術(shù)(包括LAMP (Linux, Apache, MySQL,
23、and PHP),HTML5/XHTML/AJAX 等技術(shù)),結(jié)合我們多年的生命科學(xué)科研經(jīng)歷,研發(fā)了一套獨(dú)有的、基于云計(jì)算的、專門針對(duì)于生命科學(xué)大數(shù)據(jù)的應(yīng)用開發(fā)平臺(tái)。該平臺(tái)包括系統(tǒng)核心數(shù)據(jù)管理工具,用戶程序接口及新系統(tǒng)開發(fā)工具,審計(jì)追蹤,以及眾多的生物信息分析模塊。這個(gè)平臺(tái)允許快速開發(fā)出以云計(jì)算為基礎(chǔ)的各種信息系統(tǒng)。在這個(gè)應(yīng)用開發(fā)平臺(tái)上可以整合各種管理工具、分析工具、第三方應(yīng)用等。為了將我們的應(yīng)用平臺(tái)技術(shù)和理論應(yīng)用于實(shí)際工作中,我們分析了生命科學(xué)大數(shù)據(jù)的特點(diǎn)、數(shù)據(jù)類型、用戶需求、常見困難等,在我們的平臺(tái)上開發(fā)了一套通用的科研大數(shù)據(jù)管理和分析系統(tǒng)。我們的科研大數(shù)據(jù)管理和分析系統(tǒng)是在多年的科研和實(shí)
24、踐經(jīng)驗(yàn)基礎(chǔ)上設(shè)計(jì)的。這是一套整合的、基于網(wǎng)絡(luò)的大數(shù)據(jù)系統(tǒng),能夠在多個(gè)方面幫助科研人員提高效率和降低成本,包括大數(shù)據(jù)長期存儲(chǔ),整合,常用分析流水線的自動(dòng)化,數(shù)據(jù)搜索和圖表顯示的優(yōu)化,自動(dòng)生成實(shí)時(shí)研究報(bào)告等。在生物醫(yī)藥行業(yè)里普及這套系統(tǒng),能夠極大地提高科研效率和降低成本,最終引領(lǐng)科研行業(yè)進(jìn)入云計(jì)算時(shí)代。我們的科研大數(shù)據(jù)管理和分析系統(tǒng)在提供了非常強(qiáng)大的數(shù)據(jù)分析能力的同時(shí),也注重用戶界面的人性化,以及充分把數(shù)據(jù)分析結(jié)果和生物醫(yī)學(xué)意義緊密結(jié)合,使科研人員不需要有統(tǒng)計(jì)或生物信息學(xué)背景也能駕馭大數(shù)據(jù)。系統(tǒng)里包含行業(yè)里最新的生物信息、生物統(tǒng)計(jì)、數(shù)據(jù)整合、網(wǎng)絡(luò)數(shù)據(jù)庫、數(shù)據(jù)后臺(tái)處理等技術(shù),具有國際領(lǐng)先水平。主要技
25、術(shù)與性能指標(biāo)(500字之內(nèi)):科研大數(shù)據(jù)應(yīng)用開發(fā)平臺(tái)。指標(biāo):1)高速;這個(gè)平臺(tái)允許我們快速開發(fā)出基于云計(jì)算的信息系統(tǒng)。一個(gè)中等實(shí)驗(yàn)室的基因表達(dá)數(shù)據(jù)庫用我們的平臺(tái)一周內(nèi)可以完成,而其他平臺(tái)則需數(shù)月時(shí)間。)高整合度;我們的平臺(tái)包括常用的生物分析工具(DNA和蛋白序列分析,引物設(shè)計(jì),抗體流程等),并很方便插入第三方數(shù)據(jù)庫和應(yīng)用(如GenBank, SRA, R/Bioconductor)。案例:此平臺(tái)已經(jīng)被用于開發(fā)多種科研信息管理系統(tǒng)(如實(shí)驗(yàn)動(dòng)物信息管理系統(tǒng))并以經(jīng)過數(shù)千科研人員的測試,相關(guān)產(chǎn)品也已經(jīng)擁有數(shù)百家國際著名科研院所實(shí)驗(yàn)室的付費(fèi)客戶??蒲写髷?shù)據(jù)管理系統(tǒng)。指標(biāo):)自動(dòng)化程度高。系統(tǒng)包括常用生
26、物流程的自動(dòng)化,數(shù)據(jù)搜索,圖表顯示,實(shí)時(shí)研究報(bào)告等。2)成本低,是傳統(tǒng)方法的或更少,并易于擴(kuò)大。案例:糖尿病數(shù)據(jù)庫(/)。該數(shù)據(jù)庫對(duì)糖尿病研究領(lǐng)域提供強(qiáng)大的資源,允許研究人員搜索多個(gè)糖尿病小鼠模型的全基因組數(shù)據(jù)。迄今有上萬訪問量??蒲写髷?shù)據(jù)分析系統(tǒng)。指標(biāo):)優(yōu)化的分析流水線。從原始數(shù)據(jù)采集,質(zhì)控,首輪分析,整合分析,圖表顯示,我們充分結(jié)合多個(gè)最新算法,建立了靈活,高效的流水線。2)用戶界面的人性化,我們團(tuán)隊(duì)有強(qiáng)大的科研背景,熟悉科研人員需要,能把數(shù)據(jù)分析結(jié)果和生物醫(yī)學(xué)意義緊密結(jié)合。案例:數(shù)千基因芯片數(shù)據(jù)整合分析系統(tǒng)(/,內(nèi)部系統(tǒng)),聯(lián)合威斯康星大學(xué)生化系A(chǔ)ttie教授開發(fā)。該數(shù)據(jù)庫能同時(shí)多數(shù)千
27、基因芯片實(shí)驗(yàn)結(jié)果做多種分析和比較,如eQTL,Time Course, Enrichment等,允許研究人員隨時(shí)搜索多個(gè)基因組數(shù)據(jù),已成為相關(guān)實(shí)驗(yàn)室的日常數(shù)據(jù)分析工具。(二)項(xiàng)目創(chuàng)新內(nèi)容創(chuàng)新類別X理論創(chuàng)新 X應(yīng)用創(chuàng)新 X技術(shù)創(chuàng)新 工藝創(chuàng)新 結(jié)構(gòu)創(chuàng)新項(xiàng)目創(chuàng)新內(nèi)容(1200字之內(nèi)):創(chuàng)新內(nèi)容要根據(jù)選擇的創(chuàng)新類別,用技術(shù)語言按創(chuàng)新點(diǎn)分條目描述,盡可能多用實(shí)驗(yàn)數(shù)據(jù),要有數(shù)據(jù)分析、對(duì)比。如果是技術(shù)創(chuàng)新,請(qǐng)說明目前一般采用什么技術(shù),申報(bào)項(xiàng)目對(duì)什么技術(shù)進(jìn)行了創(chuàng)新,;如果是結(jié)構(gòu)創(chuàng)新、工藝創(chuàng)新,需進(jìn)行新舊結(jié)構(gòu)或工藝對(duì)比,并畫出新舊結(jié)構(gòu)圖和工藝流程圖。本項(xiàng)目描述的是一種基于云計(jì)算的、針對(duì)于科研行業(yè)的大數(shù)據(jù)管理和分
28、析的解決方案。項(xiàng)目中的技術(shù)在世界上領(lǐng)先,在中國還完全是個(gè)空白。基于篇幅限制,以下是一些總體的創(chuàng)新要點(diǎn):(一)云計(jì)算大數(shù)據(jù)解決方案相對(duì)傳統(tǒng)技術(shù)的優(yōu)勢傳統(tǒng)技術(shù)依賴大規(guī)模電腦服務(wù)器中心和專業(yè)生物信息人員來管理生物醫(yī)學(xué)的大量數(shù)據(jù),成本昂貴,效率低下,結(jié)果不容易交流。指標(biāo)傳統(tǒng)技術(shù)云計(jì)算解決方案硬件成本昂貴,經(jīng)常需要更新用戶不需投資硬件,系統(tǒng)從云端根據(jù)需要提供資源軟件每臺(tái)應(yīng)用機(jī)器要分別安裝軟件,不同系統(tǒng)的兼容問題系統(tǒng)統(tǒng)一提供軟件資源,自動(dòng)使用最新版本界面復(fù)雜,用戶需掌握多個(gè)操作系統(tǒng)及多個(gè)軟件界面簡單明了,瀏覽器界面支持所有常用系統(tǒng)數(shù)據(jù)同步和備份手續(xù)繁瑣,耗時(shí)長實(shí)時(shí)同步,自動(dòng)永久備份訪問及共享數(shù)據(jù)需要專用硬
29、件和軟件,共享困難在線快捷訪問數(shù)據(jù),方便設(shè)定共享權(quán)限(二)適用于科研行業(yè)大數(shù)據(jù)的應(yīng)用開發(fā)平臺(tái)。目前還沒有一個(gè)相應(yīng)的適合于科研行業(yè)大數(shù)據(jù)的應(yīng)用開發(fā)平臺(tái)。目前國家及大型企業(yè)的“云計(jì)算”重點(diǎn)在基礎(chǔ)設(shè)施服務(wù)、平臺(tái)服務(wù)和通用軟件服務(wù)上。只有很少的企業(yè)開始將云計(jì)算應(yīng)用在科研領(lǐng)域里。我們開發(fā)的平臺(tái)包括系統(tǒng)核心大數(shù)據(jù)管理工具,用戶程序接口及新系統(tǒng)開發(fā)工具,以及眾多的生物信息分析模塊。這個(gè)平臺(tái)方便科研信息共享,允許快速開發(fā)出以云計(jì)算為基礎(chǔ)的各種信息系統(tǒng)。已經(jīng)開發(fā)的多種應(yīng)用系統(tǒng)以及向眾多國際著名科研院所實(shí)驗(yàn)室提供的服務(wù)證明了這個(gè)平臺(tái)的實(shí)用性,可靠性,以及可塑性。(三)高端生命科學(xué)大數(shù)據(jù)分析系統(tǒng)。在生命科學(xué)領(lǐng)域里,
30、通常由于涉及到的科研數(shù)據(jù)龐大,類型復(fù)雜,數(shù)據(jù)分析通常需要專業(yè)的生物信息或生物統(tǒng)計(jì)人員參加。即使是專業(yè)人員,他們也只是利用手工或簡單的批處理命令作分析。在這種情況下,不僅效率低下,無法自動(dòng)化,也會(huì)引入很多的錯(cuò)誤。例如,在做基因序列分析時(shí),實(shí)驗(yàn)人員需要使用多個(gè)工具查找序列,轉(zhuǎn)換格式,手工拼接,人工分析結(jié)果等。我們利用在生命科學(xué)領(lǐng)域里的多年科研經(jīng)驗(yàn),建立了一系列高端生物信息數(shù)據(jù)分析系統(tǒng)。這些分析系統(tǒng)提供了非常強(qiáng)大的數(shù)據(jù)分析能力,能應(yīng)用于生命科學(xué)研究的各個(gè)領(lǐng)域,從常規(guī)的基因序列分析到復(fù)雜的基因組數(shù)據(jù)的處理。每一個(gè)分析工具都整合了最新的算法,具有最尖端的分析能力,以及最易于接受的用戶界面和服務(wù)形式。(四
31、)人性化,智能的生物醫(yī)學(xué)數(shù)據(jù)界面生物信息學(xué)近年有大幅度發(fā)展,涌現(xiàn)了大量優(yōu)秀的開源程序。但一個(gè)關(guān)鍵問題一直沒有解決,那就是絕大多數(shù)生物醫(yī)學(xué)科研人員不熟悉編程,而程序員又缺乏專業(yè)的生物知識(shí),造成數(shù)據(jù)分析和結(jié)果詮釋的脫節(jié)。我們的團(tuán)隊(duì)有獨(dú)特的生物和編程緊密結(jié)合的經(jīng)驗(yàn),在此領(lǐng)域發(fā)表過近百篇國際論文。我們開發(fā)的數(shù)據(jù)系統(tǒng)注重體現(xiàn)復(fù)雜數(shù)據(jù)背后的生物意義,并根據(jù)我們對(duì)生物醫(yī)學(xué)研究的經(jīng)驗(yàn),提供多維數(shù)據(jù)的整合功能,以幫助科學(xué)家發(fā)現(xiàn)大數(shù)據(jù)后的復(fù)雜生命現(xiàn)象。我們的理念是生物醫(yī)學(xué)研究人員無需編程知識(shí),就可以利用我們的系統(tǒng)進(jìn)行大數(shù)據(jù)的深度分析,做出新發(fā)現(xiàn)。(三)與項(xiàng)目相關(guān)的知識(shí)產(chǎn)權(quán)情況權(quán)利人相關(guān)說明:申報(bào)人或團(tuán)隊(duì)使用單位知
32、識(shí)產(chǎn)權(quán)(申報(bào)人為非權(quán)利人)的,要逐一說明是否得到了權(quán)利人的許可使用(提供許可證明文件為有效)、是否存在股權(quán)關(guān)系、合作關(guān)系等。我們正在申請(qǐng)“科研大數(shù)據(jù)管理和分析系統(tǒng)”的專有技術(shù)鑒定及相關(guān)知識(shí)產(chǎn)權(quán)。我們團(tuán)隊(duì)是相關(guān)技術(shù)的發(fā)明人,并完全擁有相應(yīng)技術(shù)的使用權(quán)。二、項(xiàng)目技術(shù)開發(fā)可行性(一)項(xiàng)目技術(shù)發(fā)展現(xiàn)狀國內(nèi)外相關(guān)技術(shù)的研究、開發(fā)現(xiàn)狀的介紹、分析(1200字之內(nèi)): 本項(xiàng)目涉及兩個(gè)關(guān)鍵技術(shù)領(lǐng)域,云計(jì)算和新一代測序技術(shù),都是國家十二五規(guī)劃的重點(diǎn)領(lǐng)域。云計(jì)算是繼個(gè)人電腦、互聯(lián)網(wǎng)之后,信息技術(shù)的重大革新,它將使現(xiàn)有的計(jì)算機(jī)處理器、存儲(chǔ)、服務(wù)器、終端、操作系統(tǒng)及應(yīng)用軟件得到深刻改變,為電子信息業(yè)帶來一個(gè)全新的發(fā)展
33、機(jī)遇。全球云計(jì)算市場發(fā)展迅速。根據(jù)2011年八月在上海舉辦的“2011IBM云計(jì)算高峰論壇”,2010年,云計(jì)算去年在全球快速成長,全球云服務(wù)市場規(guī)模達(dá)443億美元,云組件市場規(guī)模達(dá)到了108億美元。僅去年一年就有1900萬公共云用戶,80%的世界500強(qiáng)用戶已經(jīng)在使用云計(jì)算。目前在中國市場上,云計(jì)算已在各地開花結(jié)果。中國的地方政府對(duì)加強(qiáng)云計(jì)算基礎(chǔ)設(shè)施建設(shè)也熱情有加。“云計(jì)算”產(chǎn)業(yè)已被列為中國及許多地方戰(zhàn)略性新興產(chǎn)業(yè)的突破口。國家及大型企業(yè)的“云計(jì)算”重點(diǎn)在基礎(chǔ)設(shè)施服務(wù)、平臺(tái)服務(wù)和通用軟件服務(wù)上。新一代測序技術(shù)是近幾年來出現(xiàn)的新技術(shù),可以在一周之內(nèi)完成人類23條染色體上全部基因的30億堿基對(duì)的
34、序列。這個(gè)技術(shù)一經(jīng)問世,就得到了學(xué)術(shù)界和企業(yè)界的廣泛關(guān)注,成為生物醫(yī)學(xué)的熱門話題和投資的熱點(diǎn)。關(guān)于新一代測序技術(shù)的文獻(xiàn)從2007年的14篇?jiǎng)≡龅?010年的四百余篇。美國在經(jīng)濟(jì)不景氣的時(shí)候,對(duì)新一代測序技術(shù)領(lǐng)域的投資卻在不斷增加,并希望它成為繼互聯(lián)網(wǎng)之后的又一個(gè)經(jīng)濟(jì)增長點(diǎn)。在中國,新一代測序技術(shù)領(lǐng)域是中國大力支持和發(fā)展的未來重點(diǎn)領(lǐng)域,也是明確列入國家十二五規(guī)劃的重點(diǎn)領(lǐng)域。華大基因已經(jīng)成為中國乃至全球最大的測序中心之一。針對(duì)各種微生物、植物、動(dòng)物的基因組序列研究也正在積極的開展,大量的基因組和轉(zhuǎn)錄組序列被檢測,分析,基因數(shù)據(jù)越來越成為現(xiàn)代生物和醫(yī)藥研究的基礎(chǔ)之一。以新一代測序技術(shù)為代表的高通量技
35、術(shù)給生物醫(yī)學(xué)科研帶來了大數(shù)據(jù)的挑戰(zhàn),云計(jì)算的成熟為此提供了基于網(wǎng)絡(luò)的全新解決方案。全世界多家傳統(tǒng)生物信息軟件公司(SoftGenetics, DNAStar, DNAnexus,NextBio等)正在努力向云計(jì)算轉(zhuǎn)型。在美國,新創(chuàng)業(yè)的DNAnexus公司于2011年獲得谷歌1500萬美元投資,一起打造打造云端DNA數(shù)據(jù)庫以提供新一代測序數(shù)據(jù)的存儲(chǔ)和分析服務(wù)。未來DNAnexus將使用 HYPERLINK /p/52391.html o Google推出企業(yè)版Google App Engine、云存儲(chǔ)服務(wù)和Prediction API t _blank 谷歌的云服務(wù),也是有史以來運(yùn)行在Googl
36、e資源上的最大的第三方服務(wù)??蒲写髷?shù)據(jù)云計(jì)算平臺(tái)及相關(guān)系統(tǒng)的開發(fā)在國際上也是一個(gè)全新的領(lǐng)域,在國內(nèi)基本還是個(gè)空白。我們團(tuán)隊(duì)成員利用美國NIH科研基金等資助已經(jīng)在這個(gè)行業(yè)研究開發(fā)了五年。目前不僅基本平臺(tái)和主要系統(tǒng)已經(jīng)開發(fā)完成,而且這些系統(tǒng)已經(jīng)經(jīng)過了數(shù)千科研人員的測試。同時(shí),一些系統(tǒng)已經(jīng)以付費(fèi)形式推向了數(shù)百國際知名科研院所的實(shí)驗(yàn)室。我們?cè)谥袊膭?chuàng)業(yè)主要集中在將先進(jìn)的理念和核心系統(tǒng)帶入中國,充分利用本土豐富的資源和良好的創(chuàng)業(yè)環(huán)境,打造出中國開發(fā)并能推廣到全球的先進(jìn)科研大數(shù)據(jù)云計(jì)算系統(tǒng)。(二)項(xiàng)目主要研究內(nèi)容項(xiàng)目研究開發(fā)內(nèi)容及涉及的關(guān)鍵技術(shù)及技術(shù)指標(biāo)描述(1500字之內(nèi)):逐條闡述項(xiàng)目研究開發(fā)的主要內(nèi)
37、容及涉及的關(guān)鍵技術(shù)及技術(shù)指標(biāo)。1)科研大數(shù)據(jù)管理平臺(tái)的本土化及國際化由于我們的核心平臺(tái)涉及到多種技術(shù),包括互聯(lián)網(wǎng)、數(shù)據(jù)庫、硬件環(huán)境、移到設(shè)備等,本土化不僅涉及語言界面的中文化,也要考慮到中國的計(jì)算機(jī)和網(wǎng)絡(luò)等硬件設(shè)施、移到設(shè)備及環(huán)境,中國的互聯(lián)網(wǎng)特殊要求、開發(fā)人員和用戶的技術(shù)水準(zhǔn)、使用習(xí)慣等。由于核心技術(shù)已經(jīng)比較成熟,本土化的關(guān)鍵在于吸引一批本土的、熟悉中國環(huán)境的高端網(wǎng)絡(luò)技術(shù)人才,在經(jīng)過特別培訓(xùn)后能盡快掌握核心技術(shù),將界面中文化,并根據(jù)中國的技術(shù)環(huán)境作改進(jìn)。我們現(xiàn)有的核心平臺(tái)使用英語,本土化后會(huì)與中文兼容,下一步是做好國際化推廣的準(zhǔn)備,包括多國語言的支持和常用數(shù)據(jù)庫的跨國兼容。2)高端生命科學(xué)大
38、數(shù)據(jù)管理和分析系統(tǒng)的進(jìn)一步開發(fā)這里涉及到的高端大數(shù)據(jù)分析系統(tǒng)包括基因芯片,高通量測序結(jié)果數(shù)據(jù)分析,整合數(shù)據(jù)庫等?;蛐酒瑪?shù)據(jù)分析將基于BxArrays基因芯片數(shù)據(jù)在線分析系統(tǒng)。該項(xiàng)目曾兩度獲得美國NIH資金資助,由于自動(dòng)化程度高,運(yùn)算速度遠(yuǎn)高于其他系統(tǒng),被多個(gè)頂級(jí)科研院所使用。 進(jìn)一步開發(fā)將增加支持的基因芯片類型,并更加簡化界面,和加強(qiáng)與其他基因組數(shù)據(jù)如RNA-Seq的兼容性等。為了解釋高通量測序數(shù)據(jù)管理和分析策略,這里先對(duì)DNA測序技術(shù)所引起的數(shù)據(jù)分析挑戰(zhàn)做些解釋。從2005年到2010年,每臺(tái)測序機(jī)器的數(shù)據(jù)產(chǎn)生能力已提高了五十萬倍。例如,一臺(tái)Illumina公司HiSeq2000機(jī)器每次運(yùn)
39、行可以產(chǎn)生600G的堿基序列。即使只保存序列和相應(yīng)的數(shù)據(jù)質(zhì)量信息,估計(jì)也將占用600GB的磁盤空間。相比而言,一個(gè)DVD光碟一般只有4GB,也就是說,一次測序的結(jié)果需要150張DVD光盤才能存得下。對(duì)于一套典型的2*100堿基對(duì)的末端配對(duì)人類基因數(shù)據(jù),用一個(gè)8核心高級(jí)計(jì)算機(jī)和流行的tophat/cufflinnk軟件包來處理,需要處理約一個(gè)星期的時(shí)間?;蚪M信息學(xué)正面臨超大規(guī)?;蚪M數(shù)據(jù)的挑戰(zhàn)。這些數(shù)據(jù)對(duì)計(jì)算機(jī)的存儲(chǔ)能力和計(jì)算能力都是極大的挑戰(zhàn)。首先,為了處理超大規(guī)模的測序信息,我們將采用最先進(jìn)的壓縮和可擴(kuò)展的存儲(chǔ)技術(shù),包括參考基因組的壓縮和可擴(kuò)展的并行存儲(chǔ)管理的技術(shù)。我們開發(fā)的軟件可以有效地
40、壓縮文件到原始大小的1-15,使得在互聯(lián)網(wǎng)上傳輸測序數(shù)據(jù)是實(shí)際可行的。然后,我們將進(jìn)一步開發(fā)多種基于云計(jì)算的生物信息學(xué)工具。這些工具能夠讀取超大的輸入文件,將數(shù)據(jù)分解成數(shù)千個(gè)小部分,并分發(fā)到成千上萬的服務(wù)器中作并行數(shù)據(jù)處理。這種處理方法能提高數(shù)據(jù)分析速度數(shù)百倍甚至數(shù)千倍。我們的基于云計(jì)算的數(shù)據(jù)分析工具包括單核苷酸多態(tài)性分析,堿基插入和刪除分析,基因組大結(jié)構(gòu)變化,表觀遺傳改變、基因表達(dá)的差異等。我們的高通量測序結(jié)果數(shù)據(jù)分析平臺(tái)將包括以下常用分析流水線:表達(dá)譜分析(RNA-Seq)蛋白和DNA結(jié)合分析(ChIP-Seq)定位針對(duì)性測序(Targeted Sequencing)全基因組測序(Whol
41、e-genome sequencing)我們的整合數(shù)據(jù)庫將基于在線數(shù)據(jù)庫和應(yīng)用進(jìn)行設(shè)計(jì)。這個(gè)系統(tǒng)允許用戶不通過編程就可以設(shè)計(jì)相關(guān)的、有數(shù)據(jù)庫支持的應(yīng)用。用戶根據(jù)程序指導(dǎo)創(chuàng)建數(shù)據(jù)庫表格。然后,系統(tǒng)將自動(dòng)生成相應(yīng)的數(shù)據(jù)錄入和其他操作的網(wǎng)絡(luò)界面。這樣用戶就可以立即導(dǎo)入數(shù)據(jù)。設(shè)置相關(guān)權(quán)限后,用戶可以輕松地與他人分享的數(shù)據(jù)庫內(nèi)容,或者與其他人合作,一起更新和維護(hù)內(nèi)容。3)人性化,智能的生物醫(yī)學(xué)數(shù)據(jù)界面的完善和開發(fā)我們系統(tǒng)一個(gè)獨(dú)特的優(yōu)勢是利用簡潔直觀的界面提供強(qiáng)大的功能,以幫助生物醫(yī)學(xué)研究者在不需編程背景下,完成大數(shù)據(jù)的深度分析,做出新發(fā)現(xiàn)。這些界面及后臺(tái)功能是基于團(tuán)隊(duì)帶頭人多年的相關(guān)科研和開發(fā)經(jīng)驗(yàn)。為保
42、持此優(yōu)勢,我們的整個(gè)團(tuán)隊(duì)將堅(jiān)持以人性化界面為主的理念,充分利用新技術(shù)來優(yōu)化大數(shù)據(jù)處理過程。一方面盡量自動(dòng)化常規(guī)步驟以減少對(duì)生物統(tǒng)計(jì)和信息學(xué)背景知識(shí)的依賴,另一方面加強(qiáng)生物醫(yī)藥科學(xué)人員常用的工具,如基因注解,圖表顯示,功能富集等。公司將吸引有具有編程和生物雙背景的高端人才來帶領(lǐng)營銷和開發(fā)團(tuán)隊(duì),并和多個(gè)學(xué)科帶頭人保持密切聯(lián)系,以最快,最好的方式開發(fā)生命科學(xué)急需的數(shù)據(jù)產(chǎn)品。(三)項(xiàng)目技術(shù)路線描述項(xiàng)目技術(shù)路線描述(1200字之內(nèi)):包括技術(shù)原理圖、工藝流程圖、產(chǎn)品結(jié)構(gòu)圖、框架圖等。本項(xiàng)目涉及到多種平臺(tái)和應(yīng)用系統(tǒng)。具體技術(shù)細(xì)節(jié)屬于商業(yè)秘密。這里簡述一些基本技術(shù)概念和應(yīng)用性能。項(xiàng)目的核心是一個(gè)云計(jì)算應(yīng)用開
43、發(fā)平臺(tái)。該平臺(tái)包括系統(tǒng)核心數(shù)據(jù)管理工具,用戶程序接口及新系統(tǒng)開發(fā)工具,審計(jì)追蹤,以及眾多的生物信息分析模塊。這個(gè)平臺(tái)支持多用戶,并且這些用戶可以自由組合成小組,以便共享數(shù)據(jù)。系統(tǒng)結(jié)構(gòu)示意圖如下。基于商業(yè)原因,示意圖已做了簡化處理。我們團(tuán)隊(duì)成員在行業(yè)里的豐富知識(shí)和經(jīng)驗(yàn)使得我們能夠向客戶提供國際領(lǐng)先的產(chǎn)品和專業(yè)的服務(wù)。我們計(jì)劃在下一代高通量測序數(shù)據(jù)的分析和展示領(lǐng)域向科研人員提供全面的服務(wù)。和一些潛在的競爭對(duì)手公司相比,我們不僅提供個(gè)別算法分析結(jié)果,而且提供多個(gè)算法分析結(jié)果及比較。分析是高度自動(dòng)化的,使得用戶能夠不需要專業(yè)培訓(xùn)即可快速上手。我們已經(jīng)成功的在云計(jì)算的環(huán)境下進(jìn)行大規(guī)模的數(shù)據(jù)處理,并取得了
44、國際領(lǐng)先的數(shù)據(jù)處理速度和性能。我們的分析系統(tǒng)支持所有主流的下一代高通量測序平臺(tái),包括:The 454 FLX System from RocheGenome Analyzer Systems from IlluminaSOLiD system from Life TechnologiesIon Torrent from Life Technologies下面是我們的分析系統(tǒng)示意圖:我們的分析系統(tǒng)功能包括:Quality Control: Trim the sequence bases with low quality and remove the adaptor and other vendo
45、r specific primer contaminated reads.Demultiplexing: Demultiplex the barcode labeled sequence into different samples, supporting both both 3 and 5 indexed reads. De novoTranscriptome and Genome Assembly: Offers comprehensive support for a variety of data formats, including both short and long reads,
46、 and mixing of paired reads (both insert size and orientation). We use the Trinity for the transcriptome assembly and SOAPdenova, ABySS and ALLPATHS2 for the genome assembly. Map to Reference Sequences: Support both genome andtranscriptome. Ultra-fast alignment tools Bowtie and BWA are used.SNP Dete
47、ction for Whole Genome Sequencing and Targeted Sequencing: Based on customer specifications, the SNP detection will scan through the entire data and report all the SNPs that meet the requirements. GATK will be used to preform the SNP detection.ChIP Sequencing: Support both ChIP-seq data analysis for
48、 IP samples only and IP plus control (input) samples. The sequencing reads will be mapped to the reference genome first than perform a peak finding analysis. Read density (wig) files for each sample will be generated. User could visualize the data directly through UCSC genome browser. We use MACS an
49、d QuEST to preform the peak finding. RNA-Seq Analysis: Based on an annotated reference genome and mRNA sequencing reads, calculate the gene expression levels as well as discover novel exons. Both gene and isoform level expression level will be reported. Differentially expressed gene could be detecte
50、d also. Tools including Topat/Cufflink, Rsem, DESeq, HYPERLINK /wiki/EdgeR o EdgeREdgeR will be used.(四)項(xiàng)目技術(shù)實(shí)現(xiàn)依據(jù)設(shè)計(jì)思想依據(jù)(200字之內(nèi)):包括文獻(xiàn),或?qū)@?,或發(fā)明等。基于云計(jì)算的科研大數(shù)據(jù)管理和分析平臺(tái)及應(yīng)用系統(tǒng)屬于本團(tuán)隊(duì)專有技術(shù),正在準(zhǔn)備評(píng)估鑒定。專有技術(shù)包括:基于云計(jì)算的科研大數(shù)據(jù)應(yīng)用開發(fā)平臺(tái)。通用科研大數(shù)據(jù)信息管理系統(tǒng)。科研大數(shù)據(jù)信息分析系統(tǒng)。系統(tǒng)及數(shù)據(jù)庫設(shè)計(jì)思想主要依據(jù)是團(tuán)隊(duì)成員及合作者的實(shí)際工作案例及相應(yīng)已發(fā)表的文獻(xiàn)。Nie J, , Wei H. TF-Cluster
51、: A pipeline for identifying functionally coordinated transcription factors via network decomposition of the shared coexpression connectivity matrix (SCCM). BMC Syst Biol. 2011 Apr 15;5:53. Howden SE, , Nie J, Thomson JA. Genetic correction and analysis of induced pluripotent stem cells from a patie
52、nt with gyrate atrophy. PNAS. 2011 Apr 19;108(16):6537-42Cho M, Xiao Y, Nie J, , Soh HT. Quantitative selection of DNA aptamers through microfluidic selection and high-throughput sequencing. PNAS. 2010 Aug 31;107(35):15373-8Yu J, , Nie J, , Thomson JA. Induced pluripotent stem cell lines derived fro
53、m human somatic cells. Science. 2007 Dec 21;318(5858):1917-20. Twigger SN, Pasko D, Nie J, , Jacob HJ. Tools and strategies for physiological genomics: the Rat Genome Database. Physiol Genomics. 2005 Oct 17;23(2):246-56. Otto EA, , Zhang X, et al. Candidate exome capture identifies mutation of SDCCA
54、G8 as the cause of a retinal-renal ciliopathy. Nat Genet. 2010 Oct;42(10):840-50. Epub 2010 Sep 12. PubMed PMID: 20835237Heintzman ND, , Zhang X, et al. Histone modifications at human enhancers reflect global cell-type-specific gene expression. Nature. 2009 May 7;459(7243):108-12. Epub 2009 Mar 18.
55、PubMed PMID: 19295514.Whittle CM, , Zhang X, et al. The genomic distribution and function of histone variant HTZ-1 during C. elegans embryogenesis. PLoS Genet. 2008 Sep 12;4(9):e1000187. PubMed PMID: 18787694; PubMed Central PMCID: PMC2522285.Ravnskjaer K, , Zhang X, et al. Cooperative interactions
56、between CBP and TORC2 confer selectivity to CREB target gene expression. EMBO J. 2007 Jun 20;26(12):2880-9. Epub 2007 May 3. PubMed PMID:17476304.Zhao G., Stormo G.D., Conserved Motifs and Prediction of Regulatory Modules in Caenorhabditis elegans, 2012, G3: Genes, Genomes, Genetics, 2(4): 469-481Zh
57、ao G., Wang D., The genome of yoka poxvirus. 2011, J Virol. 85(19):10230-8. PMID: 21813608Zhao, G., Skeath, J.B. Linking pattern formation to cell-type specification: Dichaete and Ind directly repress achaete gene expression in the Drosophila CNS. 2007. Proc Natl Acad Sci U S A. 104(10):3847-52. PMI
58、D: 17360441 Zhao, G., Stormo, G.D. Evidence for active maintenance of inverted repeat structures identified by a comparative genomic approach. 2007. PLoS One. 2(2):e262. PMID: 17327921 Zhao, G., Wheeler, S.R. and Skeath, J.B. Genetic control of dorsoventral patterning and neuroblast specification in
59、 the Drosophila Central Nervous System. 2007. Int J Dev Biol. 51(2):107-15. PMID: 17294361 Zhao, G., Schriefer, L.A. and Stormo, G.D. Identification of muscle-specific regulatory modules in Caenorhabditis elegans. 2007. Genome Res. 17(3):348-57. PMID: 17284674 主要分析算法參考文獻(xiàn):M. G Grabherr and etc. Full-
60、length transcriptome assembly from RNA-Seq data without a reference genome Nature Biotechnology 29, 644652 (2011)Li et al. De novo assembly of human genomes with massively parallel short read sequencing. Genome Res (2010) vol. 20 (2) pp. 265-72Jared T. Simpson and etc.ABySS: A parallel assembler for
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年03月無錫高新區(qū)(新吳區(qū))事業(yè)單位工作人員45人筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 2025年03月國家糧食和物資儲(chǔ)備局直屬聯(lián)系單位(60名)筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 旋片真空泵項(xiàng)目風(fēng)險(xiǎn)評(píng)估報(bào)告
- 廣東省深圳實(shí)驗(yàn)學(xué)校2025年高三5月第一次調(diào)研考試歷史試題含解析
- 九州職業(yè)技術(shù)學(xué)院《高級(jí)開發(fā)技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 蘭州交通大學(xué)《量子力學(xué)(I)》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧現(xiàn)代服務(wù)職業(yè)技術(shù)學(xué)院《數(shù)字短片技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北省唐山市灤南縣2024-2025學(xué)年數(shù)學(xué)五年級(jí)第二學(xué)期期末經(jīng)典試題含答案
- 內(nèi)蒙古機(jī)電職業(yè)技術(shù)學(xué)院《兒童美術(shù)輔導(dǎo)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣東省汕頭市潮南實(shí)驗(yàn)學(xué)校2024-2025學(xué)年高三下-學(xué)分認(rèn)定考試物理試題試卷含解析
- 中醫(yī)基礎(chǔ)理論(中英文對(duì)照)
- 生理學(xué)(全套課件)
- 香港公司條例
- 污水處理系統(tǒng)工程合同范本
- 德能勤績廉個(gè)人總結(jié)的
- 二年級(jí)美術(shù)上冊(cè)課件 《3.我的手印畫》 贛美版 (共18張PPT)
- Q∕SY 126-2014 油田水處理用緩蝕阻垢劑技術(shù)規(guī)范
- GB∕T 3216-2016 回轉(zhuǎn)動(dòng)力泵 水力性能驗(yàn)收試驗(yàn) 1級(jí)、2級(jí)和3級(jí)
- 電子電氣評(píng)估規(guī)范-最新
- 黑布林繪本 Dad-for-Sale 出售爸爸課件
- 腹腔鏡下肝葉切除術(shù)(實(shí)用課件)
評(píng)論
0/150
提交評(píng)論