基于AI的多種腫瘤分類器的構(gòu)建課件_第1頁
基于AI的多種腫瘤分類器的構(gòu)建課件_第2頁
基于AI的多種腫瘤分類器的構(gòu)建課件_第3頁
基于AI的多種腫瘤分類器的構(gòu)建課件_第4頁
基于AI的多種腫瘤分類器的構(gòu)建課件_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、研究計劃基于機器學習的腫瘤細胞起源的研究1234研究依據(jù)研究目標研究內(nèi)容擬解決的關(guān)鍵問題5技術(shù)路線基于機器學習的腫瘤細胞起源的研究目 錄6研究方案與研究進展研究依據(jù)研究意義有相當比例的癌癥病例與轉(zhuǎn)移性腫瘤,需要進一步的測試確定原發(fā)位置,其中許多是從來沒有完全診斷和保持癌癥的未知起源。很多醫(yī)學團體認為,利用癌癥“發(fā)源”的器官來對癌癥進行定義就需要定義不同癌癥的治療策略。從那時候起,很多研究都表明,癌變的腫瘤或許會依賴其所發(fā)生的遺傳改變的類型來被分類或分群,這就意味著,開發(fā)新型療法就需要考慮和腫瘤相關(guān)的多個方面。科學家們證明,腫瘤首次出現(xiàn)的組織位置實際上與驅(qū)動突變的機制同樣重要,這一結(jié)果不僅為組織

2、起源在腫瘤發(fā)展中發(fā)揮作用提供了更多的證據(jù),也可能會引起與腫瘤生長早期區(qū)域相關(guān)標志物的發(fā)展。研究依據(jù)研究現(xiàn)狀2016年 Science雜志上發(fā)表了題為“Tissue of origin dictates branched-chain amino acid metabolism in mutant Kras-driven cancers”論文2016年 Science雜志上發(fā)表了”Location, location, location”論文2015 年Bioinformatics 發(fā)表“TumorTracer: a method to identify the tissue of origin

3、from the somatic mutations of a tumor specimen”研究目標研究目標優(yōu)化目前的分析流程,選擇最合理的機器學習算法構(gòu)建海量的核小體定位信息數(shù)據(jù)庫,根據(jù)不同的DNA切口的pattern來找尋腫瘤起源組織信息擁有了基于機器學習的優(yōu)化算法SCI 文章1-2篇本項目旨在通過對cosmic77等大型數(shù)據(jù)庫中腫瘤起源組織的信息與其他特征的關(guān)聯(lián)分析,用機器學習的方法達到如下目標3/ 研究內(nèi)容第一部分第二部分第三部分第四部分機器學習特征數(shù)據(jù)的采集,通過突變基因、單核苷酸突變、三核苷酸變異信息、核小體定位等特征集來選取cosmic77數(shù)據(jù)庫中的有效樣本;3/ 研究內(nèi)容第一

4、部分第二部分第三部分第四部分分析比對目前的機器學習算法,選擇最優(yōu)的學習算法,即最合理的數(shù)據(jù)敏感性和特異性的分布情況。集成學習神經(jīng)網(wǎng)絡(luò)遺傳算法支持向量機3/ 研究內(nèi)容第一部分第二部分第三部分第四部分通過AI中集成學習的方法對大樣本進行train data,test data的隨機分組和10X以上的交叉驗證;3/ 研究內(nèi)容第一部分第二部分第三部分第四部分構(gòu)建分類樹算法,研究不同腫瘤在特征集上的差異4/ 擬解決的關(guān)鍵問題選取腫瘤大數(shù)據(jù)的特征變量抽取腫瘤大數(shù)據(jù)集中的特征數(shù)據(jù):單核苷酸突變基因、三核苷酸變異信息、拷貝數(shù)變異信息、核小體定位等。關(guān)鍵基因、突變集合用于精準診斷。構(gòu)建核小體定位信息的二級數(shù)據(jù)庫

5、,需要樣本的積累。研究基于mysql數(shù)據(jù)庫的并行計算:mpi4py,增加海量數(shù)據(jù)分析的運行效率5/ 技術(shù)路線6/ 研究方案樣本數(shù)據(jù)的選取:CosmicMutantExport_v77.tsv.gz樣本特征數(shù)據(jù)提?。簡魏塑账嵬蛔兓?、三核苷酸變異信息、拷貝數(shù)變異信息、核小體定位等研究不同的機器學習算法在大數(shù)據(jù)集合中的表現(xiàn)構(gòu)建分類樹,研究不同腫瘤的特征差異根據(jù)數(shù)據(jù)量的情況,研究合理的并行計算的方法,mysql的并行存取以及Hadoop和spark等并行算法6/ 研究方案(樣本數(shù)據(jù)的選?。〤osmicMutantExport_v77.tsv.gzlabeled as “Genome.wide.scr

6、een”,not labeled as “cell-line”,然后選取Sample ID和tumor ID可以一一映射的數(shù)據(jù)樣本6/ 研究方案(樣本特征數(shù)據(jù)提?。┫到y(tǒng)突變基因單核苷酸突變信息三核苷酸變異信息核小體定位等6/ 研究基礎(chǔ)條件(工作基礎(chǔ))1) 基于集群服務(wù)器的Hadoop的環(huán)境2) PHP、R的交互環(huán)境構(gòu)建。3) 生物信息進化樹分析的基礎(chǔ)。4) 基因組生物統(tǒng)計分析的基礎(chǔ)條件,大數(shù)據(jù)的條件。6/ 研究基礎(chǔ)條件(工作條件)1) 樣本信息的不斷完善和積累。2) 生物信息的條件,大數(shù)據(jù)分析的條件。7/ 研究進展7/ 研究進展(二分類情況)7/ 研究進展(腫瘤分類學習分組)7/ 研究進展(腫瘤分類學習分組的錯分率,top3 group)7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論