




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)挖掘競賽報告目錄選題介紹1數(shù)據(jù)集情況2利用深度學習的方法3SVM方法4體會5選題介紹1室內用戶運動時序數(shù)據(jù)分類1.選題介紹隨著數(shù)據(jù)量的不斷積累,海量時序信息的處理需求日益凸顯。作為時間序列數(shù)據(jù)分析中的重要任務之一,時間序列分類應用廣泛且多樣。時間序列分類旨在賦予序列某個離散標記。傳統(tǒng)特征提取算法使用時間序列中的統(tǒng)計信息作為分類的依據(jù)。近年來,基于深度學習的時序分類取得了較大進展?;诙说蕉说奶卣魈崛》绞?,深度學習可以避免繁瑣的人工特征設計。如何對時間序列中進行有效的分類,從繁蕪叢雜的數(shù)據(jù)集中將具有某種特定形態(tài)的序列歸屬到同一個集合,對于學術研究及工業(yè)應用具有重要意義。選題介紹基于上述實際需求以及深度學習的進展,本次訓練賽旨在構建通用的時間序列分類算法。通過本賽題建立準確的時間序列分類模型,希望大家探索更為魯棒的時序特征表述方法。任務數(shù)據(jù)集介紹室內用戶運動時序數(shù)據(jù)分類輸入文字2.數(shù)據(jù)集情況數(shù)據(jù)整理自網(wǎng)上公開數(shù)據(jù)集UCI(已脫敏),數(shù)據(jù)集涵蓋2類不同時間序列,該類數(shù)據(jù)集廣泛應用于時序分類的業(yè)務場景。由于數(shù)據(jù)集已脫敏,可知每一個時間特征下的數(shù)據(jù)都已經做過規(guī)范化。因此在輸入模型時不需要再次規(guī)范化2.數(shù)據(jù)集情況數(shù)據(jù)整理自網(wǎng)上公開數(shù)據(jù)集UCI(已脫敏),數(shù)據(jù)集涵蓋2類不同時間序列,該類數(shù)據(jù)集廣泛應用于時序分類的業(yè)務場景。由于數(shù)據(jù)集已脫敏,可知每一個時間特征下的數(shù)據(jù)都已經做過規(guī)范化。因此在輸入模型時不需要再次規(guī)范化2.數(shù)據(jù)集情況2.數(shù)據(jù)集情況3.評價準則基于深度神經網(wǎng)絡分類器3.深度神經網(wǎng)絡LSTM有一些序列問題。假設我們試著去預測“IgrewupinFrance...IspeakfluentFrench”最后的這個French。當前的信息建議下一個詞可能是一種語言的名字,但是如果我們需要弄清楚是什么語言,我們是需要先前提到的離當前位置很遠的France的上下文的。這說明相關信息和當前預測位置之間的間隔就肯定變得相當?shù)拇蟆?/p>
不幸的是,在這個間隔不斷增大時,RNN會喪失學習到連接如此遠的信息的能力。3.深度神經網(wǎng)絡LSTM根據(jù)本次數(shù)據(jù)的特征,設計選用二層LSTM,取后一層隱層的特征作為輸出,由于是二分類,采用sigmoid函數(shù)激活。sigmoid3.深度神經網(wǎng)絡LSTM部分代碼如下:使用了128個神經元,dropout概率為0.5,最終在測試集上的正確率約為74%4,其他深度學習方法CNN可以很好地識別出數(shù)據(jù)中的簡單模式,然后使用這些簡單模式在更高級的層中生成更復雜的模式。當你希望從整體數(shù)據(jù)集中較短的(固定長度)片段中獲得感興趣特征,并且該特性在該數(shù)據(jù)片段中的位置不具有高度相關性時,1維卷積CNN是非常有效的。4,其他深度學習方法4,其他深度學習方法第一層定義了高度為10(也稱為卷積核大?。┑臑V波器(也稱為特征檢測器)。只有定義了一個濾波器,神經網(wǎng)絡才能夠在第一層中學習到一個單一的特征。這可能還不夠,因此我們會定義100個濾波器。這樣我們就在網(wǎng)絡的第一層中訓練得到100個不同的特性。第一個神經網(wǎng)絡層的輸出是一個71x100的矩陣。深度學習里的Attention模型其實模擬的是人腦的注意力模型。舉個例子來說,當我們閱讀一段話時,雖然我們可以看到整句話,但是在我們深入仔細地觀察時,其實眼睛聚焦的就只有很少的幾個詞,也就是說這個時候人腦對整句話的關注并不是均衡的,是有一定的權重區(qū)分的。這就是深度學習里的AttentionModel的核心思想。4,其他深度學習方法Attention機制于是改進模型,使用了雙向LSTM加attention層的模式,也就是將lstm每一個time-step的值輸出到attention層中,再得到最后的輸出。由于這個方法太消耗資源,還未得出結果。4.SVR方法SVR是支持向量回歸(supportvectorregression)的英文縮寫,是支持向量機(SVM)的重要的應用分支。從圖例中分析,支持向量機回歸與線性回歸相比,支持向量回歸表示只要在虛線內部的值都可認為是預測正確,只要計算虛線外部的值的損失即可。最終成績最終使用一維CNN,取得的成績來做為最終成績。排名109。5.體會學習了數(shù)據(jù)分析的方法學習了幾種深度學習框架學習了傳統(tǒng)回歸的方法在深度學習
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)刷漆活動方案
- 企業(yè)合規(guī)建設活動方案
- 企業(yè)園區(qū)活動方案
- 企業(yè)孵化園企業(yè)活動方案
- 企業(yè)慰問活動方案
- 企業(yè)旺季活動策劃方案
- 企業(yè)歌舞比賽活動方案
- 企業(yè)消夏晚會活動方案
- 《人工智能:AIGC基礎與應用》高職全套教學課件
- 福建省漳州實小教育集團2025年數(shù)學三下期末綜合測試試題含解析
- 香菇菌棒購銷合同范例
- 2025屆上海市復旦附中高考語文三模試卷含解析
- 二級圓柱齒輪減速器設計
- 缺血性腸病診療指南
- 《基于專業(yè)成長共同體的名師工作室建設的思與行》專題講座
- 高層建筑鋼管懸挑腳手架搭建方案
- DB43T 1173-2016 鋼-超高韌性混凝土輕型組合結構橋面技術規(guī)范
- 《ESPEN重癥病人營養(yǎng)指南(2023版)》解讀課件
- 廣西桂林市(2024年-2025年小學四年級語文)人教版期末考試(下學期)試卷及答案
評論
0/150
提交評論