




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)學(xué)建模網(wǎng)絡(luò)賽編號(hào)專(zhuān)用頁(yè)2013年第六屆“認(rèn)證杯”數(shù)學(xué)中國(guó) 目:基于音頻與用戶的開(kāi)放式音樂(lè)分類(lèi)模關(guān)鍵詞:Mel倒譜系 SOM神經(jīng)網(wǎng)絡(luò)分形維 核密度估 要音樂(lè)樣本進(jìn)行分類(lèi),開(kāi)放式分類(lèi)正確率達(dá)93%。樂(lè)的音頻的有效性。我們就是否應(yīng)該利用音樂(lè)的外部信息進(jìn)行了探討。喜好特征的“用戶”的定義,并應(yīng)用Parzen核密度估計(jì)的方法,針對(duì)具體 ( 填寫(xiě)所選題目:BThePresentPaperproposesthatwecanyzeandmakemodelsfortheInthefirstmodel,wereferencethespeechrecognitiontechnology,Thischaracteristicdoesn’trelyonthenatureofsignalandthereareforustocontinueresearching.themusic,thisnon-supervisedclassificationmodelgetsridoftheingsofthetraditionalmusicclassificationsandforthenewmusicstyles,itcanmarkoffcorrectlyatthesametime.Weclassifyreaches93%viathiswaysignal,wereferencetheconceptsinfractalgeometry,andconsiderthesoundsignalasadatasetwithfractalfeatures.Weraisethatusewhichisalsoantinoise.Inthisway,itcanfullydepictnotonlytheoverallfeaturesofthesoundsignal,butalsothestatisticalself-similaritybetweenthepartandthewhole.Meanwhile,wecanuseasignal.So,comparingwiththetraditionalwaysofextractingMFCC,thedimensionofthesoundsignaltobeitsaudiofingerprinting.Andthen,wediscusswhethertoconsiderexternalinformationofthemusic.thebox-countingdimension,weraisetwodefinitionsabouttheuser’sfingerprinting,whichreflectthecharacteristicoftheusers’like.Aimingatspecificuserdata,weapplythekerneldensityestimationtoitmakespossibletomakeanewalgorithmofmusicmendation.PAGEPAGE4音頻是指從一段音頻采樣中提取的獨(dú)特的信息,可以用于辨識(shí)不同的聲音采樣,是一項(xiàng)基于內(nèi)容的識(shí)別技術(shù)(Content-BaseIdentification,CBID)[1]。從相同采樣不同編碼格式的音頻文件提取的音頻信息是相似的。 特征(后文稱(chēng)之為用戶)。的音頻提取方法。4、不考慮音樂(lè)樣本的外部信息(如歌手、歌詞、歌名、、歌曲榜性,會(huì)在后文進(jìn)行分析討論。11類(lèi)、110mp3格樂(lè),我們統(tǒng)一截取20秒的部分,作為整首音樂(lè)的代表。Mel(ffXa(kNfM三角濾波器的頻率響應(yīng),其中Hmk第t第tQ倒譜系數(shù)的階數(shù),取值范圍為KSj輸入層的ijdimHDB(fffn基于聽(tīng)覺(jué)模型的MFCCe容易,反之則[4]。據(jù)此,人們從低頻到高頻這一段頻帶內(nèi)按臨界帶寬的大Mel(f)2595lg(1f/(DCT),這樣得到的前N維向量稱(chēng)為MFCC。PAGEPAGE6Figure2MFCCNXakxnej2k/N,0k采用的濾波器為三角濾波器,中心頻率為fm,m1, ,本文取M240,kfm 2kfmfm1fm1fmfm1,fm1kfHk 2fm1k ,fmk
fmfm1fm1fm1f0,kfmMHmk1N SmlnXakk
Hmk,0m N nm0.5 ,0n 高系統(tǒng)的識(shí)別性能。差分參數(shù)的計(jì)算可以采用下面的: C,ttkCtkCtk2kdtk2kCtCt1,tQCFCCSOM也往往橫跨多個(gè)風(fēng)格,難以基于傳統(tǒng)進(jìn)行自動(dòng)推薦。此外,隨著音樂(lè)界的迅77旨在構(gòu)造一個(gè)開(kāi)放式的分類(lèi)體系,其優(yōu)勢(shì)有以下兩點(diǎn)[6]:SOM神經(jīng)網(wǎng)絡(luò)即自組織特征映射網(wǎng)絡(luò),該網(wǎng)絡(luò)是由一個(gè)全連接的神經(jīng)元陳列組成的無(wú)教師、自組織、習(xí)網(wǎng)絡(luò)。SOM神經(jīng)網(wǎng)絡(luò)既可以學(xué)習(xí)訓(xùn)練數(shù)據(jù)輸Sj。區(qū)域Sj(t)隨著時(shí)間的增長(zhǎng)而不斷縮小。X(x1,x2,x3...xmTdj||XWj||wij為輸入層的ijwijwij(t1)wij(t)(t)(xi(t)88(t)1/t或(t)0.2(1t計(jì)算輸出jokf(min||XWjjf(x0-1函數(shù)或者其它非線形函數(shù)[8]鄉(xiāng)村,新世紀(jì),鋼琴,古典,電子,分別記為A,B,C,…,K類(lèi),每種均有10首歌曲。首先我們把流行,搖滾,說(shuō)唱,爵士,布魯斯,古典,鄉(xiāng)村,鋼琴SOM對(duì)于我們現(xiàn)在利用格式轉(zhuǎn)換軟件,將這11組音頻數(shù)據(jù),即110首mp3格式音樂(lè)轉(zhuǎn)換為wav格式。同時(shí)為了降低運(yùn)算量,我們對(duì)轉(zhuǎn)換后的音樂(lè)文件進(jìn)行降低采樣率以及轉(zhuǎn)換為單聲道的預(yù)處理。對(duì)于每首音樂(lè),我們統(tǒng)一截取20秒部分, 軟件計(jì)算其MFCC參數(shù),并將MFCC參數(shù)作為輸入值,運(yùn)用前文提到的SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練( 樂(lè)樣本的無(wú)監(jiān)督分類(lèi)。在經(jīng)過(guò)迭代后,SOM神經(jīng)網(wǎng)絡(luò)得到不同類(lèi)別的音樂(lè)樣本。SOM6420 下圖為神經(jīng)元之間的距離情況SOMNeighbor6420 Figure5神經(jīng)元之間的距離情6420 6420 Figure7結(jié)果類(lèi) 音樂(lè)樣 1C5被“錯(cuò)”分到了第一類(lèi)(流行與搖滾。但事實(shí)上,經(jīng)過(guò)我們結(jié)果SOM40類(lèi) 音樂(lè)樣 E8,I6,I7,I8,I9,I10, 2SPSSSOM神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)果以及樣本自帶的風(fēng)格進(jìn)行相關(guān)性分析。結(jié)果顯示,和SOM神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)果與樣本風(fēng)格有75.96%相關(guān)。這說(shuō)明,SOM神經(jīng)網(wǎng)絡(luò)分類(lèi)結(jié)果與傳統(tǒng)風(fēng)格一脈相承,同時(shí)結(jié)果類(lèi) 音樂(lè)樣 3簽類(lèi)型時(shí),SOM(即訓(xùn)練(K1,K692.727%,而對(duì)于訓(xùn)練集沒(méi)有的類(lèi)別,新世紀(jì),民謠,電子,SOM神經(jīng)網(wǎng)絡(luò)能夠把他們歸 從相同采樣不同編碼格式的音頻文件提取的音頻信息是相似的。概念包括Jazz(爵士、Rock(搖滾、R&B(節(jié)奏布魯斯、NewAge(新世紀(jì))等若干 征(后文稱(chēng)之為用戶)。同時(shí),隨著我國(guó)經(jīng)濟(jì)社會(huì)的發(fā)展、人民的文化需們希望探尋更加科學(xué)、有效的音頻提取方法。正如前文所述,MelMFCC及空氣動(dòng)力學(xué)理論證明了語(yǔ)音信號(hào)是一個(gè)復(fù)雜的非線性過(guò)程[10],其中存在著產(chǎn)1973年首次提出。所謂分形,是Figure8 sH(E)infdiam(Ai) E能被集族Aj)kEHs(E)limHs 點(diǎn)對(duì)應(yīng)的s值。嚴(yán)格的定義為:dimHEinfs:Hs(E)0sups:Hs(E)假設(shè)當(dāng)格子的邊長(zhǎng)是N (S):limlogN( 0log(1/f(t1ft2ft3,f(tNftN1N為偶數(shù)。令Nd()f(ti)
f(it1,N/d(2) max{f(t2i1),f(t2i),f(t2i1)}min{f(t2i1),f(t2i),f(t2i1)以 N()d()/,N(2)/其中樣本間隔1/fs,fsDB(f)lgN()/N(2)lgN()lgN1/1/
12MFCC特征提取相比,這極大地 Figure9由于時(shí)間關(guān)系,我們?cè)趦H在具有代表性的歌曲中隨機(jī)共計(jì)11種風(fēng)格、110mp3格式的音樂(lè)進(jìn)行分析,涉及到的歌手(或作曲家)有周杰倫、陳SarahBrightman、Kitaro、SecretGarden、莫扎特、比才、德彪西、巴赫等。110mp3wav格式。同時(shí),為了對(duì)于每首音樂(lè),我們統(tǒng)一截取20秒部分,通過(guò)軟件計(jì)算其計(jì)盒維數(shù)。在總計(jì)共110個(gè)樣本中,我們按類(lèi)別,將每個(gè)音樂(lè)樣本的計(jì)盒維數(shù)繪制出Figure10盒維數(shù)與其所屬類(lèi)別的均值存在較大差異,如隸屬于新世紀(jì)類(lèi)別的作曲家JoeHisaishiSummer的計(jì)盒維數(shù)與鋼琴類(lèi)的維數(shù)均值更加接近。就聽(tīng)者的感用計(jì)盒維數(shù)來(lái)刻畫(huà)音樂(lè)的音頻,似乎更能打破不同風(fēng)格間的界限,從整曲榜信息)。然而,由于這些信息本身多易于檢索、易于、易于自主獲息的音頻在應(yīng)用于個(gè)性化推薦當(dāng)中將會(huì)是非常有效的。 與音頻的概念類(lèi)似我們定義: 用戶相對(duì)容易計(jì)算和更新,并對(duì)用戶進(jìn)行遺忘處理[21];等等。戶進(jìn)行建模。我們根據(jù)前一節(jié)的討論,提出以下基于計(jì)盒維數(shù)的用戶音樂(lè) 1:設(shè)用戶的音樂(lè)庫(kù)有nx1x2xn f(xx[1
f(x為該用戶的抽取用戶特征,我們類(lèi)似地定義用戶點(diǎn)播:定義2:設(shè)用戶的有n次操作,其對(duì)應(yīng)的音樂(lè)作品的計(jì)盒維數(shù)分別x1,x2xn。x1,x2xn看做是從一維總體X中抽取出來(lái)的獨(dú)立同分布維數(shù)的用戶點(diǎn)播
f(x為該用戶的f(x的估計(jì)基于Parzen核密度估計(jì)的用 Xf(x度這個(gè)隨量的總體分布f(x)。這里我們采用Parzen核密度估計(jì)的非參數(shù)估estimationParzen所提出,屬于非參數(shù)檢驗(yàn)的方法之一。其目的是,給定數(shù)據(jù)x1,x2 xn,定義x1x2xnXX是具有未知的密度函數(shù)f的一維實(shí)函數(shù),則f的核密度估計(jì)為:f(x)
xxj nhK(nj K為上給定的核函數(shù),hnnfn(xffn(x作為密度函數(shù)估計(jì)的合理性,要求核函K(x)0,K(x)
1I(|u|2(1|u|)I(|u|3(1u2)I(|u|415(1u2)2I(|u|35(1u2)3I(|u| ue cos(u)I(|u| 1
K(u)
e
ixxxxiKxxixxii f(x)1之和。因而hn正是這n個(gè)窗的公共窗寬參數(shù)??梢钥闯觯?dāng)?shù)膆14和n256Figure11而對(duì)于雙峰均勻分布的估計(jì)如下圖所示:可見(jiàn),在h11和n256時(shí),估計(jì)Figure12ii令2MISE(f)E{[f(x)f(x)]2 f(xMISE是關(guān)于窗寬h的函數(shù),求它的最模型的應(yīng)用:用戶實(shí)交的例子。由于時(shí)間關(guān)系以及權(quán)限原因,我們無(wú)法獲取一些音樂(lè)的Figure13根據(jù)這位用戶的記錄,我們應(yīng)用Parzen核密度估計(jì)方法進(jìn)行用戶FigureFigure14
方法,得益于無(wú)監(jiān)督算法的特性,考慮了不同音樂(lè)類(lèi)別間有交叉的利用音樂(lè)信號(hào)的計(jì)盒維數(shù)作為音樂(lè)的音頻,充分刻畫(huà)了音頻信號(hào)的果,使得基于內(nèi)容的音樂(lè)推薦算法成為可能。并使用Parzen核密度估計(jì)法,對(duì)用戶進(jìn)行估計(jì),效果優(yōu)良。獲取的音樂(lè)社交的用戶數(shù)據(jù),進(jìn)行、更完善的數(shù)值試本文基于計(jì)盒維數(shù)的音頻與用戶可以被進(jìn)一步利用,以[1]CanoPBatlleEKalkerTetal.Areviewofaudio[2]佚名,MFCC語(yǔ)音MFCC特征的原理介紹,文庫(kù), 13MFCC[J].算機(jī)信息,2008,1:P095.邊肇祺,張學(xué)工等.模式識(shí)別第三 2010年8 13月CanoP,BatlleE,KalkerT,etal.Areviewofaudio柯世杰,岳振軍,分形理論在語(yǔ)音信號(hào)處理中的應(yīng)用, /view/0d4c90333968011ca300917a.html,2013年4月12日Applications.JohnWiley&Sons,.2003:xxv.ISBN0-470-84862-6.,2013413BigerelleM,IostA.FractaldimensionandclassificationFracals,000114:219佚名,豪斯多夫維數(shù),百科BB%B4%E6%95%B0,2013413BoshoffHFV.AFastBoxCountingAlgorithmforDeterminingtheFractalDimensionofSampledContinuousFunctions[C]//Proceedingsofthe1992SouthAfricanSymposiumonCommunicationsandSignalProcessing.[S.l.]:ACMPress,1992.,2013413fractalfeaturesofthemodulatedsignal[J].Sciencein:SeriesE,2001,31(6):P508-513.(in) 13 /view/.htm,2013年4月12日.BC.BA.E9.BB.9E,王星非參數(shù)統(tǒng)計(jì), functionr=mfcc(s,nbFrame=floor((l-n)/m)+fori=forj= j)=s(((j-1)*m)+h=M2=diag(h)*fori= =fft(M2(:,t=n/2;tmax=l/fs;m=melfb(24,n,fs);n2=1+floor(n/z=m*abs(frame(1:n2,r=r=r(1[x1x2]=vad(x);d=zeros(size(r));d(i,:)=r(i+1,:)-r(i-d=d/r=[rr=r(3:size(r,1)-iferror('cellmaxmustbe
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 歷史●重慶卷丨2021年重慶市普通高中學(xué)業(yè)水平選擇性考試歷史試卷及答案
- 投標(biāo)比選邀請(qǐng)書(shū)
- 開(kāi)標(biāo)會(huì)簽到表
- 共面雙裂隙砂巖力學(xué)性質(zhì)及破壞特征的規(guī)律研究
- Brand KPIs for neobanking Groww in India-英文培訓(xùn)課件2025.4
- 汽車(chē)傳感器與檢測(cè)技術(shù)電子教案:車(chē)速傳感器
- 單極世界的變數(shù)
- 惠州奧視通電子有限公司 廠房A、廠房B、宿舍工程施工組織設(shè)計(jì)
- 圖書(shū)倉(cāng)儲(chǔ)公司管理制度
- 單位運(yùn)行維護(hù)管理制度
- 肥胖中醫(yī)養(yǎng)生知識(shí)講座
- 攻讀博士學(xué)位期間語(yǔ)言學(xué)研究計(jì)劃參考范文
- 2025年綠色食品授權(quán)協(xié)議
- 四川省涼山州2025中考數(shù)學(xué)適應(yīng)性考試試卷四套附參考答案
- 婦科重點(diǎn)專(zhuān)科工作匯報(bào)
- 2025年海南農(nóng)墾自然資源開(kāi)發(fā)集團(tuán)有限公司筆試題
- 2025年廣西廣電網(wǎng)絡(luò)公司招聘筆試參考題庫(kù)含答案解析
- DB51T 1349-2011 油菜脫粒機(jī)規(guī)范
- 《高低壓配電室施工工藝標(biāo)準(zhǔn)》
- 工務(wù)安全與應(yīng)急處理
- 2021熱性驚厥臨床路徑
評(píng)論
0/150
提交評(píng)論