版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于音樂(lè)類(lèi)型分類(lèi)和個(gè)性診斷的移動(dòng)混合音樂(lè)推薦系統(tǒng)Aristomenis S. Lampropoulos Paraskevi S. Lampropoulou George A. Tsihrintzis網(wǎng)上發(fā)表:2011年2月2日施普林格科學(xué)+商業(yè)媒體公司2011摘要:為了運(yùn)作成一個(gè)移動(dòng)服務(wù)項(xiàng)目,本文提出了一個(gè)級(jí)聯(lián)混合音樂(lè)推薦系統(tǒng)。具體地說(shuō),該推薦系統(tǒng)是實(shí)現(xiàn)一個(gè)基于音樂(lè)類(lèi)型分類(lèi)和個(gè)性診斷推薦處理的集成固件。移動(dòng)用戶(hù)能夠通過(guò)他/她的手機(jī)簡(jiǎn)單地給系統(tǒng)發(fā)送一個(gè)示例查詢(xún)音樂(lè)文件,在回應(yīng)移動(dòng)用戶(hù)的查詢(xún)時(shí),系統(tǒng)推薦的音樂(lè)不僅屬于同類(lèi)音樂(lè)流派查詢(xún)結(jié)果,同時(shí)作為考慮其他用戶(hù)偏好和用戶(hù)評(píng)級(jí)的一種嘗試。推薦系統(tǒng)機(jī)制是
2、依靠個(gè)性診斷協(xié)同過(guò)濾技術(shù)來(lái)實(shí)現(xiàn)的。與現(xiàn)有的協(xié)同過(guò)濾和基于內(nèi)容的推薦技術(shù)相比。該系統(tǒng)應(yīng)用最小絕對(duì)誤差和順序得分標(biāo)準(zhǔn)的系統(tǒng),比較結(jié)果充分展示出該系統(tǒng)具有較高的性能。關(guān)鍵字:推薦系統(tǒng)級(jí)聯(lián)混合方法個(gè)性診斷移動(dòng)服務(wù)簡(jiǎn)介推薦系統(tǒng)被定義為這樣一個(gè)系統(tǒng),人們輸入建議,系統(tǒng)提供合適的接受者。今天,這個(gè)術(shù)語(yǔ)包括更廣泛的含義,是指給用戶(hù)提供個(gè)性化的推薦結(jié)果或幫助用戶(hù)實(shí)現(xiàn)興趣的程序或在有可能的最大空間上的有用對(duì)象。因?yàn)樨S富的實(shí)際應(yīng)用,推薦系統(tǒng)形成一個(gè)重要的研究領(lǐng)域。明顯的,推薦系統(tǒng)功能類(lèi)似于社交建議并且減少信息量,對(duì)用戶(hù)沒(méi)有興趣并且沒(méi)有用途。因此,可以考慮推薦系統(tǒng)作為類(lèi)似于搜索引擎或信息檢索系統(tǒng)。然而,推薦系統(tǒng)不同于
3、搜索引擎和信息檢索系統(tǒng),不僅給推薦人查詢(xún)結(jié)果,還使用其嵌入式個(gè)性化機(jī)制來(lái)選擇對(duì)象(項(xiàng)目),滿(mǎn)足具體查詢(xún)用戶(hù)的需求。因此,推薦系統(tǒng)不象搜索引擎和信息檢索系統(tǒng),它提供給用戶(hù)的信息更合適更有價(jià)值,防止用戶(hù)淹沒(méi)在大量需要瀏覽和檢查的信息中。與搜索引擎和信息檢索系統(tǒng)相比,推薦系統(tǒng)進(jìn)行的事項(xiàng)目“匹配“。這意味著搜索引擎或一個(gè)信息檢索系統(tǒng)試圖形式和返回一個(gè)與檢索項(xiàng)目相匹配的查詢(xún)排序名單。動(dòng)態(tài)相關(guān)性學(xué)習(xí)技術(shù)可以根據(jù)用戶(hù)偏好給系統(tǒng)提供提煉查詢(xún)結(jié)果的能力,因此,系統(tǒng)可以提供一個(gè)簡(jiǎn)單的推薦信息表。更復(fù)雜的搜索引擎如谷歌利用其他“權(quán)威性”標(biāo)準(zhǔn),旨在盡可能為用戶(hù)提供有用的結(jié)果,但仍不是一種個(gè)性化的方式。推薦系統(tǒng)的研究結(jié)
4、合了近期快速發(fā)展的移動(dòng)技術(shù),并且繼續(xù)被手機(jī)技術(shù)和移動(dòng)網(wǎng)絡(luò)技術(shù)的革新所推進(jìn)?,F(xiàn)代手機(jī)依靠其內(nèi)在能力提供多媒體服務(wù)。內(nèi)置了照相機(jī)、收音機(jī)、媒體播放器和其他生成和處理多媒體數(shù)據(jù)的模塊。這些優(yōu)勢(shì)導(dǎo)致用戶(hù)不僅把手機(jī)當(dāng)成基本通話(huà)工具,更把它視為娛樂(lè)和存儲(chǔ)設(shè)備。除此之外,近幾年一系列對(duì)手機(jī)存儲(chǔ)容量的限制也被排除。隨著移動(dòng)技術(shù)的快速發(fā)展,移動(dòng)寬帶用戶(hù)創(chuàng)作音樂(lè)庫(kù)文件已經(jīng)實(shí)現(xiàn)。明顯的,操縱大量數(shù)據(jù)越來(lái)越成為復(fù)雜耗時(shí)的過(guò)程,一致移動(dòng)用戶(hù)不能有效管理音樂(lè)文件資源。這個(gè)事實(shí)促成一個(gè)能推薦給其用戶(hù)合適音樂(lè)的系統(tǒng)。因此,期望一個(gè)給用戶(hù)查詢(xún)結(jié)果的推薦系統(tǒng),并且能夠嘗試預(yù)測(cè)用戶(hù)是否對(duì)推薦音樂(lè)有興趣。具體地說(shuō),音樂(lè)推薦系統(tǒng)根據(jù)用
5、戶(hù)的相似之處嘗試推薦給用戶(hù)一些音樂(lè)文件,這樣,用戶(hù)的個(gè)性化也被嵌入到推薦系統(tǒng)之中。我們當(dāng)前的工作重點(diǎn)是建設(shè)一個(gè)在擁有很少甚至沒(méi)有用戶(hù)偏好甚至沒(méi)有用戶(hù)偏好數(shù)據(jù)的情況下,能適應(yīng)不斷變化的用戶(hù)偏好的推薦系統(tǒng),該系統(tǒng)能迅速反饋給用戶(hù)所希望查詢(xún)的結(jié)果。眾所周知,協(xié)同過(guò)濾技術(shù)患有不協(xié)作、用戶(hù)偏見(jiàn)、冷啟動(dòng)等問(wèn)題,我們建立的是基于內(nèi)容檢索和個(gè)人偏好診斷的協(xié)作過(guò)濾系統(tǒng)。具體來(lái)說(shuō),本文的組織結(jié)構(gòu)如下:第二部分回顧之前的相關(guān)工作,第三介紹我們已經(jīng)開(kāi)發(fā)出來(lái)系統(tǒng)。第四部分描述了后端整合到系統(tǒng)的推薦技術(shù)。第五部分對(duì)基于最小絕對(duì)錯(cuò)誤和得分排序標(biāo)準(zhǔn)的評(píng)價(jià)結(jié)果的推薦技術(shù)的評(píng)估。最后,在第六部分,插入描繪了系統(tǒng)的未來(lái)研究方向。2
6、 相關(guān)工作常規(guī)的推薦技術(shù)室系統(tǒng)過(guò)濾,具體的說(shuō),協(xié)同過(guò)濾技術(shù)就是在考慮其他人對(duì)部分音樂(lè)的排序等級(jí)而推薦給用戶(hù)的一種技術(shù)。例如,有目標(biāo)用戶(hù)喜歡音樂(lè)A和B,現(xiàn)有一部分用戶(hù)喜歡音樂(lè)A、B、C,音樂(lè)C可能將會(huì)被推薦給這個(gè)目標(biāo)用戶(hù)。換句話(huà)說(shuō),也就是推薦給目標(biāo)用戶(hù)的是消費(fèi)偏好相似的其他一組用戶(hù)的內(nèi)容。由于其本身的特性,協(xié)同過(guò)濾已經(jīng)普遍用于預(yù)測(cè)各種偏好問(wèn)題,如網(wǎng)絡(luò)新聞、電子商務(wù)、數(shù)字圖書(shū)館等。在文獻(xiàn)中,協(xié)同過(guò)濾技術(shù)一再應(yīng)用在移動(dòng)環(huán)境中。例如,MobiTip就是利用協(xié)同過(guò)濾技術(shù)預(yù)測(cè)基于新的或用戶(hù)提供更新的電影數(shù)據(jù)變化率。類(lèi)似的,我們?cè)?提到的,最早之一的音樂(lè)推薦系統(tǒng)就是用協(xié)同過(guò)濾技術(shù)。這個(gè)系統(tǒng)利用WEB過(guò)濾過(guò)的
7、數(shù)據(jù)來(lái)支撐節(jié)目播放列表。所以被稱(chēng)作“基于系統(tǒng)過(guò)濾的推薦引擎”。他們的系統(tǒng)產(chǎn)生的是基于用戶(hù)播放列表內(nèi)容的推薦。另一方面,基于內(nèi)容的推薦系統(tǒng)是基于系統(tǒng)通過(guò)關(guān)聯(lián)特征發(fā)現(xiàn)對(duì)象的興趣。這些系統(tǒng)學(xué)習(xí)基于用戶(hù)相關(guān)項(xiàng)目特征的興趣文件。然后,推薦系統(tǒng)在沒(méi)有匹配興趣的情況下建立起來(lái)。為進(jìn)一步改進(jìn)推薦性能和消除每個(gè)獨(dú)立推薦技術(shù)的缺點(diǎn),考慮使用各種混合技術(shù)。一種混合的推薦方法是基于內(nèi)容預(yù)測(cè)和系統(tǒng)過(guò)濾技術(shù)?;趦?nèi)容的預(yù)測(cè)部分可以解決依靠相關(guān)性項(xiàng)目來(lái)預(yù)測(cè)不相關(guān)項(xiàng)目等級(jí)的稀疏矩陣和第一評(píng)估者問(wèn)題。由于混合方法的性能通常依賴(lài)于精確的基于內(nèi)容預(yù)測(cè),支持向量機(jī)通常被應(yīng)用到基于內(nèi)容的預(yù)測(cè)任務(wù)中。更具體的說(shuō),混合推薦系統(tǒng)可以分為以下
8、幾類(lèi):- 聯(lián)合分離推薦;- 增加基于內(nèi)容特征協(xié)作模式;- 增加協(xié)作特征的內(nèi)容模式;- 單一統(tǒng)一推薦模式。第一類(lèi)混合推薦系統(tǒng)包括兩個(gè)獨(dú)立協(xié)作和基于內(nèi)容的系統(tǒng)。有四種不同的方法結(jié)合兩個(gè)分離的系統(tǒng):加權(quán)混合方法: 輸出(評(píng)級(jí))獲得個(gè)人推薦系統(tǒng)組合在一起以產(chǎn)生一個(gè)單一的最后的建議或者使用線性組合7或18投票方案P-Tango系統(tǒng)最初給兩個(gè)推薦系統(tǒng)相等的權(quán)重,但逐漸地根據(jù)用戶(hù)的評(píng)級(jí)來(lái)調(diào)整預(yù)測(cè)權(quán)重。系統(tǒng)保持兩個(gè)過(guò)濾方法相互獨(dú)立,保證發(fā)揮各自的優(yōu)勢(shì)。切換權(quán)重方法:系統(tǒng)在推薦技術(shù)之間進(jìn)行切換,并且選擇對(duì)當(dāng)前狀況推薦質(zhì)量較好的推薦技術(shù)。該技術(shù)一個(gè)典型的例子是日學(xué)習(xí)推薦系統(tǒng),它選擇具有較高可信度的推薦子系統(tǒng)。這種
9、方法的另外一個(gè)例子是在27提到的,它選擇根據(jù)提供的推薦結(jié)果與用戶(hù)評(píng)級(jí)一致性較高的基于內(nèi)容或協(xié)同過(guò)濾技術(shù)。分區(qū)混合法:在這種方法中,結(jié)果從不同的推薦子系統(tǒng)同時(shí)給出。一個(gè)例子是在25提到的基于電視播出和用戶(hù)偏好系統(tǒng)信息的文字描述。推薦系統(tǒng)在最后的推薦結(jié)果中同時(shí)給出這兩種技術(shù)的推薦結(jié)果。梯度混合法: 在這種方法中,先用一種技術(shù)產(chǎn)生一個(gè)粗略的候選結(jié)果,再采用第二種技術(shù)對(duì)粗選結(jié)果進(jìn)行精確選擇。這種方法比加權(quán)混合方法的各種應(yīng)用技術(shù)在所有預(yù)測(cè)項(xiàng)目上都更有效。因?yàn)榈谝患?jí)過(guò)濾已把候選項(xiàng)進(jìn)行了過(guò)濾,所以這種混合方法計(jì)算任務(wù)更小。然而,這種方法對(duì)于低優(yōu)先級(jí)推薦時(shí)對(duì)無(wú)用數(shù)據(jù)具有更高的兼容性。換句話(huà)說(shuō),這種梯度混合方法
10、可以分析兩個(gè)梯度。第一級(jí)(基于內(nèi)容的方法或基于(協(xié)同)知識(shí))選擇中間推薦結(jié)果。然后,第二級(jí)(基于內(nèi)容協(xié)同或基于知識(shí)協(xié)同方法)從第一級(jí)推薦結(jié)果中選擇更合適的項(xiàng)目。BurKe5開(kāi)發(fā)了一個(gè)叫做EntreeC.的酒店推薦系統(tǒng)。這個(gè)系統(tǒng)首先用基于知識(shí)的方法選擇客戶(hù)的用餐偏好,在基于知識(shí)的方法中,創(chuàng)作者根據(jù)事先定義好的描述酒店特征的屬性構(gòu)造特征向量。這種方法與基于內(nèi)容的方法相似,然而,我們必須注意是在基于知識(shí)的屬于已被使用并且元數(shù)據(jù)是獨(dú)立于內(nèi)容的。這些酒店用協(xié)同方法進(jìn)行等級(jí)排序。除前面提到的方法之外,最近的推薦系統(tǒng)包括下面方法:在9里,作者提出了一個(gè)上下文感知的音樂(lè)推薦系統(tǒng),該系統(tǒng)是就內(nèi)容檢索,音樂(lè)本體和
11、領(lǐng)域?qū)S眯g(shù)語(yǔ)諸如精神和心里情景。創(chuàng)建了情緒狀態(tài)轉(zhuǎn)換模型(ESTM),來(lái)描繪復(fù)雜的人類(lèi)情感并且能夠把用戶(hù)的心里情景和喜好用COMUS來(lái)評(píng)估。音樂(lè)推薦系統(tǒng)基于當(dāng)前的、用戶(hù)想要的、ESTM已經(jīng)完成低等級(jí)特征算法分類(lèi)。ALBANESE ET AL.2,提出了另外一種方法,該方法融合了隱藏在使用日志中的低等級(jí)特征的信息使用模式和用于預(yù)測(cè)用戶(hù)行為的語(yǔ)義描述符來(lái)提供有效的推薦信息。在這個(gè)推薦系統(tǒng)中,作者介紹了多通道瀏覽器和多通道對(duì)象來(lái)模擬用戶(hù)并發(fā)瀏覽多類(lèi)型對(duì)象。在系統(tǒng)原型上進(jìn)行了廣泛的試驗(yàn),得到了良好的試驗(yàn)結(jié)果。在10里,創(chuàng)建者提出了一個(gè)基于用戶(hù)上下文的框架來(lái)為周?chē)襟w服務(wù)。擬議的框架包含了動(dòng)態(tài)確定上下文并
12、提供媒體用戶(hù)需求。該框架能隨著時(shí)間的變化適應(yīng)媒體服務(wù),并且能根據(jù)環(huán)境靈活的更新用戶(hù)喜好。3 推薦系統(tǒng)綜述我們的推薦系統(tǒng)是一個(gè)固件系統(tǒng)。具體地說(shuō),我們的系統(tǒng)允許移動(dòng)用戶(hù)通過(guò)他/她的移動(dòng)終端發(fā)送實(shí)例音樂(lè)到音樂(lè)庫(kù)查詢(xún)和與需求音樂(lè)相似的音樂(lè)文件名進(jìn)行查詢(xún)。在前述的預(yù)備工作中13-15,開(kāi)發(fā)系統(tǒng)的動(dòng)機(jī)是減少現(xiàn)有移動(dòng)音樂(lè)推薦系統(tǒng)的局限性。具體的說(shuō),我們的系統(tǒng)是不需要操作的系統(tǒng),并且不需要應(yīng)用程序接口或特別的客戶(hù)端安裝。該系統(tǒng)使用支持所有手機(jī)的推送技術(shù)。推送就是在不需要用戶(hù)明確需求的情況下給移動(dòng)用戶(hù)發(fā)送一條信息。信息發(fā)送可能是人到人或應(yīng)用到人甚至應(yīng)用到應(yīng)用。一些推送應(yīng)用的例子包括預(yù)警信息、股票行情和每日星座
13、。在這幾種情況中,有用戶(hù)定制服務(wù)和根據(jù)用戶(hù)喜好推送的預(yù)警信息。在WAP推送中,允許推送發(fā)起者傳送推送內(nèi)容并且傳遞指令到推送網(wǎng)關(guān),然后推送網(wǎng)關(guān)根據(jù)傳送指令推送內(nèi)容到WAP客戶(hù)端(諸如“客戶(hù)”或“終端”)。典型的是推送發(fā)起者是運(yùn)行在WEB服務(wù)器中的應(yīng)用程序。它與推送網(wǎng)關(guān)通過(guò)推送接受協(xié)議進(jìn)行通信。推送網(wǎng)關(guān)通過(guò)空中接口協(xié)議傳送推送內(nèi)容到客戶(hù)。前段推薦水平依靠開(kāi)放資源技術(shù)和仿真模型工具。編程使用JAVA語(yǔ)言。一些完成前段運(yùn)行水平的服務(wù)已經(jīng)實(shí)現(xiàn)。我們使用開(kāi)放資源軟件WAP Push SDKV2.0版本來(lái)實(shí)現(xiàn)推送協(xié)議。推送代理網(wǎng)關(guān)已經(jīng)使用開(kāi)放資源軟件Kannel.Kannel是開(kāi)服昂資源WAP網(wǎng)關(guān)。最后,對(duì)
14、形同運(yùn)行說(shuō)明和評(píng)估,我們使用Developer Platform 2.0 SDK-Nokia 6230平臺(tái)版本。它是Nokia Developer Platform 2.0SDK 仿真規(guī)范。SDK提供媒體內(nèi)容和J2ME平臺(tái)應(yīng)用的環(huán)境。另外,雖然推薦系統(tǒng)算法是基于先進(jìn)的久經(jīng)考驗(yàn)的辨識(shí)/機(jī)器學(xué)習(xí)技術(shù),推薦系統(tǒng)程序與用戶(hù)交互非常簡(jiǎn)單,不需要用戶(hù)有先進(jìn)的技巧。的確,用戶(hù)通過(guò)多媒體終端發(fā)起的服務(wù),包含用戶(hù)通過(guò)音頻文件發(fā)起推薦處理程序。推薦處理過(guò)程有兩步組成。第一步,處理程序區(qū)分用戶(hù)提交的音樂(lè)文件流派,然后第二步推薦系統(tǒng)按照以下程序進(jìn)行。協(xié)同過(guò)濾技術(shù)應(yīng)用把選擇的歌曲文件排列在較高的等級(jí)序列。推薦結(jié)果的內(nèi)容
15、傳送格式不需要呈現(xiàn)給用戶(hù),因?yàn)檫@樣將引起用戶(hù)不必要的高消費(fèi)。推薦系統(tǒng)反饋給用戶(hù)簡(jiǎn)單的推送信息來(lái)代替。每一個(gè)推送消息與推薦音樂(lè)文件列表進(jìn)行連接。然后,用戶(hù)可以選擇推薦音樂(lè)文件或者通過(guò)提供排序等價(jià)更新系統(tǒng)提供的推薦列表。隨后,系統(tǒng)根據(jù)用戶(hù)排序等級(jí)更新推薦列表。推送技術(shù)允許系統(tǒng)在沒(méi)有用戶(hù)發(fā)送信息的情況下更新推薦文件列表。連接都有命名,一邊用戶(hù)根據(jù)連接名稱(chēng)選擇是否從WEB服務(wù)器下載這些音樂(lè)文件到他的手機(jī)?,F(xiàn)實(shí)中,通信系統(tǒng)是一個(gè)前段到后端的多層級(jí)體系結(jié)構(gòu)。前段包括實(shí)現(xiàn)用戶(hù)通信的模塊,移動(dòng)網(wǎng),應(yīng)用程序。后端是指實(shí)現(xiàn)推薦機(jī)制的模塊。本文設(shè)計(jì)的推薦系統(tǒng)允許音樂(lè)數(shù)據(jù)庫(kù)是分布式的并且和后端代理網(wǎng)關(guān),推送發(fā)起者,前
16、段無(wú)線接入?yún)f(xié)議服務(wù)器相分離。4基于音樂(lè)類(lèi)型分類(lèi)和個(gè)性診斷的混合音樂(lè)推薦方案如上一節(jié)所述,用于方案實(shí)現(xiàn)的后端包含所有模塊。具體而言,我們中間件系統(tǒng)后端包含兩個(gè)方面。第一,采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)支持向量機(jī)分類(lèi)器,從而增強(qiáng)內(nèi)容信息,以便于在音樂(lè)類(lèi)型分類(lèi)系統(tǒng)查詢(xún)支持的音樂(lè)文件。第二,利用現(xiàn)有特定用戶(hù)或其他用戶(hù)的評(píng)級(jí)以提供個(gè)性化的方案。本推薦機(jī)制的目的在于返回音頻/音樂(lè)搜索結(jié)果,而不僅僅是查詢(xún)同類(lèi)型的音頻/音樂(lè)和內(nèi)容相似的文件。但也考慮到用戶(hù)喜好的每一個(gè)音樂(lè)文件的評(píng)級(jí)。(如圖1)具體步驟如下:1. 用戶(hù)通過(guò)提交詢(xún)問(wèn)(目的音樂(lè))進(jìn)行初始查詢(xún),特征提取器提取對(duì)應(yīng)30個(gè)音頻詳情的一組值。2. 第一,分類(lèi)標(biāo)識(shí)查
17、詢(xún)音樂(lè)文件的類(lèi)型。第二,推薦程序?qū)⒏鶕?jù)用戶(hù)喜好返回歌曲。更確切的說(shuō),一級(jí)分類(lèi)器識(shí)別音樂(lè)查詢(xún)文件類(lèi)型的信心。判決值(信心)是查詢(xún)特定類(lèi)別幅度的差額。選擇對(duì)應(yīng)最高判定值分類(lèi)器類(lèi)型。3. 第二級(jí)采用個(gè)性診斷方法,返回一個(gè)推薦列表。數(shù)據(jù)庫(kù)中的每個(gè)音樂(lè)文件可以關(guān)聯(lián)五個(gè)評(píng)分等級(jí)。另外,每個(gè)音樂(lè)類(lèi)型被細(xì)分成4個(gè)等級(jí)0,1,2,3。4. 最后,用戶(hù)既能夠選擇并下載音頻/音樂(lè)或提供推薦項(xiàng)目評(píng)級(jí),還可以收到新的推薦列表。4.1SVM分類(lèi)器支持向量機(jī)(SVM)是尋找單獨(dú)數(shù)據(jù)點(diǎn)最佳超平面途徑,概括最優(yōu)數(shù)據(jù)的監(jiān)督分類(lèi)系統(tǒng)。超平面即所謂的每類(lèi)的最近點(diǎn)距離最大化的最大間隔超平面。令S =S1,S2, . . . , Sn其
18、中,SjRd是對(duì)應(yīng)音樂(lè)數(shù)據(jù)庫(kù)文件的一組d維特征向量。任何超平面分離的兩個(gè)數(shù)據(jù)類(lèi)(二進(jìn)制或二分類(lèi))形式如(1)。圖1 推薦方案 (1)其中,f:Rd-1,+1。SVM分類(lèi)器得到解決二次規(guī)劃問(wèn)題如 (2)約束條件:(3)最佳解決方案的決策函數(shù)如下: (4)支持向量機(jī)的一個(gè)顯著特征是僅有一小部分的Wi系數(shù)為非零。相應(yīng)的Si對(duì)(邊緣支持向量)和完整定義輸出標(biāo)簽的決策功能。設(shè)定訓(xùn)練模式只出現(xiàn)在點(diǎn)乘積項(xiàng)(Si)(Sj),這里定義一個(gè)核心函數(shù)K(Si,Sj)=(Si)(Sj)映射到多維空間并進(jìn)行點(diǎn)積運(yùn)算。我們引用的具體的高斯函數(shù)為K(si, s j) =在第一步的音樂(lè)推薦過(guò)程中多類(lèi)而非出現(xiàn)二元分類(lèi)問(wèn)題。為解
19、決這一問(wèn)題,本文理由協(xié)同分類(lèi)技術(shù)通過(guò)分類(lèi)集合致力于空間的特定視圖,包括原始空間的分解。分為以下兩個(gè)步驟:第一,訓(xùn)練的二進(jìn)制SVM分類(lèi)器對(duì)其中每個(gè)特定類(lèi)的對(duì)象進(jìn)行分類(lèi)。第二,與第一步的分類(lèi)結(jié)果相結(jié)合,以得出最終的分類(lèi)決策。集成分類(lèi)器,遵循反對(duì)(OAO)或成對(duì)策略。OAO方法是通過(guò)在成對(duì)類(lèi)之間培訓(xùn)二進(jìn)制SVM。因此,OAO模式為K(K-1)/2 二進(jìn)制SVM解決K類(lèi)分類(lèi)問(wèn)題。每個(gè)K(K-1)/2 SVM為目的類(lèi)投一票,并將票數(shù)最高的分配給輸入樣本X。4.2個(gè)性診斷推薦過(guò)程實(shí)現(xiàn)的第二層是個(gè)性診斷技術(shù)。這一層面的主要特點(diǎn)是,有意義概率語(yǔ)義的預(yù)測(cè),此外,假設(shè)每個(gè)用戶(hù)的喜好構(gòu)成其基本人格類(lèi)型的一個(gè)特征。因
20、此,考慮到在線用戶(hù)已知的項(xiàng)目評(píng)級(jí),這使得估計(jì)他/她與另一用戶(hù)有相同的性格類(lèi)型的概率成為可能。用戶(hù)可以看到給定用戶(hù)采用“真”收視率向量的個(gè)性類(lèi)型。一個(gè)真正的評(píng)級(jí)不同于一定量的(高斯)噪聲下用戶(hù)給出的實(shí)際報(bào)告評(píng)級(jí)。特定用戶(hù)個(gè)性類(lèi)型,個(gè)性診斷方法估計(jì)的是系統(tǒng)相同性格類(lèi)型中給定用戶(hù)的概率,從而,估計(jì)用戶(hù)喜好新項(xiàng)目的概率。19對(duì)每個(gè)用戶(hù)Uk的個(gè)性類(lèi)型歸納如下,其中K=1,2,m,Um=u1,u2,um,用戶(hù)Uk的優(yōu)選條件是In=i1,i2,in: (5)Rture(Uk,il)其中,ilIn,l=1,2,n代表項(xiàng)目il的用戶(hù)Uk的真正評(píng)級(jí)。關(guān)鍵在于區(qū)別“真”的用戶(hù)評(píng)級(jí)和(已知)用戶(hù)評(píng)級(jí)報(bào)告。推薦系統(tǒng)的設(shè)
21、計(jì)者是不能直接訪問(wèn)真正的用戶(hù)喜好的評(píng)級(jí)編碼。然而,用戶(hù)提供的報(bào)告評(píng)級(jí)應(yīng)用于推薦系統(tǒng)。據(jù)推測(cè),用戶(hù)給出的評(píng)級(jí)報(bào)告包括高斯噪聲。假設(shè)用戶(hù)可以在不同情況下,相同的項(xiàng)目,根據(jù)上下文的不同評(píng)級(jí)報(bào)告。因此,我們可以認(rèn)為一個(gè)項(xiàng)目il的用戶(hù)評(píng)級(jí)報(bào)告服從獨(dú)立正態(tài)分布Rture(Uk,il)。特別是: (6)其中是空閑變量,X是推薦系統(tǒng)的用戶(hù)評(píng)級(jí)報(bào)告,y是無(wú)噪聲條件下用戶(hù)Uk報(bào)告評(píng)級(jí)值。此外,假設(shè)用戶(hù)評(píng)估項(xiàng)目組R代表目標(biāo)人群的個(gè)性類(lèi)型的分布。因此,考慮到這樣的假設(shè),制定先驗(yàn)概率,在線用戶(hù)Ua對(duì)應(yīng)的向量v,根據(jù)v其他用戶(hù)的速率作為給定的的頻率,因此,明確計(jì)算出現(xiàn),并非我們簡(jiǎn)單定義。是一個(gè)隨機(jī)變量,可以取值m,(R(
22、u1), R(u2), . . . , R(um),每個(gè)概率為1/m: (7)結(jié)合(6)和(7),并給出在線用戶(hù)的評(píng)級(jí),可以運(yùn)用貝葉斯法則計(jì)算出在線用戶(hù)相同性格類(lèi)型占其他用戶(hù)的概率。 (8)因此,計(jì)算每個(gè)用戶(hù)Uk數(shù)量,可以計(jì)算得到不可見(jiàn)項(xiàng)目IJ在線用戶(hù)的評(píng)級(jí)分布。這個(gè)概率分布,推薦系統(tǒng)所產(chǎn)生的在線用戶(hù)Ua項(xiàng)目IJ預(yù)期評(píng)級(jí)。(9)該模型被描述為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中一個(gè)典型的診斷模型,如下:首先,觀察到評(píng)級(jí)和計(jì)算概率,每個(gè)人的個(gè)性類(lèi)型使用的原因(8)。評(píng)級(jí)可以被視為“癥狀”,而個(gè)性類(lèi)型為“病”,導(dǎo)致這些癥狀出現(xiàn)在診斷模型中。其次,可為不可見(jiàn)項(xiàng)目計(jì)算出等級(jí)值的概率(9),返回預(yù)測(cè)推薦系統(tǒng)最有可能的評(píng)級(jí)。
23、個(gè)性診斷另外一層意思,在線用戶(hù)評(píng)級(jí)被認(rèn)為是通過(guò)選擇其他用戶(hù)之一均勻隨機(jī)高斯噪聲添加到他/她的評(píng)級(jí)“產(chǎn)生”。可根據(jù)在線用戶(hù)評(píng)級(jí)推斷出他/她實(shí)際上是其他用戶(hù)之一,計(jì)算得到其他項(xiàng)目評(píng)級(jí)的概率。5推薦系統(tǒng)評(píng)估設(shè)定用戶(hù)組U = u1, u2, . . . , um,音樂(lè)數(shù)據(jù)庫(kù)中相關(guān)項(xiàng)目I = i1, i2, . . . , in,用于音樂(lè)推薦系統(tǒng)的實(shí)現(xiàn)。數(shù)據(jù)庫(kù)中的每一個(gè)音樂(lè)文件對(duì)應(yīng)于30維向量空間V,要求參與我們實(shí)驗(yàn)的每個(gè)用戶(hù)為數(shù)據(jù)庫(kù)中每個(gè)項(xiàng)目分配唯一的評(píng)級(jí)值。設(shè)R(u, i)為用戶(hù)U分配給項(xiàng)目I的評(píng)級(jí)值,通過(guò)以下公式定義四類(lèi): (10)為了說(shuō)明本推薦方法的性能,研究采用從4類(lèi)西方音樂(lè)選出400個(gè)音樂(lè)文
24、件。具體地,集合包含了四類(lèi)西方音樂(lè)中每個(gè)30S持續(xù)時(shí)間的100個(gè)音樂(lè)文件(見(jiàn)表1)。表1 classes of western music為捕獲某些方面具體的應(yīng)用功能,音頻信號(hào)可以以多種形式表示。特征提取的大量重要的工作更適合于描述和模擬音樂(lè)信號(hào)。本文中,采用Tzanetakis和Cook 28, 29最初提議的特定30維客觀特征。值得一提的是,這不僅提供了低級(jí)別音樂(lè)信號(hào)的統(tǒng)計(jì)特性表示方法,也包含高水平心理聲學(xué)算法信息的提取??傊?,這些功能表現(xiàn)出有節(jié)奏的內(nèi)容(節(jié)奏,節(jié)拍和速度信息),音樂(lè)信號(hào)音調(diào),旋律及和聲的描述。這些文件被15個(gè)用戶(hù)分配評(píng)級(jí)值,用戶(hù)至少對(duì)150個(gè)音樂(lè)文件聲明他們的觀點(diǎn)。正如之
25、前提到的評(píng)級(jí)值按照數(shù)值規(guī)模從1(低優(yōu)優(yōu)先級(jí))到3(高優(yōu)先級(jí)),評(píng)級(jí)為0表示相應(yīng)的文件沒(méi)有評(píng)級(jí)值,因此被視為非首選。分類(lèi)算法,采用基于RBF-SVM分類(lèi)器,設(shè)=0.1,所有30維空間向量歸到0,1區(qū)間。使用十倍交叉驗(yàn)證評(píng)估方法對(duì)第一級(jí)分類(lèi)精度進(jìn)行計(jì)算。進(jìn)行評(píng)估的數(shù)據(jù)集和的90%用于訓(xùn)練,另外10%用于測(cè)試。過(guò)程中,對(duì)與不相交的分區(qū)迭代的結(jié)果取平均值。準(zhǔn)確的說(shuō),十倍交叉驗(yàn)證結(jié)果見(jiàn)表2,其中N=10,MA:平均精度,ME:平均誤差,SD:標(biāo)準(zhǔn)差,SEM:標(biāo)準(zhǔn)差。 (11)表2 Musical genre classification fold analysis (12) (13) (14)音樂(lè)類(lèi)型分
26、類(lèi)推薦系統(tǒng)的平均精度見(jiàn)表3。表3 Accuracy%鑒于推薦方法的評(píng)估效率,對(duì)每個(gè)用戶(hù)的評(píng)級(jí)采用十倍交叉驗(yàn)證程序。因此,每個(gè)用戶(hù)的數(shù)據(jù)集合中90%用于訓(xùn)練,10%用于測(cè)試。每一段,系統(tǒng)從每個(gè)類(lèi)型查詢(xún)十塊共收錄40個(gè)音樂(lè)文件。過(guò)程中,對(duì)與不相交的分區(qū)迭代的結(jié)果取平均值。最后,對(duì)所有用戶(hù)的結(jié)果取平均值,采用平均值絕對(duì)誤差(MAE)和評(píng)級(jí)標(biāo)準(zhǔn)等級(jí)(RS)對(duì)預(yù)測(cè)方法準(zhǔn)確性進(jìn)行評(píng)價(jià)。MAE是推薦系統(tǒng)評(píng)估效率最常采用的方法。更確切的講,MAE對(duì)用戶(hù)U,段K的定義如下:(15)其中,P(u, k) 是正模式,即查詢(xún)文件所屬特定類(lèi)型模式。另一方面,N(u, k)是負(fù)模式,不屬于特定類(lèi)型的模式,但作為第一級(jí)分類(lèi)
27、類(lèi)型的模式。Ru,k(v)是用戶(hù)給定的評(píng)估值,u,k(v)是系統(tǒng)預(yù)測(cè)的評(píng)估值。RS假定根據(jù)用戶(hù)預(yù)測(cè)項(xiàng)目評(píng)級(jí)將推薦系統(tǒng)以列表的方式呈現(xiàn)給用戶(hù)。具體地,RS評(píng)估用戶(hù)項(xiàng)目排名清單,被視為用戶(hù)預(yù)期效用乘以用戶(hù)實(shí)用項(xiàng)目效用。一個(gè)項(xiàng)目效用的計(jì)算,如觀察評(píng)級(jí)差異,默認(rèn)值,域中性評(píng)級(jí),它可以是評(píng)級(jí)表的中點(diǎn)或數(shù)據(jù)集合的平均值。查看項(xiàng)目等價(jià)增加呈指數(shù)衰減的概率。從形式上看RS是段K,特定用戶(hù)Ui的項(xiàng)目排名清單,根據(jù)指標(biāo)j降序排列Rui,k(vj),由下式給出: 16)進(jìn)行多次實(shí)驗(yàn)后,與其他三個(gè)推薦方案即兩個(gè)協(xié)同過(guò)濾方案,一種混合方案相比,具體在以下三個(gè)方面:(1)CF Pearson相關(guān)系數(shù)為基準(zhǔn),(2)CF個(gè)性診斷,(3)混合音樂(lè)類(lèi)型分類(lèi)與Pearson相關(guān)系數(shù)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 觸電急救課件
- 蘇教版江蘇省南京市2023-2024學(xué)年高二上學(xué)期期末模擬數(shù)學(xué)試題
- 環(huán)境問(wèn)題 課件
- 貝殼課件席慕蓉
- 第四講 有趣的動(dòng)物(看圖寫(xiě)話(huà)教學(xué))-二年級(jí)語(yǔ)文上冊(cè)(統(tǒng)編版)
- 自然拼讀課件
- 意大利地圖課件
- 西京學(xué)院《語(yǔ)言程序設(shè)計(jì)》2022-2023學(xué)年期末試卷
- 西京學(xué)院《數(shù)字化與網(wǎng)絡(luò)化制造》2021-2022學(xué)年期末試卷
- 譯林牛津英語(yǔ)7年級(jí)上冊(cè)7AUnit3ReadingⅡ
- TD-T 1041-2013 土地整治工程質(zhì)量檢驗(yàn)與評(píng)定規(guī)程
- 文化差異與跨文化交際知到章節(jié)答案智慧樹(shù)2023年鄭州大學(xué)
- 基恩士FS-N18N放大器常用調(diào)試說(shuō)明書(shū)
- 保潔人員排班表
- 2023年安徽省交通控股集團(tuán)招聘筆試題庫(kù)及答案解析
- 領(lǐng)導(dǎo)在班組長(zhǎng)會(huì)上的講話(huà)(5篇)
- LY/T 1956-2011縣級(jí)林地保護(hù)利用規(guī)劃編制技術(shù)規(guī)程
- GB/T 30842-2014高壓試驗(yàn)室電磁屏蔽效能要求與測(cè)量方法
- GB/T 20399-2006自然保護(hù)區(qū)總體規(guī)劃技術(shù)規(guī)程
- 簡(jiǎn)單折紙筆筒制作
- 九年級(jí)化學(xué)上冊(cè)復(fù)習(xí)課件(1-7單元)(2)第五單元復(fù)習(xí)課件
評(píng)論
0/150
提交評(píng)論