技術(shù)驅(qū)動-直擊人-悠易互通核心技術(shù)優(yōu)勢_第1頁
技術(shù)驅(qū)動-直擊人-悠易互通核心技術(shù)優(yōu)勢_第2頁
技術(shù)驅(qū)動-直擊人-悠易互通核心技術(shù)優(yōu)勢_第3頁
技術(shù)驅(qū)動-直擊人-悠易互通核心技術(shù)優(yōu)勢_第4頁
技術(shù)驅(qū)動-直擊人-悠易互通核心技術(shù)優(yōu)勢_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

技術(shù)驅(qū)動直擊“人”心目錄核心技術(shù)及系統(tǒng)架構(gòu)說明數(shù)據(jù)累積量展示及擴(kuò)展應(yīng)用核心技術(shù)及系統(tǒng)架構(gòu)說明實(shí)現(xiàn)BT定向,技術(shù)難點(diǎn)有哪些用戶行為數(shù)據(jù)的收集海量數(shù)據(jù)的存儲計(jì)算用戶興趣的分析建模行為定向的應(yīng)用和完善YOYI廣泛和豐富的媒體流量資源自主搜索引擎及云計(jì)算云存儲平臺自主分類詞庫、完善的語義及行為分析技術(shù)豐富的BT商業(yè)化經(jīng)驗(yàn),完善的廣告優(yōu)化技術(shù)(1)用戶行為數(shù)據(jù)的收集YOYI受眾數(shù)據(jù)收集原理頁面瀏覽行為瀏覽記錄收集存儲(包含自然搜索行為)廣告交互行為

電子商務(wù)交互行為

收集存儲廣告交互及電商行為YOYIADNetwork

范圍內(nèi)用戶的歷史瀏覽軌跡用戶行為分析模塊YOYI復(fù)合垂直搜索引擎模塊YOYI用戶屬性庫實(shí)時定向API復(fù)合搜索系統(tǒng)復(fù)合搜索引擎提供URL到頁面重點(diǎn)關(guān)鍵詞的轉(zhuǎn)換。意為傳統(tǒng)垂直搜索和針對媒體上不斷新增的新頁面的實(shí)時補(bǔ)充抓取程序相結(jié)合。為BT定向的用戶行為分析服務(wù),同時提供用戶即時瀏覽興趣關(guān)鍵詞定向的頁面分詞功能。復(fù)合搜索系統(tǒng)原理示意圖頁面正文區(qū)域智能提取復(fù)合搜索抓取YOYI基礎(chǔ)詞庫正文分詞(2)海量數(shù)據(jù)的存儲計(jì)算分布式計(jì)算平臺完善的分布式存儲及分布式計(jì)算平臺,提供對所有收集到的用戶行為數(shù)據(jù)的持久化存儲及高性能分析計(jì)算支持。(3)受眾行為分析建模受眾精準(zhǔn)興趣分析的4個維度用戶興趣關(guān)鍵詞用戶興趣行業(yè)用戶興趣產(chǎn)品類別當(dāng)前瀏覽頁面關(guān)鍵詞受眾興趣分類體系我們結(jié)合廣告主的營銷需求,經(jīng)過分析調(diào)整,整理出了包含22個興趣行業(yè)、230個產(chǎn)品類別的受眾興趣分類體系。興趣分類的體系,用以經(jīng)過分析計(jì)算,給用戶標(biāo)識出興趣Tag。讓廣告主能夠更容易地從人群興趣的維度選擇廣告定向的條件。消費(fèi)數(shù)碼汽車手機(jī)改裝筆記本電腦SUV二手車兩個受眾興趣分類體系的核心技術(shù)基于語料學(xué)習(xí)的分類詞庫按照行業(yè)及產(chǎn)品分類體系的結(jié)構(gòu),我們對關(guān)鍵詞庫進(jìn)行了基于語料訓(xùn)練方式的整理,基于大量分類語料的語料訓(xùn)練及自學(xué)習(xí),得出了與各個分類指標(biāo)化關(guān)聯(lián)的,高可用性的分類詞庫。用戶興趣分類算法通過不斷的數(shù)據(jù)建模及修正,我們得出了依據(jù)用戶行為及內(nèi)容分類,得出用戶行業(yè)/產(chǎn)品興趣的高可用性算法。用戶分類算法圖示用戶分類的確定采用改進(jìn)的樸素貝葉斯(Na?veBayes,NB)分類算法,YOYI基于NB這種利用概率分布統(tǒng)計(jì)進(jìn)行分類的算法,進(jìn)行了大量面向應(yīng)用的改進(jìn)和完善。用戶對于每一個興趣分類的屬性相似度,都參照一個三維的特征向量系進(jìn)行評估。用戶興趣詞與此分類覆蓋度越高,用戶興趣屬性與此分類相似度越高;覆蓋的興趣詞中,詞的詞頻越高,用戶興趣屬性與此分類相似度越高;覆蓋的興趣詞中,詞與此分類的關(guān)聯(lián)度評分越高,用戶興趣屬性與此分類相似度越高;人口統(tǒng)計(jì)學(xué)分析研究同時,我們擁有自主的問卷調(diào)查系統(tǒng),并基于普查性的用戶屬性聚類分析,結(jié)合自主的經(jīng)過改進(jìn)的SVM支持向量機(jī)用戶分類算法,進(jìn)行了一定范圍內(nèi)的用戶人口統(tǒng)計(jì)學(xué)分析的研究,取得了很好的效果。(4)受眾行為定向的應(yīng)用受眾行為定向?qū)V告效果的提升目前,我們已經(jīng)為超過400家廣告主提供了廣告精準(zhǔn)定向服務(wù)。廣告訂單CTR平均可以提升50-150%,最高達(dá)到280%數(shù)據(jù)累積量展示及應(yīng)用活躍Cookie數(shù)據(jù)庫用戶標(biāo)本積累情況截止到2011年6月4日,YOYI可以用于定向與分析的活躍Cookie樣本數(shù)量,達(dá)到了2.655億人,總Cookie樣本數(shù),超過10億。用戶訪問記錄及行為數(shù)據(jù)收集情況同時,截止到2011年6月,對于用戶訪問歷史軌跡點(diǎn)及訪問行為數(shù)據(jù)的記錄,增加到了208億條。受眾群體屬性分析報告除了廣告定向應(yīng)該之外,BT的用戶屬性數(shù)據(jù),還用于向廣告主提供

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論