版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第11章文本挖掘與Web挖掘
目錄13.1文本挖掘概述
13.2文本挖掘13.3Web挖掘
13.1文本挖掘概述
13.1.1文本挖掘的基本概念
13.1.2文本特征的表示
13.1.3文本特征的提取
13.1.1文本挖掘的基本概念
文本挖掘一詞出現(xiàn)于1998年第十屆歐洲機(jī)器學(xué)習(xí)會(huì)議上。Kodratoff認(rèn)為文本挖掘的目的是從文本集合中,試圖在一定的理解水平上盡可能多地提取知識(shí)。1.概念文本挖掘是一個(gè)從大量文本數(shù)據(jù)中提取以前未知的、有用的、可理解的、可操作的知識(shí)的過程。文本數(shù)據(jù)包括:技術(shù)報(bào)告、文本集、新聞、電子郵件、網(wǎng)頁、用戶手冊(cè)等。2.主要任務(wù)
(1)短語提取提取文本集中所有相關(guān)的短語。(2)概念提?。ň垲悾?duì)這些短語之間的關(guān)系,建立一個(gè)該文本集中的主要概念
。(3)可視化顯示和導(dǎo)航
從多個(gè)視角出發(fā)進(jìn)行分析.3.文本挖掘與數(shù)據(jù)挖掘
數(shù)據(jù)挖掘文本挖掘研究對(duì)象用數(shù)字表示的、結(jié)構(gòu)化的數(shù)據(jù)無結(jié)構(gòu)或者半結(jié)構(gòu)化的文本對(duì)象結(jié)構(gòu)關(guān)系數(shù)據(jù)庫自由開放的文本目標(biāo)獲取知識(shí),預(yù)測(cè)以后的狀態(tài)提取概念和知識(shí)方法歸納學(xué)習(xí)、決策樹、神經(jīng)網(wǎng)絡(luò)、粗糙集、遺傳算法等提取短語、形成概念、關(guān)聯(lián)分析、聚類、分類成熟度從1994年開始得到廣泛應(yīng)用從2000年開始得到廣泛應(yīng)用13.1.2文本特征的表示
文本特征指的是關(guān)于文本的元數(shù)據(jù):(1)描述性特征,例如文本的名稱、日期、大小、類型等;(2)語義性特征,例如文本的作者、機(jī)構(gòu)、標(biāo)題、內(nèi)容等。矢量空間模型(VSM)是效果較好的表示文本特征的方法。每個(gè)文本d表示為其中的一個(gè)規(guī)范化特征矢量:V(d)=(t1,w1(d);…;ti,wi(d);…;tn,wn(d))d中出現(xiàn)的所有單詞作為ti,或所有短語。wi(d)一般被定義為ti在d中出現(xiàn)頻率tfi(d)的函數(shù)。
函數(shù)wi(d)=Ψ(tfi(d))
,常用的Ψ有:
(1)平方根函數(shù)(2)對(duì)數(shù)函數(shù)13.1.3文本特征的提取
特征提取主要是識(shí)別文本中代表其特征的詞項(xiàng)。文本特征分為一般特征和數(shù)字特征,其中一般特征主要包括動(dòng)詞和名詞短語,如人名、組織名等;數(shù)字特征主要包括日期、時(shí)間、貨幣以及單純數(shù)字信息。
特征項(xiàng)抽取的判斷算法(1)該特征項(xiàng)集合包含所有該類中出現(xiàn)的詞。(2)對(duì)于每個(gè)詞,計(jì)算詞Wi和類別Cj的互信息量I(W,C)
(3)對(duì)于該類中所有的詞,依據(jù)上面計(jì)算的互信息量排序。(4)抽取互信息量大的詞作為特征項(xiàng)。(5)根據(jù)抽取的特征項(xiàng)進(jìn)行向量壓縮,精簡向量表示。13.2文本挖掘
13.2.1文本挖掘功能層次
13.2.2關(guān)聯(lián)分析
13.2.3文本聚類
13.2.4文本分類13.2.1文本挖掘功能層次
關(guān)鍵詞相似檢索詞語關(guān)聯(lián)分析自然語言處理文本聚類文本分類文本挖掘功能層次(1)關(guān)鍵詞檢索關(guān)鍵詞建立倒排文件索引,與傳統(tǒng)的信息檢索使用的技術(shù)類似。(2)相似檢索找到相似內(nèi)容的文本。(3)詞語關(guān)聯(lián)分析聚焦在詞語(包括關(guān)鍵詞)之間的關(guān)聯(lián)信息分析上。(4)文本聚類和文本分類實(shí)現(xiàn)文本的聚類和分類。(5)自然語言處理揭示自然語言處理技術(shù)的語義,進(jìn)行文本語義挖掘。13.2.2關(guān)聯(lián)分析
在文本數(shù)據(jù)庫中,每一文本被視為一個(gè)事務(wù),文本中的關(guān)鍵詞組可視為事務(wù)中的一組事務(wù)項(xiàng)。即文本數(shù)據(jù)庫可表示為:{文本編號(hào),關(guān)鍵詞集}
文本數(shù)據(jù)庫中關(guān)鍵詞關(guān)聯(lián)挖掘的問題就變成事務(wù)數(shù)據(jù)庫中事務(wù)項(xiàng)的關(guān)聯(lián)挖掘。
關(guān)聯(lián)分析挖掘可以用于找出詞或關(guān)鍵詞間的關(guān)聯(lián)。
13.2.3文本聚類
層次聚類法對(duì)于給定的文本集合D={d1,…,di,…,dn}:(1)將D中的每個(gè)文本di看作是一個(gè)具有單成員的類ci={di},這些類構(gòu)成了D的一個(gè)聚類:C={c1,…,ci,…,cn};(2)計(jì)算C中每對(duì)類(ci,cj)之間的相似度sim(ci,cj);(3)選取具有最大相似度的類對(duì),并將ci和cj合并為一個(gè)新的類ck=ci∪cj,從而構(gòu)成了D的一個(gè)新的聚類C={c1,…,cn-1};(4)重復(fù)上述步驟,直至C中剩下一個(gè)類為止。該過程構(gòu)造出一棵生成樹,其中包含了類的層次信息,以及所有類內(nèi)和類間的相似度。
13.2.4文本分類
首先,把一組預(yù)先聚類過的文本作為訓(xùn)練集。然后對(duì)訓(xùn)練集進(jìn)行分析以便得出各類的分類模式。對(duì)文本分類的有效方法是基于關(guān)聯(lián)的分類:(1)提出關(guān)鍵詞和詞組。(2)生成關(guān)鍵詞和詞組的概念層次,或類層次結(jié)構(gòu)。(3)詞關(guān)聯(lián)挖掘方法用于發(fā)現(xiàn)關(guān)聯(lián)詞,它可以最大化區(qū)分一類文本與另一類文本。這導(dǎo)致了對(duì)每一類文本,有一組關(guān)聯(lián)規(guī)則。11.3Web挖掘13.3.1Web挖掘概述13.3.2
Web內(nèi)容挖掘13.3.3Web結(jié)構(gòu)挖掘13.3.4Web應(yīng)用挖掘13.3.5Web日志分析與實(shí)例13.3.1Web挖掘概述1.Web信息特點(diǎn)(1)Web信息特別龐大(2)Web信息非常復(fù)雜(3)Web信息是動(dòng)態(tài)的(4)Web信息使用者復(fù)雜(5)Web信息中的“垃圾”非常多2.Web數(shù)據(jù)挖掘的意義Web挖掘的實(shí)質(zhì):從Web頁面及其鏈接和用戶對(duì)頁面的訪問中挖掘出用戶感興趣的知識(shí)。通過Web數(shù)據(jù)挖掘,可以從數(shù)以億計(jì)存儲(chǔ)大量多種多樣信息的Web頁面及其鏈接和用戶對(duì)頁面的訪問中挖掘出需要的有用知識(shí)。Web挖掘的數(shù)據(jù)來源是網(wǎng)站數(shù)據(jù),這些數(shù)據(jù)包括網(wǎng)頁文本信息、網(wǎng)頁鏈接信息、網(wǎng)站的訪問記錄以及其他可收集的信息。例如:Web日志(服務(wù)器日志、錯(cuò)誤日志、Cookie日志等)、在線市場(chǎng)數(shù)據(jù)、Web頁面、Web頁面超鏈接以及包括用戶注冊(cè)信息等數(shù)據(jù)源。3.Web挖掘分類Web挖掘分類(1)Web內(nèi)容挖掘提取文字、圖片或其他組成網(wǎng)頁內(nèi)容成分的信息和知識(shí)。
(2)Web結(jié)構(gòu)挖掘提取網(wǎng)絡(luò)的拓?fù)湫畔?,即網(wǎng)頁之間的鏈接信息。
(3)Web應(yīng)用挖掘提取關(guān)于客戶如何運(yùn)用瀏覽器瀏覽和使用頁面鏈接的信息。(4)區(qū)別與聯(lián)系結(jié)構(gòu)挖掘的表達(dá)方式是鏈接圖,提示了哪些頁面通過當(dāng)前頁可以幾步內(nèi)到達(dá)。內(nèi)容挖掘的表達(dá)方式是一個(gè)網(wǎng)絡(luò)索引,提示了網(wǎng)頁的主題。應(yīng)用挖掘集中于挖掘客戶的行為,特別是隨著時(shí)間的變化。13.3.2Web內(nèi)容挖掘Web內(nèi)容挖掘的基本技術(shù)是文本挖掘。
1.信息檢索信息檢索的目標(biāo)是找到你想要找的,從兩個(gè)方面來判斷該查詢的有效性:“召回(recall)”和“精度(precision)”?!熬取被卮鹆恕霸诜祷氐木W(wǎng)頁中,正確的標(biāo)題的比例是多少”;“召回”回答了“返回了多少正確頁面”。2.從純文本中提取信息
通過將純文本轉(zhuǎn)化為結(jié)構(gòu)化的數(shù)據(jù),他們能夠直接應(yīng)用數(shù)據(jù)挖掘技術(shù)做出預(yù)測(cè)。這種從非結(jié)構(gòu)化數(shù)據(jù)中創(chuàng)建結(jié)構(gòu)化數(shù)據(jù)的過程叫做特征抽取。通過以XML標(biāo)記的形式向網(wǎng)站中添加更結(jié)構(gòu)化的內(nèi)容,比通過提高從非結(jié)構(gòu)化的文本中提取信息的技術(shù)來得更加迅速一些。13.3.3Web結(jié)構(gòu)挖掘結(jié)構(gòu)挖掘可以告訴我們一些站點(diǎn)的受歡迎程度和它同其他站點(diǎn)的距離(通過跳轉(zhuǎn)次數(shù)來判定)。萬維網(wǎng)(www)是一個(gè)有向圖G=(V,E),V是頁面的集合,E是頁面之間的超鏈接集合。頁面抽象為圖中的頂點(diǎn),而頁面之間的超鏈接抽象為圖中的有向邊。頂點(diǎn)v的入邊表示對(duì)v的引用,出邊表示v引用了其它的頁面。Web頁面之間的超鏈接揭示了Web結(jié)構(gòu)。1.網(wǎng)頁的引用一篇文章的有用與否在于這篇文章出現(xiàn)在其他文章的參考書目中的次數(shù)。特別是作者,會(huì)因?yàn)樗淖髌返闹貜?fù)引用而在某個(gè)學(xué)科出名。網(wǎng)頁引用的rank方法:(1)一個(gè)頁面被多次引用,則這個(gè)頁面很可能是重要的;(2)一個(gè)頁面盡管沒有被多次引用,但被一個(gè)重要頁面引用,則這個(gè)頁面很可能是重要的;(3)一個(gè)頁面的重要性被傳遞到它所引用的頁面。2、中樞和權(quán)威Kleinberg提出:一個(gè)鏈接到許多權(quán)威站點(diǎn)的站點(diǎn)叫做中樞(hub);被許多中樞鏈接的站點(diǎn)叫做權(quán)威(authority)。這兩個(gè)概念放在一起可以辨別出權(quán)威和大眾化站點(diǎn)(如Yahoo)之間的區(qū)別。一種尋找權(quán)威的結(jié)構(gòu)化的方法就是:
用其他的站點(diǎn)到該站點(diǎn)的鏈接數(shù)來將它們分級(jí)。要給站點(diǎn)分級(jí),不要用指向它們的鏈接的總數(shù),而是用指向它們的標(biāo)題相關(guān)的中樞的數(shù)量來分級(jí)。3.導(dǎo)航頁
導(dǎo)航頁使他們能夠很容易地找到他們想要找的網(wǎng)頁。
4.目標(biāo)頁目標(biāo)頁給瀏覽者提供所有的內(nèi)容。
13.3.4Web應(yīng)用(訪問信息)挖掘在Web應(yīng)用挖掘中,我們考慮的是對(duì)客戶的理解,這時(shí)客戶應(yīng)用模式就是非常關(guān)鍵的??蛻魬?yīng)用模式可以從多個(gè)層次檢測(cè)和挖掘到,即從單個(gè)客戶在一次對(duì)話中的一系列的單擊到跨越了幾個(gè)月或數(shù)年的客戶群的購買中獲取應(yīng)用模式。1.Web應(yīng)用挖掘的意義
Web應(yīng)用挖掘的意義:(1)改進(jìn)Web站點(diǎn)的效率。
(2)實(shí)現(xiàn)個(gè)性化服務(wù)。(3)商業(yè)知識(shí)的發(fā)現(xiàn)。(4)發(fā)現(xiàn)導(dǎo)航模式。(5)抽取訪問信息特性。2.Web應(yīng)用挖掘中的技術(shù)Web應(yīng)用挖掘中的常用技術(shù): (1)路徑分析。 (2)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)。(3)序列模式發(fā)現(xiàn)。 (4)分類。 (5)聚類。
3.Web訪問日志挖掘(1)對(duì)訪問日志(WebLog)進(jìn)行清洗、過濾和轉(zhuǎn)換,從中抽取感興趣的數(shù)據(jù)。(2)將資源的類型、大小、請(qǐng)求的時(shí)間、停留時(shí)間、請(qǐng)求者的域名、用戶、服務(wù)器狀態(tài)作為數(shù)據(jù)立方體的維變量。將對(duì)頁面和文件請(qǐng)求次數(shù)、來自不同域請(qǐng)求次數(shù)、事件、會(huì)話、錯(cuò)誤次數(shù)分別作為在這些維變量下的度量變量,建立數(shù)據(jù)立方體。通過切塊、切片分析可以回答:哪些成分或特色被經(jīng)?;蚺紶柺褂?,網(wǎng)絡(luò)流量隨時(shí)間的變化規(guī)律。(3)利用數(shù)據(jù)挖掘技術(shù)進(jìn)行Web流量分析、典型的事件序列和用戶行為模式分析。4.應(yīng)用挖掘的作用(1)利用Web應(yīng)用挖掘可以實(shí)現(xiàn)用戶建模; (2)利用Web應(yīng)用挖掘發(fā)現(xiàn)導(dǎo)航模式,從而改進(jìn)Web站點(diǎn)的結(jié)構(gòu)設(shè)計(jì),實(shí)行個(gè)性化推銷;(3)利用Web應(yīng)用挖掘改進(jìn)訪問效率,改進(jìn)服務(wù)器性能; (4)利用Web應(yīng)用挖掘還可以進(jìn)行個(gè)性化服務(wù);(5)利用Web應(yīng)用挖掘進(jìn)行商業(yè)知識(shí)的發(fā)現(xiàn); (6)利用Web應(yīng)用挖掘進(jìn)行用戶移動(dòng)模式的發(fā)現(xiàn)。13.3.5Web日志分析與實(shí)例1.Web日志數(shù)據(jù)概述 Web訪問日志數(shù)據(jù)具有如下基本特征: ⑴動(dòng)態(tài)變化性⑵數(shù)據(jù)量大⑶多維性⑷結(jié)構(gòu)化程度較高⑸包含大量瑣碎數(shù)據(jù)Web日志的記錄格式包括如下常用字段: ①每次訪問者的客戶端機(jī)器IP地址。 ②用戶訪問日期和時(shí)間,精確到秒。 ③用戶訪問的網(wǎng)頁名稱。 ④用戶的本次訪問請(qǐng)求是否成功的狀態(tài)。 ⑤傳輸文件的字節(jié)大小。 ⑥引導(dǎo)用戶訪問到本站點(diǎn)的前驅(qū)URL。 ⑦訪問者使用的瀏覽器版本和操作系統(tǒng)版本 在Web日志分析中,把握動(dòng)態(tài)變化趨勢(shì)很重要,其內(nèi)在規(guī)律、有用知識(shí)可能是稍縱即逝的,如用戶訪問趨勢(shì)、訪問熱點(diǎn)變化、異常訪問模式等。流式數(shù)據(jù)多維查詢與挖掘則是實(shí)現(xiàn)Web日志分析的有效工具。2.面向Web日志分析的流式數(shù)據(jù)多維模型(1)時(shí)間維度,是流式數(shù)據(jù)多維模型的基礎(chǔ),其中包含年、月、日、時(shí)、分、秒等多個(gè)時(shí)間粒度層次信息。(2)主題維度,綜合網(wǎng)站可劃分為滾動(dòng)新聞、明星新聞、影視新聞等多個(gè)子版塊,每個(gè)子版塊關(guān)注不同的新聞內(nèi)容,即不同主題。(3)用戶維度,屬性取值代表不同地區(qū)的訪問者,其中的維成員對(duì)應(yīng)于Web訪問日志中的訪問主機(jī),即訪問客戶端的IP地址。
(4)度量屬性
①請(qǐng)求數(shù):Web訪問日志的每一條記錄對(duì)應(yīng)一次請(qǐng)求,②頁面瀏覽數(shù):即頁面被打開(請(qǐng)求)的次數(shù),是網(wǎng)站分析中最常見的度量。 ③傳輸數(shù)據(jù)量:傳輸數(shù)據(jù)量可用于統(tǒng)計(jì)網(wǎng)站的流量,以及衡量不同用戶以及不同周期內(nèi)的訪問情況,需要將所有請(qǐng)求的傳輸字節(jié)數(shù)相加得到結(jié)果。3.Web日志數(shù)據(jù)的多維查詢
在Web日志分析中,經(jīng)常需獲取某一特定維度視角或數(shù)據(jù)粒度層次上的聚集信息。下面以流式數(shù)據(jù)三維視圖(小時(shí),城市,視頻版塊)為例,進(jìn)行Web日志多維查詢。對(duì)Web日志查詢舉例: (1)Q1:對(duì)上午6時(shí)至12時(shí),查詢每個(gè)小時(shí)的頁面瀏覽數(shù),查詢視圖為:
(小時(shí),*,*)切塊查詢條件定義在時(shí)間維度上。
Q1查詢結(jié)果如表13.2所示,結(jié)果表明,網(wǎng)站的高峰訪問時(shí)間段為上午“9-10時(shí)”,而其他時(shí)段則相對(duì)較少。
表13.2Q1查詢結(jié)果
時(shí)間
頁面瀏覽數(shù) 5-7時(shí) 953 7-8時(shí) 1080 8-9時(shí) 3295 9-10時(shí)5122 10-11時(shí) 4270 11-12時(shí) 1945 (2)Q2:對(duì)工作時(shí)間7時(shí)至12時(shí)之間,查詢主要的子版塊的頁面瀏覽數(shù),即在上面查詢的基礎(chǔ)上,下鉆到子版塊的查詢。查詢視圖為:
(小時(shí),*,子版塊)在時(shí)間維度和主題維度上定義切塊查詢。
Q2查詢結(jié)果如表13.3所示,表明上午工作時(shí)間的訪問多集中在“滾動(dòng)新聞”,而其他版塊相對(duì)較少。表13.3Q2查詢結(jié)果
時(shí)間 子版塊 頁面瀏覽數(shù) 7-12時(shí) 滾動(dòng)新聞 1945 7-12時(shí)圖片新聞 5377-12時(shí)綜藝新聞 8997-12時(shí)明星新聞 3747-12時(shí)音樂新聞 3427-12時(shí)人物訪談 308(3)Q3:對(duì)晚間18時(shí)至22時(shí)之間,查詢主要省份的頁面瀏覽數(shù),如北京,上海,廣東,湖南,江蘇,浙江,遼寧,重慶。查詢視圖為:
(小時(shí),省,*)在時(shí)間維度和用戶維度上定義切塊查詢。
Q3查詢目的在于發(fā)現(xiàn)訪問者的區(qū)域分布情況,查詢結(jié)果如表13.4所示,表明熱點(diǎn)訪問省級(jí)區(qū)域?yàn)椤罢憬焙汀氨本薄?表13.4Q3查詢結(jié)果
時(shí)間 省份 頁面瀏覽數(shù) 8-22時(shí) 北京 54548-22時(shí)上海 5188-22時(shí)廣東 14158-22時(shí)湖南 3348-22時(shí)江蘇 7058-22時(shí)浙江 101018-22時(shí)遼寧 2618-22時(shí)重慶 165(4)Q4:對(duì)浙江省主要城市,查詢18點(diǎn)至22點(diǎn)之間的頁面瀏覽數(shù),如杭州市,寧波市,溫州市,紹興市,嘉興市,金華市。查詢視圖為:
(小時(shí),城市,*)在時(shí)間維度和用戶維度上定義切塊查詢。查詢結(jié)果如表13.5所示,結(jié)果表明網(wǎng)站的訪問者大部分來自于杭州市和嘉興市,而其他城市較少。 表13.5Q4查詢結(jié)果
時(shí)間 省份 城市 頁面瀏覽數(shù) 18-22時(shí) 浙江 杭州市 338118-22時(shí)浙江寧波市 15918-22時(shí)浙江溫州市 12018-22時(shí)浙江紹興市 8718-22時(shí)浙江嘉興市 113418-22時(shí)浙江金華市 33從以上的Web日志數(shù)據(jù)的多維查詢分析,可以得出的結(jié)論是:(1)網(wǎng)站上的頁面瀏覽的高峰訪問時(shí)段是上午9-10時(shí)。(2)工作時(shí)間訪問最多的是滾動(dòng)新聞(3)晚間訪問網(wǎng)站最多的省份是浙江和北京,其中浙江省內(nèi)訪問最多的的用戶主要是杭州市和嘉興市。4.連續(xù)查詢熱點(diǎn)訪問信息或異?,F(xiàn)象(5)Q5:連續(xù)跟蹤最近1小時(shí)內(nèi)的每個(gè)版塊的頁面瀏覽總數(shù)變化趨勢(shì)。查詢視圖為:
(分鐘,*,子版塊)時(shí)間窗口為60分鐘,查詢條件分別對(duì)應(yīng)不同版塊,包括明星新聞、滾動(dòng)新聞、圖片新聞、影視新聞。
Q5連續(xù)的查詢結(jié)果表明,“滾動(dòng)新聞”版塊的訪問量較高,在10-24時(shí)間段,訪問量相對(duì)穩(wěn)定在900次左右。比其它子版塊要高出400-600次,并且在上午9時(shí)監(jiān)測(cè)到一個(gè)高峰訪問周期,迏到1600次,比平均值高出近一倍,這是一個(gè)異常情況。(6)Q6:連續(xù)跟蹤最近1小對(duì)內(nèi)不同城市的訪問量變化情況,包括浙江省的杭州市,嘉興市,麗水市。查詢視圖為:
(分鐘,城市,*)
時(shí)間窗口為60分鐘,查詢條件定義在用戶維度上。三城市不同時(shí)間訪問頁面次數(shù)對(duì)比表見表13.6。浙江省三城市
不同時(shí)間訪問頁面次數(shù)對(duì)比表時(shí)間杭州市嘉興市麗水市02時(shí)50150004時(shí)3050006時(shí)8050008時(shí)100180010時(shí)210220110012時(shí)10019070014時(shí)1505080016時(shí)6508070018時(shí)100150850202303060024時(shí)100500800Q6連續(xù)的查詢是針對(duì)杭州市、嘉興市和麗水市,進(jìn)行對(duì)比分析結(jié)果表明:麗水市在8-24時(shí),平均訪問量有800次,大大高于其它兩個(gè)城市(相當(dāng)于4-6倍)。杭州市平均訪問量200次,嘉興市平均訪問量120次。麗水市在上午10時(shí),頁面瀏覽數(shù)的訪問量達(dá)到最高峰1100次。杭州市在下午16時(shí)達(dá)到最高峰,訪問量是700次。嘉興市在上午9時(shí)達(dá)到最高峰,訪問量是400次。但麗水市清晨時(shí)的訪問量是0??梢婝愃性谡憬∈且粋€(gè)特例。(7)Q7:連續(xù)跟蹤主要省份對(duì)特定版塊的訪問量變化情況,查詢視圖為:(分鐘, 省,滾動(dòng)新聞),時(shí)間窗口為60分鐘,查詢條件定義在用戶維度上,用戶分別對(duì)應(yīng)浙江省、江蘇省和上海市,主題維度的子版塊定為“滾動(dòng)新聞”。Q7連續(xù)的查詢結(jié)果,表明浙江省對(duì)“滾動(dòng)新聞”版塊關(guān)注較多,在0-7小時(shí)內(nèi),平均訪問量有30次左右;在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度漫畫改編動(dòng)畫合作開發(fā)合同協(xié)議文檔4篇
- 二零二五版生態(tài)停車場(chǎng)雨棚建設(shè)與綠化合同3篇
- 2025年校園樂器更新?lián)Q代采購與安裝合同3篇
- 2025年度高科技行業(yè)保密協(xié)議參考模板2篇
- 二零二四年二手挖掘機(jī)交易合同與維修配件供應(yīng)協(xié)議3篇
- 第一人民醫(yī)院二零二五年度進(jìn)修人員醫(yī)療技能培訓(xùn)與考核協(xié)議3篇
- 2025年新能源車輛信托借款合同173篇
- 二零二五年度知識(shí)產(chǎn)權(quán)授權(quán)使用合同樣本6篇
- 二零二五版水利工程招投標(biāo)合同范本及管理要求6篇
- 2025年度高效溫室大棚租賃與農(nóng)業(yè)科技成果轉(zhuǎn)化與應(yīng)用合同3篇
- 社會(huì)學(xué)概論課件
- 華為經(jīng)營管理-華為的研發(fā)管理(6版)
- C及C++程序設(shè)計(jì)課件
- 帶狀皰疹護(hù)理查房
- 公路路基路面現(xiàn)場(chǎng)測(cè)試隨機(jī)選點(diǎn)記錄
- 平衡計(jì)分卡-化戰(zhàn)略為行動(dòng)
- 國家自然科學(xué)基金(NSFC)申請(qǐng)書樣本
- 湖南省省級(jí)溫室氣體排放清單土地利用變化和林業(yè)部分
- 材料設(shè)備驗(yàn)收管理流程圖
- 培訓(xùn)機(jī)構(gòu)消防安全承諾書范文(通用5篇)
- (完整版)建筑業(yè)10項(xiàng)新技術(shù)(2017年最新版)
評(píng)論
0/150
提交評(píng)論