版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)生產(chǎn)實(shí)習(xí)報(bào)告.完整項(xiàng)目理論學(xué)習(xí)設(shè)計(jì)UI基礎(chǔ)概念及UI的發(fā)展前景網(wǎng)站設(shè)計(jì)規(guī)范及流程Photoshop軟件的基本認(rèn)識(shí)和使用2、前端1)Html5+CSS3技術(shù)HTML5相關(guān)基礎(chǔ)知識(shí),包括HTML5概述、Web開發(fā)歷史、HTML標(biāo)簽、HTML5文檔結(jié)構(gòu)與創(chuàng)建HTML5文檔;CSS3概述,CSS選擇器,頁(yè)面元素布局方式(浮動(dòng)、定位),定義文本、字體與顏色,設(shè)計(jì)背景、陰影和邊框,使用2D、3D變換,設(shè)計(jì)動(dòng)畫以及CSS3的其他新特性。2)JavaScript語(yǔ)言JavaScript發(fā)展、概述,js變量、流程控制、循環(huán)、函數(shù)、對(duì)象等基礎(chǔ)語(yǔ)法;利用JavaScript操作瀏覽器、文檔模型,頁(yè)面動(dòng)效制作;使用Ajax技術(shù)與后臺(tái)進(jìn)行異步數(shù)據(jù)交互;分析和處理數(shù)據(jù)并進(jìn)行前臺(tái)可視化展示3)Nodejs框架Nodejs的發(fā)展、概述,使用Nodejs制作簡(jiǎn)2.2JavaScript進(jìn)行數(shù)據(jù)請(qǐng)求及分析處理 JavaScript是一個(gè)瀏覽器腳本語(yǔ)言,用它可以操作頁(yè)面元素,從而實(shí)現(xiàn)頁(yè)面數(shù)據(jù)的渲染及更新。使用JavaScript中的Ajax技術(shù)可以發(fā)送異步數(shù)據(jù)請(qǐng)求2.3Nodejs進(jìn)行服務(wù)器環(huán)境搭建 Nodejs是JavaScript的運(yùn)行環(huán)境,可以使JavaScript語(yǔ)言在服務(wù)器端運(yùn)行,由于Ajax必須在服務(wù)器環(huán)境下運(yùn)行,所以使用Nodejs搭建web服務(wù)器,從而支持ajax技術(shù),以及使用Nodejs中的“文件模塊”讀取本地文件的內(nèi)容并將讀取到數(shù)據(jù)返回前臺(tái)。2.4Echarts插件進(jìn)行數(shù)據(jù)可視化展示在網(wǎng)站KPI分析中,有很多數(shù)據(jù)是需要使用圖標(biāo)進(jìn)行展示的,如用戶每小時(shí)PV統(tǒng)計(jì)、頁(yè)面獨(dú)立IP的訪問(wèn)量統(tǒng)計(jì)、用戶的訪問(wèn)設(shè)備統(tǒng)計(jì)等,復(fù)雜的圖標(biāo)使用CSS或Photoshop制作時(shí)會(huì)非常復(fù)雜。Echarts是百度一款可視化插件,可以使用代碼將數(shù)據(jù)方便快捷的轉(zhuǎn)化為各類圖表。3、后臺(tái)搭建及設(shè)計(jì)部分3.1Nginx日志分析一個(gè)網(wǎng)站服務(wù)器日志中,每條日志都代表著用戶的一次訪問(wèn),下面就是一條Nginx服務(wù)器日志:18--[18/Sep/2017:06:51:36+0000]"GET/wp-includes/js/comment-reply.min.js?ver=3.6HTTP/1.1"3040"http://blog.fens.me/nodejs-socketio-chat/""Mozilla/5.0(WindowsNT5.1;rv:23.0)Gecko/20100101Firefox/23.0"其中包含了多種信息,包含訪問(wèn)者IP、訪問(wèn)用戶名稱、訪問(wèn)時(shí)間、狀態(tài)碼、訪問(wèn)設(shè)備等等,從一個(gè)網(wǎng)站的日志可以分析出運(yùn)行情況等。3.2網(wǎng)站KPI指標(biāo)網(wǎng)站KPI指標(biāo)可以看出一個(gè)網(wǎng)站的運(yùn)行情況,并且通過(guò)大數(shù)據(jù)分析可以得到用戶的習(xí)慣,為網(wǎng)站的發(fā)展運(yùn)營(yíng)做出戰(zhàn)略性判斷PV(pageview)即頁(yè)面瀏覽量,通常是衡量一個(gè)網(wǎng)絡(luò)新聞?lì)l道或網(wǎng)站甚至一條網(wǎng)絡(luò)新聞的主要指標(biāo)。網(wǎng)頁(yè)瀏覽數(shù)是評(píng)價(jià)網(wǎng)站流量最常用的指標(biāo)之一,簡(jiǎn)稱為PV。監(jiān)測(cè)網(wǎng)站PV的變化趨勢(shì)和分析其變化原因是很多站長(zhǎng)定期要做的工作。PageViews中的Page一般是指普通的html網(wǎng)頁(yè),也包含php、jsp等動(dòng)態(tài)產(chǎn)生的html內(nèi)容。來(lái)自瀏覽器的一次html內(nèi)容請(qǐng)求會(huì)被看作一個(gè)PV,逐漸累計(jì)成為PV總數(shù)。UV(uniquevisitor),指訪問(wèn)某個(gè)站點(diǎn)或點(diǎn)擊某條新聞的不同IP地址的人數(shù)。在同一天內(nèi),uv只記錄第一次進(jìn)入網(wǎng)站的具有獨(dú)立IP的訪問(wèn)者,在同一天內(nèi)再次訪問(wèn)該網(wǎng)站則不計(jì)數(shù)。獨(dú)立IP訪問(wèn)者提供了一定時(shí)間內(nèi)不同觀眾數(shù)量的統(tǒng)計(jì)指標(biāo),而沒(méi)有反應(yīng)出網(wǎng)站的全面活動(dòng)。IP,網(wǎng)站每天的訪問(wèn)IP數(shù)Browser(訪問(wèn)設(shè)備),可以看到用戶平常喜歡用PC還是移動(dòng)端等訪問(wèn)設(shè)備訪問(wèn)3.3項(xiàng)目背景-架構(gòu)分析1、在少量數(shù)據(jù)的情況下1).少量數(shù)據(jù)的情況(10Mb,100Mb,10G),在單機(jī)處理尚能忍受的時(shí)候,我們可以直接利用各種工具,awk、grep、sort、join等都是日志分析的利器,再配合perl,python,正則表達(dá)式,基本就可以解決問(wèn)題2).例如,從Nginx日志中得到訪問(wèn)量最高的5分IP,實(shí)現(xiàn)很簡(jiǎn)單:cataccess.log.10|awk'{a[$1]++}END{for(bina)printb”\t”a[b]}'|sort-k2-r|head-n102、在海量數(shù)據(jù)的情況下1).當(dāng)數(shù)據(jù)量每天以10G,100G增長(zhǎng)的時(shí)候,單機(jī)處理能力已經(jīng)不能滿足需求。我們就需要增加系統(tǒng)的復(fù)雜性,用計(jì)算機(jī)集群,存儲(chǔ)陣列來(lái)解決。在Hadoop出現(xiàn)之前,海量數(shù)據(jù)存儲(chǔ),和海量日志分析都是非常困難的。只有少數(shù)一些公司,掌握著高效的并行計(jì)算,分布式計(jì)算,分布式存儲(chǔ)的核心技術(shù)2)Hadoop的出現(xiàn),大幅度的降低了海量數(shù)據(jù)處理的門檻,讓小公司甚至是個(gè)人都有能力,搞定海量數(shù)據(jù)。并且,Hadoop也非常適合日志分析系統(tǒng)3.4日志的手機(jī)方式1、腳本收集架構(gòu)設(shè)計(jì):應(yīng)用系統(tǒng)及日志系統(tǒng)架構(gòu)架構(gòu)設(shè)計(jì):數(shù)據(jù)流1).日志是有業(yè)務(wù)系統(tǒng)產(chǎn)生的,我們可以設(shè)置web服務(wù)器每天產(chǎn)生一個(gè)新的目錄,目錄下面會(huì)產(chǎn)生多個(gè)日志文件,每個(gè)日志文件64M。 2).設(shè)置系統(tǒng)定時(shí)器CRON,夜間在0點(diǎn)后,向HDFS導(dǎo)入昨天的日志文件。3).完成導(dǎo)入后,設(shè)置系統(tǒng)定時(shí)器,啟動(dòng)MapReduce程序,提取并計(jì)算統(tǒng)計(jì)指標(biāo)4).完成計(jì)算后,設(shè)置系統(tǒng)定時(shí)器,從HDFS導(dǎo)出統(tǒng)計(jì)指標(biāo)數(shù)據(jù)到數(shù)據(jù)庫(kù),方便以后的即時(shí)查詢2、FlumeFlume體系架構(gòu)1).dataflow描述了數(shù)據(jù)從產(chǎn)生,傳輸、處理并最終寫入目標(biāo)的一條路徑(圖中的實(shí)線)2).Agent用于采集數(shù)據(jù),是Flume中產(chǎn)生數(shù)據(jù)流的地方,將產(chǎn)生的數(shù)據(jù)流傳輸?shù)絚ollector3).collector用于對(duì)數(shù)據(jù)進(jìn)行聚合,往往會(huì)產(chǎn)生一個(gè)更大的流4).收集數(shù)據(jù)有2種主要工作模式,如下:PushSources:外部系統(tǒng)會(huì)主動(dòng)地將數(shù)據(jù)推送到FlumePollingSources:Flume到外部系統(tǒng)中獲取數(shù)據(jù)3.5需求分析此次項(xiàng)目要統(tǒng)計(jì)出來(lái)的KPI指標(biāo)1).PV(PageView):頁(yè)面訪問(wèn)量統(tǒng)計(jì)2).IP:頁(yè)面獨(dú)立IP的訪問(wèn)量統(tǒng)計(jì)3).Time:用戶每小時(shí)PV的統(tǒng)計(jì)4).Browser:用戶的訪問(wèn)設(shè)備的統(tǒng)計(jì)3.6算法模型1、變量分析1、remote_addr:記錄客戶端的IP地址,2、remote_user:記錄客戶端用戶名稱,3、time_local:記錄時(shí)間與時(shí)區(qū),4、request:記錄請(qǐng)求的url與http協(xié)議,5、status:記錄請(qǐng)求狀態(tài),6、body_bytes_sent:記錄發(fā)送內(nèi)容大小7、http_referer:用來(lái)記錄從哪個(gè)頁(yè)面鏈接訪問(wèn)過(guò)來(lái)的8、http_user_agent:記錄客戶瀏覽器的相關(guān)信息,2、變量解析1、remote_addr2、remote_user3、time_local4、request5、status6、body_bytes_sent7、http_referer8、http_user_agent要想獲得上述變量,需要對(duì)Nginx日志進(jìn)行分片處理3、并行算法本次采用MapReduce并行算法框架各個(gè)模塊算法解析如下1、PV(PageView):頁(yè)面訪問(wèn)量統(tǒng)計(jì) -Map:{key:$request,value:1} -Reduce:{key:$request,value:求和(sum)}2、IP:頁(yè)面獨(dú)立IP統(tǒng)計(jì) -Map:{key:$request,value:remote_addr} -Reduce:{key:$request,value:去重再求和(sum(unique))}3、Time:用戶每小時(shí)PV的統(tǒng)計(jì) -Map:{key:$time_local,value:1} -Reduce:{key:$time_local,value:求和(sum)}4、Browser:用戶的訪問(wèn)設(shè)備統(tǒng)計(jì) -Map:{key:$http_user-agent,value:1} -Reduce:{key:$http_user_agent,value:求和(sum)}四、項(xiàng)目實(shí)現(xiàn)1設(shè)計(jì)部分 使用Photoshop矢量工具、文字工具等進(jìn)行網(wǎng)頁(yè)設(shè)計(jì)2前端部分2.1Ajax其核心有JavaScript、XMLHTTPRequest、DOM對(duì)象組成,通過(guò)XmlHttpRequest對(duì)象來(lái)向服務(wù)器發(fā)異步請(qǐng)求,從服務(wù)器獲得數(shù)據(jù),然后用JavaScript來(lái)操作DOM而更新頁(yè)面。2.2傳統(tǒng)的HTPP服務(wù)器會(huì)由Aphche、Nginx、IIS之類的軟件來(lái)?yè)?dān)任,但是nodejs并不需要,nodejs提供了http模塊,自身就可以用來(lái)構(gòu)建服務(wù)器,而且http模塊是由C++實(shí)現(xiàn)的,性能可靠。打開瀏覽器,輸入localhost:88888我們就可以看到屏幕上的提示,這表明這個(gè)最簡(jiǎn)單的nodejs服務(wù)器已經(jīng)搭建成功了。2.3Excel和Mac的Numbers里面所帶有的圖表功能,有一些基本的圖表類型,如柱形圖、折線圖、餅圖、條形圖、面積圖、散點(diǎn)圖等等這些基本的圖表類型,用Echarts都可以實(shí)現(xiàn),并且Echarts通過(guò)程序來(lái)控制數(shù)據(jù),因此能夠做到及時(shí)拓展數(shù)據(jù)使用Echarts繪制圖標(biāo)需要初始化Echarts實(shí)例、配置圖標(biāo)數(shù)據(jù)、創(chuàng)建圖表三個(gè)步驟:3后端部分3.1 Hadoop集群搭建Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡(jiǎn)稱HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來(lái)部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput)來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(wèn)(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。Hadoop的框架最核心的設(shè)計(jì)就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),則MapReduce為海量的數(shù)據(jù)提供了計(jì)算。Hadoop集群有三種配置模式獨(dú)立模式所有的程序運(yùn)行在一個(gè)JVM中,不需要啟動(dòng)hadoop的進(jìn)程,應(yīng)用的是本地文件系統(tǒng)偽分布式 完全類似于完全分布式,但是只有一個(gè)節(jié)點(diǎn)完全分布式 可以真正體現(xiàn)出分布式存儲(chǔ)及分布式處理思想我們?cè)谶@里搭建一個(gè)三臺(tái)Centos主機(jī)的完全分布式集
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 公共安全領(lǐng)域視頻監(jiān)控系統(tǒng)研發(fā)合作協(xié)議
- 娛樂(lè)業(yè)演藝活動(dòng)條款與責(zé)任明確協(xié)議
- 維修協(xié)議合同
- 體育產(chǎn)業(yè)智能化發(fā)展合同
- 農(nóng)業(yè)種植技術(shù)指導(dǎo)及風(fēng)險(xiǎn)免責(zé)協(xié)議
- 軟件銷售及服務(wù)合同與軟件銷售合同
- 2025年事故車買賣的協(xié)議書
- 2025年度水塘承包租賃合作協(xié)議3篇
- 2025年度智慧城市弱電網(wǎng)絡(luò)設(shè)施維保合同范本3篇
- 2025年度技術(shù)咨詢合同標(biāo)的及服務(wù)內(nèi)容2篇
- 小學(xué)科學(xué)青島版(六三制)六年級(jí)上冊(cè)全冊(cè)教案(共25課)(2022秋)
- 2024焊接工藝規(guī)程
- 外研版(2024新版)七年級(jí)上冊(cè)英語(yǔ)期末復(fù)習(xí)Unit1~6共6套學(xué)業(yè)質(zhì)量檢測(cè)試卷匯編(含答案)
- 藥理學(xué)期末試卷
- 小學(xué)高年級(jí)課后服務(wù) scratch3.0編程教學(xué)設(shè)計(jì) 一階第27課 植物大戰(zhàn)僵尸-僵尸來(lái)襲教學(xué)設(shè)計(jì)
- 2024年人民日?qǐng)?bào)社招聘應(yīng)屆高校畢業(yè)生85人筆試高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 中西醫(yī)結(jié)合科工作制度
- 沈鼓集團(tuán)招聘筆試題庫(kù)2024
- 南平武夷高新技術(shù)產(chǎn)業(yè)控股集團(tuán)有限公司招聘筆試題庫(kù)2024
- 施工現(xiàn)場(chǎng)臨時(shí)用電安全監(jiān)理檢查表
- 2024小英新人教版PEP三年級(jí)上冊(cè)全冊(cè)單元測(cè)試測(cè)評(píng)卷
評(píng)論
0/150
提交評(píng)論