食品藥品監(jiān)管平臺投資信息化項目建議書_第1頁
食品藥品監(jiān)管平臺投資信息化項目建議書_第2頁
食品藥品監(jiān)管平臺投資信息化項目建議書_第3頁
食品藥品監(jiān)管平臺投資信息化項目建議書_第4頁
食品藥品監(jiān)管平臺投資信息化項目建議書_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

目錄TOC\o"3-3"\h\z\u\t"標(biāo)題1,1,標(biāo)題2,2"一、項目的背景和必要性 21.1. 項目建設(shè)背景 21.2. 食品藥品監(jiān)管服務(wù)工作存在的問題和差距 21.3. 項目建設(shè)的必要性 31.4. 項目建設(shè)的可行性 31.5. 項目建設(shè)依據(jù) 3二、項目建設(shè)的目標(biāo) 4三、項目的主要內(nèi)容 43.1食品藥品監(jiān)管系統(tǒng)硬件采購 43.2應(yīng)用軟件的開發(fā)和使用 53.3系統(tǒng)功能介紹 73.3.1企業(yè)主體庫 73.3.2食藥許可信息管理 73.3.3網(wǎng)絡(luò)主體庫 83.3.4網(wǎng)絡(luò)商品庫 83.3.5投訴監(jiān)管 103.3.6網(wǎng)絡(luò)抽檢 103.3.7網(wǎng)絡(luò)監(jiān)測 123.3.8案源管理 123.3.9任務(wù)管理 123.3.10系統(tǒng)公告 133.3.11風(fēng)險分析 133.3.12監(jiān)管APP 163.3.13標(biāo)簽管理 173.3.14統(tǒng)計分析 183.3.15系統(tǒng)設(shè)置 193.3.16監(jiān)管數(shù)據(jù)抓取 213.3.17數(shù)據(jù)對接 22四、項目的技術(shù)基礎(chǔ)、特點及實施的條件 224.1項目技術(shù)特點 224.1.1食品藥品監(jiān)管系統(tǒng) 234.2項目實施條件 334.2.1網(wǎng)絡(luò)需求 33五、效益分析 33項目的背景和必要性項目建設(shè)背景當(dāng)前我國食品藥品安全問題層出不窮,僅以今年315為例,圍繞互聯(lián)網(wǎng)外賣平臺的種種黑幕屢屢被媒體曝光,比如銷售過期食品、假冒偽劣藥品、商家營業(yè)證件不全等等,引起了強(qiáng)烈的社會反響,相關(guān)部門也展開了一系列整治行動。食品藥品網(wǎng)絡(luò)交易是運(yùn)用互聯(lián)網(wǎng)信息技術(shù)產(chǎn)生的新型交易活動和方式,互聯(lián)網(wǎng)的虛擬性特點,給食品藥品稽查管理部門的監(jiān)管工作增加了難度,因此,要監(jiān)管食品藥品這一新領(lǐng)域必須抓住互聯(lián)網(wǎng)信息技術(shù)這個環(huán)節(jié),以互聯(lián)網(wǎng)信息技術(shù)為依托和手段,建立技術(shù)功能相對齊全,上下互通,部門互聯(lián)、資源共享的網(wǎng)絡(luò)監(jiān)管信息系統(tǒng)和平臺,實現(xiàn)“以網(wǎng)管網(wǎng)”的互聯(lián)網(wǎng)信息化監(jiān)管,為促進(jìn)服務(wù)網(wǎng)絡(luò)經(jīng)濟(jì)發(fā)展,維護(hù)經(jīng)營者和消費(fèi)者的合法權(quán)益,規(guī)范網(wǎng)絡(luò)市場秩序的打下牢固堅實的基礎(chǔ)。食品藥品監(jiān)管服務(wù)工作存在的問題和差距近年來,食品藥品稽查大隊雖然加大政務(wù)管理信息的信息化建設(shè)。但在食品藥品網(wǎng)絡(luò)交易監(jiān)管信息化建設(shè)上,始終是空白,造成對食品藥品網(wǎng)絡(luò)交易各大平臺內(nèi)商家的監(jiān)管無法實現(xiàn),隨之而來的商家投訴、網(wǎng)購消費(fèi)糾紛解決以及網(wǎng)購產(chǎn)業(yè)發(fā)展均無從談起。可監(jiān)管工作現(xiàn)狀又倒逼我們必須開展上述工作,來解決食品藥品網(wǎng)絡(luò)交易中存在的問題。經(jīng)過前期的調(diào)研、論證,食品藥品網(wǎng)絡(luò)交易監(jiān)管工作主要在以下方面存在問題和差距:未建立全市統(tǒng)一的食品藥品監(jiān)管系統(tǒng),缺乏“以網(wǎng)管網(wǎng)”的必要手段,造成監(jiān)管對象家底數(shù)不清。目前,沒有一家經(jīng)濟(jì)管理部門能夠準(zhǔn)確統(tǒng)計出食品藥品網(wǎng)絡(luò)交易經(jīng)營戶數(shù)、經(jīng)濟(jì)規(guī)模及稅收等情況,尤其是在全國各大第三方交易平臺采取嚴(yán)格保密措施保護(hù)平臺商鋪信息的情況下,難以獲取這些交易平臺上商家的信息,給監(jiān)管工作帶來了極大的難度,致使成千上萬的有問題的商家游離在有效監(jiān)管之外,造成違法行為較多,同時也無法了解和統(tǒng)計出他們的經(jīng)濟(jì)情況,更無法為食品藥品監(jiān)管發(fā)展規(guī)劃和政策的出臺提供權(quán)威科學(xué)的數(shù)據(jù)依據(jù)。項目建設(shè)的必要性食品藥品監(jiān)管系統(tǒng)的建設(shè),將有利于加快推進(jìn)網(wǎng)絡(luò)監(jiān)管工作的步伐,實現(xiàn)“以網(wǎng)絡(luò)信息技術(shù)為依托和手段,以網(wǎng)管網(wǎng),努力實現(xiàn)網(wǎng)絡(luò)信息化監(jiān)管”的工作目標(biāo),更好地促進(jìn)網(wǎng)絡(luò)市場健康發(fā)展。項目建設(shè)的可行性我局在食品藥品監(jiān)管的建設(shè)處于空白狀態(tài),通過本項目建設(shè),建立起能滿足監(jiān)管服務(wù)工作需求的食品藥品監(jiān)管平臺,提升食品藥品網(wǎng)絡(luò)交易的監(jiān)管和服務(wù)能力,遏制食品藥品交易的違法行為,營造公平競爭的網(wǎng)絡(luò)市場環(huán)境,維護(hù)網(wǎng)絡(luò)經(jīng)營者和消費(fèi)者合法權(quán)益,促進(jìn)本地區(qū)網(wǎng)絡(luò)交易的健康、快速、有序發(fā)展。為此,我局在借鑒國內(nèi)其他類似地區(qū)監(jiān)管系統(tǒng)信息化建設(shè)成功經(jīng)驗的基礎(chǔ)上,結(jié)合本地區(qū)食品藥品交易監(jiān)管的實際,按照擬建項目編制、審查的法定程序和要求,經(jīng)過長時間的調(diào)研、論證,認(rèn)為擬建項目可行。項目建設(shè)依據(jù)食藥總局《網(wǎng)絡(luò)食品安全違法行為查出辦法》(2016年第27號令)國家總局《關(guān)于整治藥品流通領(lǐng)域違法經(jīng)營行為的公告》(2016年第94號令)《食品藥品稽查執(zhí)法工作規(guī)則》的通知項目建設(shè)的目標(biāo)本項目旨在開發(fā)一套食品藥品監(jiān)管服務(wù)系統(tǒng),食品藥品稽查部門對食品藥品監(jiān)管各項工作進(jìn)行統(tǒng)一管理,建立食品藥品監(jiān)管信息數(shù)據(jù)庫,實現(xiàn)對網(wǎng)絡(luò)經(jīng)營主體、客體的搜索、維護(hù)、統(tǒng)計、監(jiān)管等一系列工作,建立有效機(jī)制實現(xiàn)協(xié)同工作,提高食品藥品稽查部門食品藥品監(jiān)管效率。項目的主要內(nèi)容3.1食品藥品監(jiān)管系統(tǒng)硬件采購食品藥品監(jiān)管系統(tǒng)同時具有對內(nèi)(政務(wù)網(wǎng))提供稽查管理業(yè)務(wù),對外(互聯(lián)網(wǎng))抓取目標(biāo)平臺數(shù)據(jù)兩方面的職能。為保證內(nèi)外網(wǎng)安全通信,采取了一些硬件防護(hù)手段進(jìn)行安全防護(hù),保證系統(tǒng)的整體安全性。由于本食品藥品監(jiān)管平臺,所有需要監(jiān)測的網(wǎng)絡(luò)交易信息數(shù)據(jù)量,將在千萬級的。為了應(yīng)對如此多的數(shù)據(jù)量,達(dá)到必要的監(jiān)管力度,就需要使用與該大數(shù)據(jù)量相匹配的硬件設(shè)備。系統(tǒng)將采用7臺服務(wù)器作為數(shù)據(jù)存儲、分析服務(wù)器及WEB服務(wù)器。3.2應(yīng)用軟件的開發(fā)和使用食品藥品監(jiān)管系統(tǒng)架構(gòu)食品藥品監(jiān)管系統(tǒng),需要包含數(shù)據(jù)抓取、數(shù)據(jù)分析、數(shù)據(jù)存儲和數(shù)據(jù)展示這四大功能。下面將按照這幾大功能,分別進(jìn)行闡述。分布式數(shù)據(jù)抓取系統(tǒng)系統(tǒng)采用分布式數(shù)據(jù)抓取技術(shù),可以對淘寶、京東、百度外賣、餓了么、美團(tuán)、百度糯米平臺的數(shù)據(jù)進(jìn)行動態(tài)抓取。針對各網(wǎng)絡(luò)交易平臺的保護(hù)特性,進(jìn)行真實擬人化的數(shù)據(jù)抓取。能夠完成大量復(fù)雜數(shù)據(jù)的抓取工作。該系統(tǒng)需要實現(xiàn):智能的抓取、更新和顯示網(wǎng)絡(luò)交易平臺上的商家主體信息;智能的抓取、更新和顯示網(wǎng)絡(luò)交易平臺上的商品信息;對于交易平臺的主體商家和商品進(jìn)行分類歸并存儲,節(jié)省存儲空間;可以針對指定商家主體或者商品的信息進(jìn)行抓取,用于監(jiān)管和查證;分布式存儲與備份系統(tǒng)面對抓取的大量網(wǎng)絡(luò)交易數(shù)據(jù),我們需要采用分布式存儲技術(shù),以便保證數(shù)據(jù)庫在大數(shù)據(jù)量下的可靠性、可用性和存儲效率。另外,對于數(shù)據(jù)抓取過程中所采集的網(wǎng)頁信息,需采用索引數(shù)據(jù)庫的存儲方式進(jìn)行存儲,即由索引器對收集來的網(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息,根據(jù)權(quán)值算法得到每一個關(guān)鍵字的權(quán)值索引信息,然后根據(jù)這些索引信息建立數(shù)據(jù)庫,提高數(shù)據(jù)抓取系統(tǒng)的抓取效率,避免重復(fù)抓取。該系統(tǒng)需要實現(xiàn):分布式數(shù)據(jù)庫設(shè)計,具有大量數(shù)據(jù)(千萬級)存取能力;實現(xiàn)數(shù)據(jù)安全備份功能;數(shù)據(jù)分析與數(shù)據(jù)挖掘系統(tǒng)面對大量的網(wǎng)絡(luò)交易平臺數(shù)據(jù),如果只是進(jìn)行簡單的統(tǒng)計分析,顯然是不夠的。所以本系統(tǒng)將會利用數(shù)據(jù)挖掘技術(shù),對所抓取的數(shù)據(jù)進(jìn)行處理,呈現(xiàn)出隱藏在數(shù)據(jù)內(nèi)部的有用信息。該系統(tǒng)需要實現(xiàn):可以針對商家主體和(或)商品信息提供詳盡的分類統(tǒng)計和各類銷售狀況報表顯示功能;可以對商家的交易量、交易價格等信息進(jìn)行有效挖掘;動態(tài)頁面數(shù)據(jù)展示部分由于平臺所涉及到的網(wǎng)絡(luò)主體有這數(shù)量大,內(nèi)容復(fù)雜,形式多樣等特點。為了能夠直觀的方便的對數(shù)據(jù)進(jìn)行展示、分析,系統(tǒng)前端頁面的實現(xiàn)應(yīng)采用動態(tài)頁面展示技術(shù),使得數(shù)據(jù)的展示能夠采用復(fù)雜多變的動態(tài)圖表、詳盡智能的統(tǒng)計分析表格、簡單易用的操作模式、實時更新的網(wǎng)絡(luò)交易數(shù)據(jù)。實現(xiàn)系統(tǒng)用戶管理功能??梢栽黾?、刪除用戶賬戶或者修改賬戶使用權(quán)限。系統(tǒng)管理員可以修改用戶組權(quán)限。方便系統(tǒng)管理員對整個監(jiān)管平臺的管理和操作。業(yè)務(wù)處理能力,初期基本實現(xiàn)網(wǎng)絡(luò)主體庫、網(wǎng)絡(luò)商品庫、投訴監(jiān)管、抽檢等業(yè)務(wù)功能,徹底擺脫現(xiàn)有全手工化傳統(tǒng)模式。3.3系統(tǒng)功能介紹3.3.1企業(yè)主體庫管理經(jīng)營者的基本注冊信息,實現(xiàn)經(jīng)營者注冊信息的多重條件組合查詢。針對經(jīng)營者的營業(yè)范圍,對該經(jīng)營者進(jìn)行監(jiān)管,發(fā)現(xiàn)經(jīng)營者是否存在超出經(jīng)營者經(jīng)營范圍的網(wǎng)站或者網(wǎng)店信息。企業(yè)主體庫數(shù)據(jù)定期從工商局拷貝過來,更新系統(tǒng)內(nèi)數(shù)據(jù)。主要功能包括:企業(yè)主體信息的檢索、詳情查看。企業(yè)主體庫關(guān)聯(lián)網(wǎng)店、網(wǎng)站信息庫??梢圆榭雌髽I(yè)相關(guān)網(wǎng)店、網(wǎng)站信息。企業(yè)信息的導(dǎo)入導(dǎo)出功能。3.3.2食藥許可信息管理對接食品藥品生產(chǎn)經(jīng)營許可證信息系統(tǒng),將系統(tǒng)數(shù)據(jù)納入食品藥品監(jiān)管平臺進(jìn)行數(shù)據(jù)分析、比對,發(fā)現(xiàn)無許可證銷售的網(wǎng)店、網(wǎng)站、企業(yè)信息。主要功能如下:對接食品藥品生產(chǎn)經(jīng)營許可證信息,將數(shù)據(jù)納入系統(tǒng)進(jìn)行管理。可以檢索食藥許可信息。系統(tǒng)數(shù)據(jù)比對,發(fā)現(xiàn)無食品藥品銷售許可證信息的主體。3.3.3網(wǎng)絡(luò)主體庫網(wǎng)絡(luò)主體庫主要是針對餓了么、美團(tuán)外賣、百度外賣上存在的商家信息進(jìn)行統(tǒng)一管理,方便用戶能夠直觀的網(wǎng)上開設(shè)的網(wǎng)絡(luò)主體進(jìn)行快速檢索,快速篩選,得到用戶關(guān)注的主體信息。主要包括如下功能:3.3.4網(wǎng)絡(luò)商品庫管理各個平臺網(wǎng)絡(luò)商品信息,可以針對商品信息進(jìn)行查看、檢索、同時可以查看某個網(wǎng)店所有商品信息,可以針對商品進(jìn)行相關(guān)統(tǒng)計分析,具體功能如下:

3.3.5投訴監(jiān)管對投訴進(jìn)行管理,并且對投訴處理結(jié)果進(jìn)行展示,為在投訴處理過程中,提供相關(guān)投訴處理的數(shù)據(jù)支撐。同時,投訴以及投訴處理結(jié)果的數(shù)據(jù)保存在系統(tǒng)中,為后期建立經(jīng)營者信用評價體系,以及信用懲戒,提供有力的數(shù)據(jù)支撐。(1)投訴信息錄入:此模塊的功能是管理新增投訴信息。提供手動新增投訴信息和按Excel文件批量導(dǎo)入投訴信息。(2)未處理投訴信息:此模塊提供按條件查詢未處理投訴信息,當(dāng)投訴信息被處理時,可以添加該投訴信息的處理結(jié)果。(3)已處理投訴信息:此模塊的功能是管理已處理投訴信息,提供按報表類型導(dǎo)出Excel文件功能。(4)統(tǒng)計分析:針對投訴需要生成的相關(guān)報表,可以在線查看相關(guān)統(tǒng)計信息,同時可以導(dǎo)出到Excel中查看詳細(xì)情況。3.3.6網(wǎng)絡(luò)抽檢由于需要定期對網(wǎng)上店鋪進(jìn)行抽檢,抽檢信息具備查詢、分類、分析和統(tǒng)計功能。網(wǎng)絡(luò)抽檢基本流程如下:主要功能如下:(1)待抽檢商品信息錄入:通過實地摸排、網(wǎng)絡(luò)添加、重點抽檢三種方式,實現(xiàn)抽檢商品信息入庫。(2)商品抽檢結(jié)果信息錄入:選取單個商品,實現(xiàn)商品抽檢結(jié)果的錄入,包含抽檢過程中產(chǎn)生的圖片和視頻以及抽檢的結(jié)果信息。(3)抽檢結(jié)果信息詳情:方便查看抽檢結(jié)果信息以及在抽檢過程中產(chǎn)生的圖片和視頻信息。對抽檢合格的商品提供信息的管理。對抽檢不合格的商品提供復(fù)檢功能,復(fù)檢申請書以圖片的方式上傳。(4)復(fù)檢結(jié)果信息錄入:當(dāng)被抽檢的經(jīng)濟(jì)戶口對抽檢的結(jié)果不滿意時,可以提出復(fù)檢。當(dāng)復(fù)檢完成時,復(fù)檢結(jié)果信息可通過此模塊入庫,包含復(fù)檢過程中產(chǎn)生的圖片和視頻信息。(5)復(fù)檢結(jié)果信息詳情:提供復(fù)檢結(jié)果的查看功能。包含商品的基本信息、初檢結(jié)果信息、復(fù)檢申請書、復(fù)檢結(jié)果信息。(6)重點抽檢對象:在網(wǎng)絡(luò)抽檢過程中,食品藥品稽查人員可以將存在嚴(yán)重情況的商品信息和網(wǎng)店信息添加到重點抽檢庫中,以便以后再次抽檢該網(wǎng)店中的相關(guān)商品,并且可以對店鋪網(wǎng)頁進(jìn)行截圖保存。3.3.7網(wǎng)絡(luò)監(jiān)測網(wǎng)絡(luò)監(jiān)測模塊,主要為用戶能夠有目標(biāo)、有針對性的對一批網(wǎng)店、網(wǎng)站信息進(jìn)行監(jiān)測。用戶通過設(shè)置相關(guān)關(guān)鍵詞、排除詞,系統(tǒng)根據(jù)用戶錄入關(guān)鍵詞的情況,進(jìn)行自動化檢索目標(biāo)網(wǎng)店、網(wǎng)站信息。用戶可以針對該關(guān)鍵詞下的網(wǎng)店、網(wǎng)站信息進(jìn)行針對性的監(jiān)測,從而發(fā)現(xiàn)案源線索。3.3.8案源管理在針對網(wǎng)店、網(wǎng)站進(jìn)行巡查,以及在網(wǎng)店、網(wǎng)站的監(jiān)測中,針對發(fā)現(xiàn)違規(guī)店鋪,可以加入案源模塊進(jìn)行管理,為后期立案提供數(shù)據(jù)支持。查詢:可以根據(jù)經(jīng)營者名稱,以及店鋪名稱等條件進(jìn)行篩選,查看待成為案源信息的名單,以及標(biāo)注的內(nèi)容。導(dǎo)出:可以針對篩選結(jié)果進(jìn)行導(dǎo)出,為后期立案或者行政指導(dǎo)提供數(shù)據(jù)支撐。維護(hù):可以針對案源信息進(jìn)行維護(hù),已經(jīng)立案或者已經(jīng)進(jìn)行指導(dǎo)的經(jīng)營者可以在系統(tǒng)中進(jìn)行標(biāo)注,并且可以進(jìn)行撤銷操作。下發(fā):可以針對不同轄區(qū)管理的企業(yè)發(fā)生的案源線索,食藥監(jiān)局可以針對案源信息進(jìn)行下發(fā)到相應(yīng)區(qū)縣所進(jìn)行處理。區(qū)縣所處理的情況可以進(jìn)行及時查看。3.3.9任務(wù)管理食藥監(jiān)局可以針對區(qū)縣所進(jìn)行任務(wù)的下發(fā),各個區(qū)縣所可以針對相應(yīng)任務(wù)進(jìn)行處理,同時反饋處理結(jié)果,具體功能如下:任務(wù)的新增、修改、刪除。任務(wù)的分發(fā),可以指定任務(wù)的執(zhí)行單位。任務(wù)進(jìn)度的查看,反饋結(jié)果信息的查看。3.3.10系統(tǒng)公告用戶可以在系統(tǒng)內(nèi)發(fā)布相關(guān)工作公告,下級單位進(jìn)入系統(tǒng)可以查看公告的內(nèi)容,便于工作的通知以及下達(dá),具體功能如下:系統(tǒng)公告的新增、修改、查看。系統(tǒng)公告信息的展示。3.3.11風(fēng)險分析風(fēng)險分析主要包括以下內(nèi)容:地址模糊、地址重復(fù)分析系統(tǒng)對所有店鋪地址信息進(jìn)行智能篩選分析,檢索出地址不明確、模糊、重復(fù)的相關(guān)店鋪,最終在系統(tǒng)界面清晰展示出來,有利于食藥品監(jiān)督工作的順利開展。其他風(fēng)險分析除了以上列出的風(fēng)險之外還存在新上商家、發(fā)票服務(wù)風(fēng)險、評價較低、月售環(huán)比異常、熱門商品、電話號碼風(fēng)險等。新上商家風(fēng)險:系統(tǒng)智能篩選出新注冊的商家信息,對無證經(jīng)營、無實名認(rèn)證的商家進(jìn)行分類,方便食品藥品監(jiān)察人員進(jìn)行督促整改。發(fā)票服務(wù)風(fēng)險:系統(tǒng)通過對商家評論智能篩選分析,判斷商家是否存在發(fā)票問題。評價較低:系統(tǒng)通過對各店鋪評價進(jìn)行智能分析,篩選出差評較低的商家,幫助食品藥品監(jiān)察人員對評價較低的商家進(jìn)行調(diào)查、督促整改。月售環(huán)比異常分析:系統(tǒng)通過對平臺基本情況分析、平臺交易情況分析、以及商家銷量排名;通過同比和環(huán)比體現(xiàn)電商平臺的發(fā)展趨勢、行業(yè)的發(fā)展趨勢。熱門商品分析:系統(tǒng)通過商品銷售數(shù)量,篩選出熱門商品,通過商品評價、店鋪信譽(yù)等對熱門商品進(jìn)行智能分析,判斷熱門商品是否存在虛假信息。電話號碼風(fēng)險分析:系統(tǒng)通過對各商家基本信息進(jìn)行智能分析,篩選出無電話號碼的店鋪、電話號碼重復(fù)的店鋪,幫助食品藥品監(jiān)察人員對電話號碼存在問題的商家進(jìn)行調(diào)查、督促整改。3.3.12監(jiān)管APP根據(jù)對食品藥品稽查大隊的工作研究和調(diào)研,針對日常食藥監(jiān)管工作的需要我司研發(fā)出一款移動終端采集APP軟件,食藥監(jiān)管人員可以攜帶我們的移動終端APP去各商家實體店進(jìn)行摸排走訪。支持自動定位地址(地址可以和系統(tǒng)地址進(jìn)行比對發(fā)現(xiàn)虛假地址)。支持一鍵拍照上傳,這樣實現(xiàn)線上線下結(jié)合。同時可以快速寫入備注(衛(wèi)生狀況不佳、沒有營業(yè)資質(zhì)等等之類)。同時可以在線進(jìn)行相關(guān)系統(tǒng)相關(guān)業(yè)務(wù)操作。最終實現(xiàn)線上巡檢、線下巡檢相結(jié)合。使店鋪落地。具體功能如下:線下采集功能支持自動定位地址(地址可以和系統(tǒng)地址進(jìn)行比對發(fā)現(xiàn)虛假地址)。支持一鍵拍照上傳,這樣實現(xiàn)線上線下結(jié)合。同時可以快速寫入備注(衛(wèi)生狀況不佳、沒有營業(yè)資質(zhì)等等之類)。數(shù)據(jù)查詢企業(yè)、網(wǎng)店、商品等網(wǎng)絡(luò)主體相關(guān)數(shù)據(jù)查詢,可以為辦公人員外出辦公時,調(diào)取網(wǎng)監(jiān)系統(tǒng)數(shù)據(jù)提供便利。消息推送相關(guān)緊急工作,通過APP進(jìn)行通知,提醒工作人員及時完成工作。統(tǒng)計報表相關(guān)報表統(tǒng)計分析,方便工作人員實時掌握系統(tǒng)數(shù)據(jù)。3.3.13標(biāo)簽管理多維標(biāo)簽庫標(biāo)簽多維功能由于系統(tǒng)數(shù)據(jù)量較大,統(tǒng)一的管理不夠嚴(yán)謹(jǐn),容易出現(xiàn)紕漏。通過標(biāo)簽實現(xiàn)系統(tǒng)數(shù)據(jù)的分類可以很好的管理系統(tǒng)數(shù)據(jù),保證每一個數(shù)據(jù)的準(zhǔn)確率。標(biāo)簽還可以實現(xiàn)兩種數(shù)據(jù)之間的關(guān)聯(lián),通過這種關(guān)聯(lián),可以及時且準(zhǔn)確的找出用戶所需要的數(shù)據(jù)。主要功能如下:用戶可以根據(jù)自己的想法設(shè)置標(biāo)簽,并通過將系統(tǒng)數(shù)據(jù)加入到此標(biāo)簽中,實現(xiàn)對系統(tǒng)數(shù)據(jù)的關(guān)聯(lián)和分類。用戶可以利用標(biāo)簽進(jìn)行快速搜索出包含改標(biāo)簽的店鋪信息。3.3.14統(tǒng)計分析統(tǒng)計分析主要包含對平臺基本情況分析、平臺交易情況分析、以及商家銷量排名。實現(xiàn)數(shù)值統(tǒng)計和圖表統(tǒng)計功能。通過同比和環(huán)比體現(xiàn)電商平臺的發(fā)展趨勢、行業(yè)的發(fā)展趨勢。(1)分別統(tǒng)計各個平臺的店鋪和商品新增以及消亡情況,經(jīng)過一定的數(shù)據(jù)沉淀,反映各個電商平臺規(guī)模發(fā)展走向;(2)分別統(tǒng)計各個平臺商品銷售量以及銷售額情況,經(jīng)過一定的數(shù)據(jù)沉淀,反映各個電商平臺經(jīng)濟(jì)發(fā)展發(fā)展走向;(3)商家銷量排名統(tǒng)計,按照月粒度,按照商家銷量進(jìn)行排名。3.3.15系統(tǒng)設(shè)置1.權(quán)限控制本系統(tǒng)采用的權(quán)限控制技術(shù)是以角色為基礎(chǔ)的訪問控制技術(shù)。根據(jù)登錄用戶的角色不同,給定不同模塊的操作權(quán)限。以角色為基礎(chǔ)的訪問控制原理如下:以角色為基礎(chǔ)的訪問控制(Role-basedaccesscontrol,RBAC),是資訊安全領(lǐng)域中,一種較新且廣為使用的訪問控制機(jī)制,其不同于強(qiáng)制訪問控制以及自由選定訪問控制直接賦予使用者權(quán)限,而是將權(quán)限賦予角色。是一套較強(qiáng)制訪問控制以及自由選定訪問控制更為中性且更具靈活性的訪問控制技術(shù)。系統(tǒng)角色:為方便系統(tǒng)權(quán)限管理,確保數(shù)據(jù)使用的安全性,系統(tǒng)角色分為系統(tǒng)管理員和系統(tǒng)用戶。系統(tǒng)管理員負(fù)責(zé)設(shè)置本級系統(tǒng)用戶權(quán)限、創(chuàng)建下級單位和添加下一級系統(tǒng)管理員。系統(tǒng)用戶權(quán)限根據(jù)實際工作業(yè)務(wù)設(shè)置,如A用戶只需要查看系統(tǒng)數(shù)據(jù),不涉及具體業(yè)務(wù),那么只需給A用戶設(shè)置查看權(quán)限;B用戶只負(fù)責(zé)投訴業(yè)務(wù),則將B用戶權(quán)限限定在投訴模塊,對其他模塊數(shù)據(jù)具有查看、下載權(quán)限;C用戶涉及多個業(yè)務(wù),則根據(jù)實際業(yè)務(wù)需求開通系統(tǒng)功能使用權(quán)限。系統(tǒng)角色和組織結(jié)構(gòu)的關(guān)系:系統(tǒng)采取角色管理模式,不同角色在系統(tǒng)中有不同的功能,所有角色均由系統(tǒng)管理員設(shè)置管理,在水平層級上系統(tǒng)管理員負(fù)責(zé)設(shè)置同級別的其他用戶角色,在垂直層級上系統(tǒng)管理員負(fù)責(zé)設(shè)置下一級的系統(tǒng)管理員。系統(tǒng)管理的原則:(1).系統(tǒng)管理便捷,層級分明(2).系統(tǒng)權(quán)限分配合理,符合實際工作需要(3).系統(tǒng)權(quán)限設(shè)置確保數(shù)據(jù)使用的安全性2.數(shù)據(jù)采集管理數(shù)據(jù)采集管理模塊是由操作人員添加系統(tǒng)中不存在的店鋪信息,并設(shè)置優(yōu)先等級,數(shù)據(jù)采集系統(tǒng)會根據(jù)這些信息采集相應(yīng)的數(shù)據(jù),添加到數(shù)據(jù)庫中,實現(xiàn)店鋪的管理。數(shù)據(jù)采集服務(wù)的狀態(tài)監(jiān)測可以看出各個數(shù)據(jù)采集系統(tǒng)的工作情況以及任務(wù)完成情況。主要功能如下:數(shù)據(jù)采集任務(wù)設(shè)定:針對系統(tǒng)中手動錄入的經(jīng)濟(jì)戶口地址信息,數(shù)據(jù)采集系統(tǒng)進(jìn)行定向采集,將經(jīng)濟(jì)戶口的詳細(xì)信息采集到本系統(tǒng)中,同時,實時進(jìn)行碰撞關(guān)聯(lián),將店鋪信息和經(jīng)營者信息關(guān)聯(lián)在一起。數(shù)據(jù)采集任務(wù)狀態(tài)監(jiān)測:針對數(shù)據(jù)采集系統(tǒng)集群的采集的內(nèi)容進(jìn)行監(jiān)測,實時查看數(shù)據(jù)采集系統(tǒng)當(dāng)前工作狀態(tài)信息。3.基礎(chǔ)設(shè)置通過基礎(chǔ)設(shè)置模塊,可以實現(xiàn)食品藥品監(jiān)管系統(tǒng)的基礎(chǔ)信息設(shè)置。主要包含:(1)系統(tǒng)名稱修改:可以修改食品藥品監(jiān)管系統(tǒng)的名稱。(2)安全性驗證:可以開啟和關(guān)閉登錄時是否驗證IP;登錄時是否啟用驗證碼。3.3.16監(jiān)管數(shù)據(jù)抓取爬取百度外賣、餓了么、美團(tuán)、百度糯米平臺:分析百度外賣、餓了么、美團(tuán)、百度糯米等的頁面布局與內(nèi)容,將百度外賣、餓了么、美團(tuán)、百度糯米等商城上市轄區(qū)內(nèi)的經(jīng)濟(jì)戶口信息抓取到本地。爬取淘寶、天貓、京東、蘇寧系統(tǒng)平臺:分析淘寶、天貓、京東、蘇寧系統(tǒng)中的食藥品相關(guān)的頁面布局與內(nèi)容,將淘寶、京東等商城上市轄區(qū)內(nèi)的經(jīng)濟(jì)戶口信息抓取到本地。自建網(wǎng)站數(shù)據(jù)采集:依托企業(yè)注冊信息數(shù)據(jù)庫,系統(tǒng)自動采集企業(yè)相關(guān)的網(wǎng)站信息庫。數(shù)據(jù)分類、清洗、分析:針對采集下來的數(shù)據(jù)進(jìn)行歸類、分析、清洗、并存儲。3.3.17數(shù)據(jù)對接對接企業(yè)注冊信息數(shù)據(jù):企業(yè)注冊信息庫,定期導(dǎo)入系統(tǒng),進(jìn)行和食品藥品經(jīng)營許可信息進(jìn)行關(guān)聯(lián)碰撞。對接食品藥品經(jīng)營許可信息庫:對接食品藥品經(jīng)營許可信息,將食品藥品經(jīng)營許可信息導(dǎo)入數(shù)據(jù)庫。進(jìn)行和企業(yè)主體信息進(jìn)行關(guān)聯(lián)碰撞。項目的技術(shù)基礎(chǔ)、特點及實施的條件4.1項目技術(shù)特點該系統(tǒng)本著成熟性和先進(jìn)性的要求,進(jìn)行技術(shù)路線的選擇。保證技術(shù)的可行性、可持續(xù)性和可拓展性,降低項目的風(fēng)險。本項目為食品藥品監(jiān)管系統(tǒng),技術(shù)路線選擇將按照上述部分予以具體闡述。4.1.1食品藥品監(jiān)管系統(tǒng)食品藥品監(jiān)管系統(tǒng),主要負(fù)責(zé)對淘寶、京東、百度外賣、餓了么、美團(tuán)、百度糯米平臺上的網(wǎng)絡(luò)交易主體信息進(jìn)行存儲、管理、分析和展示,其中的網(wǎng)絡(luò)交易信息主要指提供網(wǎng)絡(luò)商品交易的主體信息、日常人工網(wǎng)絡(luò)巡查信息以及平臺監(jiān)管系統(tǒng)網(wǎng)絡(luò)數(shù)據(jù)抓取的數(shù)據(jù)信息等。食品藥品監(jiān)管系統(tǒng)擬提供以下功能:規(guī)范化自動化的業(yè)務(wù)工作流:通過系統(tǒng)提供規(guī)范化自動化的稽查管理業(yè)務(wù)相關(guān)工作流程,提高食品藥品稽查大隊的日常巡查監(jiān)管效率,規(guī)范工作流程,減少辦公成本,將減少重復(fù)勞動。自動化數(shù)據(jù)監(jiān)控:該監(jiān)管系統(tǒng)還能夠通過分布式數(shù)據(jù)抓取技術(shù),對各大交易平臺(本期項目重點針對淘寶、京東、百度外賣、餓了么、美團(tuán)、百度糯米等平臺)上的網(wǎng)絡(luò)交易進(jìn)行在線監(jiān)控,對交易信息進(jìn)行在線抓取。智能統(tǒng)計分析:對所獲得的數(shù)據(jù)進(jìn)行統(tǒng)計分析,對大量的交易數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,進(jìn)行風(fēng)險預(yù)測和行業(yè)調(diào)研,提供準(zhǔn)確的統(tǒng)計報表,為政策指定提供依據(jù)。動態(tài)圖形化內(nèi)容展示:通過動態(tài)網(wǎng)頁技術(shù),對分析后的數(shù)據(jù)進(jìn)行實時、直觀的展示。根據(jù)上面的功能描述,食品藥品監(jiān)管平臺將主要分為以下模塊:數(shù)據(jù)管理模塊、數(shù)據(jù)分析模塊、網(wǎng)絡(luò)交易數(shù)據(jù)抓取模塊、動態(tài)數(shù)據(jù)展示模塊,其中涉及到關(guān)鍵技術(shù)主要有分布式數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)挖掘技術(shù)、分布式數(shù)據(jù)抓取技術(shù)、動態(tài)數(shù)據(jù)展示技術(shù)。下面就這四項技術(shù)選擇進(jìn)行詳細(xì)說明。分布式數(shù)據(jù)抓取技術(shù)鑒于當(dāng)前互聯(lián)網(wǎng)信息的爆炸性增長,以及本區(qū)域網(wǎng)絡(luò)交易蓬勃發(fā)展的現(xiàn)狀,采用普通的搜索數(shù)據(jù)爬蟲,將無法滿足食品藥品稽查大隊的監(jiān)管需求。目前,即使大型的信息采集系統(tǒng)對Web的覆蓋率也只有30-40%,刷新一遍采集頁面也需要一個多月的時間。為此,我們可以采用分布式網(wǎng)絡(luò)數(shù)據(jù)抓取技術(shù)。分布式網(wǎng)絡(luò)數(shù)據(jù)抓取包含多個數(shù)據(jù)抓取程序,每個數(shù)據(jù)抓取程序需要完成的任務(wù)和單個的數(shù)據(jù)抓取程序類似,它們從互聯(lián)網(wǎng)上下載網(wǎng)頁,并把網(wǎng)頁保存在本地的磁盤,從中抽取URL并沿著這些URL的指向繼續(xù)抓取。由于并行數(shù)據(jù)抓取程序需要分割下載任務(wù),可能數(shù)據(jù)抓取程序會將自己抽取的URL發(fā)送給其他數(shù)據(jù)抓取程序。這些數(shù)據(jù)抓取程序可能分布在同一個局域網(wǎng)之中,或者分散在不同的地理位置。根據(jù)數(shù)據(jù)抓取程序的分散程度不同,可以把分布式數(shù)據(jù)抓取程序分成以下兩大類:基于局域網(wǎng)分布式網(wǎng)絡(luò)數(shù)據(jù)抓?。哼@種分布式抓取器的所有數(shù)據(jù)抓取在同一個局域網(wǎng)里運(yùn)行,通過高速的網(wǎng)絡(luò)連接相互通信。這些數(shù)據(jù)抓取通過同一個網(wǎng)絡(luò)去訪問外部互聯(lián)網(wǎng),下載網(wǎng)頁,所有的網(wǎng)絡(luò)負(fù)載都集中在他們所在的那個局域網(wǎng)的出口上。由于局域網(wǎng)的帶寬較高,數(shù)據(jù)抓取之間的通信的效率能夠得到保證;但是網(wǎng)絡(luò)出口的總帶寬上限是固定的,數(shù)據(jù)抓取的數(shù)量會受到局域網(wǎng)出口帶寬的限制。基于廣域網(wǎng)分布式網(wǎng)絡(luò)數(shù)據(jù)抓?。寒?dāng)并行抓取器的數(shù)據(jù)抓取分別運(yùn)行在不同地理位置(或網(wǎng)絡(luò)位置),我們稱這種并行抓取器為分布式抓取器。例如,分布式抓取器的數(shù)據(jù)抓取可能位于中國,日本,和美國,分別負(fù)責(zé)下載這三地的網(wǎng)頁。分布式抓取器的優(yōu)勢在于可以子在一定程度上分散網(wǎng)絡(luò)流量,減小網(wǎng)絡(luò)出口的負(fù)載。如果數(shù)據(jù)抓取分布在不同的地理位置(或網(wǎng)絡(luò)位置),需要間隔多長時間進(jìn)行一次相互通信就成為了一個值得考慮的問題。數(shù)據(jù)抓取之間的通訊帶寬可能是有限的,通常需要通過互聯(lián)網(wǎng)進(jìn)行通信,這將會產(chǎn)生網(wǎng)絡(luò)安全隱患。分布式數(shù)據(jù)抓取技術(shù)是一項較為成熟的數(shù)據(jù)抓取技術(shù),可以應(yīng)對大量的數(shù)據(jù)需求。目前,google,百度等行業(yè)巨頭也都使用了該項技術(shù)。鑒于擬建項目的實際需求和部門內(nèi)部網(wǎng)絡(luò)安全問題的考慮,建議采用局域網(wǎng)分布式數(shù)據(jù)抓取。對于這種局域網(wǎng)分布式數(shù)據(jù)抓取,可以采用基于Hadoop的分布式系統(tǒng)架構(gòu),對其進(jìn)行分布式搜索引擎的模塊劃分;并通過Map/Reduce分布式計算加以實現(xiàn)。Hadoop是一個分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會所開發(fā)。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力高速運(yùn)算和存儲。Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。HDFS有高容錯性的特點,并且設(shè)計用來部署在低廉的(low-cost)硬件上;而且它提供高傳輸率(highthroughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。Hadoop的框架最核心的設(shè)計就是:HDFS和MapReduce.HDFS為海量的數(shù)據(jù)提供了存儲,而MapReduce為海量的數(shù)據(jù)提供了計算。Map/Reduce是一種編程模式,可用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算(大于1T)。Map/Reduce來源于函數(shù)式編程的Map,Reduce概念,Map是映射,Reduce是規(guī)約。它極大地方便了編程人員在不會分布式并行編程的情況下,將自己的程序運(yùn)行在分布式系統(tǒng)上。食品藥品監(jiān)管系統(tǒng),通過上述方式實現(xiàn)的局域網(wǎng)分布式網(wǎng)絡(luò)數(shù)據(jù)抓取,可以對重點網(wǎng)絡(luò)交易平臺和網(wǎng)站的定點監(jiān)測;可以通過垂直搜索,采集我們所關(guān)心的數(shù)據(jù);對數(shù)據(jù)進(jìn)行整理和過濾;大大提高網(wǎng)絡(luò)交易數(shù)據(jù)采集效率。該數(shù)據(jù)抓取技術(shù)還可以通過策略配置,來對數(shù)據(jù)抓取的各種業(yè)務(wù)邏輯行為進(jìn)行定制,修改。可以靈活的增加減少分配數(shù)據(jù)抓取數(shù)據(jù)抓取的個數(shù)和每個數(shù)據(jù)數(shù)據(jù)抓取的任務(wù)量。分布式數(shù)據(jù)存儲與備份技術(shù)海量網(wǎng)絡(luò)交易數(shù)據(jù)的存儲,分布式數(shù)據(jù)庫無疑是最好的存儲方式。分布式數(shù)據(jù)庫系統(tǒng)是在集中式數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上發(fā)展起來的,是計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)結(jié)合的產(chǎn)物。分布式數(shù)據(jù)庫系統(tǒng)適合于單位分散的部門,允許各個部門將其常用的數(shù)據(jù)存儲在本地,實施就地存放本地使用,從而提高響應(yīng)速度,降低通信費(fèi)用?;诰W(wǎng)絡(luò)基礎(chǔ)上的分布式數(shù)據(jù)庫系統(tǒng)經(jīng)常對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)分片。從數(shù)據(jù)意義上講,數(shù)據(jù)分布的合理與否不僅影響著訪問的局部性,而且也制約著數(shù)據(jù)查詢及事務(wù)處理的效率。分布式存儲用到的關(guān)鍵技術(shù)主要有切分?jǐn)?shù)據(jù)庫,負(fù)載均衡,集群,讀寫分離。切分?jǐn)?shù)據(jù)庫通常指的是水平切分,它通過一系列的切分規(guī)則將數(shù)據(jù)水平分布到不同的db或table中,再通過相應(yīng)的db路由或者table路由規(guī)則找到需要查詢的具體的db或table,以進(jìn)行query操作。通過切分?jǐn)?shù)據(jù)庫可以降低單臺機(jī)器的負(fù)載,同時最大限度的降低了了宕機(jī)造成的損失負(fù)載均衡的職責(zé)就是定位到一臺具體的DB服務(wù)器,這種策略會分析當(dāng)前sql的讀寫特性,如果是寫操作或是要求實時性很強(qiáng)的操作,直接將查詢負(fù)載分到Master,如果是讀操作則通過負(fù)載策略分配到一個Slave。通過負(fù)載均衡策略,可以有效的降低單臺機(jī)器的訪問負(fù)載和宕機(jī)的可能性。集群是一組相互獨(dú)立的、通過高速網(wǎng)絡(luò)互聯(lián)的計算機(jī),構(gòu)成了一個組,并以單一系統(tǒng)的模式加以管理。通過集群策略可以解決數(shù)據(jù)庫宕機(jī)帶來的單點數(shù)據(jù)庫不能訪問的問題。讀寫分離策略把寫操作集中在一個節(jié)點上,而讀操作集中在其他的N個節(jié)點上進(jìn)行,這就從另一個方面有效的提高了讀的效率,保證了系統(tǒng)的高可用性,最大限度了提高了應(yīng)用中讀取數(shù)據(jù)的速度和并發(fā)量。目前,谷歌、亞馬遜、Facebook,微軟和阿里巴巴等國際型大互聯(lián)網(wǎng)公司都采用了大規(guī)模分布式存儲系統(tǒng)。例如Facebook的數(shù)據(jù)倉庫Hadoop集群已成為世界上已知規(guī)模最大的Hadoop存儲集群。已配置存儲容量總共超過21PB,大于之前大名鼎鼎的雅虎集群(14PB)。在Hadoop的早期,F(xiàn)acebook就與另外幾個互聯(lián)網(wǎng)巨擘,充分利用這種框架來管理其不斷發(fā)展的業(yè)務(wù)。由于每月活躍用戶超過4億個,頁面瀏覽量超過5000億人次,每個月共享的內(nèi)容多達(dá)250億則,對于自稱能夠處理大數(shù)據(jù)問題的任何技術(shù)而言,F(xiàn)acebook是再合適不過的應(yīng)用環(huán)境。下面一些統(tǒng)計數(shù)字描述了Facebook的數(shù)據(jù)倉庫Hadoop集群的幾個特點:每天增加12TB的壓縮數(shù)據(jù);每天掃描800TB的壓縮數(shù)據(jù);每天處理25000個映射/化簡作業(yè);HDFS里面有6500萬個文件;30000個客戶機(jī)同時訪問HDFSNameNde。食品藥品監(jiān)管系統(tǒng)每天在網(wǎng)絡(luò)交易平臺上,抓取的數(shù)據(jù)經(jīng)分析處理后也會達(dá)到千萬級甚至億萬級別的數(shù)據(jù)。無疑這會給數(shù)據(jù)庫造成了相當(dāng)高的負(fù)載,對于系統(tǒng)的穩(wěn)定性和擴(kuò)展性造成了極大的問題。傳統(tǒng)的網(wǎng)絡(luò)存儲系統(tǒng)采用集中的存儲服務(wù)器存放所有數(shù)據(jù),存儲服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規(guī)模存儲應(yīng)用的需要。數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。隨著信息技術(shù)的高速發(fā)展,人們積累的數(shù)據(jù)量急劇增長,動輒以TB計,如何從海量的數(shù)據(jù)中提取有用的知識成為當(dāng)務(wù)之急。數(shù)據(jù)挖掘就是為順應(yīng)這種需要應(yīng)運(yùn)而生發(fā)展起來的數(shù)據(jù)處理技術(shù)。是知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase)的關(guān)鍵步驟。數(shù)據(jù)挖掘的工作主要分為關(guān)聯(lián)分析、聚類分析、分類、預(yù)測、時序模式和偏差分析等。各種數(shù)據(jù)挖掘任務(wù)就是通過這些類別的算法來實現(xiàn)的。關(guān)聯(lián)分析(associationanalysis):關(guān)聯(lián)規(guī)則挖掘是由RakeshApwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的知識。關(guān)聯(lián)分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個閥值來度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。聚類分析(clustering):聚類是把數(shù)據(jù)按照相似性歸納成若干類別,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)相異。聚類分析可以建立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的分布模式,以及可能的數(shù)據(jù)屬性之間的相互關(guān)系。分類(classification):分類就是找出一個類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,并用這種描述來構(gòu)造模型,一般用規(guī)則或決策樹模式表示。分類是利用訓(xùn)練數(shù)據(jù)集通過一定的算法而求得分類規(guī)則。分類可被用于規(guī)則描述和預(yù)測。預(yù)測(predication):預(yù)測是利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并由此模型對未來數(shù)據(jù)的種類及特征進(jìn)行預(yù)測。預(yù)測關(guān)心的是精度和不確定性,通常用預(yù)測方差來度量。目前,很多公司已成功地部署了數(shù)據(jù)挖掘應(yīng)用系統(tǒng)。伴隨該項技術(shù)的逐步成熟,數(shù)據(jù)挖掘技術(shù)已經(jīng)可以廣泛適用于任何想通過業(yè)務(wù)數(shù)據(jù)分析,來進(jìn)行商業(yè)決策的公司。數(shù)據(jù)挖掘成功的兩個關(guān)鍵因素是:一個大且完整的數(shù)據(jù)倉庫,和一個可挖掘的定義、理解都明確的商務(wù)流程,如客戶展望、保持,商業(yè)活動管理等等。其中一些成功的應(yīng)用例子包括:大型制藥公司可以分析他最近的銷售行動及其結(jié)果以改進(jìn)高職位醫(yī)師的目標(biāo)市場,并決定哪些市場活動將在后續(xù)的幾個月有最大的效果。數(shù)據(jù)需要包括競爭對手的市場活動信息和當(dāng)?shù)蒯t(yī)療系統(tǒng)的信息等。其分析結(jié)果,可以通過廣域網(wǎng)分發(fā)到各銷售隊伍,它可以使地區(qū)代表從決策過程中關(guān)鍵屬性的視點來檢視這些建議。而且,隨著這一過程的進(jìn)行,數(shù)據(jù)倉庫的動態(tài)分析允許來自整個組織的最好的實踐應(yīng)用于特定的銷售環(huán)境。信用卡公司可利用他的巨大的客戶交易數(shù)據(jù)倉庫來確定客戶對新的信用卡中最感興趣的產(chǎn)品。使用一個小型的測試郵件,就可以確定一個客戶對新產(chǎn)品的親和力屬性。最近的項目已經(jīng)表明,采用超常規(guī)的方法對指定目標(biāo)的郵寄活動,可以節(jié)省20倍的費(fèi)用。擁有很大的直銷隊伍的多樣化的運(yùn)輸公司,可使用數(shù)據(jù)挖掘以確定其服務(wù)的最好模式。用數(shù)據(jù)挖掘來分析他自己的客戶體驗,該公司可建立唯一的分段以確定高位值的預(yù)期。每一個這樣的例子有一個共同且清晰的基礎(chǔ),他們利用數(shù)據(jù)挖掘技術(shù)找出在數(shù)據(jù)倉庫里隱藏的關(guān)于客戶篤信的知識,從而在減少銷售費(fèi)用的同時還能改善客戶關(guān)系,提高公司效益。通過上面這些例子,我們可以看到數(shù)據(jù)挖掘技術(shù)廣泛的應(yīng)用場景。所以,在面對網(wǎng)絡(luò)交易平臺的海量交易數(shù)據(jù)分析時,我們同樣可以采用數(shù)據(jù)挖掘技術(shù)。利用該技術(shù),在分散的、獨(dú)立的、復(fù)雜的交易數(shù)據(jù)中找出關(guān)聯(lián)性;發(fā)現(xiàn)其中隱藏的有用信息。比如:可以通過挖掘算法對從交易平臺上采集的交易信息進(jìn)行分類(classification)處理,來找出可疑的違規(guī)商家,規(guī)范各網(wǎng)絡(luò)商家的交易行為;也可以通過對行業(yè)交易量、交易價格等數(shù)據(jù)的預(yù)測(predication)分析,來進(jìn)行行業(yè)調(diào)研,預(yù)測行業(yè)發(fā)展趨勢,引導(dǎo)行業(yè)健康有序的發(fā)展。B/S架構(gòu)與動態(tài)數(shù)據(jù)展示技術(shù)展示系統(tǒng)采用基于B/S結(jié)構(gòu)的動態(tài)網(wǎng)頁技術(shù)??梢灾С挚缙脚_、不需要安裝客戶端、易用性高等特點,展示的數(shù)據(jù)生動、直觀、具有實時性。B/S結(jié)構(gòu)(Browser/Server結(jié)構(gòu))結(jié)構(gòu)即瀏覽器和服務(wù)器結(jié)構(gòu)。它是隨著Internet技術(shù)的興起,對C/S結(jié)構(gòu)的一種變化或者改進(jìn)的結(jié)構(gòu)。在這種結(jié)構(gòu)下,用戶工作界面是通過WWW瀏覽器來實現(xiàn),極少部分事務(wù)邏輯在前端(Browser)實現(xiàn),但是主要事務(wù)邏輯在服務(wù)器端(Server)實現(xiàn),形成所謂三層3-tier結(jié)構(gòu)。這樣就大大簡化了客戶端電腦載荷,減輕了系統(tǒng)維護(hù)與升級的成本和工作量,降低了用戶的總體成本(TCO)。以目前的技術(shù)看,局域網(wǎng)建立B/S結(jié)構(gòu)的網(wǎng)絡(luò)應(yīng)用,并通過Internet/Intranet模式下數(shù)據(jù)庫應(yīng)用,相對易于把握、成本也是較低的。特別是在一些跨平臺編程語言出現(xiàn)之后,B/S架構(gòu)管理軟件更是方便、快捷、高效。它是一次性到位的開發(fā),能實現(xiàn)不同的人員,從不同的地點,以不同的接入方式(比如LAN,WAN,Internet/Intranet等)訪問和操作共同的數(shù)據(jù)庫;它能有效地保護(hù)數(shù)據(jù)平臺和管理訪問權(quán)限,服務(wù)器數(shù)據(jù)庫也很安全。目前某部門的內(nèi)網(wǎng)(Intranet)、外網(wǎng)(Internet)和北京東方清大公司“案件、辦公管理軟件”就是B/S結(jié)構(gòu)管理軟件,工作人員在局域網(wǎng)各工作站通過WWW瀏覽器就能實現(xiàn)工作業(yè)務(wù)。通常Web

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論