大數(shù)據(jù)及其典型應(yīng)用_第1頁
大數(shù)據(jù)及其典型應(yīng)用_第2頁
大數(shù)據(jù)及其典型應(yīng)用_第3頁
大數(shù)據(jù)及其典型應(yīng)用_第4頁
大數(shù)據(jù)及其典型應(yīng)用_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、信息資源管理-擴(kuò)展知識大數(shù)據(jù)及其典型應(yīng)用1.2022/9/32引子棱鏡門波士頓馬拉松爆炸案PredPol少數(shù)派報(bào)告2013 大數(shù)據(jù)元年video.一、大數(shù)據(jù)的相關(guān)概念二、國內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀三、構(gòu)建大數(shù)據(jù)分析平臺四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例目錄2022/9/33.一、大數(shù)據(jù)的相關(guān)概念2022/9/34.數(shù)據(jù)管理技術(shù)發(fā)展歷史數(shù)據(jù)管理技術(shù)歷經(jīng)人工管理、文件管理、數(shù)據(jù)庫管理等時代,大數(shù)據(jù)技術(shù)的出現(xiàn)使該領(lǐng)域進(jìn)入了一個新的發(fā)展階段- 5 - 194619511956196119701974197919912001200320082011第一臺計(jì)算機(jī)ENIAC面世磁帶+卡片人工管理磁盤被發(fā)明,進(jìn)入

2、文件管理時代網(wǎng)絡(luò)型SQLE-RGE公司發(fā)明第一個網(wǎng)絡(luò)模型數(shù)據(jù)庫,但僅限于GE自己的主機(jī)1960年代,IT系統(tǒng)規(guī)模和復(fù)雜度變大,數(shù)據(jù)與應(yīng)用分離的需求開始產(chǎn)生,數(shù)據(jù)庫技術(shù)開始萌芽并蓬勃發(fā)展,并在1990年后逐步統(tǒng)一到以關(guān)系型數(shù)據(jù)庫為主導(dǎo)IBM E.F.Dodd提出關(guān)系模型SQL語言被發(fā)明關(guān)系型數(shù)據(jù)庫ORACLE發(fā)布第一個商用SQL關(guān)系數(shù)據(jù)庫,后續(xù)快速發(fā)展數(shù)據(jù)倉庫數(shù)據(jù)倉庫開始涌現(xiàn),關(guān)系數(shù)據(jù)庫開始全面普及且平臺無關(guān),進(jìn)入成熟期2001年后,互聯(lián)網(wǎng)迅速發(fā)展,數(shù)據(jù)量成倍遞增,量變引起質(zhì)變,開始對數(shù)據(jù)管理技術(shù)提出全新的要求1946年,電腦誕生,數(shù)據(jù)與應(yīng)用緊密捆綁在文件中,彼此不分Hadoop成為Apache

3、頂級項(xiàng)目,重點(diǎn)支持海量數(shù)據(jù)分布式管理和分布式計(jì)算GFS谷歌發(fā)表論文介紹分布式計(jì)算.大數(shù)據(jù)發(fā)展背景全球信息化發(fā)展已步入大數(shù)據(jù)時代150億個設(shè)備連接到互聯(lián)網(wǎng)全球每秒鐘發(fā)送 290萬封電子郵件每天有 2.88 萬小時視頻上傳到Y(jié)outubeFacebook 每日評論達(dá)32億條,每天上傳照片近3億張,每月處理數(shù)據(jù)總量約130萬TB2011年全球產(chǎn)生數(shù)據(jù)量1.8ZB,預(yù)計(jì)2020年將增長到35ZB大數(shù)據(jù)正迅速成為最值得關(guān)注的IT領(lǐng)域之一2011年5月,EMC World 2011大會主題“云計(jì)算相遇大數(shù)據(jù)”,EMC 除了一直倡導(dǎo)的云計(jì)算外,還拋出大數(shù)據(jù)(BigData)概念2011年6月底,IBM、麥肯

4、錫等眾多國外機(jī)構(gòu)發(fā)布大數(shù)據(jù)相關(guān)研究報(bào)告,予以積極跟進(jìn)2011 年10 月,Gartner 認(rèn)為2012 年十大戰(zhàn)略技術(shù)將包括大數(shù)據(jù)2011 年11 月底,IDC 將大數(shù)據(jù)放入2012 年信息通信產(chǎn)業(yè)十大預(yù)測之一- 6 - IDC全球數(shù)據(jù)量預(yù)測( 1ZB = 1百萬PB = 10億TB)Google網(wǎng)站 Big data關(guān)鍵詞搜索及新聞引用量.什么是大數(shù)據(jù)123大數(shù)據(jù)的定義理解大數(shù)據(jù)的“4V”特征大數(shù)據(jù)的產(chǎn)生、增長2022/9/37.“大數(shù)據(jù)”是如何產(chǎn)生的?facebook社交網(wǎng)絡(luò)淘寶電子商務(wù)微博、Apps移動互聯(lián) 21世紀(jì)是數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓展了互聯(lián)網(wǎng)的

5、邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。 互聯(lián)網(wǎng)(社交、搜索、電商)、移動互聯(lián)網(wǎng)(微博)、物聯(lián)網(wǎng)(傳感器,智慧地球)、車聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融(銀行、股市、保險)、電信(通話、短信)都在瘋狂產(chǎn)生著數(shù)據(jù)。 半個世紀(jì)以來,隨著計(jì)算機(jī)技術(shù)全面融入社會生活,信息爆炸已經(jīng)積累到了一個開始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長速度也在加快。信息爆炸的學(xué)科如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個概念*。如今,這個概念幾乎應(yīng)用到了所有人類智力與發(fā)展的領(lǐng)域中。2022/9/38.大數(shù)據(jù)時代的爆炸增長想駕馭這龐大的數(shù)據(jù),我們必須了解大數(shù)據(jù)的特征。地球上至今總共的數(shù)據(jù)量:

6、在2006 年,個人用戶才剛剛邁進(jìn)TB時代,全球一共新產(chǎn)生了約180EB的數(shù)據(jù);在2011 年,這個數(shù)字達(dá)到了1.8ZB。而有市場研究機(jī)構(gòu)預(yù)測:到2020 年,整個世界的數(shù)據(jù)總量將會增長44 倍,達(dá)到35.2ZB(1ZB=10 億TB)!GBTBPBEBZB1GB = 230字節(jié)1TB = 240字節(jié)1PB = 250字節(jié)1EB = 260字節(jié)1ZB = 270字節(jié)2022/9/39.大數(shù)據(jù)的4V特征“大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值密度低(Value)”就是“大數(shù)據(jù)”的顯著特征,或者說,只有具備這些特點(diǎn)的數(shù)據(jù),才是大數(shù)據(jù)。VolumeVelo

7、cityValueVariety2022/9/310.大數(shù)據(jù)的構(gòu)成大數(shù)據(jù) = 海量數(shù)據(jù) + 復(fù)雜類型的數(shù)據(jù)海量交易數(shù)據(jù):企業(yè)內(nèi)部的經(jīng)營交易信息主要包括聯(lián)機(jī)交易數(shù)據(jù)和聯(lián)機(jī)分析數(shù)據(jù),是結(jié)構(gòu)化的、通過關(guān)系數(shù)據(jù)庫進(jìn)行管理和訪問的靜態(tài)、歷史數(shù)據(jù)。通過這些數(shù)據(jù),我們能了解過去發(fā)生了什么。大數(shù)據(jù)包括:交易數(shù)據(jù)和交互數(shù)據(jù)集在內(nèi)的所有數(shù)據(jù)集海量交互數(shù)據(jù):源于Facebook、Twitter、LinkedIn及其他來源的社交媒體數(shù)據(jù)構(gòu)成。它包括了呼叫詳細(xì)記錄CDR、設(shè)備和傳感器信息、GPS和地理定位映射數(shù)據(jù)、通過管理文件傳輸Manage File Transfer協(xié)議傳送的海量圖像文件、Web文本和點(diǎn)擊流數(shù)據(jù)、科

8、學(xué)信息、電子郵件等等??梢愿嬖V我們未來會發(fā)生什么。海量數(shù)據(jù)處理:大數(shù)據(jù)的涌現(xiàn)已經(jīng)催生出了設(shè)計(jì)用于數(shù)據(jù)密集型處理的架構(gòu)。例如具有開放源碼、在商品硬件群中運(yùn)行的Apache Hadoop。2022/9/311.分析技術(shù):數(shù)據(jù)處理:自然語言處理技術(shù)統(tǒng)計(jì)和分析:A/B test; top N排行榜;地域占比;文本情感分析數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則分析;分類;聚類模型預(yù)測:預(yù)測模型;機(jī)器學(xué)習(xí);建模仿真大數(shù)據(jù)技術(shù):數(shù)據(jù)采集:ETL工具數(shù)據(jù)存?。宏P(guān)系數(shù)據(jù)庫;NoSQL;SQL等基礎(chǔ)架構(gòu)支持:云存儲;分布式文件系統(tǒng)等計(jì)算結(jié)果展現(xiàn):云計(jì)算;標(biāo)簽云;關(guān)系圖等一些相關(guān)技術(shù)存儲結(jié)構(gòu)化數(shù)據(jù)海量數(shù)據(jù)的查詢、統(tǒng)計(jì)、更新等操作效率低

9、非結(jié)構(gòu)化數(shù)據(jù)圖片、視頻、word、pdf、ppt等文件存儲不利于檢索、查詢和存儲半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化存儲按照非結(jié)構(gòu)化存儲解決方案:Hadoop(MapReduce技術(shù))流計(jì)算(twitter的storm和yahoo!的S4)數(shù)據(jù)采集數(shù)據(jù)儲存數(shù)據(jù)管理數(shù)據(jù)分析與挖掘2022/9/312.2022/9/313大數(shù)據(jù)的市場潛力.利用GPS數(shù)據(jù)了解交通狀況智能電表應(yīng)用級家庭能源監(jiān)測2012年3月29日奧巴馬政府公布了”大數(shù)據(jù)研發(fā)計(jì)劃”。該計(jì)劃的目標(biāo)是改進(jìn)現(xiàn)有人們從海量和復(fù)雜的數(shù)據(jù)中獲取知識的能力,從而加速美國在科學(xué)與工程領(lǐng)域發(fā)明的步伐,增強(qiáng)國家安全,轉(zhuǎn)變現(xiàn)有的教學(xué)和學(xué)習(xí)方式?!按髷?shù)據(jù)戰(zhàn)略”上升為美國

10、最高國策對數(shù)據(jù)占有和控制,做為在陸權(quán)、海權(quán)、空權(quán)之外的另一種國家核心能力。大數(shù)據(jù)的浪潮谷歌搜索與流感預(yù)測大數(shù)據(jù)與喬布斯的癌癥治療微博&投資沃爾瑪?shù)钠【婆c紙尿布塔吉特預(yù)測少女懷孕沃爾瑪?shù)皳榕c颶風(fēng)用品的關(guān)系“魔毯”病人的監(jiān)控智慧城市&智能化交通谷歌翻譯系統(tǒng)14.理解大數(shù)據(jù)數(shù)據(jù)已經(jīng)成為可以與物質(zhì)資產(chǎn)和人力資本相提并論的重要的生產(chǎn)要素 麥肯錫大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿15.二、國內(nèi)外大數(shù)據(jù)分析的研究現(xiàn)狀16.流感趨勢預(yù)測2022/9/317全球每年約10%15%的人群會患上流感,受感染人群約5000萬人,死亡人數(shù)約50萬。這可不是個小數(shù)字。如果我們能夠盡早提前預(yù)測到流感即將爆發(fā),無疑將使全

11、球公眾都將受益:政府和醫(yī)療機(jī)構(gòu)提前拿出應(yīng)對措施,就能挽救大量生命。2008年,谷歌推出了其著名的流感趨勢網(wǎng)站(http:/flutrends)。該網(wǎng)站假定的前提是:如果用戶患上了流感,則他們會搜索更多同流感相關(guān)的信息。如此一來,如果對任何一個國家或地區(qū)有關(guān)流感的搜索量進(jìn)行統(tǒng)計(jì),就能較好推斷出某個國家或地區(qū)是否正爆發(fā)流感。事實(shí)上,谷歌的這項(xiàng)統(tǒng)計(jì)數(shù)據(jù)被證實(shí)很有效。谷歌的相應(yīng)數(shù)據(jù),同美國疾病控制與預(yù)防中心(CDC)等政府機(jī)構(gòu)所統(tǒng)計(jì)的數(shù)據(jù)非常接近(97%)。在某些情況下,谷歌甚至能夠比CDC提前一周預(yù)測出哪些地區(qū)將爆發(fā)流感。.2022/9/318全球每星期會有數(shù)以百萬計(jì)的用戶在網(wǎng)上搜索健康信息。正如您

12、所預(yù)料的那樣,在流感季節(jié),與流感有關(guān)的搜索會明顯增多;到了過敏季節(jié),與過敏有關(guān)的搜索會顯著上升;而到了夏季,與曬傷有關(guān)的搜索又會大幅增加。某些搜索字詞非常有助于了解流感疫情。Google 流感趨勢會根據(jù)匯總的 Google 搜索數(shù)據(jù),近乎實(shí)時地對全球當(dāng)前的流感疫情進(jìn)行估測。搜索流感相關(guān)主題的人數(shù)與實(shí)際患有流感癥狀的人數(shù)之間存在著密切的關(guān)系。當(dāng)然,并非每個搜索“流感”的人都真的患有流感,但將與流感有關(guān)的搜索查詢匯總到一起時,便可以找到一種模式。將統(tǒng)計(jì)的查詢數(shù)量與傳統(tǒng)流感監(jiān)測系統(tǒng)的數(shù)據(jù)進(jìn)行了對比,結(jié)果發(fā)現(xiàn)許多搜索查詢在流感季節(jié)確實(shí)會明顯增多。通過對這些搜索查詢的出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),便可以估測出世界上

13、不同國家和地區(qū)的流感傳播情況。Detecting influenza epidemics using search engine query data, Nature 457, 1012-1014 (19 February 2009) .2022/9/319上圖顯示了根據(jù)歷史查詢所得的美國近幾年的流感估測結(jié)果,以及這些結(jié)果與官方的流感監(jiān)測數(shù)據(jù)的對比。從圖中可以看出,根據(jù)與流感相關(guān)的 Google 搜索查詢所得到的估測結(jié)果,與以往的流感疫情指示線非常接近。當(dāng)然,過去的表現(xiàn)并不能保證以后的結(jié)果一定準(zhǔn)確。.2022/9/320.2022/9/321.2022/9/322卡耐基梅隆大學(xué)的 Jiwei

14、Li 和康乃爾大學(xué)的 Claire Cardie,成功利用 Twitter 預(yù)測了早期流感爆發(fā)。他們的方式與 Google 類似。首先,從 Twitter 數(shù)據(jù)流中過濾包含與“流感”相關(guān),并帶有位置標(biāo)簽的 tweet;然后,在地圖上標(biāo)注這些 tweet 的位置分布,以及隨時間產(chǎn)生的變化。同時,還制作了流感的動態(tài)變化模型。新模型中,流感包括 4 個階段:無傳染階段、爆發(fā)階段、穩(wěn)定階段以及衰退階段。此外,采用了全新的算法,試圖盡可能快得發(fā)現(xiàn)不同時期的轉(zhuǎn)換節(jié)點(diǎn)。實(shí)際上,Li 和 Cardie 在 2008 年 6 月至 2010 年 6 月間,已經(jīng)利用 100 萬美國人的 360 萬條 tweet

15、,驗(yàn)證了該方法的有效性。 為了檢驗(yàn)他們的預(yù)測是否成真,Li 和 Cardie 將他們的分析與 CDC 進(jìn)行對比。他們說,“我們確信,流感相關(guān) tweet 與 CDC 提供的流感疾病案例數(shù)目,呈顯著相關(guān)。 ”.2022/9/323.2022/9/324日本國內(nèi)有一個網(wǎng)站,你只要打開這個網(wǎng)站用自己的 Twitter 賬號登錄,就可以在短時間內(nèi)通過數(shù)萬條 Twitter 找出可能感冒的人,并通過過去的感冒情況和今日的感冒情況進(jìn)行分析(以及統(tǒng)計(jì)目前發(fā)燒以及嗓子痛的患者數(shù)量),另外該程序還會結(jié)合氣溫和濕度的變化來預(yù)測 將來感冒的流行情況,并制作一個“易感冒日歷”。目前,此類服務(wù)正在日本陸續(xù)展開。通過這個

16、服務(wù)器的分析,大家就能夠知道在自己身邊到底有多少人有感冒的癥狀,并提前做好預(yù)防準(zhǔn)備。日本國立感染癥研究所將會把全國約5000 個醫(yī)療診所的流感患者進(jìn)行統(tǒng)計(jì)并發(fā)布數(shù)據(jù)。經(jīng)過對比,研究所得出的實(shí)際統(tǒng)計(jì)數(shù)字和網(wǎng)站上預(yù)測的結(jié)果基本是一致的,那么為什么大數(shù)據(jù)的結(jié)果會很準(zhǔn)呢?首先是因?yàn)橥ㄟ^網(wǎng)絡(luò)信息分析的技術(shù)有所進(jìn)步,已經(jīng)可以通過各種各樣的留言自動搜索到相關(guān)的數(shù)據(jù),并自動分類。就像 Google 現(xiàn)在所使用的技術(shù),就是利用服務(wù)器分析與流感關(guān)系十分密切的十幾個單詞進(jìn)行統(tǒng)計(jì)。另一個就是大數(shù)據(jù)所特有的功能。在流感最嚴(yán)重的時候,每天會有成千上萬條 Tweets 發(fā)布,即便有一些誤差,但通過數(shù)據(jù)分析也能分析出數(shù)據(jù)的精

17、準(zhǔn)度。以往,公共機(jī)構(gòu)在發(fā)布流感情報(bào)的時候至少要延遲一周,在有些偏遠(yuǎn)地區(qū)的立桿信息也并不確切,而現(xiàn)在,通過網(wǎng)絡(luò)能夠有效彌補(bǔ)這些缺憾。.2022/9/325.2022/9/326.淘寶的數(shù)據(jù)化運(yùn)營實(shí)例分析分析流程1. 分析主題確定及數(shù)據(jù)指標(biāo)的選擇;2. 數(shù)據(jù)倉庫數(shù)據(jù)提取及清洗;3. 不相關(guān)指標(biāo)剔除;4. 用訓(xùn)練數(shù)據(jù)建立模型;5. 用測試數(shù)據(jù)檢驗(yàn)?zāi)P停?. 預(yù)測新的流失用戶,并提取用戶名單; 7.制訂挽留策略:對圈定的客戶進(jìn)一步進(jìn)行分群,然后逐群制 訂有針對的挽留策略。比如有的群組是屬于夜間通話多(和 總體的均值相比)的客戶,那么針對他們的挽留策略可能是 推薦一些夜間通話優(yōu)惠的資費(fèi)方案。 8.實(shí)施挽

18、留行動、收集客戶反饋。 9.評估挽留效果:2022/9/327.三、構(gòu)建大數(shù)據(jù)分析平臺28.四、公共安全領(lǐng)域大數(shù)據(jù)應(yīng)用案例29.面向公共安全領(lǐng)域的大數(shù)據(jù)分析技術(shù)平臺數(shù)據(jù)挖掘Data Miner多維分析BI Beans查詢Discoverer數(shù)據(jù)倉庫管理(OEM)數(shù)據(jù)提取WarehouseBuilder應(yīng)用服務(wù)器ApplicationServer/PortalDataBase人口數(shù)據(jù)外部數(shù)據(jù)犯罪數(shù)據(jù)報(bào)表ReportsData MiningOLAP數(shù)據(jù)轉(zhuǎn)換中央數(shù)據(jù)倉庫知識發(fā)現(xiàn)信息展現(xiàn)應(yīng)用系統(tǒng)源數(shù)據(jù)數(shù)據(jù)獲取數(shù)據(jù)管理數(shù)據(jù)使用2022/9/330.刑偵的犯罪預(yù)防搜集犯罪的信息 推斷罪犯的習(xí)慣 預(yù)測罪案的

19、發(fā)生非法出入境判別海關(guān)走私模式的分析緊急事件的處理人員的緊急疏散資源的緊急調(diào)配 緊急狀態(tài)的安全管理緊急事件發(fā)生的預(yù)演交通管理公共安全領(lǐng)域基于大數(shù)據(jù)的智能分析2022/9/331.信息的來源銀行交易歷史資料庫/知識庫公共信息政府?dāng)?shù)據(jù)庫Internet截獲/監(jiān)聽情報(bào) 通信情報(bào)人工情報(bào)2022/9/332.問題的關(guān)鍵大量的信息(有關(guān)/無關(guān))是分析的基礎(chǔ),也是分析的障礙事件的信息往往是隨機(jī)獲得不確定的因素影響分析的結(jié)果分析的速度是關(guān)鍵2022/9/333.飛速膨脹的信息多種學(xué)科的邊緣結(jié)合有限的記憶和注意范圍長時間持續(xù)的分析工作嚴(yán)重依賴分析人員的經(jīng)驗(yàn)如何用計(jì)算機(jī)系統(tǒng)支持復(fù)雜海量的分析過程 ?限制 他們承

20、擔(dān)了大部分負(fù)擔(dān)依靠分析人員2022/9/334.限制 分析人員的沉重負(fù)擔(dān)依靠分析人員2022/9/335.當(dāng)前的分析需求從不同的來源有效的集成知識和信息連續(xù)的知識積累提供自動的警告為分析人員的查詢提供答案構(gòu)造不同的案件情節(jié)假設(shè)2022/9/336.定性, 定量分析時間 & 頻率分析Databases經(jīng)驗(yàn)自由文本統(tǒng)一的知識系統(tǒng)從不同信息來源和格式獲取數(shù)據(jù)2022/9/337.基本信息 組織 個人人工情報(bào)事件數(shù)據(jù)庫銀行交易其它數(shù)據(jù)源政府?dāng)?shù)據(jù)庫通信情報(bào)監(jiān)聽 反饋 人工情報(bào) 詢問 檢查 模擬 聯(lián)結(jié)事件生成 Events:Meeting (What, Who, Where, When, Frequenc

21、y)Travel (Who, How, Where, When, Length)Phone call (Who, When, Length, Content, Frequency)Delivery (Who, When, How, Size, What, Frequent, Payment)Other (What, Who, When, Where)Crime (What, When, Where, Who, How)2022/9/338.典型應(yīng)用 1 刑事罪案自動分析2022/9/339.參與分析的數(shù)據(jù)罪犯 犯罪技巧 (爆炸-爆炸物制作, 殺人方式, 動機(jī)等等), 屬于特定團(tuán)伙和團(tuán)伙中的角色

22、 (計(jì)劃者, 輔助者, 領(lǐng)導(dǎo)者, 執(zhí)行者/馬仔等等), 戶籍地/暫住地, 入獄歷史團(tuán)伙 成員, 角色潛在目標(biāo) 人群/公共機(jī)構(gòu)/商業(yè)機(jī)構(gòu), 他們的位置知識和經(jīng)驗(yàn) 這些因素如何相互作用 包括外在的影響和經(jīng)驗(yàn) (過去發(fā)生的事件)新的信息會源源不斷 2022/9/340.模擬案例- 西西里, 巴勒莫, 4/4/03 : “Corradi 拘捕了 Don Marcello” (公共信息)理解信息 Corradi 是巴勒莫警方的的首席偵探 Don Marcello 是 Marcello 家族的教父 Marcello 家族具有很強(qiáng)的報(bào)復(fù)性巴勒莫警方很可能遭到報(bào)復(fù)文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問Data

23、 Mining / 先驗(yàn)知識推理, 警報(bào)2022/9/341.新的信息理解信息Bob 是 Marcello 家族的成員Bob 是家族中的計(jì)劃者和談判代表Marcello 家族的勢力只限于巴勒莫 談判代表到外面的地區(qū)尋找家族內(nèi)沒有的炸彈專家炸彈制造和使用是 Marcello 家族沒有的技術(shù), Parsi 地區(qū)的黑手黨家族有這樣的專家 Per 是Parsi 地區(qū)的黑手黨炸彈專家同時間服刑的罪犯經(jīng)常會一起合作犯案Per 和 Bob 有同時間服刑的歷史Marcello 家族有可能以炸彈攻擊的方式報(bào)復(fù) Don Marcello 的被拘捕Bob 有可能計(jì)劃用炸彈攻擊巴勒莫警方巴勒莫, 4/4/03 : “

24、Corradi 拘捕了 Don Marcello” (公共信息)巴勒莫, 5/5/03 : “Bob 在 Parsi 出現(xiàn)” (警方通報(bào))文本信息的理解外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問Data Mining / 先驗(yàn)知識外部數(shù)據(jù)訪問外部數(shù)據(jù)訪問Data Mining / 先驗(yàn)知識Data Mining / 先驗(yàn)知識推理, 警報(bào)外部數(shù)據(jù)訪問2022/9/342.新的信息巴勒莫, 4/4/03 : “Corradi 拘捕了 Don Marcello” (公共信息)巴勒莫, 5/5/03 : “Bob 在 Parsi 出現(xiàn)” (警方通報(bào))羅馬, 5/5/03 : “Fabrizzi 將會29號在

25、巴勒莫法庭宣判 Don Marcello (公共信息)巴勒莫, 7/5/03 : “這個月巴勒莫會發(fā)生一些事情” (警方情報(bào)) 有可能報(bào)復(fù)巴勒莫警方 可能是一起炸彈攻擊有可能針對 Fabrizzi 法官 可能的攻擊手段, 謀殺或是炸彈攻擊基于時間的相關(guān)分析(所有的分析都是與時間高度相關(guān)的)2022/9/343.新的信息如果我們拘捕 Per? 炸彈攻擊的威脅會降低, 但是不會消失 Marcello 家族的談判代表還知道其他的炸彈專家, 等等如果我們同時拘捕 Per 和 Bob?推理, 假設(shè)分析推理, 假設(shè)分析2022/9/344巴勒莫, 4/4/03 : “Corradi 拘捕了 Don Marcello” (公共信息)巴勒莫, 5/5/03 : “Bob 在 Parsi 出現(xiàn)” (警方通報(bào))羅馬, 5/5/03 : “Fabrizzi 將會29號在巴勒莫法庭宣判 Don Marcello (公共信息)巴勒莫, 7/5/03 : “這個月巴勒莫會發(fā)生一些事情” (警方情報(bào)).本月有事情 (突發(fā)事件) 在巴勒莫發(fā)生Fabrizzi 將在29日宣判Don MarcelloBob 出現(xiàn)在 Parsi密切注意相關(guān)人員的接觸炸彈有可能在制造中(假設(shè)事件與 Marcello 家族有關(guān) - 警告會在三個月內(nèi)有效)可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論