




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)管理與大數(shù)據(jù)目錄數(shù)據(jù)與數(shù)據(jù)模型數(shù)據(jù)管理技術數(shù)據(jù)處理大數(shù)據(jù)與云計算大數(shù)據(jù)應用5.1數(shù)據(jù)與數(shù)據(jù)模型1.數(shù)據(jù)2.數(shù)據(jù)模型3.概念數(shù)據(jù)模型4.結(jié)構數(shù)據(jù)模型5.1.1數(shù)據(jù)
1.數(shù)據(jù)的概念2.數(shù)據(jù)與信息的關系數(shù)據(jù)是指對客觀事物進行記錄并可以鑒別的符號,是對客觀事物的性質(zhì)、狀態(tài)以及相互關系等進行記載的物理符號或這些物理符號的組合。在計算機科學中,數(shù)據(jù)是指所有能輸入計算機中并被計算機程序處理的符號的總稱,比如字符、數(shù)字、圖形、圖像、音頻、視頻等。數(shù)據(jù)是信息的表現(xiàn)形式和載體,信息是數(shù)據(jù)的意義和內(nèi)涵,二者是形與質(zhì)的關系。5.1.2數(shù)據(jù)模型
1.概念:數(shù)據(jù)模型描述了數(shù)據(jù)庫中數(shù)據(jù)的組織
形式,它不僅要表示存儲了哪些數(shù)據(jù),
更重要的是要以一定的結(jié)構形式表示
出各種不同數(shù)據(jù)之間的聯(lián)系。2.分類概念數(shù)據(jù)模型結(jié)構數(shù)據(jù)模型獨立于計算機系統(tǒng)直接面向數(shù)據(jù)庫邏輯結(jié)構5.1.3概念數(shù)據(jù)模型概念數(shù)據(jù)模型簡稱概念模型。只是用來描述信息結(jié)構,使數(shù)據(jù)庫設計人員在設計初始階段集中精力分析數(shù)據(jù)以及數(shù)據(jù)之間的聯(lián)系。不同人對某一事物的描述可能不同。概念數(shù)據(jù)模型中常用的術語
(1)實體(Entity)(2)實體集(EntitySet)(3)實體型(EntityType)(4)聯(lián)系(Relationship)
(5)聯(lián)系分類(Relationshipclassify)
(6)屬性(Attribute)(7)碼(Key)
(8)域(Domain)
一對一
一對多
多對多是現(xiàn)實世界的第一層抽象概念數(shù)據(jù)模型的表示方法最常用的表示方法就是“實體—聯(lián)系”方法,簡稱E-R方法。E-R的組成中的通用標識:
(1)實體型:
(2)屬性:
(3)聯(lián)系:
(4)連線:用矩形表示,矩形框內(nèi)寫明實體名用橢圓表示,并用無向邊與相應的實體連接起來用菱形表示,菱形框內(nèi)寫明聯(lián)系名。聯(lián)系本身也是一種實體型,也可以有屬性用線段表示,連接實體和各個屬性以及實體和聯(lián)系,連接聯(lián)系時,注明聯(lián)系類型(1:1、1:n或n:m)。如果一個聯(lián)系具有屬性,則這些屬性也要用連線與該聯(lián)系連接起來。5.1.4結(jié)構數(shù)據(jù)模型
結(jié)構數(shù)據(jù)模型又叫邏輯數(shù)據(jù)模型,它直接面向數(shù)據(jù)庫的邏輯結(jié)構。這類模型涉及計算機系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng),所以稱為結(jié)構數(shù)據(jù)模型。是現(xiàn)實世界的第二層抽象結(jié)構數(shù)據(jù)模型數(shù)據(jù)結(jié)構數(shù)據(jù)操作數(shù)據(jù)完整性約束描述數(shù)據(jù)的類型、內(nèi)容、性質(zhì)以及數(shù)據(jù)間的聯(lián)系等,它將確定數(shù)據(jù)庫的邏輯結(jié)構。數(shù)據(jù)完整性約束主要描述數(shù)據(jù)結(jié)構內(nèi)數(shù)據(jù)間的語法、詞義聯(lián)系,制約和依存關系,以及數(shù)據(jù)動態(tài)變化的規(guī)則,保證數(shù)據(jù)的正確、有效和相容。數(shù)據(jù)操作是數(shù)據(jù)庫內(nèi)各種對象允許執(zhí)行的操作(如查詢、修改、刪除等)的集合,并定義這些操作的確切含義、操作規(guī)則以及如何實現(xiàn)。結(jié)構數(shù)據(jù)模型層次數(shù)據(jù)模型網(wǎng)狀數(shù)據(jù)模型關系數(shù)據(jù)模型統(tǒng)稱為非關系數(shù)據(jù)模型這兩種模型對數(shù)據(jù)的操作方式都是過程式的,需要在程序中給出存取路徑和具體的存取方法,程序和數(shù)據(jù)沒有完全獨立為了克服非關系數(shù)據(jù)模型的缺點,20世紀70年代誕生了關系數(shù)據(jù)模型,直到今日,絕大多數(shù)數(shù)據(jù)庫管理系統(tǒng)都是基于關系數(shù)據(jù)模型的。層次模型是滿足如下兩個條件的集合:
1.有且只有一個根節(jié)點
2.除根節(jié)點外其他節(jié)點有且只有一個雙親節(jié)點。3.各節(jié)點之間都是一對多或一對一聯(lián)系。優(yōu)點:對于一對一或一對多聯(lián)系可以直接轉(zhuǎn)換成層次數(shù)據(jù)模型中的父子聯(lián)系缺點:對于多對多聯(lián)系則不能直接轉(zhuǎn)換,通常要分解為多個
一對多聯(lián)系的模型來實現(xiàn)。倒長的樹1.層次數(shù)據(jù)模型根節(jié)點葉子節(jié)點葉子節(jié)點層次模型是滿足如下兩個條件的集合:
1.網(wǎng)狀數(shù)據(jù)模型允許有多個節(jié)點無雙親,2.允許每個節(jié)點有多個雙親。圖結(jié)構模型2.網(wǎng)狀數(shù)據(jù)模型3.關系模型學號姓名性別年齡班級20180101王剛男20網(wǎng)絡工程20180201李紅女20英語20180301劉鑫男20應用數(shù)學記錄或元祖關系關系數(shù)據(jù)模型是簡單的二維表結(jié)構每個二維表稱作一個關系,表頭(所有列標題)稱為關系的結(jié)構,表體(內(nèi)容)稱為關系的值。每一行數(shù)據(jù)稱作一個元組,每一列數(shù)據(jù)稱作一個屬性。圖5-5“學生信息”關系數(shù)據(jù)模型屬性或字段名關系的基本運算關系的基本運算包括選擇、投影和連接三種。選擇:從指定的關系中選擇滿足給定條件的元組組成新的關系。圖5-7選擇運算投影:從指定關系的屬性集合中選取若干個屬性組成新的關系。圖5-8投影運算連接:將兩個關系中的元組按指定條件組合,生成新的關系。連接內(nèi)連接
外連接左連接右連接全連接5.2數(shù)據(jù)管理技術1.數(shù)據(jù)庫2.數(shù)據(jù)倉庫3.數(shù)據(jù)挖掘5.2.1數(shù)據(jù)庫1.數(shù)據(jù)庫的概念數(shù)據(jù)庫是按照數(shù)據(jù)結(jié)構來組織、存儲和管理數(shù)據(jù)的倉庫。DBMS把數(shù)據(jù)庫分為三級,自下而上分別是內(nèi)模式、模式和外模式,如圖5-10所示。內(nèi)模式,是對整個數(shù)據(jù)庫的存儲結(jié)構和特征的描述,是數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部的表示方式,一個數(shù)據(jù)庫只有一個內(nèi)模式。模式,也稱概念模式、邏輯模式,是對整個數(shù)據(jù)庫邏輯結(jié)構和特征的描述,表示了數(shù)據(jù)的全部信息內(nèi)容,接近實際數(shù)據(jù)。外模式,是數(shù)據(jù)庫用戶使用局部數(shù)據(jù)的邏輯結(jié)構和特征的描述,是數(shù)據(jù)庫用戶看到的數(shù)據(jù)視圖,一個數(shù)據(jù)庫可以有多個外模式2.數(shù)據(jù)庫技術的新發(fā)展面向?qū)ο髷?shù)據(jù)庫(OODB)分布式數(shù)據(jù)庫(DDB)數(shù)據(jù)庫技術的其他應用5.2.2數(shù)據(jù)倉庫
1.什么是數(shù)據(jù)倉庫
數(shù)據(jù)倉庫之父W.H.Inmon給出的定義為:“數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用于支持管理決策過程?!保?)面向主題數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織的。主題是一個抽象概念,是在較高層次上將信息系統(tǒng)中的數(shù)據(jù)綜合、歸類后進行分析利用的對象。(2)集成數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)提取、清理的基礎上經(jīng)過系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉庫內(nèi)的信息是關于整個企業(yè)的一致的全局信息。相關數(shù)據(jù)越完整,得到的結(jié)果就越可靠。因此,對源數(shù)據(jù)的集成是數(shù)據(jù)倉庫建設中最關鍵,也是最復雜的一步。(3)穩(wěn)定數(shù)據(jù)倉庫中的數(shù)據(jù)一旦被寫入就不再變化,用戶只能通過分析工具對其進行查詢和分析,不能修改或刪除,數(shù)據(jù)倉庫中的數(shù)據(jù)對終端用戶來說是只讀的、穩(wěn)定的。(4)隨時間變化數(shù)據(jù)倉庫中的數(shù)據(jù)通常是歷史數(shù)據(jù),記錄了企業(yè)從過去某一時點到目前的各個階段的信息,因此數(shù)據(jù)倉庫中的數(shù)據(jù)都具有時間維度。通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預測。2.數(shù)據(jù)抽取、轉(zhuǎn)換和裝載數(shù)據(jù)抽取數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)裝載ETL(Extract-Transform-Load)從數(shù)據(jù)倉庫角度來看,并不是業(yè)務數(shù)據(jù)庫中的所有數(shù)據(jù)都是決策支持所必需的,通常只要提取與分析主題相關的數(shù)據(jù)即可。對于決策支持系統(tǒng)來說,最重要的就是準確性,不一致性必須在數(shù)據(jù)裝入數(shù)據(jù)倉庫以前被消除。這就是數(shù)據(jù)轉(zhuǎn)換要做的工作,也被稱為“數(shù)據(jù)清洗”。數(shù)據(jù)裝載負責將數(shù)據(jù)按照物理數(shù)據(jù)模型定義的表結(jié)構裝入數(shù)據(jù)倉庫,至此整個ETL過程結(jié)束。5.2.3數(shù)據(jù)挖掘
1.什么是數(shù)據(jù)挖掘
從技術層面定義,數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中集中識別出有效的、新穎的、潛在有用的、可理解的信息或模式的過程。從商業(yè)角度定義,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術,其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關鍵性數(shù)據(jù)。2.數(shù)據(jù)挖掘的過程(1)商業(yè)理解(2)數(shù)據(jù)理解(3)數(shù)據(jù)準備(4)建立模型(5)模型評估(6)結(jié)果部署①確定商業(yè)目標,發(fā)現(xiàn)影響結(jié)果的重要因素,從商業(yè)角度描繪客戶的首要目標。②評估形勢,查找所有的資源、局限、設想以及在確定數(shù)據(jù)分析目標和項目方案時應考慮到的各種其他的因素,包括風險和意外、相關術語、成本和收益等。③確定數(shù)據(jù)挖掘的目標,制訂項目計劃。①數(shù)據(jù)的初步收集:包括字段的數(shù)目、存儲方式、數(shù)據(jù)源等諸多方面。②數(shù)據(jù)描述:從總體上描述數(shù)據(jù)的屬性,并檢查數(shù)據(jù)是否能夠滿足相關要求。③數(shù)據(jù)的探索性分析:對數(shù)據(jù)進行初步理解,探測數(shù)據(jù)中比較有趣的數(shù)據(jù)子集,進而形成對潛在信息的假設。④數(shù)據(jù)質(zhì)量檢驗:包括檢驗數(shù)據(jù)的完整性和正確性、填補缺失值等。具體步驟包括數(shù)據(jù)選擇、數(shù)據(jù)清洗、數(shù)據(jù)構建、數(shù)據(jù)整合、數(shù)據(jù)格式化等。對于同一個數(shù)據(jù)挖掘問題,可能有多種方法可供選擇,但每一種技術對數(shù)據(jù)有著不同的限制及要求,因此經(jīng)常需要回到數(shù)據(jù)準備階段重新進行數(shù)據(jù)的選擇、清洗、轉(zhuǎn)換等活動?;仡櫾跇嫿P瓦^程中所執(zhí)行的每一個步驟,確保這些模型能夠達到企業(yè)的目標。根據(jù)需求的不同,結(jié)果部署階段有時只需要將發(fā)現(xiàn)的結(jié)果以及過程組織成為可讀文本形式,而有時候需要回退到商業(yè)理解階段重新調(diào)整。3.數(shù)據(jù)挖掘的應用5.3數(shù)據(jù)處理1.數(shù)據(jù)處理方式2.批數(shù)據(jù)管理系統(tǒng)3.流數(shù)據(jù)管理系統(tǒng)5.3.1數(shù)據(jù)處理方式
批數(shù)據(jù):離線數(shù)據(jù),是以靜態(tài)方式存儲的一類數(shù)據(jù),這類數(shù)據(jù)一般比較穩(wěn)定,很少進行修改。批處理:對批數(shù)據(jù)的處理稱為批處理。流數(shù)據(jù):是一組順序、大量、快速、連續(xù)到達的數(shù)據(jù)序列。流處理:對流數(shù)據(jù)的處理稱為流處理。
混合處理模式1.對批數(shù)據(jù)的處理重在由系統(tǒng)自動處理,不需過度交互,且能夠提高CPU的利用率。2.批數(shù)據(jù)管理系統(tǒng)要解決的問題是分布式存儲與分布式計算問題,并且需要盡量保證數(shù)據(jù)的本地性以減少網(wǎng)絡開銷。3.目前較為流行的分布式計算思路為“計算向數(shù)據(jù)移動”的理念。需要采用流數(shù)據(jù)處理的大數(shù)據(jù)應用場景主要有網(wǎng)頁點擊數(shù)的實時統(tǒng)計、傳感器網(wǎng)絡、金融中的高頻交易等。流處理模式是將數(shù)據(jù)視為流,源源不斷的數(shù)據(jù)組成了數(shù)據(jù)流,當新的數(shù)據(jù)到來時就立刻處理并返回所需的結(jié)果。很多大數(shù)據(jù)處理問題需要混合使用多種處理模式,實現(xiàn)高實時性的大數(shù)據(jù)查詢和計算分析?;旌咸幚砟J綄⒊蔀闈M足多樣性大數(shù)據(jù)處理和應用需求的有效手段。5.3.2批數(shù)據(jù)管理系統(tǒng)HadoopMapReduce負責計算HDFS分布式文件系統(tǒng),負責存儲數(shù)據(jù)YARN統(tǒng)一資源調(diào)度器,負責管理計算資源,如CPU和內(nèi)存等①高可靠性:Hadoop具有按位存儲和處理數(shù)據(jù)的能力。②高擴展性:Hadoop是在可用的計算機集群間分配數(shù)據(jù)并完成計算任務的,這些集群可以方便地擴展到數(shù)以千計的節(jié)點中。③高效性:Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點動態(tài)平衡。④高容錯性:Hadoop自動保存數(shù)據(jù)的多個副本,能自動將失敗的任務重新分配。⑤低成本:與一體機、商用數(shù)據(jù)倉庫相比,Hadoop是開源的,項目的軟件成本因此會大大降低。優(yōu)點:特點:①數(shù)據(jù)實時到達,到達速度較快。②數(shù)據(jù)到達次序獨立。③數(shù)據(jù)規(guī)模龐大,無法預知數(shù)據(jù)的大小。④數(shù)據(jù)一經(jīng)處理,除非進行存儲,很難再次獲取。典型系統(tǒng):Apache公司開發(fā)的StormStorm特點:免費開源、分布式、高容錯、實時計算系統(tǒng)。
彌補了Hadoop批處理所不能滿足的實時要求,令持續(xù)不斷的流計算變得容易。經(jīng)常用于實時分析、在線機器學習、持續(xù)計算、分布式遠程調(diào)用和ETL等領域。5.3.3流數(shù)據(jù)管理系統(tǒng)5.4大數(shù)據(jù)與云計算1.大數(shù)據(jù)概述2.云計算簡介3.大數(shù)據(jù)下的隱私5.4.1大數(shù)據(jù)下的隱私
1.什么是大數(shù)據(jù)美國研究機構Gartner給出定義:大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。2015年,國務院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》中定義:大數(shù)據(jù)是以容量大、類型多、存取速度快、價值密度低為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和關聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的新一代信息技術。2.大數(shù)據(jù)的4V特征4個v容量(volume)大類型(variety)多存取速度(velocity)快價值(value)密度低3.大數(shù)據(jù)的特點
(1)不是隨機樣本,而是全體數(shù)據(jù)(2)不是精確性,而是混雜性(3)不是因果關系,而是相關關系1.什么是云把本地的數(shù)據(jù)、資源、計算和管理運營都放到遠程的服務器中,通過網(wǎng)絡進行連接和使用,就成為云存儲、云計算和云服務。目前的云分為公有云、私有云和混合云。2.云計算的定義美國國家標準與技術研究院的定義:云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網(wǎng)絡訪問,進入可配置的計算資源池,其中的資源(網(wǎng)絡、服務器、存儲、應用軟件和服務)能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。5.4.2云計算簡介
私有云混合云公有云公有云是指云服務提供商為用戶提供能夠使用的云,用戶可通過Internet使用。核心屬性是共享資源服務,云服務提供商有時會通過技術手段將一臺物理服務器分割為多臺虛擬服務器,租給不同的用戶使用。目前政府推行的“企業(yè)上云”,就是鼓勵企業(yè)接入幾家著名的公有云平臺,以節(jié)約企業(yè)成本提高效率。目前國內(nèi)較為出名的公有云平臺包括阿里云、百度云、華為云、騰訊云等。是指為一個客戶單獨使用而構建的云,提供對數(shù)據(jù)、安全性和服務質(zhì)量的最有效控制。該客戶擁有基礎設施,并可以控制在此基礎設施上部署應用程序的方式。私有云可部署在企業(yè)數(shù)據(jù)中心的防火墻內(nèi),也可以部署在一個安全的主機托管場所,如云服務提供商的機房。私有云的核心屬性是專有資源?;旌显迫诤狭斯性坪退接性?,是近年來云計算的主要模式和發(fā)展方向。出于安全考慮,企業(yè)更愿意將數(shù)據(jù)存放在私有云中,但是同時又希望可以獲得公有云的計算資源,在這種情況下混合云被越來越多地采用,它將公有云和私有云進行混合和匹配,以獲得最佳的效果,這種個性化的解決方案達到了既省錢又安全的目的。3.云計算的特征
(1)自助服務(2)廣泛的網(wǎng)絡訪問(3)資源池化(4)資源的靈活調(diào)度(5)可度量的服務5.4.3大數(shù)據(jù)下的隱私
隱私問題由來已久,計算機的出現(xiàn)使得越來越多的數(shù)據(jù)以數(shù)字化形式存儲在計算機中,互聯(lián)網(wǎng)的發(fā)展則使數(shù)據(jù)更加容易產(chǎn)生和傳播,特別在當下的大數(shù)據(jù)時代,隱私保護已經(jīng)成為人們必須面對的重要問題。從另一個角度來看,數(shù)據(jù)公開是非常有必要的。大數(shù)據(jù)時代的隱私性主要體現(xiàn)于在不暴露用戶敏感信息的前提下進行有效的數(shù)據(jù)挖掘,這有別于傳統(tǒng)的信息安全領域更加關注文件的私密性等安全屬性的情況。統(tǒng)計數(shù)據(jù)庫數(shù)據(jù)研究中最早開展數(shù)據(jù)隱私性技術方面的研究,近年來此項技術逐漸成為相關領域的研究熱點。5.5大數(shù)據(jù)應用1.互聯(lián)網(wǎng)領域中的大數(shù)據(jù)應用2.生活中的大數(shù)據(jù)應用3.未來大數(shù)據(jù)5.5.1互聯(lián)網(wǎng)領域中的大數(shù)據(jù)應用
1.眾包概念:指的是一個公司或機構把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網(wǎng)絡的做法。
案例:維基百科谷歌ReCAPTCHA系統(tǒng)高德地圖和百度地圖
Weddar亞馬遜MechanicalTurk2.網(wǎng)絡廣告
網(wǎng)絡廣告:又稱在線廣告,是指在線媒體上投放的廣告,開啟了大規(guī)模自動化地利用數(shù)據(jù)改善產(chǎn)品和提高收入的先河。(1)微信的斑馬系統(tǒng)通過分析用戶特征來提取用戶畫像,并在此基礎
上提供受眾分析、精準推廣、激活留存和商業(yè)智
能決策等模塊。圖5-15斑馬系統(tǒng)結(jié)構圖通過對微信原始數(shù)據(jù)(包括個人填寫的信息、網(wǎng)絡行為、社交關系等)進行提取和分析,得到用戶的屬性和各種特征,比如居住地、年齡、是否結(jié)婚、是否正在旅游等。這樣一個個的用戶在系統(tǒng)里就有了各自豐富的特征,這個過程形成了用戶畫像。圖5-16用戶畫像示意圖斑馬系統(tǒng)的典型應用就是朋友圈廣告人群定向投放系統(tǒng)。圖5-17朋友圈廣告人群定向投放系統(tǒng)示意圖朋友圈廣告包含了頭像、昵稱、圖片、文字等元素,用戶可以點贊、評論,降低了受眾廣告排斥度,提高了廣告的閱讀量。用戶對廣告點贊或評論后,能收到好友對該條廣告的最新點贊或評論的消息提醒,促使用戶與好友之間產(chǎn)生了有關廣告內(nèi)容的交流互動。(2)YouTube的廣告5.5.2生活中的大數(shù)據(jù)應用1.餐飲行業(yè)從屏芯科技餐飲云平臺中隨機選擇一家火鍋店,基于其過去一年的歷史數(shù)據(jù),即可進行菜品關聯(lián)分析。如果從不同的時間維度、就餐人數(shù)進行關聯(lián)分析和對比解讀,就可得出一些反映顧客消費習慣的有趣結(jié)論。圖5-19火鍋店暢銷菜品排名
左圖所示為某火鍋店暢銷菜品排名,其中列出了這家火鍋店在過去一年中的暢銷菜品以及每個菜品的支持度。圖5-20展示了在滿足最小支持度和置信度閾值情況下的菜品關聯(lián)分析結(jié)果,其中圓圈
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東水資源管理市場前景及投資研究報告
- 2025年超高壓電纜連接件項目可行性分析報告
- 2025年度裝修工程風險管理與保險合同
- 中國杭州市旅游行業(yè)市場發(fā)展現(xiàn)狀及投資規(guī)劃建議報告
- 2025年度綠色建筑節(jié)能改造裝修工程承包合同
- 2025年度食堂食品安全責任承包管理合同4篇
- 放射性物品運輸核與輻射安全分析報告書格式和內(nèi)容
- 2025年度智慧城市建設員工聘用合同書
- 2025年度屋頂綠化草坪設計、施工與維護一體化合同
- 2024-2025年中國步進系統(tǒng)行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y方向研究報告
- 產(chǎn)后抑郁癥講課課件
- 人工智能背景下高職五育并舉的人才培養(yǎng)研究
- 汽車行業(yè)維修記錄管理制度
- IQC檢驗作業(yè)指導書
- 城市自來水廠課程設計
- 重慶市2024年小升初語文模擬考試試卷(含答案)
- 2024智慧城市數(shù)據(jù)采集標準規(guī)范
- 【人教版】《勞動教育》七上 勞動項目一 疏通廚房下水管道 課件
- 2024特斯拉的自動駕駛系統(tǒng)FSD發(fā)展歷程、技術原理及未來展望分析報告
- 2024-2030年中國銀行人工智能行業(yè)市場深度調(diào)研及發(fā)展趨勢與投資前景研究報告
- 五屆全國智能制造應用技術技能大賽數(shù)字孿生應用技術員(智能制造控制技術方向)賽項實操樣題
評論
0/150
提交評論