數據與大數據教學課件-1_第1頁
數據與大數據教學課件-1_第2頁
數據與大數據教學課件-1_第3頁
數據與大數據教學課件-1_第4頁
數據與大數據教學課件-1_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

情境引入基于歷史數據,利用數據建模定量分析不同球員特點,合理搭配,重新組隊;打破傳統(tǒng)思維,通過分析比賽數據,尋找“性價比”最高球員,運用數據取得成功;布拉德?皮特主演的《點球成金》是一部美國奧斯卡獲獎影片,所講述的是皮特扮演的棒球隊總經理利用計算機數據分析,對球隊進行了翻天覆地的改造,讓一家不起眼的小球隊能夠取得巨大的成功。情境引入互聯網、移動網絡、物聯網等每天都產生著大量數據,這些數據規(guī)模巨大、格式多樣,已經很難用傳統(tǒng)的方式進行處理。于是,大數據技術應運而生,通過分析、挖掘這些數據,發(fā)現其蘊藏的價值。情境引入引用資源中的附件3:智慧校園解決方案視頻討論交流話題:

天氣預報越來越準確了,準確率可以達100%嗎?從天氣預報的發(fā)展、設備、技術、數據方面進行描述知識講解什么是大數據?了解數據的采集和來源有哪些?數據的方式有哪些?是不是數據量大就是大數據?引用資源中的附件4:《3分鐘讓你認識什么是大數據》視頻知識講解什么是大數據?其實很簡單,大數據其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產生的數據,在大數據時代,任何微小的數據都可能產生不可思議的價值。大數據代表著信息量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值。知識講解大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。數量(volume):TB\PB\EB\ZB僅供開采162年僅供開采45年僅供開采60年不可再生資源VS數據過去3年數據總量比以往4萬年還多2013年,10分鐘的信息總量將達1.8ZB2010年全球數據總量1.2ZB,年增長50%數據不再是社會生產的“副產物”,而是可被二次乃至多次加工的原料,從中可以探索更大價值,它變成了生產資料。問題思考大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。1Byte1KB1MB1GB1TB1PB1EB1ZB1YB1PB相當于50%的全美學術研究圖書館藏書信息內容5EB相當于至今全世界人類所講過的話語1ZB如同全世界海灘上的沙子數量總和1YB相當于7000位人類體內的微細胞總和一般情況下,大數據是以PB、EB、ZB為單位進行計量的問題1:現在為什么現在闖紅燈等違規(guī)行為越來越少了?問題2:請你估算一下一天產生的數據量有多少?知識講解大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。速度(Velocity):數據產生的速度快,數據處理的速度快知識講解大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。多樣(Variety):人工產生的,機器自動產生知識講解大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。多樣(Variety):人工產生的,機器自動產生行業(yè)/企業(yè)內數據互聯網數據物聯網數據大數據數據來源多企業(yè)內部多個應用系統(tǒng)的數據、互聯網和物聯網的興起,帶來了微博、社交網站、傳感器等多種來源。數據類型多保存在關系數據庫中的結構化數據只占少數,70~80%的數據是如圖片、音頻、視頻、模型、連接信息、文檔等非結構化和半結構化數據。關聯性強數據之間頻繁交互,比如游客在旅行途中上傳的圖片和日志,就與游客的位置、行程等信息有了很強的關聯性。知識講解大數據的特征:4V,數量(volume)、速度(Velocity)、多樣(Variety)和價值(Value)。價值(Value):價值密度低,大量的視頻記錄下來,有許多冗余挖掘大數據的價值類似沙里淘金,從海量數據中挖掘稀疏但珍貴的信息;價值密度低,是大數據的一個典型特征;大數據不僅僅是技術,關鍵是產生價值可以從各個層面進行優(yōu)化,更要考慮整體討論交流女性,尤其當今女大學生是人力資源中不可缺少的組成部分.職場中女性面臨著調和家庭與事業(yè)兩方面矛盾的問題.就女大學生職業(yè)生涯規(guī)劃的內容而言,主要集中在三方面:現代女性職業(yè)發(fā)展的困境;女大學生的職業(yè)定位與外界影響;如何促進女大學生職業(yè)生涯的發(fā)展問題。想要設計一個性別對女大學生職業(yè)生涯規(guī)劃影響的調查研究,具體怎么做?知識講解更好不是因果關系而是相關關系更多不是隨機樣本而是全部數據更雜不是精確性而是混雜性大數據的思維變革知識講解大數據的思維變革人口大普查全數據模式隨機采樣樣本模式大數據應用全數據模式是指在國家統(tǒng)一規(guī)定的時間內,按照統(tǒng)一的方法、統(tǒng)一的項目、統(tǒng)一的調查表和統(tǒng)一的標準時點,對全國人口普遍地、逐戶逐人地進行的一次性調查登記;主要特點是調查組織高度集中性,普查對象的全面完整性;人口大普查耗時耗費,一般來講是十年一次,新中國成立以來共進行了6次人口大普查;人口大普查是一種典型的全數據模式;大數據時代小數據時代知識講解大數據的思維變革人口大普查全數據模式隨機采樣樣本模式大數據應用全數據模式人口大普查是一種耗時耗費的工程,一般是以十年為單位;各國每年需要進行幾百次的小規(guī)模人口調查,采取隨機采樣分析的方式,這是一種樣本模式;源于實用并且很好的創(chuàng)新!隨機采樣分析是小數據時代的產物;大數據時代小數據時代知識講解大數據的思維變革人口大普查全數據模式隨機采樣樣本模式大數據應用全數據模式我們已具備了大數據的各種技術能力,思維需要轉換到大數據的全數據模式:樣本=全部;大數據不用隨機分析法這樣的捷徑,而采用所有數據的方法;這里的“大”是相對的——相撲比賽所有數據存儲還不需要一個TB,但是是所有的數據!在大數據時代采用隨機采樣法,就像在汽車時代騎馬一樣,雖然特定情況下仍可采樣隨機采樣法,但是慢慢地我們會放棄它;大數據時代小數據時代案例分析出行大數據繪制的“城市星云圖”是這樣的!案例分析出行大數據繪制的“城市星云圖”是這樣的!案例分析阿里釘釘大數據案例分析引用資源中的附件5:如何在大數據里掘金?視頻討論交流馬云說數據重要、李彥宏說算法重要、馬化騰說場景重要,大家說的矛盾嗎?你是怎么理解的?大數據給社會帶來了哪些影響?引用資源中的附件6:馬化騰專

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論