廈門大學(xué)林子雨編著_第1頁
廈門大學(xué)林子雨編著_第2頁
廈門大學(xué)林子雨編著_第3頁
廈門大學(xué)林子雨編著_第4頁
廈門大學(xué)林子雨編著_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作(版本號(hào):2016年5月14日版本)主講教師:林子雨廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室二零一六年五月目錄

目錄1 實(shí)驗(yàn)?zāi)康?12 實(shí)驗(yàn)平臺(tái) 13 實(shí)驗(yàn)內(nèi)容和要求 14 實(shí)驗(yàn)報(bào)告 1附錄1:任課教師介紹 2附錄2:課程教材介紹 2附錄3:中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái)介紹 3廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作 主講教師:林子雨/linziyu第1頁

廈門大學(xué)林子雨編著《大數(shù)據(jù)技術(shù)原理與應(yīng)用》教材配套機(jī)房上機(jī)實(shí)驗(yàn)指南實(shí)驗(yàn)3第四章熟悉常用的HBase操作主講教師:林子雨E-mail:ziyulin@個(gè)人主頁:/linziyu實(shí)驗(yàn)?zāi)康?. 理解HBase在Hadoop體系結(jié)構(gòu)中的角色;2. 熟練使用HBase操作常用的Shell命令;3. 熟悉HBase操作常用的JavaAPI。實(shí)驗(yàn)平臺(tái)操作系統(tǒng):LinuxHadoop版本:2.6.0或以上版本HBase版本:1.1.2或以上版本JDK版本:1.6或以上版本JavaIDE:Eclipse實(shí)驗(yàn)內(nèi)容和要求編程實(shí)現(xiàn)以下指定功能,并用Hadoop提供的HBaseShell命令完成相同任務(wù):列出HBase所有的表的相關(guān)信息,例如表名;在終端打印出指定的表的所有記錄數(shù)據(jù);向已經(jīng)創(chuàng)建好的表添加和刪除指定的列族或列;清空指定的表的所有記錄數(shù)據(jù);統(tǒng)計(jì)表的行數(shù)?,F(xiàn)有以下關(guān)系型數(shù)據(jù)庫中的表和數(shù)據(jù),要求將其轉(zhuǎn)換為適合于HBase存儲(chǔ)的表并插入數(shù)據(jù):學(xué)生表(Student)學(xué)號(hào)(S_No)姓名(S_Name)性別(S_Sex)年齡(S_Age)2015001Zhangsanmale232015003Maryfemale222015003Lisimale24課程表(Course)課程號(hào)(C_No)課程名(C_Name)學(xué)分(C_Credit)123001Math2.0123002ComputerScience5.0123003English3.0選課表(SC)學(xué)號(hào)(SC_Sno)課程號(hào)(SC_Cno)成績(SC_Score)201500112300186201500112300369201500212300277201500212300399201500312300198201500312300295同時(shí),請(qǐng)編程完成以下指定功能:(1)createTable(StringtableName,String[]fields) 創(chuàng)建表,參數(shù)tableName為表的名稱,字符串?dāng)?shù)組fields為存儲(chǔ)記錄各個(gè)域名稱的數(shù)組。要求當(dāng)HBase已經(jīng)存在名為tableName的表的時(shí)候,先刪除原有的表,然后再創(chuàng)建新的表。 (2)addRecord(StringtableName,Stringrow,String[]fields,String[]values) 向表tableName、行row(用S_Name表示)和字符串?dāng)?shù)組files指定的單元格中添加對(duì)應(yīng)的數(shù)據(jù)values。其中fields中每個(gè)元素如果對(duì)應(yīng)的列族下還有相應(yīng)的列限定符的話,用“columnFamily:column”表示。例如,同時(shí)向“Math”、“ComputerScience”、“English”三列添加成績時(shí),字符串?dāng)?shù)組fields為{“Score:Math”,”Score;ComputerScience”,”Score:English”},數(shù)組values存儲(chǔ)這三門課的成績。 (3)scanColumn(StringtableName,Stringcolumn) 瀏覽表tableName某一列的數(shù)據(jù),如果某一行記錄中該列數(shù)據(jù)不存在,則返回null。要求當(dāng)參數(shù)column為某一列族名稱時(shí),如果底下有若干個(gè)列限定符,則要列出每個(gè)列限定符代表的列的數(shù)據(jù);當(dāng)參數(shù)column為某一列具體名稱(例如“Score:Math”)時(shí),只需要列出該列的數(shù)據(jù)。 (4)modifyData(StringtableName,Stringrow,Stringcolumn) 修改表tableName,行row(可以用學(xué)生姓名S_Name表示),列column指定的單元格的數(shù)據(jù)。(5)deleteRow(StringtableName,Stringrow) 刪除表tableName中row指定的行的記錄。利用HBase和MapReduce完成如下任務(wù):假設(shè)HBase有2張表,表的邏輯視圖及部分?jǐn)?shù)據(jù)如下所示:表邏輯視圖及部分?jǐn)?shù)據(jù)書名(bookName)價(jià)格(price)DatabaseSystemConcept30$ThinkinginJava60$DataMining25$要求:從HBase讀出上述兩張表的數(shù)據(jù),對(duì)“price”的排序,并將結(jié)果存儲(chǔ)到HBase中。實(shí)驗(yàn)報(bào)告《大數(shù)據(jù)技術(shù)原理與應(yīng)用》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問題:解決方案(列出遇到的問題和解決辦法,列出沒有解決的問題):附錄1:任課教師介紹林子雨(1978-),男,博士,廈門大學(xué)計(jì)算機(jī)科學(xué)系助理教授,主要研究領(lǐng)域?yàn)閿?shù)據(jù)庫,實(shí)時(shí)主動(dòng)數(shù)據(jù)倉庫,數(shù)據(jù)挖掘.主講課程:《大數(shù)據(jù)技術(shù)基礎(chǔ)》辦公地點(diǎn):廈門大學(xué)海韻園科研2號(hào)樓E-mail:ziyulin@個(gè)人主頁:/linziyu數(shù)據(jù)庫實(shí)驗(yàn)室網(wǎng)站:附錄2:課程教材介紹《大數(shù)據(jù)技術(shù)原理與應(yīng)用——概念、存儲(chǔ)、處理、分析與應(yīng)用》,由廈門大學(xué)計(jì)算機(jī)科學(xué)系教師林子雨博士編著,是中國高校第一本系統(tǒng)介紹大數(shù)據(jù)知識(shí)的專業(yè)教材。本書定位為大數(shù)據(jù)技術(shù)入門教材,為讀者搭建起通向“大數(shù)據(jù)知識(shí)空間”的橋梁和紐帶,以“構(gòu)建知識(shí)體系、闡明基本原理、引導(dǎo)初級(jí)實(shí)踐、了解相關(guān)應(yīng)用”為原則,為讀者在大數(shù)據(jù)領(lǐng)域“深耕細(xì)作”奠定基礎(chǔ)、指明方向。全書共有13章,系統(tǒng)地論述了大數(shù)據(jù)的基本概念、大數(shù)據(jù)處理架構(gòu)Hadoop、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫HBase、NoSQL數(shù)據(jù)庫、云數(shù)據(jù)庫、分布式并行編程模型MapReduce、流計(jì)算、圖計(jì)算、數(shù)據(jù)可視化以及大數(shù)據(jù)在互聯(lián)網(wǎng)、生物醫(yī)學(xué)和物流等各個(gè)領(lǐng)域的應(yīng)用。在Hadoop、HDFS、HBase和MapReduce等重要章節(jié),安排了入門級(jí)的實(shí)踐操作,讓讀者更好地學(xué)習(xí)和掌握大數(shù)據(jù)關(guān)鍵技術(shù)。本書可以作為高等院校計(jì)算機(jī)專業(yè)、信息管理等相關(guān)專業(yè)的大數(shù)據(jù)課程教材,也可供相關(guān)技術(shù)人員參考、學(xué)習(xí)、培訓(xùn)之用。歡迎訪問《大數(shù)據(jù)技術(shù)原理與應(yīng)用——概念、存儲(chǔ)、處理、分析與應(yīng)用》教材官方網(wǎng)站:/post/bigdata掃一掃訪問教材官網(wǎng)附錄3:中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái)介紹中國高校大數(shù)據(jù)課程公共服務(wù)平臺(tái),由中國高校首個(gè)“數(shù)字教師”的提出者和建設(shè)者——林子雨老師發(fā)起,由廈門大學(xué)數(shù)據(jù)庫實(shí)驗(yàn)室全力打造,由廈門大學(xué)云計(jì)算與大數(shù)據(jù)研究中心、海峽云計(jì)算與大數(shù)據(jù)應(yīng)用研究中心攜手共建。這是國內(nèi)第一個(gè)服務(wù)于高校大數(shù)據(jù)課程建設(shè)的公共服務(wù)平臺(tái),旨在促進(jìn)國內(nèi)高校大數(shù)據(jù)課程體系建設(shè),提高大數(shù)據(jù)課程教學(xué)水平,降低大數(shù)據(jù)課程學(xué)習(xí)門檻,提升學(xué)生課程學(xué)習(xí)效果。平臺(tái)服務(wù)對(duì)象涵蓋高校、教師和學(xué)生。平臺(tái)為高校開設(shè)大數(shù)據(jù)課程提供全流程輔助,為教師開展教學(xué)工作提供一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論