2024年廣西職業(yè)院校技能大賽中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)樣題第2套_第1頁(yè)
2024年廣西職業(yè)院校技能大賽中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)樣題第2套_第2頁(yè)
2024年廣西職業(yè)院校技能大賽中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)樣題第2套_第3頁(yè)
2024年廣西職業(yè)院校技能大賽中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)樣題第2套_第4頁(yè)
2024年廣西職業(yè)院校技能大賽中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)樣題第2套_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024年廣西職業(yè)院校技能大賽

中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)

樣題第2套

一、背景描述

在當(dāng)今數(shù)字化飛速發(fā)展的時(shí)代,大數(shù)據(jù)技術(shù)在各行各業(yè)都

扮演著至關(guān)重要的角色,而在學(xué)校數(shù)據(jù)管理領(lǐng)域,大數(shù)據(jù)的應(yīng)

用更是愈發(fā)凸顯其重要性。學(xué)校作為一個(gè)龐大而復(fù)雜的組織體

系,擁有眾多的學(xué)生、教職工和各種資源,數(shù)據(jù)的產(chǎn)生和管理

變得日益龐大而復(fù)雜。因此,大數(shù)據(jù)技術(shù)的引入成為學(xué)校數(shù)據(jù)

治理的一項(xiàng)重要舉措。

在中職教育領(lǐng)域,大數(shù)據(jù)比賽的舉辦對(duì)學(xué)生、學(xué)校和整個(gè)

教育體系都具有重要的意義。首先,大數(shù)據(jù)比賽為中職學(xué)生提

供了一個(gè)實(shí)踐和展示自己技能的平臺(tái)。通過(guò)參與比賽,學(xué)生可

以運(yùn)用所學(xué)的大數(shù)據(jù)技術(shù)知識(shí),解決實(shí)際問(wèn)題,提高實(shí)際操作

能力。這不僅有助于加深學(xué)生對(duì)大數(shù)據(jù)領(lǐng)域的理解,還鍛煉了

他們的團(tuán)隊(duì)協(xié)作和問(wèn)題解決能力。

其次,中職大數(shù)據(jù)比賽有助于激發(fā)學(xué)生對(duì)科學(xué)技術(shù)的興趣。

通過(guò)實(shí)際操作和創(chuàng)新性的比賽內(nèi)容,學(xué)生更容易對(duì)大數(shù)據(jù)技術(shù)

產(chǎn)生濃厚的興趣,并在實(shí)踐中感受到這一領(lǐng)域的魅力。這種積

極的學(xué)習(xí)體驗(yàn)有助于激發(fā)學(xué)生對(duì)科技領(lǐng)域的興趣,培養(yǎng)創(chuàng)新意

識(shí),為其未來(lái)的職業(yè)發(fā)展奠定基礎(chǔ)。

另外,中職大數(shù)據(jù)比賽也為學(xué)校提供了一個(gè)展示自身教學(xué)

水平和培養(yǎng)優(yōu)秀學(xué)生的機(jī)會(huì)。優(yōu)異的比賽成績(jī)不僅可以提升學(xué)

校的聲譽(yù),還有助于吸引更多學(xué)生報(bào)考相關(guān)專業(yè)。同時(shí),學(xué)校

通過(guò)組織和支持學(xué)生參與大數(shù)據(jù)比賽,也能夠加深與企業(yè)、行

業(yè)的合作關(guān)系,促進(jìn)校企合作的深度發(fā)展。

總體而言,中職大數(shù)據(jù)比賽在推動(dòng)學(xué)生綜合素質(zhì)提升、促

進(jìn)科技創(chuàng)新、推動(dòng)學(xué)校發(fā)展等方面發(fā)揮著重要的作用。通過(guò)這

樣的比賽活動(dòng),中職教育能夠更好地適應(yīng)社會(huì)需求,培養(yǎng)更符

合產(chǎn)業(yè)發(fā)展需求的人才,為學(xué)生未來(lái)的職業(yè)生涯打下堅(jiān)實(shí)基礎(chǔ)。

二、模塊一:平臺(tái)搭建與運(yùn)維

(一)任務(wù)一:大數(shù)據(jù)平臺(tái)搭建

1.子任務(wù)一:Hadoop完全分布式安裝配置

本任務(wù)需要使用root用戶完成相關(guān)配置。打開競(jìng)賽平臺(tái)

的賽題資源的容器資源,利用智聯(lián)助手的SSH集成窗口打開容

器,基于競(jìng)賽平臺(tái)進(jìn)行完全分布式模式Hadoop的搭建和管理。

相關(guān)安裝文件在容器“/opt”目錄下,請(qǐng)選擇對(duì)應(yīng)的安裝包進(jìn)

行安裝,用不到的可忽略。主機(jī)名為master、slave1、slave2

的三臺(tái)節(jié)點(diǎn)都需要安裝JDK和Hadoop。

(1)在master節(jié)點(diǎn)執(zhí)行命令,創(chuàng)建jdk安裝目錄

“/data/jdk”和Hadoop安裝目錄“/data/hadoop”,執(zhí)行l(wèi)s

命令查看創(chuàng)建的目錄。提交創(chuàng)建目錄的命令和查看的結(jié)果截圖;

(2)在master節(jié)點(diǎn)執(zhí)行tar命令(請(qǐng)確保在解壓縮文件

時(shí),不要保留原始文件路徑中的第一個(gè)目錄層級(jí)),將節(jié)點(diǎn)中

“/opt”目錄下jdk安裝文件解壓到節(jié)點(diǎn)中的“/data/jdk”

目錄,將Hadoop安裝文件解壓到節(jié)點(diǎn)中的“/data/hadoop”

目錄,執(zhí)行l(wèi)s命令分別查看解壓后的文件。提交解壓命令和

查看的結(jié)果截圖;

(3)在三臺(tái)節(jié)點(diǎn)分別修改“/etc/hosts”配置,添加三

臺(tái)節(jié)點(diǎn)ip和主機(jī)名映射;配置ssh免密,實(shí)現(xiàn)master、slave1、

slave2三臺(tái)節(jié)點(diǎn)間相互免密登錄,在master節(jié)點(diǎn)執(zhí)行“ssh

slave1”命令和在slave2節(jié)點(diǎn)執(zhí)行“sshmaster”命令驗(yàn)證。

提交“/etc/hosts”配置截圖、在master執(zhí)行的免密命令和

執(zhí)行結(jié)果截圖、驗(yàn)證命令的結(jié)果截圖;

(4)在master節(jié)點(diǎn)使用scp命令并使用絕對(duì)路徑將jdk

目錄拷貝到slave1和slave2(若路徑不存在,則需新建),

并在三臺(tái)節(jié)點(diǎn)的“/etc/profile”文件中配置jdk環(huán)境變量并

使其生效,配置完畢后,在節(jié)點(diǎn)中執(zhí)行“java-version”命

令,檢測(cè)jdk是否安裝成功。提交scp命令、環(huán)境變量截圖和

使環(huán)境變量生效命令、檢測(cè)命令結(jié)果截圖;

(5)依次配置hadoop-env.sh、core-site.xml、workers

配置文件,其中NameNode的地址為master節(jié)點(diǎn),端口為9000,

master、slave1、slave2節(jié)點(diǎn)均作為DataNode,配置好相關(guān)

環(huán)境。在master節(jié)點(diǎn)使用scp命令將配置完的Hadoop安裝目

錄直接拷貝至slave1和slave2(若路徑不存在,則需新建),

在三臺(tái)節(jié)點(diǎn)的“/etc/profile”文件中配置Hadoop環(huán)境變量,

配置完畢后,在容器中執(zhí)行“hadoopversion”命令,檢測(cè)

Hadoop是否安裝成功。提交修改的配置內(nèi)容截圖、scp命令、

環(huán)境變量截圖、檢測(cè)命令結(jié)果截圖;

(6)在master節(jié)點(diǎn)初始化Hadoop環(huán)境namenode。提交

初始化命令和結(jié)果截圖;

(7)在master節(jié)點(diǎn)依次啟動(dòng)HDFS、YARN集群,在三個(gè)

節(jié)點(diǎn)分別執(zhí)行jps命令,查看節(jié)點(diǎn)中的進(jìn)程。提交jps查看結(jié)

果截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

2.子任務(wù)二:Flume安裝配置

本任務(wù)需要使用root用戶完成相關(guān)配置,已安裝Hadoop

及需要配置前置環(huán)境,具體要求如下:

(1)在節(jié)點(diǎn)中執(zhí)行命令,創(chuàng)建Flume安裝目錄

“/data/flume”,執(zhí)行l(wèi)s命令查看創(chuàng)建的目錄。提交創(chuàng)建目

錄命令、查看命令和結(jié)果截圖;

(2)在節(jié)點(diǎn)中執(zhí)行tar命令(請(qǐng)確保在解壓縮文件時(shí),

不要保留原始文件路徑中的第一個(gè)目錄層級(jí)),將“/opt”目

錄下Flume安裝文件解壓到節(jié)點(diǎn)中的“/data/flume”目錄,

在“/etc/profile”文件中配置Flume環(huán)境變量FLUME_HOME

和PATH的值并使其生效,執(zhí)行命令“flume-ngversion”檢

測(cè)Flume是否安裝成功。提交解壓命令、環(huán)境變量截圖、檢測(cè)

命令結(jié)果截圖;

(3)進(jìn)入$FLUME_HOME/conf目錄下,使用cp命令將

flume-env.sh.template文件復(fù)制一份,并重命名為

flume-env.sh;在$FLUME_HOME目錄下新建一份test.txt文件,

在文件中輸入內(nèi)容“這是一份flume的測(cè)試文檔”,在

$FLUME_HOME/conf目錄下新建file-flume-hdfs.conf,配置

flume將test.txt傳輸?shù)紿DFS的“/tmp/flume”目錄下,運(yùn)

行Flume并查看HDFS中“/tmp/flume”目錄下生成的內(nèi)容。

提交cp命令、file-flume-hdfs.conf配置內(nèi)容截圖、運(yùn)行

Flume的命令、查看HDFS目錄中文件的內(nèi)容的命令和結(jié)果截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

(二)任務(wù)二:數(shù)據(jù)庫(kù)配置維護(hù)

1.子任務(wù)一:數(shù)據(jù)庫(kù)配置

打開競(jìng)賽平臺(tái)的賽題資源的數(shù)據(jù)庫(kù)資源,利用智聯(lián)助手的

SSH集成窗口打開master節(jié)點(diǎn),基于競(jìng)賽平臺(tái)進(jìn)行MySQL的搭

建和管理。具體要求如下:

(1)在賽題資源的數(shù)據(jù)庫(kù)資源對(duì)應(yīng)的ip的節(jié)點(diǎn)中執(zhí)行命

令,創(chuàng)建MySQL安裝目錄“/data/mysql”;執(zhí)行tar命令,

將容器中“/opt”目錄下Mysql安裝文件解壓到“/data/mysql”

目錄,執(zhí)行l(wèi)s命令查看解壓后的文件。提交tar命令和ls結(jié)

果截圖;

(2)安裝好MySQL后,對(duì)數(shù)據(jù)庫(kù)進(jìn)行初始化,將$MYSQL/bin

目錄下的mysql腳本創(chuàng)建軟鏈到/usr/bin目錄,在

/etc/systemd/system目錄中配置mysql.service,配置開機(jī)

自啟動(dòng)并啟動(dòng)數(shù)據(jù)庫(kù)。提交初始化命令、創(chuàng)建軟鏈命令、

mysql.service配置內(nèi)容截圖、配置自啟動(dòng)命令、啟動(dòng)數(shù)據(jù)庫(kù)

結(jié)果截圖;

(3)使用root用戶和密碼登錄MySQL,然后將root用戶

的密碼修改為賽題資源的數(shù)據(jù)庫(kù)資源的密碼,配置授予root

用戶在任何主機(jī)('%')上連接時(shí)對(duì)所有數(shù)據(jù)庫(kù)(*.*)的全部

權(quán)限,并允許該用戶授予權(quán)限給其他用戶,配置完刷新權(quán)限。

提交修改密碼sql語(yǔ)句和結(jié)果截圖、配置授予權(quán)限sql語(yǔ)句和

結(jié)果截圖;

(4)連接數(shù)據(jù)庫(kù),先用sql創(chuàng)建一個(gè)“exam”數(shù)據(jù)庫(kù)(字

符集設(shè)置utf8mb4),再創(chuàng)建一個(gè)“test”新用戶,密碼與root

密碼一致,將“exam”數(shù)據(jù)庫(kù)權(quán)限授予“test”用戶,刷新權(quán)

限后用“test”賬號(hào)登錄數(shù)據(jù)庫(kù),執(zhí)行“showdatabases;”

命令查看數(shù)據(jù)庫(kù)。提交創(chuàng)庫(kù)sql語(yǔ)句、建用戶語(yǔ)句、授權(quán)語(yǔ)句、

“showdatabases;”的結(jié)果截圖;

(5)將“test”用戶刪除。提交刪除語(yǔ)句;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

2.子任務(wù)二:數(shù)據(jù)庫(kù)表維護(hù)

打開競(jìng)賽平臺(tái)的賽題資源的數(shù)據(jù)庫(kù)資源,利用智聯(lián)助手的

數(shù)據(jù)庫(kù)工具打開“exam”數(shù)據(jù)庫(kù),基于競(jìng)賽平臺(tái)進(jìn)行MySQL的

數(shù)據(jù)庫(kù)表維護(hù)。

(1)在MySQL數(shù)據(jù)庫(kù)的“exam”數(shù)據(jù)庫(kù)中創(chuàng)建

“athlete_events”數(shù)據(jù)表。數(shù)據(jù)表的表字段格式如下:

表1“athlete_events”的表字段結(jié)構(gòu)

字段類型注釋

Namevarchar名稱

Sexvarchar性別

Ageint年齡

Heightint身高

Weightint體重

Gamesvarchar賽事

Cityvarchar城市

Eventvarchar比賽項(xiàng)目

Medalvarchar獎(jiǎng)牌

提交建表sql語(yǔ)句和結(jié)果截圖;

(2)為“athlete_events”表添加數(shù)據(jù)記錄。記錄如下:

NameSeAgeHeightWeightGamesCityEventMedal

x

CaoM21160422016RiodeDivingMen'sGold

YuanSummerJaneiroSpringboard

ChenM20168602016RiodeDivingMen'sPlatformGold

AisenSummerJaneiro

ChenM27188812016RiodeBadmintonMen'sGold

LongSummerJaneiroSingles

ChenF27172632016RiodeSailingWomen'sSilver

PeinaSummerJaneiroWindsurfer

ChenochiShortTrackSpeedBronze

DequanWinterSkatingMen's5,000

metresRelay

JiaM22175702014SochiFreestyleSkiingMen'sBronze

ZongyanWinterAerials

g

CaiYunM32181682012LondonBadmintonMen'sGold

SummerDoubles

ZouKaiM24158552012LondonGymnasticsMen'sGold

SummerTeamAll-Around

ZhouF241751332012LondonWeightliftingWomen'sGold

LuluSummerSuper-Heavyweight

ZhangM24178702012LondonTableTennisMen'sGold

JikeSummerSingles

GuoF26157602010VancouFreestyleSkiingBronze

XinxinWinterverWomen'sAerials

LiNinaF27160522010VancouFreestyleSkiingSilver

WinterverWomen'sAerials

BaoF24172672008BeijingFencingWomen'sSilver

YingyingSummerSabre,Team

FengF29183752008BeijingVolleyballWomen'sBronze

KunSummerVolleyball

HanM22173752006TorinoFreestyleSkiingMen'sGold

XiaopenWinterAerials

g

ChenF28182752004AthinaVolleyballWomen'sGold

JingSummerVolleyball

ChenF21183732004AthinaTaekwondoWomen'sGold

ZhongSummerHeavyweight

ZhaoM28177752002SaltFigureSkatingMixedBronze

HongboWinterLakePairs

City

CaiYalinM23174602000SydneyShootingMen'sAirGold

SummerRifle,10metres

ChenF23158632000SydneyWeightliftingWomen'sGold

XiaominSummerMiddleweight

ChenLuF21162521998NaganoFigureSkatingBronze

WinterWomen'sSingles

HeQiF22178681996AtlantaVolleyballWomen'sSilver

SummerVolleyball

LuLinM27174601996AtlantaTableTennisMen'sSilver

SummerDoubles

LiM22157521996AtlantaGymnasticsMen'sGold

XiaoshuaSummerIndividualAll-Around

ng

YeF29168701994LillehaSpeedSkatingBronze

QiaoboWintermmerWomen's1,000metres

提交第一條數(shù)據(jù)的插入sql語(yǔ)句及所有數(shù)據(jù)添加結(jié)果截圖;

(3)新增“Year”字段(int),注釋為“年份”,將“Games”

字段中的年份數(shù)字提取到“Year”字段,并查詢“Year”在2000

年到2008年之間的數(shù)據(jù)。提交新增字段sql和結(jié)果截圖、提

取年份sql、查詢的sql和結(jié)果截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

3.子任務(wù)三:數(shù)據(jù)表查詢

(1)篩選出比賽項(xiàng)目為“VolleyballWomen'sVolleyball”

且身高大于“180”的數(shù)據(jù),并按照年份“Year”進(jìn)行升序排

序。提交sql和結(jié)果截圖;

(2)查詢2016年參賽人員年齡、身高和體重各自的最大

值、最小值和平均值。提交sql和結(jié)果截圖;

(3)按年份分組查詢每年參賽人員的男女人數(shù)各多少。

提交sql和結(jié)果截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

三、模塊二:數(shù)據(jù)獲取與處理

(一)任務(wù)一:數(shù)據(jù)獲取與清洗

1.子任務(wù)一:數(shù)據(jù)獲取

打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T1文件分類,

下載parse_athlete_events.py文件。賽題資源中靜態(tài)資源

athlete_events.html是奧運(yùn)會(huì)運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)列表內(nèi)

容,點(diǎn)擊進(jìn)入可打開網(wǎng)頁(yè)。parse_athlete_events.py為Python

腳本文件,程序讀取athlete_events.html,使用lxml對(duì)網(wǎng)頁(yè)

進(jìn)行解析,提取相應(yīng)的列表數(shù)據(jù),并將結(jié)果輸出。

(1)用競(jìng)賽平臺(tái)智聯(lián)助手的python腳本工具打開

parse_athlete_events.py文件,補(bǔ)全文件中【1】代碼,配置

公共資源地址url。提交url地址代碼;

(2)使用瀏覽器打開賽題資源中靜態(tài)資源文件

athlete_events.html網(wǎng)頁(yè)文件,通過(guò)“審查”工具進(jìn)行網(wǎng)頁(yè)

結(jié)構(gòu)分析。補(bǔ)全parse_athlete_events.py中【2】代碼,實(shí)

現(xiàn)獲取奧運(yùn)會(huì)運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)div列表。提交補(bǔ)全代碼;

(3)補(bǔ)全parse_athlete_events.py中【3】~【5】代碼,

實(shí)現(xiàn)“text”,“舉辦城市”和“代表隊(duì)伍”文本內(nèi)容提取。

提交補(bǔ)全代碼;

(4)運(yùn)行parse_athlete_events.py腳本,完成奧運(yùn)會(huì)

運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)列表的解析并打印輸出。提交運(yùn)行結(jié)果

截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

2.子任務(wù)二:數(shù)據(jù)處理

打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T1文件分類,

下載athlete_events.csv文件。通過(guò)編寫python代碼完成對(duì)

相關(guān)數(shù)據(jù)文件中數(shù)據(jù)的清洗和整理。請(qǐng)分析相關(guān)數(shù)據(jù)集,根據(jù)

題目規(guī)定要求實(shí)現(xiàn)數(shù)據(jù)處理,具體要求如下:

(1)查看athlete_events.csv中數(shù)據(jù)總數(shù)、標(biāo)準(zhǔn)差、均

值、最小值、四分之一分位數(shù)、二分之一分位數(shù)、四分之三分

位數(shù)和最大值。提交代碼截圖和結(jié)果截圖;

(2)對(duì)athlete_events.csv文件進(jìn)行處理,對(duì)于Age列

數(shù)據(jù),采用“Age”填充缺失值,并將年齡數(shù)字大于等于90的

數(shù)據(jù)刪除,然后存入athlete_events_c1.csv中。提交代碼截

圖;

(3)對(duì)athlete_events_c1.csv文件進(jìn)行處理,對(duì)于

Height列和Weight列數(shù)據(jù),將缺失值的數(shù)據(jù)刪除,然后存入

athlete_events_c2.csv中。提交代碼截圖;

(4)對(duì)athlete_events_c2.csv文件進(jìn)行處理,對(duì)于

Weight列數(shù)據(jù),小數(shù)點(diǎn)后超過(guò)一位數(shù)的數(shù)據(jù),將小數(shù)四舍五入

改為一位數(shù),然后存入athlete_events_c3.csv中。提交代碼

截圖;

將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

(二)任務(wù)二:數(shù)據(jù)標(biāo)注

對(duì)athlete_events_c3.csv進(jìn)行標(biāo)注,判斷運(yùn)動(dòng)員是否獲

得獎(jiǎng)牌,具體的標(biāo)注規(guī)則如下:

(1)如果“Medal”列數(shù)據(jù)不為空,則數(shù)據(jù)標(biāo)注為“yes”;

(2)如果“Medal”列數(shù)據(jù)為空,則數(shù)據(jù)標(biāo)注為“no”;

標(biāo)注好的數(shù)據(jù)存儲(chǔ)為列“Have_Medal”并和

athlete_events_c3.csv數(shù)據(jù)合并存入result.csv。提交代碼

截圖和csv文件;

將上述任務(wù)的結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上傳中對(duì)

應(yīng)的任務(wù)序號(hào)下。

(三)任務(wù)三:數(shù)據(jù)統(tǒng)計(jì)

1.子任務(wù)一:處理異常數(shù)據(jù)

打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T3文件分類,

下載TravelInsurancePrediction.csv文件。該文件存儲(chǔ)了旅

游保險(xiǎn)預(yù)測(cè)相關(guān)數(shù)據(jù),數(shù)據(jù)中有以下內(nèi)容:

Age:年齡,int類型

EmploymentType:職業(yè)種類,varchar類型

GraduateOrNot:是否畢業(yè)生,varchar類型

AnnualIncome:年收入,int類型

FamilyMembers:家庭成員,int類型

ChronicDiseases:是否有慢性病,int類型

FrequentFlyer:是否經(jīng)常坐飛機(jī),varchar類型

EverTravelledAbroad:曾經(jīng)出國(guó)旅游,varchar類型

TravelInsurance:是否購(gòu)買旅游保險(xiǎn),int類型

編寫MapReduce程序,實(shí)現(xiàn)以下功能:清除曾經(jīng)有出國(guó)旅

游的人員數(shù)據(jù),在控制臺(tái)按順序打印輸出前20條數(shù)據(jù),輸出

結(jié)果到HDFS,使用命令查看結(jié)果。提交代碼截圖和結(jié)果截圖;

將上述任務(wù)的程序和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

2.子任務(wù)二:數(shù)據(jù)統(tǒng)計(jì)

使用競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T3文件分類

的TravelInsurancePrediction.csv文件,編寫MapReduce程

序,實(shí)現(xiàn)以下功能:根據(jù)“GraduateOrNot”字段統(tǒng)計(jì)畢業(yè)生

與非畢業(yè)生人數(shù),并在控制臺(tái)輸出,輸出結(jié)果到HDFS,使用命

令查看結(jié)果。提交代碼截圖和結(jié)果截圖;

將上述任務(wù)的程序和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)

果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

四、模塊三:數(shù)據(jù)分析與可視化

(一)任務(wù)一:數(shù)據(jù)分析與可視化

使用競(jìng)賽平臺(tái)可視化工具或者下載可視化操作文件至本

地進(jìn)行代碼編寫并以圖表展示。

1.子任務(wù)一:柱狀圖數(shù)據(jù)分析與可視化

使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱

狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源

P2-M3-T1-SUBT1文件分類,下載visualization.zip文件至本

地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2008年得獎(jiǎng)數(shù)

量前十的國(guó)家數(shù)據(jù)進(jìn)行可視化展示:

【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】

(1)編寫補(bǔ)充yAxis對(duì)象,獲取相關(guān)數(shù)據(jù)中barData數(shù)

據(jù),設(shè)置y軸顯示類型為“類目軸”、設(shè)置坐標(biāo)軸文字顏色值

為:#999999,大小為:12、設(shè)置坐標(biāo)軸在grid區(qū)域中的分

隔線顏色為:#CAD3E0,線的類型為:虛線、設(shè)置y軸顯示數(shù)

據(jù)為"2008年得獎(jiǎng)數(shù)量前十的國(guó)家名稱"。

(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中barData數(shù)

據(jù),設(shè)置圖表顯示類型為柱狀圖、設(shè)置系列名稱為“獎(jiǎng)牌數(shù)量”、

設(shè)置柱條的寬度為20,背景顏色為:rgba(180,180,180,0.2)、

將"2008年得獎(jiǎng)數(shù)量前十的國(guó)家",barData對(duì)象中的數(shù)據(jù)設(shè)置

為柱狀圖顯示數(shù)據(jù)。

(3)附上“2008年得獎(jiǎng)數(shù)量前十的國(guó)家柱狀圖”截圖與

相關(guān)代碼截圖。

【本地操作】

解壓visualization.zip文件至本地,根據(jù)

visualization/data/data.js文件中barData對(duì)象中的數(shù)據(jù),

補(bǔ)充完整visualization/js/chat.js文件中g(shù)etBarChart()

函數(shù)的代碼

(1)編寫補(bǔ)充yAxis對(duì)象,獲取barData數(shù)據(jù),設(shè)置y

軸顯示類型為“類目軸”、設(shè)置坐標(biāo)軸文字顏色值為:#999999,

大小為:12、設(shè)置坐標(biāo)軸在grid區(qū)域中的分隔線顏色為:

#CAD3E0,線的類型為:虛線、設(shè)置y軸顯示數(shù)據(jù)為"2008年得

獎(jiǎng)數(shù)量前十的國(guó)家名稱"。

(2)編寫補(bǔ)充series對(duì)象,獲取barData數(shù)據(jù),設(shè)置圖

表顯示類型為柱狀圖、設(shè)置系列名稱為“獎(jiǎng)牌數(shù)量”、設(shè)置柱

條的寬度為20,背景顏色為:rgba(180,180,180,0.2)、將

"2008年得獎(jiǎng)數(shù)量前十的國(guó)家",barData對(duì)象中的數(shù)據(jù)設(shè)置為

柱狀圖顯示數(shù)據(jù)。

(3)運(yùn)行網(wǎng)頁(yè),附上“2008年得獎(jiǎng)數(shù)量前十的國(guó)家柱狀

圖”截圖與相關(guān)代碼截圖。

將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上

傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

2.子任務(wù)二:折線圖數(shù)據(jù)分析與可視化

使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱

狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源

P2-M3-T1-SUBT2文件分類,下載visualization.zip文件至本

地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)中國(guó)在各屆夏季

奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量變化數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)如下:

【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】

(1)編寫補(bǔ)充tooltip對(duì)象,設(shè)置提示框組件的觸發(fā)類

型為坐標(biāo)軸觸發(fā)、設(shè)置指示器類型為:直線指示器、設(shè)置提示

框浮層的文字顏色:#666666,字體大小為:12。

(2)編寫補(bǔ)充xAxis對(duì)象,獲取相關(guān)數(shù)據(jù)中l(wèi)ineData數(shù)

據(jù),設(shè)置X軸顯示類型為“類目軸”、設(shè)置坐標(biāo)文字顯示

為:#999999,文字大小設(shè)置為:12,文字間隔為0,文字傾斜

角度為40度、設(shè)置X軸顯示坐標(biāo)為“各界夏季奧運(yùn)會(huì)”。

(3)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中l(wèi)ineData

數(shù)據(jù),設(shè)置圖表顯示類型為'line'、設(shè)置線條顯示平滑,標(biāo)記

大小為6的三角形、設(shè)置折線圖文字顯示(將文字顏色設(shè)置為

#999999,文字大小設(shè)置為:12)、將"中國(guó)在各屆夏季奧運(yùn)會(huì)

上的獎(jiǎng)牌數(shù)量"對(duì)象中的數(shù)據(jù)設(shè)置為折線顯示數(shù)據(jù)。

(4)附上“中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量變化折

線圖”截圖與相關(guān)代碼截圖。

【本地操作】

解壓visualization.zip文件至本地,根據(jù)

visualization/data/data.js文件中l(wèi)ineData對(duì)象中的數(shù)據(jù),

補(bǔ)充完整visualization/js/chat.js文件中g(shù)etLineChart()

函數(shù)的代碼

(1)編寫補(bǔ)充tooltip對(duì)象,設(shè)置提示框組件的觸發(fā)類

型為坐標(biāo)軸觸發(fā)、設(shè)置指示器類型為:直線指示器、設(shè)置提示

框浮層的文字顏色:#666666,字體大小為:12。

(2)編寫補(bǔ)充xAxis對(duì)象,獲取lineData數(shù)據(jù),設(shè)置X

軸顯示類型為“類目軸”、設(shè)置坐標(biāo)文字顯示為:#999999,文

字大小設(shè)置為:12,文字間隔為0,文字傾斜角度為40度、設(shè)

置X軸顯示坐標(biāo)為“各界夏季奧運(yùn)會(huì)”。

(3)編寫補(bǔ)充series對(duì)象,獲取lineData數(shù)據(jù),設(shè)置

圖表顯示類型為'line'、設(shè)置線條顯示平滑,標(biāo)記大小為6的

三角形、設(shè)置折線圖文字顯示(將文字顏色設(shè)置為#999999,文

字大小設(shè)置為:12)、將"中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量

"對(duì)象中的數(shù)據(jù)設(shè)置為折線顯示數(shù)據(jù)。

(4)運(yùn)行網(wǎng)頁(yè),附上“中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌

數(shù)量變化折線圖”截圖與相關(guān)代碼截圖。

將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上

傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

3.子任務(wù)三:餅圖數(shù)據(jù)分析與可視化

使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱

狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源

P2-M3-T1-SUBT3文件分類,下載visualization.zip文件至本

地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2016夏季奧運(yùn)

會(huì)運(yùn)動(dòng)員年齡分布數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)如下:

【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】

(1)編寫補(bǔ)充legend對(duì)象,獲取相關(guān)數(shù)據(jù)中pieData數(shù)

據(jù),設(shè)置圖例的朝向?yàn)椋捍怪憋@示、設(shè)置圖例在X軸方向上的

位置為右、設(shè)置圖例上顯示的文字信息為:年齡段,圖例項(xiàng)的

圖標(biāo)都設(shè)置為圓形、設(shè)置圖例文字顏色為:#999999,大小為:

12。

(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中pieData數(shù)

據(jù),設(shè)置圖表類型為'pie'、設(shè)置系列名稱為'2016夏季奧運(yùn)會(huì)

運(yùn)動(dòng)員年齡分布'、設(shè)置餅圖半徑為['30%','70%']、設(shè)置餅

圖高亮狀態(tài),標(biāo)簽文字顏色:#999999,大?。?4,居中顯示、

將'2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布'對(duì)象中的數(shù)據(jù)設(shè)置為餅

圖顯示數(shù)據(jù)。

(3)附上“2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布餅圖”截圖

與相關(guān)代碼截圖。

【本地操作】

解壓visualization.zip文件至本地,根據(jù)

visualization/data/data.js文件中pieData對(duì)象中的數(shù)據(jù),

補(bǔ)充完整visualization/js/chat.js文件中g(shù)etPieChart()

函數(shù)的代碼

(1)編寫補(bǔ)充legend對(duì)象,獲取pieData數(shù)據(jù),設(shè)置圖

例的朝向?yàn)椋捍怪憋@示、設(shè)置圖例在X軸方向上的位置為右、

設(shè)置圖例上顯示的文字信息為:年齡段,圖例項(xiàng)的圖標(biāo)都設(shè)置

為圓形、設(shè)置圖例文字顏色為:#999999,大小為:12。

(2)編寫補(bǔ)充series對(duì)象,獲取pieData數(shù)據(jù),設(shè)置圖

表類型為'pie'、設(shè)置系列名稱為'2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡

分布'、設(shè)置餅圖半徑為['30%','70%']、設(shè)置餅圖高亮狀態(tài),

標(biāo)簽文字顏色:#999999,大?。?4,居中顯示、將'2016夏季

奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布'對(duì)象中的數(shù)據(jù)設(shè)置為餅圖顯示數(shù)據(jù)。

(3)運(yùn)行網(wǎng)頁(yè),附上“2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布

餅圖”截圖與相關(guān)代碼截圖。

將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上

傳中對(duì)應(yīng)的任務(wù)序號(hào)下。

4.子任務(wù)四:雷達(dá)圖數(shù)據(jù)分析與可視化

使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱

狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源

P2-M3-T1-SUBT4文件分類,下載visualization.zip文件至本

地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2016奧運(yùn)會(huì)男

籃各國(guó)年齡、身高、體重平均值數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)

如下:

【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】

(1)編寫補(bǔ)充radar對(duì)象,設(shè)置雷達(dá)圖的中心(圓心)

坐標(biāo)為百分比形式,第一項(xiàng)為相對(duì)于容器寬度50%,第二項(xiàng)為相

對(duì)于容器高度70%、設(shè)置雷達(dá)圖的外半徑值為180、設(shè)置雷達(dá)

圖的指示器,分別為:Age、Height、Weight,設(shè)置最大值分

別為:39、218、137。

(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中radarData

數(shù)據(jù),設(shè)置圖表顯示類型為'radar'、設(shè)置標(biāo)記的圖形為

'triangle',標(biāo)記的大小為10、將

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論