




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2024年廣西職業(yè)院校技能大賽
中職組《大數(shù)據(jù)應(yīng)用與服務(wù)》賽項(xiàng)
樣題第2套
一、背景描述
在當(dāng)今數(shù)字化飛速發(fā)展的時(shí)代,大數(shù)據(jù)技術(shù)在各行各業(yè)都
扮演著至關(guān)重要的角色,而在學(xué)校數(shù)據(jù)管理領(lǐng)域,大數(shù)據(jù)的應(yīng)
用更是愈發(fā)凸顯其重要性。學(xué)校作為一個(gè)龐大而復(fù)雜的組織體
系,擁有眾多的學(xué)生、教職工和各種資源,數(shù)據(jù)的產(chǎn)生和管理
變得日益龐大而復(fù)雜。因此,大數(shù)據(jù)技術(shù)的引入成為學(xué)校數(shù)據(jù)
治理的一項(xiàng)重要舉措。
在中職教育領(lǐng)域,大數(shù)據(jù)比賽的舉辦對(duì)學(xué)生、學(xué)校和整個(gè)
教育體系都具有重要的意義。首先,大數(shù)據(jù)比賽為中職學(xué)生提
供了一個(gè)實(shí)踐和展示自己技能的平臺(tái)。通過(guò)參與比賽,學(xué)生可
以運(yùn)用所學(xué)的大數(shù)據(jù)技術(shù)知識(shí),解決實(shí)際問(wèn)題,提高實(shí)際操作
能力。這不僅有助于加深學(xué)生對(duì)大數(shù)據(jù)領(lǐng)域的理解,還鍛煉了
他們的團(tuán)隊(duì)協(xié)作和問(wèn)題解決能力。
其次,中職大數(shù)據(jù)比賽有助于激發(fā)學(xué)生對(duì)科學(xué)技術(shù)的興趣。
通過(guò)實(shí)際操作和創(chuàng)新性的比賽內(nèi)容,學(xué)生更容易對(duì)大數(shù)據(jù)技術(shù)
產(chǎn)生濃厚的興趣,并在實(shí)踐中感受到這一領(lǐng)域的魅力。這種積
極的學(xué)習(xí)體驗(yàn)有助于激發(fā)學(xué)生對(duì)科技領(lǐng)域的興趣,培養(yǎng)創(chuàng)新意
識(shí),為其未來(lái)的職業(yè)發(fā)展奠定基礎(chǔ)。
另外,中職大數(shù)據(jù)比賽也為學(xué)校提供了一個(gè)展示自身教學(xué)
水平和培養(yǎng)優(yōu)秀學(xué)生的機(jī)會(huì)。優(yōu)異的比賽成績(jī)不僅可以提升學(xué)
校的聲譽(yù),還有助于吸引更多學(xué)生報(bào)考相關(guān)專業(yè)。同時(shí),學(xué)校
通過(guò)組織和支持學(xué)生參與大數(shù)據(jù)比賽,也能夠加深與企業(yè)、行
業(yè)的合作關(guān)系,促進(jìn)校企合作的深度發(fā)展。
總體而言,中職大數(shù)據(jù)比賽在推動(dòng)學(xué)生綜合素質(zhì)提升、促
進(jìn)科技創(chuàng)新、推動(dòng)學(xué)校發(fā)展等方面發(fā)揮著重要的作用。通過(guò)這
樣的比賽活動(dòng),中職教育能夠更好地適應(yīng)社會(huì)需求,培養(yǎng)更符
合產(chǎn)業(yè)發(fā)展需求的人才,為學(xué)生未來(lái)的職業(yè)生涯打下堅(jiān)實(shí)基礎(chǔ)。
二、模塊一:平臺(tái)搭建與運(yùn)維
(一)任務(wù)一:大數(shù)據(jù)平臺(tái)搭建
1.子任務(wù)一:Hadoop完全分布式安裝配置
本任務(wù)需要使用root用戶完成相關(guān)配置。打開競(jìng)賽平臺(tái)
的賽題資源的容器資源,利用智聯(lián)助手的SSH集成窗口打開容
器,基于競(jìng)賽平臺(tái)進(jìn)行完全分布式模式Hadoop的搭建和管理。
相關(guān)安裝文件在容器“/opt”目錄下,請(qǐng)選擇對(duì)應(yīng)的安裝包進(jìn)
行安裝,用不到的可忽略。主機(jī)名為master、slave1、slave2
的三臺(tái)節(jié)點(diǎn)都需要安裝JDK和Hadoop。
(1)在master節(jié)點(diǎn)執(zhí)行命令,創(chuàng)建jdk安裝目錄
“/data/jdk”和Hadoop安裝目錄“/data/hadoop”,執(zhí)行l(wèi)s
命令查看創(chuàng)建的目錄。提交創(chuàng)建目錄的命令和查看的結(jié)果截圖;
(2)在master節(jié)點(diǎn)執(zhí)行tar命令(請(qǐng)確保在解壓縮文件
時(shí),不要保留原始文件路徑中的第一個(gè)目錄層級(jí)),將節(jié)點(diǎn)中
“/opt”目錄下jdk安裝文件解壓到節(jié)點(diǎn)中的“/data/jdk”
目錄,將Hadoop安裝文件解壓到節(jié)點(diǎn)中的“/data/hadoop”
目錄,執(zhí)行l(wèi)s命令分別查看解壓后的文件。提交解壓命令和
查看的結(jié)果截圖;
(3)在三臺(tái)節(jié)點(diǎn)分別修改“/etc/hosts”配置,添加三
臺(tái)節(jié)點(diǎn)ip和主機(jī)名映射;配置ssh免密,實(shí)現(xiàn)master、slave1、
slave2三臺(tái)節(jié)點(diǎn)間相互免密登錄,在master節(jié)點(diǎn)執(zhí)行“ssh
slave1”命令和在slave2節(jié)點(diǎn)執(zhí)行“sshmaster”命令驗(yàn)證。
提交“/etc/hosts”配置截圖、在master執(zhí)行的免密命令和
執(zhí)行結(jié)果截圖、驗(yàn)證命令的結(jié)果截圖;
(4)在master節(jié)點(diǎn)使用scp命令并使用絕對(duì)路徑將jdk
目錄拷貝到slave1和slave2(若路徑不存在,則需新建),
并在三臺(tái)節(jié)點(diǎn)的“/etc/profile”文件中配置jdk環(huán)境變量并
使其生效,配置完畢后,在節(jié)點(diǎn)中執(zhí)行“java-version”命
令,檢測(cè)jdk是否安裝成功。提交scp命令、環(huán)境變量截圖和
使環(huán)境變量生效命令、檢測(cè)命令結(jié)果截圖;
(5)依次配置hadoop-env.sh、core-site.xml、workers
配置文件,其中NameNode的地址為master節(jié)點(diǎn),端口為9000,
master、slave1、slave2節(jié)點(diǎn)均作為DataNode,配置好相關(guān)
環(huán)境。在master節(jié)點(diǎn)使用scp命令將配置完的Hadoop安裝目
錄直接拷貝至slave1和slave2(若路徑不存在,則需新建),
在三臺(tái)節(jié)點(diǎn)的“/etc/profile”文件中配置Hadoop環(huán)境變量,
配置完畢后,在容器中執(zhí)行“hadoopversion”命令,檢測(cè)
Hadoop是否安裝成功。提交修改的配置內(nèi)容截圖、scp命令、
環(huán)境變量截圖、檢測(cè)命令結(jié)果截圖;
(6)在master節(jié)點(diǎn)初始化Hadoop環(huán)境namenode。提交
初始化命令和結(jié)果截圖;
(7)在master節(jié)點(diǎn)依次啟動(dòng)HDFS、YARN集群,在三個(gè)
節(jié)點(diǎn)分別執(zhí)行jps命令,查看節(jié)點(diǎn)中的進(jìn)程。提交jps查看結(jié)
果截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
2.子任務(wù)二:Flume安裝配置
本任務(wù)需要使用root用戶完成相關(guān)配置,已安裝Hadoop
及需要配置前置環(huán)境,具體要求如下:
(1)在節(jié)點(diǎn)中執(zhí)行命令,創(chuàng)建Flume安裝目錄
“/data/flume”,執(zhí)行l(wèi)s命令查看創(chuàng)建的目錄。提交創(chuàng)建目
錄命令、查看命令和結(jié)果截圖;
(2)在節(jié)點(diǎn)中執(zhí)行tar命令(請(qǐng)確保在解壓縮文件時(shí),
不要保留原始文件路徑中的第一個(gè)目錄層級(jí)),將“/opt”目
錄下Flume安裝文件解壓到節(jié)點(diǎn)中的“/data/flume”目錄,
在“/etc/profile”文件中配置Flume環(huán)境變量FLUME_HOME
和PATH的值并使其生效,執(zhí)行命令“flume-ngversion”檢
測(cè)Flume是否安裝成功。提交解壓命令、環(huán)境變量截圖、檢測(cè)
命令結(jié)果截圖;
(3)進(jìn)入$FLUME_HOME/conf目錄下,使用cp命令將
flume-env.sh.template文件復(fù)制一份,并重命名為
flume-env.sh;在$FLUME_HOME目錄下新建一份test.txt文件,
在文件中輸入內(nèi)容“這是一份flume的測(cè)試文檔”,在
$FLUME_HOME/conf目錄下新建file-flume-hdfs.conf,配置
flume將test.txt傳輸?shù)紿DFS的“/tmp/flume”目錄下,運(yùn)
行Flume并查看HDFS中“/tmp/flume”目錄下生成的內(nèi)容。
提交cp命令、file-flume-hdfs.conf配置內(nèi)容截圖、運(yùn)行
Flume的命令、查看HDFS目錄中文件的內(nèi)容的命令和結(jié)果截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
(二)任務(wù)二:數(shù)據(jù)庫(kù)配置維護(hù)
1.子任務(wù)一:數(shù)據(jù)庫(kù)配置
打開競(jìng)賽平臺(tái)的賽題資源的數(shù)據(jù)庫(kù)資源,利用智聯(lián)助手的
SSH集成窗口打開master節(jié)點(diǎn),基于競(jìng)賽平臺(tái)進(jìn)行MySQL的搭
建和管理。具體要求如下:
(1)在賽題資源的數(shù)據(jù)庫(kù)資源對(duì)應(yīng)的ip的節(jié)點(diǎn)中執(zhí)行命
令,創(chuàng)建MySQL安裝目錄“/data/mysql”;執(zhí)行tar命令,
將容器中“/opt”目錄下Mysql安裝文件解壓到“/data/mysql”
目錄,執(zhí)行l(wèi)s命令查看解壓后的文件。提交tar命令和ls結(jié)
果截圖;
(2)安裝好MySQL后,對(duì)數(shù)據(jù)庫(kù)進(jìn)行初始化,將$MYSQL/bin
目錄下的mysql腳本創(chuàng)建軟鏈到/usr/bin目錄,在
/etc/systemd/system目錄中配置mysql.service,配置開機(jī)
自啟動(dòng)并啟動(dòng)數(shù)據(jù)庫(kù)。提交初始化命令、創(chuàng)建軟鏈命令、
mysql.service配置內(nèi)容截圖、配置自啟動(dòng)命令、啟動(dòng)數(shù)據(jù)庫(kù)
結(jié)果截圖;
(3)使用root用戶和密碼登錄MySQL,然后將root用戶
的密碼修改為賽題資源的數(shù)據(jù)庫(kù)資源的密碼,配置授予root
用戶在任何主機(jī)('%')上連接時(shí)對(duì)所有數(shù)據(jù)庫(kù)(*.*)的全部
權(quán)限,并允許該用戶授予權(quán)限給其他用戶,配置完刷新權(quán)限。
提交修改密碼sql語(yǔ)句和結(jié)果截圖、配置授予權(quán)限sql語(yǔ)句和
結(jié)果截圖;
(4)連接數(shù)據(jù)庫(kù),先用sql創(chuàng)建一個(gè)“exam”數(shù)據(jù)庫(kù)(字
符集設(shè)置utf8mb4),再創(chuàng)建一個(gè)“test”新用戶,密碼與root
密碼一致,將“exam”數(shù)據(jù)庫(kù)權(quán)限授予“test”用戶,刷新權(quán)
限后用“test”賬號(hào)登錄數(shù)據(jù)庫(kù),執(zhí)行“showdatabases;”
命令查看數(shù)據(jù)庫(kù)。提交創(chuàng)庫(kù)sql語(yǔ)句、建用戶語(yǔ)句、授權(quán)語(yǔ)句、
“showdatabases;”的結(jié)果截圖;
(5)將“test”用戶刪除。提交刪除語(yǔ)句;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
2.子任務(wù)二:數(shù)據(jù)庫(kù)表維護(hù)
打開競(jìng)賽平臺(tái)的賽題資源的數(shù)據(jù)庫(kù)資源,利用智聯(lián)助手的
數(shù)據(jù)庫(kù)工具打開“exam”數(shù)據(jù)庫(kù),基于競(jìng)賽平臺(tái)進(jìn)行MySQL的
數(shù)據(jù)庫(kù)表維護(hù)。
(1)在MySQL數(shù)據(jù)庫(kù)的“exam”數(shù)據(jù)庫(kù)中創(chuàng)建
“athlete_events”數(shù)據(jù)表。數(shù)據(jù)表的表字段格式如下:
表1“athlete_events”的表字段結(jié)構(gòu)
字段類型注釋
Namevarchar名稱
Sexvarchar性別
Ageint年齡
Heightint身高
Weightint體重
Gamesvarchar賽事
Cityvarchar城市
Eventvarchar比賽項(xiàng)目
Medalvarchar獎(jiǎng)牌
提交建表sql語(yǔ)句和結(jié)果截圖;
(2)為“athlete_events”表添加數(shù)據(jù)記錄。記錄如下:
NameSeAgeHeightWeightGamesCityEventMedal
x
CaoM21160422016RiodeDivingMen'sGold
YuanSummerJaneiroSpringboard
ChenM20168602016RiodeDivingMen'sPlatformGold
AisenSummerJaneiro
ChenM27188812016RiodeBadmintonMen'sGold
LongSummerJaneiroSingles
ChenF27172632016RiodeSailingWomen'sSilver
PeinaSummerJaneiroWindsurfer
ChenochiShortTrackSpeedBronze
DequanWinterSkatingMen's5,000
metresRelay
JiaM22175702014SochiFreestyleSkiingMen'sBronze
ZongyanWinterAerials
g
CaiYunM32181682012LondonBadmintonMen'sGold
SummerDoubles
ZouKaiM24158552012LondonGymnasticsMen'sGold
SummerTeamAll-Around
ZhouF241751332012LondonWeightliftingWomen'sGold
LuluSummerSuper-Heavyweight
ZhangM24178702012LondonTableTennisMen'sGold
JikeSummerSingles
GuoF26157602010VancouFreestyleSkiingBronze
XinxinWinterverWomen'sAerials
LiNinaF27160522010VancouFreestyleSkiingSilver
WinterverWomen'sAerials
BaoF24172672008BeijingFencingWomen'sSilver
YingyingSummerSabre,Team
FengF29183752008BeijingVolleyballWomen'sBronze
KunSummerVolleyball
HanM22173752006TorinoFreestyleSkiingMen'sGold
XiaopenWinterAerials
g
ChenF28182752004AthinaVolleyballWomen'sGold
JingSummerVolleyball
ChenF21183732004AthinaTaekwondoWomen'sGold
ZhongSummerHeavyweight
ZhaoM28177752002SaltFigureSkatingMixedBronze
HongboWinterLakePairs
City
CaiYalinM23174602000SydneyShootingMen'sAirGold
SummerRifle,10metres
ChenF23158632000SydneyWeightliftingWomen'sGold
XiaominSummerMiddleweight
ChenLuF21162521998NaganoFigureSkatingBronze
WinterWomen'sSingles
HeQiF22178681996AtlantaVolleyballWomen'sSilver
SummerVolleyball
LuLinM27174601996AtlantaTableTennisMen'sSilver
SummerDoubles
LiM22157521996AtlantaGymnasticsMen'sGold
XiaoshuaSummerIndividualAll-Around
ng
YeF29168701994LillehaSpeedSkatingBronze
QiaoboWintermmerWomen's1,000metres
提交第一條數(shù)據(jù)的插入sql語(yǔ)句及所有數(shù)據(jù)添加結(jié)果截圖;
(3)新增“Year”字段(int),注釋為“年份”,將“Games”
字段中的年份數(shù)字提取到“Year”字段,并查詢“Year”在2000
年到2008年之間的數(shù)據(jù)。提交新增字段sql和結(jié)果截圖、提
取年份sql、查詢的sql和結(jié)果截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
3.子任務(wù)三:數(shù)據(jù)表查詢
(1)篩選出比賽項(xiàng)目為“VolleyballWomen'sVolleyball”
且身高大于“180”的數(shù)據(jù),并按照年份“Year”進(jìn)行升序排
序。提交sql和結(jié)果截圖;
(2)查詢2016年參賽人員年齡、身高和體重各自的最大
值、最小值和平均值。提交sql和結(jié)果截圖;
(3)按年份分組查詢每年參賽人員的男女人數(shù)各多少。
提交sql和結(jié)果截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
三、模塊二:數(shù)據(jù)獲取與處理
(一)任務(wù)一:數(shù)據(jù)獲取與清洗
1.子任務(wù)一:數(shù)據(jù)獲取
打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T1文件分類,
下載parse_athlete_events.py文件。賽題資源中靜態(tài)資源
athlete_events.html是奧運(yùn)會(huì)運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)列表內(nèi)
容,點(diǎn)擊進(jìn)入可打開網(wǎng)頁(yè)。parse_athlete_events.py為Python
腳本文件,程序讀取athlete_events.html,使用lxml對(duì)網(wǎng)頁(yè)
進(jìn)行解析,提取相應(yīng)的列表數(shù)據(jù),并將結(jié)果輸出。
(1)用競(jìng)賽平臺(tái)智聯(lián)助手的python腳本工具打開
parse_athlete_events.py文件,補(bǔ)全文件中【1】代碼,配置
公共資源地址url。提交url地址代碼;
(2)使用瀏覽器打開賽題資源中靜態(tài)資源文件
athlete_events.html網(wǎng)頁(yè)文件,通過(guò)“審查”工具進(jìn)行網(wǎng)頁(yè)
結(jié)構(gòu)分析。補(bǔ)全parse_athlete_events.py中【2】代碼,實(shí)
現(xiàn)獲取奧運(yùn)會(huì)運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)div列表。提交補(bǔ)全代碼;
(3)補(bǔ)全parse_athlete_events.py中【3】~【5】代碼,
實(shí)現(xiàn)“text”,“舉辦城市”和“代表隊(duì)伍”文本內(nèi)容提取。
提交補(bǔ)全代碼;
(4)運(yùn)行parse_athlete_events.py腳本,完成奧運(yùn)會(huì)
運(yùn)動(dòng)員數(shù)據(jù)和獎(jiǎng)牌成績(jī)列表的解析并打印輸出。提交運(yùn)行結(jié)果
截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
2.子任務(wù)二:數(shù)據(jù)處理
打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T1文件分類,
下載athlete_events.csv文件。通過(guò)編寫python代碼完成對(duì)
相關(guān)數(shù)據(jù)文件中數(shù)據(jù)的清洗和整理。請(qǐng)分析相關(guān)數(shù)據(jù)集,根據(jù)
題目規(guī)定要求實(shí)現(xiàn)數(shù)據(jù)處理,具體要求如下:
(1)查看athlete_events.csv中數(shù)據(jù)總數(shù)、標(biāo)準(zhǔn)差、均
值、最小值、四分之一分位數(shù)、二分之一分位數(shù)、四分之三分
位數(shù)和最大值。提交代碼截圖和結(jié)果截圖;
(2)對(duì)athlete_events.csv文件進(jìn)行處理,對(duì)于Age列
數(shù)據(jù),采用“Age”填充缺失值,并將年齡數(shù)字大于等于90的
數(shù)據(jù)刪除,然后存入athlete_events_c1.csv中。提交代碼截
圖;
(3)對(duì)athlete_events_c1.csv文件進(jìn)行處理,對(duì)于
Height列和Weight列數(shù)據(jù),將缺失值的數(shù)據(jù)刪除,然后存入
athlete_events_c2.csv中。提交代碼截圖;
(4)對(duì)athlete_events_c2.csv文件進(jìn)行處理,對(duì)于
Weight列數(shù)據(jù),小數(shù)點(diǎn)后超過(guò)一位數(shù)的數(shù)據(jù),將小數(shù)四舍五入
改為一位數(shù),然后存入athlete_events_c3.csv中。提交代碼
截圖;
將上述任務(wù)的命令和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
(二)任務(wù)二:數(shù)據(jù)標(biāo)注
對(duì)athlete_events_c3.csv進(jìn)行標(biāo)注,判斷運(yùn)動(dòng)員是否獲
得獎(jiǎng)牌,具體的標(biāo)注規(guī)則如下:
(1)如果“Medal”列數(shù)據(jù)不為空,則數(shù)據(jù)標(biāo)注為“yes”;
(2)如果“Medal”列數(shù)據(jù)為空,則數(shù)據(jù)標(biāo)注為“no”;
標(biāo)注好的數(shù)據(jù)存儲(chǔ)為列“Have_Medal”并和
athlete_events_c3.csv數(shù)據(jù)合并存入result.csv。提交代碼
截圖和csv文件;
將上述任務(wù)的結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上傳中對(duì)
應(yīng)的任務(wù)序號(hào)下。
(三)任務(wù)三:數(shù)據(jù)統(tǒng)計(jì)
1.子任務(wù)一:處理異常數(shù)據(jù)
打開競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T3文件分類,
下載TravelInsurancePrediction.csv文件。該文件存儲(chǔ)了旅
游保險(xiǎn)預(yù)測(cè)相關(guān)數(shù)據(jù),數(shù)據(jù)中有以下內(nèi)容:
Age:年齡,int類型
EmploymentType:職業(yè)種類,varchar類型
GraduateOrNot:是否畢業(yè)生,varchar類型
AnnualIncome:年收入,int類型
FamilyMembers:家庭成員,int類型
ChronicDiseases:是否有慢性病,int類型
FrequentFlyer:是否經(jīng)常坐飛機(jī),varchar類型
EverTravelledAbroad:曾經(jīng)出國(guó)旅游,varchar類型
TravelInsurance:是否購(gòu)買旅游保險(xiǎn),int類型
編寫MapReduce程序,實(shí)現(xiàn)以下功能:清除曾經(jīng)有出國(guó)旅
游的人員數(shù)據(jù),在控制臺(tái)按順序打印輸出前20條數(shù)據(jù),輸出
結(jié)果到HDFS,使用命令查看結(jié)果。提交代碼截圖和結(jié)果截圖;
將上述任務(wù)的程序和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
2.子任務(wù)二:數(shù)據(jù)統(tǒng)計(jì)
使用競(jìng)賽平臺(tái)賽題資源的文件資源的P2-M2-T3文件分類
的TravelInsurancePrediction.csv文件,編寫MapReduce程
序,實(shí)現(xiàn)以下功能:根據(jù)“GraduateOrNot”字段統(tǒng)計(jì)畢業(yè)生
與非畢業(yè)生人數(shù),并在控制臺(tái)輸出,輸出結(jié)果到HDFS,使用命
令查看結(jié)果。提交代碼截圖和結(jié)果截圖;
將上述任務(wù)的程序和結(jié)果截圖提交到競(jìng)賽平臺(tái)的賽題結(jié)
果上傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
四、模塊三:數(shù)據(jù)分析與可視化
(一)任務(wù)一:數(shù)據(jù)分析與可視化
使用競(jìng)賽平臺(tái)可視化工具或者下載可視化操作文件至本
地進(jìn)行代碼編寫并以圖表展示。
1.子任務(wù)一:柱狀圖數(shù)據(jù)分析與可視化
使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱
狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源
P2-M3-T1-SUBT1文件分類,下載visualization.zip文件至本
地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2008年得獎(jiǎng)數(shù)
量前十的國(guó)家數(shù)據(jù)進(jìn)行可視化展示:
【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】
(1)編寫補(bǔ)充yAxis對(duì)象,獲取相關(guān)數(shù)據(jù)中barData數(shù)
據(jù),設(shè)置y軸顯示類型為“類目軸”、設(shè)置坐標(biāo)軸文字顏色值
為:#999999,大小為:12、設(shè)置坐標(biāo)軸在grid區(qū)域中的分
隔線顏色為:#CAD3E0,線的類型為:虛線、設(shè)置y軸顯示數(shù)
據(jù)為"2008年得獎(jiǎng)數(shù)量前十的國(guó)家名稱"。
(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中barData數(shù)
據(jù),設(shè)置圖表顯示類型為柱狀圖、設(shè)置系列名稱為“獎(jiǎng)牌數(shù)量”、
設(shè)置柱條的寬度為20,背景顏色為:rgba(180,180,180,0.2)、
將"2008年得獎(jiǎng)數(shù)量前十的國(guó)家",barData對(duì)象中的數(shù)據(jù)設(shè)置
為柱狀圖顯示數(shù)據(jù)。
(3)附上“2008年得獎(jiǎng)數(shù)量前十的國(guó)家柱狀圖”截圖與
相關(guān)代碼截圖。
【本地操作】
解壓visualization.zip文件至本地,根據(jù)
visualization/data/data.js文件中barData對(duì)象中的數(shù)據(jù),
補(bǔ)充完整visualization/js/chat.js文件中g(shù)etBarChart()
函數(shù)的代碼
(1)編寫補(bǔ)充yAxis對(duì)象,獲取barData數(shù)據(jù),設(shè)置y
軸顯示類型為“類目軸”、設(shè)置坐標(biāo)軸文字顏色值為:#999999,
大小為:12、設(shè)置坐標(biāo)軸在grid區(qū)域中的分隔線顏色為:
#CAD3E0,線的類型為:虛線、設(shè)置y軸顯示數(shù)據(jù)為"2008年得
獎(jiǎng)數(shù)量前十的國(guó)家名稱"。
(2)編寫補(bǔ)充series對(duì)象,獲取barData數(shù)據(jù),設(shè)置圖
表顯示類型為柱狀圖、設(shè)置系列名稱為“獎(jiǎng)牌數(shù)量”、設(shè)置柱
條的寬度為20,背景顏色為:rgba(180,180,180,0.2)、將
"2008年得獎(jiǎng)數(shù)量前十的國(guó)家",barData對(duì)象中的數(shù)據(jù)設(shè)置為
柱狀圖顯示數(shù)據(jù)。
(3)運(yùn)行網(wǎng)頁(yè),附上“2008年得獎(jiǎng)數(shù)量前十的國(guó)家柱狀
圖”截圖與相關(guān)代碼截圖。
將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上
傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
2.子任務(wù)二:折線圖數(shù)據(jù)分析與可視化
使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱
狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源
P2-M3-T1-SUBT2文件分類,下載visualization.zip文件至本
地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)中國(guó)在各屆夏季
奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量變化數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)如下:
【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】
(1)編寫補(bǔ)充tooltip對(duì)象,設(shè)置提示框組件的觸發(fā)類
型為坐標(biāo)軸觸發(fā)、設(shè)置指示器類型為:直線指示器、設(shè)置提示
框浮層的文字顏色:#666666,字體大小為:12。
(2)編寫補(bǔ)充xAxis對(duì)象,獲取相關(guān)數(shù)據(jù)中l(wèi)ineData數(shù)
據(jù),設(shè)置X軸顯示類型為“類目軸”、設(shè)置坐標(biāo)文字顯示
為:#999999,文字大小設(shè)置為:12,文字間隔為0,文字傾斜
角度為40度、設(shè)置X軸顯示坐標(biāo)為“各界夏季奧運(yùn)會(huì)”。
(3)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中l(wèi)ineData
數(shù)據(jù),設(shè)置圖表顯示類型為'line'、設(shè)置線條顯示平滑,標(biāo)記
大小為6的三角形、設(shè)置折線圖文字顯示(將文字顏色設(shè)置為
#999999,文字大小設(shè)置為:12)、將"中國(guó)在各屆夏季奧運(yùn)會(huì)
上的獎(jiǎng)牌數(shù)量"對(duì)象中的數(shù)據(jù)設(shè)置為折線顯示數(shù)據(jù)。
(4)附上“中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量變化折
線圖”截圖與相關(guān)代碼截圖。
【本地操作】
解壓visualization.zip文件至本地,根據(jù)
visualization/data/data.js文件中l(wèi)ineData對(duì)象中的數(shù)據(jù),
補(bǔ)充完整visualization/js/chat.js文件中g(shù)etLineChart()
函數(shù)的代碼
(1)編寫補(bǔ)充tooltip對(duì)象,設(shè)置提示框組件的觸發(fā)類
型為坐標(biāo)軸觸發(fā)、設(shè)置指示器類型為:直線指示器、設(shè)置提示
框浮層的文字顏色:#666666,字體大小為:12。
(2)編寫補(bǔ)充xAxis對(duì)象,獲取lineData數(shù)據(jù),設(shè)置X
軸顯示類型為“類目軸”、設(shè)置坐標(biāo)文字顯示為:#999999,文
字大小設(shè)置為:12,文字間隔為0,文字傾斜角度為40度、設(shè)
置X軸顯示坐標(biāo)為“各界夏季奧運(yùn)會(huì)”。
(3)編寫補(bǔ)充series對(duì)象,獲取lineData數(shù)據(jù),設(shè)置
圖表顯示類型為'line'、設(shè)置線條顯示平滑,標(biāo)記大小為6的
三角形、設(shè)置折線圖文字顯示(將文字顏色設(shè)置為#999999,文
字大小設(shè)置為:12)、將"中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌數(shù)量
"對(duì)象中的數(shù)據(jù)設(shè)置為折線顯示數(shù)據(jù)。
(4)運(yùn)行網(wǎng)頁(yè),附上“中國(guó)在各屆夏季奧運(yùn)會(huì)上的獎(jiǎng)牌
數(shù)量變化折線圖”截圖與相關(guān)代碼截圖。
將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上
傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
3.子任務(wù)三:餅圖數(shù)據(jù)分析與可視化
使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱
狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源
P2-M3-T1-SUBT3文件分類,下載visualization.zip文件至本
地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2016夏季奧運(yùn)
會(huì)運(yùn)動(dòng)員年齡分布數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)如下:
【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】
(1)編寫補(bǔ)充legend對(duì)象,獲取相關(guān)數(shù)據(jù)中pieData數(shù)
據(jù),設(shè)置圖例的朝向?yàn)椋捍怪憋@示、設(shè)置圖例在X軸方向上的
位置為右、設(shè)置圖例上顯示的文字信息為:年齡段,圖例項(xiàng)的
圖標(biāo)都設(shè)置為圓形、設(shè)置圖例文字顏色為:#999999,大小為:
12。
(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中pieData數(shù)
據(jù),設(shè)置圖表類型為'pie'、設(shè)置系列名稱為'2016夏季奧運(yùn)會(huì)
運(yùn)動(dòng)員年齡分布'、設(shè)置餅圖半徑為['30%','70%']、設(shè)置餅
圖高亮狀態(tài),標(biāo)簽文字顏色:#999999,大?。?4,居中顯示、
將'2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布'對(duì)象中的數(shù)據(jù)設(shè)置為餅
圖顯示數(shù)據(jù)。
(3)附上“2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布餅圖”截圖
與相關(guān)代碼截圖。
【本地操作】
解壓visualization.zip文件至本地,根據(jù)
visualization/data/data.js文件中pieData對(duì)象中的數(shù)據(jù),
補(bǔ)充完整visualization/js/chat.js文件中g(shù)etPieChart()
函數(shù)的代碼
(1)編寫補(bǔ)充legend對(duì)象,獲取pieData數(shù)據(jù),設(shè)置圖
例的朝向?yàn)椋捍怪憋@示、設(shè)置圖例在X軸方向上的位置為右、
設(shè)置圖例上顯示的文字信息為:年齡段,圖例項(xiàng)的圖標(biāo)都設(shè)置
為圓形、設(shè)置圖例文字顏色為:#999999,大小為:12。
(2)編寫補(bǔ)充series對(duì)象,獲取pieData數(shù)據(jù),設(shè)置圖
表類型為'pie'、設(shè)置系列名稱為'2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡
分布'、設(shè)置餅圖半徑為['30%','70%']、設(shè)置餅圖高亮狀態(tài),
標(biāo)簽文字顏色:#999999,大?。?4,居中顯示、將'2016夏季
奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布'對(duì)象中的數(shù)據(jù)設(shè)置為餅圖顯示數(shù)據(jù)。
(3)運(yùn)行網(wǎng)頁(yè),附上“2016夏季奧運(yùn)會(huì)運(yùn)動(dòng)員年齡分布
餅圖”截圖與相關(guān)代碼截圖。
將上述任務(wù)的代碼和結(jié)果提交到競(jìng)賽平臺(tái)的賽題結(jié)果上
傳中對(duì)應(yīng)的任務(wù)序號(hào)下。
4.子任務(wù)四:雷達(dá)圖數(shù)據(jù)分析與可視化
使用競(jìng)賽平臺(tái)數(shù)據(jù)治理下數(shù)據(jù)分析與可視化工具,點(diǎn)擊柱
狀圖編寫補(bǔ)充代碼或者打開競(jìng)賽平臺(tái)賽題資源的文件資源
P2-M3-T1-SUBT4文件分類,下載visualization.zip文件至本
地解壓,編寫補(bǔ)充代碼,實(shí)現(xiàn)Web網(wǎng)頁(yè)形式對(duì)2016奧運(yùn)會(huì)男
籃各國(guó)年齡、身高、體重平均值數(shù)據(jù)進(jìn)行可視化展示。任務(wù)點(diǎn)
如下:
【競(jìng)賽平臺(tái)的數(shù)據(jù)分析與可視化工具】
(1)編寫補(bǔ)充radar對(duì)象,設(shè)置雷達(dá)圖的中心(圓心)
坐標(biāo)為百分比形式,第一項(xiàng)為相對(duì)于容器寬度50%,第二項(xiàng)為相
對(duì)于容器高度70%、設(shè)置雷達(dá)圖的外半徑值為180、設(shè)置雷達(dá)
圖的指示器,分別為:Age、Height、Weight,設(shè)置最大值分
別為:39、218、137。
(2)編寫補(bǔ)充series對(duì)象,獲取相關(guān)數(shù)據(jù)中radarData
數(shù)據(jù),設(shè)置圖表顯示類型為'radar'、設(shè)置標(biāo)記的圖形為
'triangle',標(biāo)記的大小為10、將
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 咬指甲癥的臨床護(hù)理
- 三種教學(xué)設(shè)計(jì)方案案例資料
- 2025-2030中國(guó)金剛石圓孔鋸行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 小學(xué)英語(yǔ)牛津譯林版三年級(jí)下冊(cè)O(shè)nthefarm教學(xué)設(shè)計(jì)
- 2025-2030中國(guó)硼酸行業(yè)市場(chǎng)運(yùn)行分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- 2025-2030中國(guó)點(diǎn)對(duì)點(diǎn)微波天線行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025年鄉(xiāng)村醫(yī)生考試題庫(kù):農(nóng)村慢性病管理與慢性病患者教育試題
- 2025年小學(xué)英語(yǔ)畢業(yè)考試模擬卷:語(yǔ)音語(yǔ)調(diào)訓(xùn)練互動(dòng)學(xué)習(xí)評(píng)估
- 網(wǎng)頁(yè)設(shè)計(jì)與制作教程教學(xué)設(shè)計(jì) 項(xiàng)目四(任務(wù)1 字體類型、大小、顏色)
- 2025年鄉(xiāng)村醫(yī)生考試題庫(kù)(農(nóng)村居民健康檔案管理)健康教育試題
- (二模)濟(jì)寧市2025年4月高考模擬考試地理試卷
- 首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院招聘考試真題2024
- 抽化糞池合同協(xié)議
- 中醫(yī)養(yǎng)生館運(yùn)營(yíng)方案中醫(yī)養(yǎng)生館策劃書
- (二模)寧波市2024-2025學(xué)年第二學(xué)期高考模擬考試 英語(yǔ)試卷(含答案)+聽力音頻+聽力原文
- 高考備考:100個(gè)高考常考易錯(cuò)的文言實(shí)詞(翻譯+正誤辨析)
- 軟件項(xiàng)目交付管理制度
- 知識(shí)產(chǎn)權(quán)現(xiàn)場(chǎng)審核記錄表模板
- 機(jī)械系統(tǒng)動(dòng)力學(xué)試題及答案
- 食品安全自查、從業(yè)人員健康管理、進(jìn)貨查驗(yàn)記錄、食品安全事故處置等保證食品安全的規(guī)章制度
- 2024年吉林省中考滿分作文《情味浸潤(rùn)的時(shí)光》4
評(píng)論
0/150
提交評(píng)論