Python數(shù)據(jù)分析與可視化 教學(xué)大綱 及 習(xí)題答案(呂云翔 )_第1頁
Python數(shù)據(jù)分析與可視化 教學(xué)大綱 及 習(xí)題答案(呂云翔 )_第2頁
Python數(shù)據(jù)分析與可視化 教學(xué)大綱 及 習(xí)題答案(呂云翔 )_第3頁
Python數(shù)據(jù)分析與可視化 教學(xué)大綱 及 習(xí)題答案(呂云翔 )_第4頁
Python數(shù)據(jù)分析與可視化 教學(xué)大綱 及 習(xí)題答案(呂云翔 )_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Python數(shù)據(jù)分析與可視化課程教學(xué)大綱課程代碼:課程名稱:Python數(shù)據(jù)分析與可視化開課學(xué)期:學(xué)分/學(xué)時(shí):3/48課程類型:適用專業(yè)/開課對象:先修課程:開課單位:團(tuán)隊(duì)負(fù)責(zé)人:責(zé)任教授:執(zhí)筆人:核準(zhǔn)院長:一、課程的性質(zhì)、目的與任務(wù)Python數(shù)據(jù)分析與可視化是計(jì)算機(jī)相關(guān)中的一門數(shù)據(jù)分析入門課程,該 課程介紹了Python語言在數(shù)據(jù)分析方面的應(yīng)用,按照數(shù)據(jù)分析的步驟,從數(shù)據(jù)預(yù) 處理、分析、可視化等方面介紹了數(shù)據(jù)分析的方式,并通過兩個(gè)完整的數(shù)據(jù)分析 實(shí)例進(jìn)行相關(guān)知識(shí)的學(xué)習(xí)。主要內(nèi)容包括Python基礎(chǔ)知識(shí)介紹、數(shù)據(jù)預(yù)處理、數(shù) 據(jù)分析基礎(chǔ)工具NumPy、處理結(jié)構(gòu)化數(shù)據(jù)工具Pandas、數(shù)據(jù)分析與

2、知識(shí)發(fā)現(xiàn)、 scikit-learn實(shí)現(xiàn)數(shù)據(jù)分析、Matplotlib交互式圖表繪制、實(shí)例:科比職業(yè)生涯進(jìn)球 分析、實(shí)例:世界杯等。本課程的目的與任務(wù)是使學(xué)生通過本課程的學(xué)習(xí),從數(shù)據(jù)分析的基礎(chǔ)理論知 識(shí)入手,按照數(shù)據(jù)分析的基本流程循序漸進(jìn)的學(xué)習(xí)數(shù)據(jù)分析知識(shí),并使用Python 編程進(jìn)行實(shí)戰(zhàn)操作。通過兩個(gè)完整數(shù)據(jù)分析實(shí)例的學(xué)習(xí),幫助學(xué)生更好的掌握數(shù) 據(jù)分析技能,做到理論與實(shí)踐相結(jié)合,方法與應(yīng)用相結(jié)合。本課程除要求學(xué)生掌 握數(shù)據(jù)分析的基礎(chǔ)知識(shí)和相關(guān)Python庫使用,更重要的是要求學(xué)生掌握理論與實(shí) 踐結(jié)合的學(xué)習(xí)方式,為更深入地學(xué)習(xí)打下良好的基礎(chǔ)。1、python中的多行注釋使用三引號(hào)表示。2、pa

3、ndas能對數(shù)據(jù)進(jìn)行排序、分組、歸并等操作。3、Scikitjearn包括多種分類、回歸、聚類、降維、模型選擇和預(yù)處 理的算法。4、Matplotlib是一個(gè)繪圖庫。5、將Ipython項(xiàng)目中與其程序設(shè)計(jì)語言無關(guān)的部分獨(dú)立出來形成的新項(xiàng)目是Jupyter。第三章選擇題1、下列不是集中趨勢的主要測度的是?(D)A、均值B、中位數(shù)C、眾數(shù)D、方差2、下列不是離散程度的主要測度的是?(D)A、極差B、方差C、標(biāo)準(zhǔn)差D、中位數(shù)3、下列不屬于數(shù)據(jù)質(zhì)量的評(píng)估標(biāo)準(zhǔn)的是?(C)A、完整性B、一致性C、可控性D、及時(shí)性4、下列不屬于噪聲數(shù)據(jù)處理方法的是你?(B)A、分箱技術(shù)B、同化技術(shù)C、聚類技術(shù)D、回歸技術(shù)5

4、、下列不屬于特征提取方法的是?(B)A、主成分分析B、多重判別分析C、獨(dú)立成分分析D、線性判別分析對錯(cuò)題1、數(shù)據(jù)庫中不含缺失值的變量被稱為完全變量(T)2、噪聲是指被觀測變量的隨機(jī)誤差或標(biāo)準(zhǔn)差(F)3、一致性是指數(shù)據(jù)是否合乎規(guī)范,數(shù)據(jù)內(nèi)的數(shù)據(jù)是否保持一致的格式(T)4、及時(shí)性是指數(shù)據(jù)產(chǎn)生到可以查看的時(shí)間間隔,也叫數(shù)據(jù)的延時(shí)時(shí)長(T)5、特征構(gòu)建是指從預(yù)處理的數(shù)據(jù)中人工構(gòu)建新的特征(F)填空題1、數(shù)據(jù)分析需要特別關(guān)注集中趨勢、離散程度兩點(diǎn)。2、般可以通過數(shù)據(jù)統(tǒng)計(jì)中的記錄值和唯一值兩個(gè)值來評(píng)估數(shù)據(jù)質(zhì)3、3、4、5、量的完整性。數(shù)據(jù)質(zhì)量是數(shù)據(jù)分析結(jié)果的有效性和準(zhǔn)確性的前提保證。異常數(shù)據(jù)如果沒喲規(guī)律可

5、循幾乎不可能被還原,只能將其過濾。特征提取是在原始特征的基礎(chǔ)上,自動(dòng)構(gòu)建新的特征,將源石特 征轉(zhuǎn)換為一組更具物理意義、統(tǒng)計(jì)意義或者核的特征。第四章選擇題:lx關(guān)于NumPy說法不正確正確的是(D)A、NumPy是Python處理數(shù)組和矢量運(yùn)算的庫。B、NumPy是高性能計(jì)算的基礎(chǔ)。C、NumPy是數(shù)據(jù)分析的基礎(chǔ)。D、Pandas scikit-learn 和 Matplotlib 是 NumPy 的基礎(chǔ)2、關(guān)于ndarray對象說法不正確正確的是(D)A、Ndarray對象指的是多維數(shù)組對象。B、Ndarray對象是NumPy中很重要的對象。C、Ndarray保存的是同一類型的對象。D、Nda

6、rray的訪問方式不同于列表。3、下列哪些不是描述ndarray對象的屬性(C)A、 shapeB、ndimC、arrayD、size4、創(chuàng)建單位矩陣,對角線元素為1,其余為。需要用到下列哪個(gè)函數(shù)(D)A、 onesB、onesjikeC、empty J ikeD、eye、identity5、對下列函數(shù)說法正確的是(B)A、reshape會(huì)修改原adarray對象Bs reveal不會(huì)修改原adarray對象C、T會(huì)修改原adarray對象D、resize不會(huì)修改原adarray對象判斷題1、floatl6為半精度浮點(diǎn)數(shù)。(對)2、floatl28為雙精度浮點(diǎn)數(shù)(錯(cuò))擴(kuò)展精度3、complex

7、l28 (cl6)使用兩個(gè)雙精度浮點(diǎn)數(shù)表示的復(fù)數(shù)。(對)4、empty指定shape,創(chuàng)建新數(shù)組,且填充為0 (錯(cuò))不填充5、size指ndarray對象的維度。(錯(cuò))元素個(gè)數(shù)填空題1、代碼中用指代NumPy。2、查詢某個(gè)ndarray對象的dtype屬性,會(huì)返回一個(gè)(dtype)類型的對象。3、T函數(shù)返回原ndarray對象的(轉(zhuǎn)置)4、布爾值的字節(jié)長度為(1)5、ndim指ndarray對象的(維度)。第五章一、單選題.以下哪一個(gè)Series對象不同()AA disc = 1 :1,,2, :2, 3 :3 obj c = Series (disc, index=,T , 2, 3)B d

8、isc =1 :1, 2 :2, 3 :3 obj_c = Series (disc, index= 1, 2, 3)C disc =a : 1, b :2, c :3 obj_c = Series (disc, index=,T , 2, 3)D disc = ,a : 1, b :2, c :3 obj_c = Series(disc, index= 1, 2, 3).以下哪一項(xiàng)不是DataFrame對象的屬性()DA columnsB indexC valuesD length.以下哪一項(xiàng)可以對DataFrame對象進(jìn)行行的刪除()AAdrop, axis=0Bdrop, axis=lC

9、 delD pop. Index對象中,以下哪一項(xiàng)針對時(shí)間間隔數(shù)據(jù)()DA Int64IndexB MultilndexC DatetimeindexD Periodindex. group by” 包括 “” 3 個(gè)階段()AAsplit-app1y-combineB split-combine-applyC combine-apply-splitDcombine-split-app1y二、判斷題Index對象可以修改。Falsepandas提供了缺失值處理功能。TrueIndex對象支持并、差、交的操作。True在創(chuàng)建Series對象時(shí)并沒有指定索引,pandas自動(dòng)創(chuàng)建一個(gè)1 - n的序

10、列作為索引。Falsepanadas提供的cov函數(shù),能夠自動(dòng)進(jìn)行數(shù)據(jù)對齊的操作。 True三、填空題pandas兩種基本的數(shù)據(jù)結(jié)構(gòu)為 和 。 (SeriesDataFrame )In 1: obj a = Series(1, 2, 3, 4)In 2 : obj_a.Out 2: Int64Index(0, 1, 2, 3)In 3 : obj_a.Out 3: array(1, 2, 3, 4) (index values )loc函數(shù)接收Index對象的, iloc函數(shù)接收Index對象的。 (標(biāo)簽位置)可以通過GroupBy對象的 函數(shù)實(shí)現(xiàn)自定義函數(shù);函數(shù)會(huì)將數(shù)據(jù)對象分成多個(gè)組,然后對

11、每個(gè)組調(diào)用傳入的函數(shù),最后將其組合到一起。(agg apply )對象產(chǎn)生的是定長窗口; 對象產(chǎn)生的是擴(kuò)展窗口; 對象產(chǎn)生 的是指數(shù)加權(quán)窗口。(Rolling Expanding EWM )弟八早一、單選題.以下哪一項(xiàng)不屬于非線性分類模型()AA 邏輯回歸B 支持向量機(jī)C 決策樹D k近鄰.以下哪一項(xiàng)屬于懶惰學(xué)習(xí)()DA邏輯回歸B支持向量機(jī)C 決策樹D k近鄰.以下哪一項(xiàng)算法用于序列數(shù)據(jù)中頻繁序列的挖掘()DA DijstraB AprioriC FP-TreeD PrefixSpan.支持度用概率公式表示為()AP(B|A)BP(An B )CP(B)DP(B|A) / P( B ). 是把

12、一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別()A分類分析B關(guān)聯(lián)分析C聚類分析D 回歸分析二、判斷題. k近鄰算法的訓(xùn)練時(shí)間開銷為0。True.線性判別分析,針對訓(xùn)練集,將其投影到一條直線上,使得同類樣本點(diǎn)盡可能接近,異 類樣本點(diǎn)盡量遠(yuǎn)離。True.同一個(gè)問題和樣本產(chǎn)生的決策樹一定相同。False.回歸分析的目的在于了解變量間是否相關(guān)、相關(guān)方向和相關(guān)強(qiáng)度,并建立數(shù)學(xué)模型來進(jìn) 行預(yù)測。True. DBSCAN聚類速度快且能夠有效處理噪聲和發(fā)現(xiàn)任意形狀的空間聚類。True三、填空題.貝葉斯公式:O(p(y|x) = (p(x|y)p(y)/(p(x).關(guān)聯(lián)規(guī)則挖掘分為 和 o(生成頻繁項(xiàng)集生成強(qiáng)規(guī)則).

13、 Apriori算法定律1:如果一個(gè)集合是頻繁項(xiàng)集,則它的所有 都是頻繁項(xiàng)集;Apriori算法定律2:如果一個(gè)集合不是頻繁項(xiàng)集,則它的所有 都不是頻繁項(xiàng)集。(子集超集).關(guān)聯(lián)規(guī)則分析中,如果窮舉項(xiàng)集的所有組合,并測試每個(gè)組合是否滿足條件。那么對于一個(gè)元素個(gè)數(shù)為n的項(xiàng)集,所需要的時(shí)間復(fù)雜度為 o(0(2n).列舉典型的無監(jiān)督學(xué)習(xí):和 o(關(guān)聯(lián)分析聚類分析)第七章 一、單選題1、在支持向量機(jī)分類方法中,在擬合以后,可以通過以下哪一個(gè)參數(shù)獲取支持向量的索引()BB support_D以上均不是B NuSVCD以上均是B support_D以上均不是B NuSVCD以上均是A support_vec

14、tors_C n_support2、下列能夠?qū)崿F(xiàn)多元分類的是()DA SVCC高斯過程分類3、下列說法不正確的是()AA scikit-learn實(shí)現(xiàn)的lineajmodel. Lasso類使用了坐標(biāo)上升算法來擬合系數(shù)B linear_model. BayesianRidge類實(shí)現(xiàn)了貝葉斯嶺回歸,能夠在回歸問題的估計(jì)過程中引入?yún)?shù)正規(guī)化Cgaussian process. GaussianProcessRegressor 類實(shí)現(xiàn)了一個(gè)用于回歸問題的高斯過程D與最近鄰分類一樣,scikit-learn也實(shí)現(xiàn)了兩種鄰回歸,KNeighborsRegressor與RadiusNeighborsReg

15、ressor分別基于每個(gè)查詢點(diǎn)的k個(gè)最近鄰、每個(gè)查詢點(diǎn)的固定半徑內(nèi) 的“鄰居”數(shù)量實(shí)現(xiàn)4、下列關(guān)于k均值下列說法不正確的是()CA兩種k均值算法在使用時(shí)都需要通過n_clusters參數(shù)指定聚類的個(gè)數(shù)。B給足夠多的時(shí)間,k均值算法總能夠收斂,但可能得到的是局部最小值。C 在使用cluster. KMeans時(shí),通過n_jobs參數(shù)能指定該模型使用的處理器個(gè)數(shù)。若為正 值,則使用“n_jobs”個(gè)處理器,-3代表使用全部處理器,-2代表除了兩個(gè)處理器以外全 部使用,T代表除了某個(gè)處理器以外全部使用。D cluster. MiniBatchKMeans類實(shí)現(xiàn)了 k均值的算法的小批量變體5、下列關(guān)于

16、聚類說法不正確的是()CA在譜聚類中,可以設(shè)置assignabels參數(shù)以使用不同的分配策略。B在層次聚類中使用n_clusters參數(shù)可以指定聚類個(gè)數(shù),linkage參數(shù)用于指定合并的 策略,可選用 ward、complete averageC DBSCAN的核心概念是Core Samples,即位于高密度區(qū)域的樣本,其中較小的min_samples二、教學(xué)內(nèi)容及教學(xué)基本要求數(shù)據(jù)分析概述與基本概念(2學(xué)時(shí))了解數(shù)據(jù)分析的定義和歷史背景;了解數(shù)據(jù)分析的目的和任務(wù);了解數(shù)據(jù)分 析與數(shù)據(jù)挖掘的關(guān)系;了解機(jī)器學(xué)習(xí)與數(shù)據(jù)分析的關(guān)系,了解數(shù)據(jù)分析的基本步 驟,即數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)和

17、數(shù)據(jù)后處理,以及每個(gè)基 本步驟的概念與內(nèi)容;了解Python在數(shù)據(jù)分析領(lǐng)域所具有的優(yōu)點(diǎn)。Python基礎(chǔ)知識(shí)(4學(xué)時(shí))了解Python的發(fā)展史;了解Python及Pandas、scikit-leam、Matplotlib的安裝; 掌握Python的基礎(chǔ)知識(shí)及Python的一些特性,包括縮進(jìn)在Python的重要性、Python 包的使用方法、注釋的使用方法、Python語法知識(shí);了解Pandas、scikit-learn. Matplotlib等重要Python庫;了解Jupyter交互式數(shù)據(jù)科學(xué)與科學(xué)計(jì)算開發(fā)環(huán)境。數(shù)據(jù)預(yù)處理(2學(xué)時(shí))了解數(shù)據(jù)的集中趨勢、離散程度、相關(guān)性測量、數(shù)據(jù)缺失、噪聲、離

18、群點(diǎn)等 概念;了解數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)評(píng)估的完整性、一致性、準(zhǔn)確性和及時(shí)性4個(gè)要素。了 解數(shù)據(jù)清洗的概念及方式,包括缺失值的處理、噪聲數(shù)據(jù)的處理、不一致數(shù)據(jù)的 處理和異常數(shù)據(jù)的處理;了解數(shù)據(jù)的特征選擇、特征構(gòu)建和特征提取。NumPy數(shù)據(jù)分析基礎(chǔ)工具(4學(xué)時(shí))了解NumPy庫的作用;掌握多維數(shù)組對象ndarray的使用,包括ndarray的創(chuàng) 建、ndarray的索弓|、切片和迭代、ndarray的shape的操作、ndarray的基礎(chǔ)操作等。Pandas處理結(jié)構(gòu)化數(shù)據(jù)(4學(xué)時(shí))了解Pandas庫的作用和特色功能;了解Pandas中Series和DataFrame兩種主要 數(shù)據(jù)結(jié)構(gòu);掌握Series對象

19、的創(chuàng)建、訪問和操作;掌握DataFrame對象的創(chuàng)建、訪 或者較大的esp表示形成聚類的密度較高。D 在BIRCH中,有兩個(gè)重要的參數(shù):branching_factor (分支因子)和threshold (閾值), 分支因子限制了一個(gè)節(jié)點(diǎn)中的子集群的數(shù)量,閾值限制了新加入的樣本和存在于現(xiàn)有子集群 中樣本的最大距離。二、對錯(cuò)題1、在邏輯回歸中,saga求解器基于隨機(jī)平均梯度下降算法,其在大數(shù)據(jù)集上的收斂速度更 快。O錯(cuò)2、在最近鄰分類方法中,KNeighborsClassifier是基于每個(gè)查詢點(diǎn)的固定半徑r內(nèi)的鄰居 數(shù)量實(shí)現(xiàn),其中r是用戶指定的浮點(diǎn)數(shù)。()是k,是數(shù)量,是整數(shù),錯(cuò)3、Multi

20、nomialNB BernoulliNB GaussianNB 還提供了 partial_fit 方法,該方法能夠動(dòng) 態(tài)地解決加載大數(shù)據(jù)集的問題。與fit使用方法相同,操作比較簡單。,錯(cuò),與fit使用方 法不同4、嶺回歸從本質(zhì)上來說也是最小二乘法,只不過是通過對系數(shù)的大小施加懲罰來改進(jìn)。對5、Mean-Shift算法不是高度可擴(kuò)展的,因?yàn)樵趫?zhí)行算法期間需要執(zhí)行多個(gè)最近鄰搜索。因 為當(dāng)質(zhì)心較少時(shí),會(huì)停止迭代,所以此算法不收斂,錯(cuò),是收斂的三、填空題1、scikit-learn是SciPy中一個(gè)非常著名的分支,scikit-learn所支持的算法、模型均 是經(jīng)過廣泛驗(yàn)證的。在本章的學(xué)習(xí)中,主要介紹

21、了、等3大類。2、在隨機(jī)梯度下降分類方法中,lineajmodel.SGDClassifier類實(shí)現(xiàn)了簡單的隨機(jī)梯度下 降分類,可以通過loss函數(shù)來設(shè)置損失函數(shù),要軟件間隔對應(yīng)向量機(jī)、平滑Hinge或邏輯 回歸,loss的值應(yīng)分別選用、。3、目前,MLPClassifier只支持 函數(shù),通過運(yùn)行 方法進(jìn)行概率估計(jì),MLP算法使用的是 傳播的方式。4、Scikit-learn支持高斯樸素貝葉斯、多項(xiàng)分布樸素貝葉斯與伯努利樸素貝葉斯算法,分 別由、實(shí)現(xiàn)。5、AffinintyPropagation類中,若要設(shè)置相似度度量方式,設(shè)置阻尼因子,設(shè)置向量,代 表對各個(gè)點(diǎn)的偏好應(yīng)該要分別設(shè)置、等參數(shù)。答

22、案:1、分類方法;回歸方法;聚類方法2、 hinge; modified_huber; log3、交叉焙損失函數(shù);predict_proba;反向傳播naive bayes. GaussianNB naive bayes. MultinomialNB naive bayes. BernoulliNBAffinity damping preference第八章一、單選題1、在使用savefile函數(shù)將生成的函數(shù)圖像保存為圖片時(shí),可以使用下列哪個(gè)參數(shù)來指定圖片清晰度()AA dpiB bbox_inchesC tightD axes2如下圖所不,In 3表示的意思是:()BIn 1 : impor

23、t matplotlib.pyplot as pitIn 2 : fig=plt.figure ()In 3 : axes=plt.subplot (2,2,1)axes=plt . subplot(2,2,3)In 4 : fig.suptitle(Example of multiple subplots *)In 5 : pit . show ()A figure對象中的subplot布局為2X2,B figure對象中的subplot布局為2義1,C figure對象中的subplot布局為2X3,D figure對象中的subplot布局為2義2,A figure對象中的subplot

24、布局為2X2,B figure對象中的subplot布局為2義1,C figure對象中的subplot布局為2X3,D figure對象中的subplot布局為2義2,選中了索引為1的subplot同時(shí)分別選中了索引為1和3的subplot選中了索引為1的subplot選中了索引為3的subplot3、代碼 “axes, plot (t, s, color=k , linestyle =-的意思是()AA以t為橫軸,s為縱軸,A以t為橫軸,s為縱軸,畫函數(shù)圖像,線條類型為虛線B以s為橫軸,B以s為橫軸,t為縱軸,畫函數(shù)圖像,線條類型為虛線C以t為橫軸,s為縱軸,C以t為橫軸,s為縱軸,畫函數(shù)

25、圖像,線條類型為實(shí)線D以s為橫軸,t為縱軸,D以s為橫軸,t為縱軸,畫函數(shù)圖像,線條類型為實(shí)線4、如下圖所示,請問哪一行代碼創(chuàng)建了兩個(gè)柱狀圖()B1n 11 : import matplotlib.pyplot as pit import numpy as npIn 2 : figzaxes=plt.subplots()In 3 : data_m=(40, 120, 20, 100, 30, 200)data_f=(60, 180, 30z 150, 20, 50)In 4 : index = np.arange(6)width=0.4In 5 : axes.bar(index, data_m

26、, width, color= *c* z label=1 men1)axes.bar(index+width, data_f, width, color= * b * z label= * women1)In 6 : axes.set_xticks(index + width / 2)axes.set_xticklabels (Taxi, Metro, Walk, Bus, BicycleDriving axes.legend()In 7 : pit.show()A In 4B In 6A In 4B In 6B In 5D In 75、在柱狀圖設(shè)計(jì)中,為了設(shè)置顏色的透明度可以設(shè)置哪個(gè)函數(shù)的

27、哪個(gè)參數(shù)()DA axes, barh widthA axes, barh widthB axes. barh alphaC axes, bar widthD axes, bar alpha二、對錯(cuò)題1 一個(gè)figure對象只能建立一個(gè)axes,一個(gè)axes中能夠建立多個(gè)subplot ()錯(cuò)誤2、minor tick比major tick更短,而且顯示具體的坐標(biāo)值()錯(cuò)誤3、為了讓直方圖的條紋面積為1,可以為axes, hist函數(shù)設(shè)置參數(shù)density二true ()對4、使用pylot進(jìn)行3D圖表的繪制,需要?jiǎng)?chuàng)建axes時(shí)設(shè)置projection為3d對5、繪制餅圖時(shí)要調(diào)用axes, p

28、ie函數(shù),shadow表示百分比數(shù)值的顯示格式()錯(cuò)三、填空題1、如果我們要建立一個(gè)figure對象,讓它擁有2X2的axes布局,可以輸入以下代碼參考答案Import matplotlib. pyplot as pitfig, axes=plt. subplots (2,2)pit. show()2、構(gòu)建圖表的主要步驟 包括、參考答案:準(zhǔn)備數(shù)據(jù);生成圖表對象并將數(shù)據(jù)數(shù)據(jù)傳入;調(diào)整圖表裝飾項(xiàng);3、如下圖所示,添加箭頭尖端的位置為;注釋文字位置為一Code 8-6添加注釋示例In 1 : import matplotlib.pyplot as pit import numpy as npIn 2

29、 : fig=plt.figure()figr axes=plt.subplots()In 3 : axes.plot(np.arange(0r 24z 2),14,9,7,5, 12, 19, 23,26,27,24,21,19, ,-o,) In 4 : axes.set_xticks(np.arange (0,24,2)In 5 : axes.annotate(* hottest at 16:00, xy=(16, 27), xytext=(16r 22), arrowprops=dict(facecolor=,black, shrink=0.2), horizontalalignmen

30、t=center, verticalalignment= * center 6 : axes.text(12f 10, * Date: March 26th, 2018 1 z bbox=1 facecolor*: cyan, ,alpha*: 0.3, *pad*: 6)In 7 : pit . show ()參考答案:(16,27); (16, 22)4、在繪制餅圖時(shí),要調(diào)用axes, pie函數(shù),其中參數(shù)labels, sizes, explode分別代表參考答案:餅圖中分區(qū)所代表的的含義;每個(gè)分區(qū)各自的面積占比,每個(gè)分區(qū)相對中心的偏 移值5、在繪制表格時(shí),需要調(diào)用axes. table

31、函數(shù),還可以通過、來設(shè)置行 標(biāo)簽和列標(biāo)簽。rowLabeIs; colLabels問和操作,掌握基于Pandas的Index對象的訪問操作;了解Pandas的相關(guān)數(shù)學(xué)統(tǒng)計(jì) 和計(jì)算工具;了解Pandas的數(shù)學(xué)聚合和分組運(yùn)算。.數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)(4學(xué)時(shí))了解分類分析的基本概念;了解邏輯回歸、線性判別分析、支持向量機(jī)、決 策樹、K近鄰和樸素貝葉斯的相關(guān)知識(shí);了解關(guān)聯(lián)分析的基本概念,包括關(guān)聯(lián)規(guī) 則定義、指標(biāo)定義和關(guān)聯(lián)規(guī)則挖掘定義;了解關(guān)聯(lián)分析的Apriori算法、FP-Tree 算法、PrefixSpan算法;了解聚類分析的概念;了解K均值算法和DBSCAN ; 了 解回歸分析的基本概念和常用方法。

32、. scikit-learn實(shí)現(xiàn)數(shù)據(jù)的分析(4學(xué)時(shí))了解SciPy和scikit-learn的作用;掌握scikit-learn的分類方法、回歸方法和聚 類方法,分類方法包括Logistic回歸、SVM、最近鄰分類器、決策樹、隨機(jī)梯度 下降、高斯過程分類、神經(jīng)網(wǎng)絡(luò)分類和樸素貝葉斯,回歸方法包括最小二乘法、 嶺回歸、Lasso,貝葉斯嶺回歸、決策樹回歸、高斯過程回歸和最近鄰回歸,聚 類方法包括K-means、Affinity propagations Mean-shifts Spectral clusterings Hierarchical clusterings DBSCAN和Birch。.

33、Matplotlib交互式圖表繪制(4學(xué)時(shí))了解Matplotlib的作用;掌握Matplotlib中的基本布局對象的建立;掌握修改 圖表樣式、修改裝飾項(xiàng)和添加注釋的方法;掌握基礎(chǔ)圖表的繪制,包括直方圖、 散點(diǎn)圖、柱狀圖、折線圖和表格;了解使用Matplot3D繪制三維圖形的方法;了 解Matplotlib與Jupyter結(jié)合使用的方法。.數(shù)據(jù)分析實(shí)例(4學(xué)時(shí))通過用戶流失的預(yù)警”和“機(jī)器人走迷宮的最優(yōu)路徑”兩個(gè)數(shù)據(jù)分析實(shí)例 的分析,了解完整的數(shù)據(jù)分析實(shí)例的分析流程;了解實(shí)例中對數(shù)據(jù)的預(yù)處理、分 析和繪圖的過程;掌握綜合運(yùn)用所學(xué)知識(shí),進(jìn)行完整數(shù)據(jù)分析的能力。.實(shí)驗(yàn)(16學(xué)時(shí))教學(xué)說明及教學(xué)基本

34、要求見Python數(shù)據(jù)分析與可視化實(shí)驗(yàn)教學(xué)大綱。三、教學(xué)方法本課程教學(xué)方法以教師為主導(dǎo)的啟發(fā)式講授教學(xué)法為主,討論(提問)式教 學(xué)為輔,結(jié)合課外學(xué)習(xí)的教學(xué)方法。實(shí)驗(yàn)以學(xué)生動(dòng)手實(shí)驗(yàn)為主,教師的啟發(fā)式講 授教學(xué)法為輔,并結(jié)合討論(提問)式教學(xué),以及結(jié)合課外學(xué)習(xí)的教學(xué)方法。 1.本課程概念較多,因此教學(xué)形式以講授方式為主。本課程擬采用多媒體PPT 的教學(xué)方法,增加課堂信息,淺顯通俗地對概念、定義和原理進(jìn)行解釋,增加教 學(xué)的直觀性,教學(xué)過程中注意各個(gè)知識(shí)點(diǎn)的關(guān)聯(lián)性,以使學(xué)生更好地理解課程內(nèi) 容。.對課程中關(guān)鍵性概念、設(shè)計(jì)思想方面的問題可輔以課堂討論的形式。.為加強(qiáng)和落實(shí)動(dòng)手能力的培養(yǎng),每章課后應(yīng)安排作

35、業(yè),幫助學(xué)生學(xué)習(xí)和應(yīng)用。 四、課內(nèi)外教學(xué)環(huán)節(jié)及基本要求本課程共48個(gè)學(xué)時(shí),其中理論32個(gè)學(xué)時(shí),講授16周(每周2學(xué)時(shí));實(shí) 驗(yàn)16個(gè)學(xué)時(shí),講授8周(每周2學(xué)時(shí))。課外學(xué)習(xí)要求:.做好課前預(yù)習(xí),預(yù)習(xí)時(shí)以教材為主,了解相關(guān)的概念、定義、原理。預(yù)習(xí)中 認(rèn)真思考,以便帶著問題主動(dòng)地聽課。.課后要復(fù)習(xí),有余力的學(xué)生復(fù)習(xí)時(shí)還應(yīng)閱讀參考資料,認(rèn)真整理課堂聽課筆 記。.要求學(xué)生課外自主學(xué)習(xí),學(xué)生課外閱讀的參考資料以本大綱所列參考資料為 主。五、考核內(nèi)容及方式本課程成績由平時(shí)成績和期末考核成績組合而成,課程成績以百分制計(jì)算, 分配比例如下:.平時(shí)成績占30%,主要考查作業(yè)的完成程度,理論課和實(shí)驗(yàn)課的出勤率,實(shí)驗(yàn)

36、課的考試結(jié)果。其中作業(yè)占10%,實(shí)驗(yàn)占15%,出勤率占5%。.期末成績占70%,采用考試的考核方式。考試采用閉卷形式,題型為選 擇題、正確/錯(cuò)誤題、填空題、簡答題,以及應(yīng)用題。六、持續(xù)改進(jìn)本課程根據(jù)學(xué)生作業(yè)、課堂討論、平時(shí)考核情況和學(xué)生、教學(xué)督導(dǎo)等反饋, 及時(shí)對教學(xué)中不足之處進(jìn)行改進(jìn),并在下一輪課程教學(xué)中改進(jìn)。七、建議教材及參考資料建議教材:1呂云翔等.Python數(shù)據(jù)分析與可視化基礎(chǔ)與應(yīng)用M.北京:機(jī)械工業(yè)出版社, 2022.Python數(shù)據(jù)分析與可視化實(shí)驗(yàn)教學(xué)大綱教學(xué)內(nèi)容及教學(xué)基本要求LPython的安裝與使用(2學(xué)時(shí))了解Python的安裝方法;了解Python在本課程中起到的作用;掌握Python的 基礎(chǔ)知識(shí),如Python包的使用方法、注釋的使用方法、Python語法知識(shí)等;掌握 使用Python編寫并運(yùn)行簡單程序的能力。.NumPy的使用(2學(xué)時(shí))了解NumPy的基本功能和安裝方式;掌握多維數(shù)組對象ndarray的使用方式; 了解ndarray對象的重要屬性;了解創(chuàng)建ndarray對象的方法;了解ndarray的索引、 切片和迭代;了解ndarray的shape的操作;了解對ndarray中的數(shù)據(jù)進(jìn)行元素級(jí)運(yùn) 算的方法。. Pandas的使用(2學(xué)時(shí))了解Pandas庫的基本功能和安裝方式;掌握Pandas庫的使用方式;了解Pa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論