Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案章節(jié)答案2024年山東工商學(xué)院_第1頁
Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案章節(jié)答案2024年山東工商學(xué)院_第2頁
Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案章節(jié)答案2024年山東工商學(xué)院_第3頁
Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案章節(jié)答案2024年山東工商學(xué)院_第4頁
Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案章節(jié)答案2024年山東工商學(xué)院_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

Python數(shù)據(jù)分析與數(shù)據(jù)可視化智慧樹知到期末考試答案+章節(jié)答案2024年山東工商學(xué)院已知data=np.arange(20),那么語句data.shape=5,-1無法執(zhí)行,因為-1沒有含義。

答案:錯擴展庫pandas中DataFrame對象的fillna()方法,當(dāng)參數(shù)inplace=True時是原地填充缺失值,當(dāng)參數(shù)inplace=False時返回填充后的新DataFrame對象。

答案:對擴展庫pandas中Series對象的hist()方法可以用于繪制直方圖。

答案:對表達(dá)式'a'*5=='aaaaa'的值為True。

答案:對擴展庫matplotlib.pyplot的函數(shù)subplot()可以用來切分繪圖區(qū)域和創(chuàng)建子圖。

答案:對包含列表的元組不可以作為集合的元素。

答案:對使用上下文管理語句with管理文件對象時,即使with塊中的代碼發(fā)生錯誤引發(fā)異常,也能保證文件被正確關(guān)閉。

答案:對書寫文件路徑時,為了減少路徑中分隔符“\”符號的輸入,同時也為了避免不正確的轉(zhuǎn)義導(dǎo)致代碼錯誤,建議使用原始字符串。

答案:對使用pandas的date_range()函數(shù)生產(chǎn)日期時間數(shù)據(jù)時,如果以6天為間隔可以設(shè)置參數(shù)freq為'6D'。

答案:對使用擴展庫pandas的函數(shù)read_excel()讀取Excel文件時,可以使用參數(shù)usecols指定只讀取哪幾列的數(shù)據(jù)。

答案:對決策樹屬于有監(jiān)督學(xué)習(xí)算法,需要根據(jù)已知樣本數(shù)據(jù)及其目標(biāo)來訓(xùn)練并得到一個可以工作的模型,然后再使用該模型對未知樣本進行分類。

答案:對擴展庫pandas的DataFrame數(shù)據(jù)中的日期時間列支持dt接口,該接口提供了dayofweek、dayofyear、is_leap_year、quarter、weekday_name等屬性和方法。

答案:對網(wǎng)格搜索常用于在指定范圍中選取最佳參數(shù)。

答案:對在循環(huán)體中必須有break語句。

答案:錯已知df為pandas的DataFrame對象,那么df[df['交易額']>1700]表示訪問df中交易額高于1700元的數(shù)據(jù)。

答案:對擴展庫pandas中DataFrame對象提供了pivot()方法和pivot_table()方法實現(xiàn)透視表所需要的功能,返回新的DataFrame對象。

答案:對已知df為pandas的DataFrame對象,那么df.describe()可以返回所有列的數(shù)值數(shù)量、最小值、最大值、標(biāo)準(zhǔn)差、平均值等信息。

答案:錯交叉驗證可以用來檢驗?zāi)P偷姆夯芰蛘咴u估模型的質(zhì)量。

答案:對已知x=map(int,'123'),那么連續(xù)執(zhí)行多次list(x)都可以得到同樣的列表[1,2,3]。

答案:錯機器學(xué)習(xí)擴展庫sklearn中的評估器對象都提供了fit()方法使用數(shù)據(jù)對模型進行擬合和訓(xùn)練。

答案:對已知df為pandas的DataFrame對象,那么df[df['姓名'].isin(['張三','李四'])]表示訪問df中“姓名”列的值為“張三”或“李四”的數(shù)據(jù)。

答案:對擴展庫numpy的線性代數(shù)子模塊linalg中提供了用來計算不同范數(shù)的函數(shù)norm()。

答案:對擴展庫matplotlib.pyplot中的函數(shù)pie()可以用來繪制哪種圖形?

答案:餅狀圖使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的分欄數(shù)目?

答案:ncol表達(dá)式np.random.randn(3,4).shape的值為____________。

答案:(3,4)表達(dá)式not{}的值為____________。

答案:True表達(dá)式max([1111,222,33,4],key=str)的值為?

答案:4使用可視化擴展庫matplotlib的模塊pyplot中的bar()函數(shù)繪制柱狀圖時,下面哪個參數(shù)可以用來設(shè)置柱的邊框線寬?

答案:lw使用可視化擴展庫matplotlib的模塊pyplot中的scatter()函數(shù)繪制散點圖時,下面哪個參數(shù)可以用來設(shè)置散點的顏色?

答案:c已知x=np.array([1,2,3])和y=np.array([[3],[4],[5]]),那么表達(dá)式(x*y).sum()的值為____________。

答案:72Python語言中字符串對象的哪個方法可以替換其中的子串,類似于Word中的“全部替換”功能。

答案:replace()假設(shè)已使用fromfunctoolsimportreduce導(dǎo)入reduce函數(shù),那么表達(dá)式reduce(lambdax,y:x*y,range(10))的值為?

答案:0使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置餅狀圖中第一個扇形區(qū)域的起始角度?

答案:startangle擴展庫pandas中DataFrame對象的哪個方法可以用來計算數(shù)據(jù)差分?

答案:diff()使用可視化擴展庫matplotlib的模塊pyplot中的bar()函數(shù)繪制柱狀圖時,下面哪個參數(shù)可以用來設(shè)置柱的顏色?

答案:color機器學(xué)習(xí)擴展庫sklearn的neighbors模塊提供了k近鄰算法的實現(xiàn)。

答案:對機器學(xué)習(xí)擴展庫sklearn的model_selection模塊實現(xiàn)了多個交叉驗證器類以及用于學(xué)習(xí)曲線、數(shù)據(jù)集分割的函數(shù)。

答案:對已知x=np.arange(30).reshape(5,6),那么語句x[[0,3],:]=0的功能為把數(shù)組x中行下標(biāo)為0和3的所有元素值都修改為0。

答案:對擴展庫sklearn.linear_model中LinearRegression類的對象擬合完成之后,可以通過屬性coef_查看回歸系數(shù)。

答案:對在Python中,可調(diào)用對象主要包括函數(shù)(function)、lambda表達(dá)式、類(class)、類的方法(method)、實現(xiàn)了特殊方法__call__()的類的對象,這些對象作為內(nèi)置函數(shù)callable()的參數(shù)會使得該函數(shù)返回True。

答案:對數(shù)組的reshape()方法不能修改元素個數(shù),resize()方法可以。

答案:對關(guān)聯(lián)規(guī)則分析或者關(guān)聯(lián)規(guī)則學(xué)習(xí)主要用于從大規(guī)模數(shù)據(jù)中尋找物品之間隱含的或者可能存在的聯(lián)系,從而實現(xiàn)某種意義上的預(yù)測。

答案:對擴展庫sklearn.linear_model中LinearRegression類的對象擬合完成之后,可以通過score()在測試數(shù)據(jù)集上進行評分來驗證模型的質(zhì)量。

答案:對已知df為包含若干(大于10)行和列數(shù)據(jù)的DataFrame對象,那么df[:5]可以查看前5列數(shù)據(jù)。

答案:錯使用擴展庫pandas中DataFrame對象的iloc方法訪問數(shù)據(jù)時,可以使用DataFrame的index標(biāo)簽,也可以使用整數(shù)序號來指定要訪問的行和列。

答案:錯Python的for和while循環(huán)必須帶else子句。

答案:錯在機器學(xué)習(xí)擴展庫sklearn中,SVC類的參數(shù)C用來設(shè)置錯誤項的懲罰參數(shù)C,值越大對誤分類的懲罰越小,間隔越小,對錯誤的容忍度越高。

答案:錯使用擴展庫pandas的函數(shù)read_excel()讀取Excel文件時,可以使用參數(shù)index_col指定把哪一列的數(shù)據(jù)作為DataFrame對象的index。

答案:對依次執(zhí)行語句s='abcabc'和s.replace('a','d')之后,變量s的值為'dbcdbc'?

答案:錯使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置每個扇形區(qū)域的填充顏色?

答案:colors使用可視化擴展庫matplotlib的模塊pyplot中的scatter()函數(shù)繪制散點圖時,下面哪個參數(shù)可以用來設(shè)置散點符號的透明度?

答案:alpha在機器學(xué)習(xí)擴展庫sklearn中,KMeans聚類模型完成聚類之后,可以通過_____________屬性查看各個聚類的中心。

答案:cluster_centers_已知data=np.arange(20).reshape(5,4),那么表達(dá)式len(data[[3,2],[0,3]])的值為?

答案:2已知列表data=[1,2,3,4],那么data[2:100]的值為_________。

答案:[3,4]使用可視化擴展庫matplotlib的模塊pyplot中的xlabel()函數(shù)設(shè)置x軸標(biāo)簽時,下面哪個參數(shù)可以用來設(shè)置字體?

答案:fontproperties使用np.arange(8)生成的數(shù)組中最后一個元素的值為____________。

答案:7使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置餅狀圖的圓心?

答案:center使用UTF8編碼格式的中文文本文件可以直接使用GBK編碼格式進行解碼。

答案:錯擴展庫sklearn.svm中提供了線性支持向量機分類器LinearSVC、線性支持向量機回歸器LinearSVR,基于libsvm的支持向量機分類器SVC、支持向量機回歸器SVR,無監(jiān)督異常值檢測OneClassSVM,以及NuSVC和NuSVR。

答案:對機器學(xué)習(xí)擴展庫sklearn的tree模塊提供了用于分類和回歸的決策樹模型。

答案:對使用DBSCAN算法進行聚類時,需要使用參數(shù)指定聚類的數(shù)量。

答案:錯理想的模型應(yīng)該方差和偏差都很小。

答案:對表達(dá)式{3,2,1}>{1,2,3}的值為True。

答案:錯擴展庫pandas中Series對象的add_suffix()方法可以用于在每行索引后面增加后綴。

答案:對已知x=np.matrix([1,2,3,4,5]),那么表達(dá)式x*x.T的值為matrix([[55]])。

答案:對在Python3.x中,reduce()是內(nèi)置函數(shù),可以直接使用。

答案:錯聚類屬于有監(jiān)督學(xué)習(xí)。

答案:錯使用擴展庫pandas中DataFrame對象的loc方法訪問數(shù)據(jù)時,可以使用DataFrame的index標(biāo)簽,也可以使用整數(shù)序號來指定要訪問的行和列。

答案:對在Python3.x中,內(nèi)置函數(shù)input()用來接收用戶的鍵盤輸入,不管輸入什么,都以字符串形式返回。

答案:對擴展庫pandas中DataFrame對象的nsmallest()方法可以返回某列值最小的前幾條數(shù)據(jù)。

答案:對已知x和y是兩個等長的一維數(shù)組,那么表達(dá)式x.dot(y)和sum(x*y)的值相等。

答案:對使用可視化擴展庫matplotlib的模塊pyplot中的scatter()函數(shù)繪制散點圖時,下面哪個參數(shù)可以用來設(shè)置散點符號的大???

答案:s使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置餅狀圖是否顯示陰影?

答案:shadow使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例中符號在前還是文字在前?

答案:markerfirst已知data=np.array([5,8,4,2,0]),那么表達(dá)式data.argmax()的值為?

答案:1表達(dá)式np.random.randn(3).shape的值為____________。

答案:(3,)表達(dá)式{40,50,60}|{40,60,70}的值為______________。

答案:{70,40,50,60}擴展庫pandas中的Series對象哪個方法可以返回最小的前n個數(shù)據(jù)?

答案:nsmallest()使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的標(biāo)題?

答案:title已知字典data={'a':97,'A':65},那么data.get('a',None)的值為________。

答案:97已知x=np.array((1,2,3,4,5)),那么表達(dá)式(x*2).sum()的值為____________。

答案:30已知x=np.array([3,5,1,9,6,3]),那么表達(dá)式x[(x%2==0)&(x>5)][0]的值為____________。

答案:6表達(dá)式3and5的值為____________。

答案:5已知data=np.arange(20).reshape(5,4),那么表達(dá)式data[3,2]的值為?

答案:14擴展庫pandas中Series對象和DataFrame的列數(shù)據(jù)提供了cat、dt、str三種屬性接口(accessors),分別對應(yīng)分類數(shù)據(jù)、日期時間數(shù)據(jù)和字符串?dāng)?shù)據(jù)。

答案:對擴展庫pandas提供了crosstab()函數(shù)根據(jù)一個DataFrame對象中的數(shù)據(jù)生成交叉表,返回新的DataFrame對象。

答案:對擴展庫numpy的isclose()和allclose()用來測試兩個數(shù)組是否嚴(yán)格相等。

答案:錯擴展庫pandas中DataFrame對象groupby()方法的參數(shù)as_index=False時用來設(shè)置分組的列中的數(shù)據(jù)不作為結(jié)果DataFrame對象的index

答案:對兩個不等長的數(shù)組不能相加。

答案:錯對于分類算法而言,準(zhǔn)確率定義被正確分類的樣本數(shù)量與樣本總數(shù)量的比值。

答案:對擴展庫pandas的DataFrame數(shù)據(jù)中的字符串列支持str接口,該接口提供了center、contains、count、endswith、find、extract、lower、split等大量屬性和方法。

答案:對歐幾里德距離和曼哈頓距離可以看作閔科夫斯基距離的特例。

答案:對擴展庫pandas中DataFrame結(jié)構(gòu)的diff()對象支持進行數(shù)據(jù)差分,返回新的DataFrame對象。

答案:對下面表達(dá)式中等價于False的是?

答案:[]表達(dá)式chr(ord('0')+3)的值為___________。

答案:'3'使用np.zeros((3,4))生成的數(shù)組中元素個數(shù)為____________。

答案:12已知data=np.arange(20).reshape(5,4),那么表達(dá)式data.sum(axis=1)[0]的值為?

答案:40Python語言中字符串對象的哪個方法可以查看另一個字符串在當(dāng)前字符串中出現(xiàn)的次數(shù)?

答案:count()使用pip命令在線安裝擴展庫numpy的完整命令是____________。

答案:pipinstallnumpy假設(shè)已使用importmatplotlib.pyplotasplt導(dǎo)入擴展庫,那么語句ax1=plt.subplot(221)執(zhí)行之后,ax1表示畫布左上角的子圖。

答案:對擴展庫pandas中DataFrame對象的nlargest()方法可以返回某列值最大的前幾條數(shù)據(jù)。

答案:對主成分分析(PrincipalComponentAnalysis,PCA)是一種比較常用的線性降維方法,該方法通過對矩陣進行奇異值分解把高維空間中的數(shù)據(jù)映射到低維空間中重新表示,并期望在投影后的維度上方差最大,使得投影后的維度盡可能少,同時又保留盡可能多的原數(shù)據(jù)特征。

答案:對在擴展庫sklearn.naive_bayes中提供了三種樸素貝葉斯算法,分別是伯努利樸素貝葉斯BernoulliNB、高斯樸素貝葉斯GaussianNB和多項式樸素貝葉斯MultinomialNB,分別適用于伯努利分布(又稱二項分布或0-1分布)、高斯分布(也稱正態(tài)分布)和多項式分布的數(shù)據(jù)集。

答案:對已知df為pandas的DataFrame對象,那么df[df['交易額'].between(800,850)]表示訪問df中“交易額”列的值介于800和850之間的數(shù)據(jù)。

答案:對表達(dá)式np.diag((1,2,3,4)).shape的值為____________。

答案:(4,4)使用可視化擴展庫matplotlib的模塊pyplot中的scatter()函數(shù)繪制散點圖時,下面哪個參數(shù)可以用來設(shè)置散點的符號?

答案:marker擴展庫matplotlib.pyplot中的函數(shù)polar()可以用來繪制哪種圖形?

答案:雷達(dá)圖表達(dá)式all(np.random.rand(20000)<1)的值為____________。

答案:True在訓(xùn)練模型時,如果每個樣本都有預(yù)期的目標(biāo)或理想值,稱作有監(jiān)督學(xué)習(xí)。

答案:對已知df為pandas的DataFrame對象,那么df.at[3,'姓名']表示訪問行下標(biāo)為3,姓名列的值。

答案:對擴展庫pandas中Series對象的add_prefix()方法可以用于在每行索引前面增加前綴。

答案:對隨機試驗是指這樣的試驗,可以在相同條件下重復(fù)試驗多次,所有可能發(fā)生的結(jié)果都是已知的,但每次試驗到底會發(fā)生其中哪一種結(jié)果是無法預(yù)先確定的。

答案:對表達(dá)式-68//7的值為__________。

答案:-10擴展庫pandas中DataFrame對象支持使用dropna()方法丟棄帶有缺失值的數(shù)據(jù)行,或者使用fillna()方法對缺失值進行批量替換,也可以使用loc()、iloc()方法直接對符合條件的數(shù)據(jù)進行替換。

答案:對標(biāo)準(zhǔn)差是一組數(shù)據(jù)分散程度或波動程度的一種度量,也是數(shù)據(jù)不確定性或不穩(wěn)定性的一種度量。對于一組特定的數(shù)據(jù),如果標(biāo)準(zhǔn)差較大則代表大部分?jǐn)?shù)值和其平均值之間差異較大,如果標(biāo)準(zhǔn)差較小則代表這些數(shù)值較接近平均值。

答案:對已知x=np.array((1,2,3,4,5)),那么表達(dá)式(2**x).max()的值為____________。

答案:32機器學(xué)習(xí)擴展庫sklearn的cluster模塊中提供了DBSCAN、KMeans等大量聚類算法的實現(xiàn)。

答案:對在可視化擴展庫matplotlib的模塊pyplot中,plot(x,y,'r-+')使用等長數(shù)組x和y中對應(yīng)元素作為端點坐標(biāo)繪制紅色實心線并使用加號標(biāo)記端點。

答案:對表達(dá)式np.diag((1,2,3,4)).size的值為____________。

答案:16已知x=np.random.randint(0,100,(3,5)),那么表達(dá)式np.ceil(abs(np.sin(x))).sum()的值為____________。

答案:15.0使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的位置?

答案:loc擴展庫pandas的read_excel()函數(shù)用于讀取Excel文件中的數(shù)據(jù)并創(chuàng)建DataFrame對象。

答案:對擴展庫pandas中DataFrame對象支持sort_index()方法沿某個方向按標(biāo)簽進行排序并返回一個新的DataFrame對象。

答案:對使用擴展庫pandas的函數(shù)read_excel()讀取Excel文件時,可以使用參數(shù)thousands指定把什么符號作為千分符。

答案:對嶺回歸是一種用于共線性數(shù)據(jù)(自變量之間存在較強的線性關(guān)系)分析的有偏估計回歸方法,是一種改良的最小二乘估計法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價從而獲得更符合實際、更可靠的回歸系數(shù),對病態(tài)數(shù)據(jù)(這樣的數(shù)據(jù)中某個元素的微小變動會導(dǎo)致計算結(jié)果誤差很大)的擬合效果比最小二乘法好。

答案:對使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例是否顯示陰影效果?

答案:shadow擴展庫pandas的DataFrame對象的plot()方法可以直接繪制折線圖、柱狀圖、餅狀圖等各種形狀的圖形來展示數(shù)據(jù),繪圖時會自動調(diào)用擴展庫matplotlib的功能。

答案:對擴展庫pandas中DataFrame結(jié)構(gòu)支持使用groupby()方法根據(jù)指定的一列或多列的值進行分組,得到一個GroupBy對象,該GroupBy對象支持大量方法對列數(shù)據(jù)進行求和、求均值以及其他操作,并自動忽略非數(shù)值列。

答案:對列表的sort()方法沒有返回值,或者說返回值為_________。

答案:None機器學(xué)習(xí)擴展庫sklearn中的評估器對象大多提供了predict()方法用來對未知數(shù)據(jù)進行預(yù)測或分類。

答案:對隨機森林是一種集成學(xué)習(xí)方法,基本思想是把幾棵不同參數(shù)的決策樹打包到一起,每棵決策樹單獨進行預(yù)測,然后計算所有決策樹預(yù)測結(jié)果的平均值(適用于回歸分析)或所有決策樹“投票”得到最終結(jié)果(適用于分類)。

答案:對條件概率也稱后驗概率,是指在另一個事件B已經(jīng)發(fā)生的情況下事件A發(fā)生的概率,記為P(A|B)。

答案:對熵表示的是數(shù)據(jù)中包含的信息量大小或著數(shù)據(jù)的混亂程度。熵越小,數(shù)據(jù)的純度越高,數(shù)據(jù)越趨于一致,混亂程度越低;熵越大,數(shù)據(jù)的純度越低,數(shù)據(jù)混亂程度越高。

答案:對模塊sklearn.linear_model中的RidgeCV實現(xiàn)了帶有內(nèi)置的alpha參數(shù)交叉驗證的嶺回歸算法,類似于GridSearchCV,可用來在指定范圍內(nèi)自動搜索和確定約束項的最佳系數(shù)。

答案:對KMeans算法的基本思想是:選擇樣本空間中k個樣本(點)為初始中心,然后對剩余樣本進行聚類,每個中心把距離自己最近的樣本“吸引”過來,然后更新聚類中心的值,依次把每個樣本歸到距離最近的類中,重復(fù)上面的過程,直至得到某種條件下最好的聚類結(jié)果。

答案:對機器學(xué)習(xí)擴展庫sklearn在model_selection模塊中提供了用來實現(xiàn)交叉驗證的函數(shù)cross_val_score()。

答案:對擴展庫pandas中DataFrame對象的index屬性表示列名。

答案:錯一般地,不會把給定的整個數(shù)據(jù)集都用來訓(xùn)練模型,而是將其分成訓(xùn)練集和測試集兩部分,使用訓(xùn)練集對模型進行訓(xùn)練或?qū)W習(xí),然后把測試集輸入訓(xùn)練好的模型并評估其表現(xiàn)。

答案:對在進行數(shù)據(jù)分析和挖掘時,應(yīng)使用樣本盡可能多的特征,這樣可以得到更理想的結(jié)果。

答案:錯擴展庫pandas中DataFrame對象的std()方法可以計算標(biāo)準(zhǔn)差,cov()方法可以計算協(xié)方差。

答案:對對于復(fù)雜表達(dá)式,如果計算結(jié)果是正確的,那么不建議再增加圓括號來說明計算順序,這樣可以使得代碼更加簡潔清晰。

答案:錯在使用KNN算法對未知樣本進行分類時,已知類別中各類別包含的樣本數(shù)量最好差不多,否則會影響結(jié)果的準(zhǔn)確性。

答案:對擴展庫numpy的函數(shù)corrcoef()用來計算相關(guān)系數(shù)矩陣。

答案:對已知df為pandas的DataFrame對象,那么df[:10]表示訪問df中前10列數(shù)據(jù)。

答案:錯方差用來描述數(shù)據(jù)的離散程度或者波動程度,比較分散的數(shù)據(jù)集的方差大,而相對集中的數(shù)據(jù)集的方差小。

答案:對擴展庫numpy的線性代數(shù)子模塊linalg中提供了求解線性方程組的函數(shù)solve()和求解線性方程組最小二乘解的函數(shù)lstsq()。

答案:對線性回歸算法只適用于具有兩個特征的樣本,不適用于具有3個以上特征的樣本數(shù)據(jù)。

答案:錯擴展庫sklearn.linear_model中的LinearRegression類實現(xiàn)了線性回歸算法。

答案:對擴展庫pandas支持使用Python字典直接創(chuàng)建DataFrame對象,此時字典中的“鍵”將作為DataFrame中的columns。

答案:對基尼值越大,表示數(shù)據(jù)純度越低,也表示從樣本空間中隨機選取兩個樣本時這兩個樣本所屬類別不一樣的概率越大。

答案:對聚類算法KMeans屬于有監(jiān)督學(xué)習(xí)算法。

答案:錯已知x=np.matrix([[1,2,3],[4,5,6]]),那么表達(dá)式x.mean(axis=0)的值為matrix([[2.5,3.5,4.5]])。

答案:對在使用pandas進行處理時,需要借助于人工分析根據(jù)具體的業(yè)務(wù)數(shù)據(jù)來確定異常值的閾值。

答案:對在對文件進行讀寫時,文件指針的位置會自動變化,始終表示讀寫的當(dāng)前位置。

答案:對擴展庫numpy的線性代數(shù)子模塊linalg中提供了用來計算特征值與特征向量的函數(shù)eig()。

答案:對擴展庫jieba的函數(shù)cut()可以用來對中文文本進行分詞并返回包含分詞結(jié)果的列表。

答案:錯擴展庫numpy的線性代數(shù)子模塊linalg中提供了用來計算逆矩陣的函數(shù)inv()。

答案:對假設(shè)已使用importmatplotlib.pyplotasplt導(dǎo)入擴展庫,那么語句ax2=plt.subplot(222,projection='polar')執(zhí)行之后,ax2表示畫布右上角的子圖,并且在該子圖中可以繪制極坐標(biāo)圖。

答案:對擴展庫numpy函數(shù)cov()可以用來計算協(xié)方差,函數(shù)std()用來計算標(biāo)準(zhǔn)差。

答案:對在可視化擴展庫matplotlib的模塊pyplot中,plot(x,y,'g--v')使用等長數(shù)組x和y中對應(yīng)元素作為端點坐標(biāo)繪制綠色短劃線并以下三角標(biāo)記端點。

答案:對機器學(xué)習(xí)擴展庫sklearn的naive_bayes模塊提供了樸素貝葉斯算法的實現(xiàn)。

答案:對已知df為pandas的DataFrame對象,那么df[:10]表示訪問df中前10行數(shù)據(jù)。

答案:對在使用KNN算法對未知樣本進行分類時,參數(shù)k的取值不重要,對結(jié)果影響不大。

答案:錯概率是用來描述在特定試驗中一個事件發(fā)生的可能性大小的指標(biāo),是介于0和1之間的實數(shù),可以定義為某個事件發(fā)生的次數(shù)與試驗總次數(shù)的比值。

答案:對表達(dá)式len(np.random.randint(0,50,5))的值為____________。

答案:5在機器學(xué)習(xí)擴展庫sklearn中,KMeans聚類模型完成聚類之后,可以通過_____________屬性查看樣本的標(biāo)簽。

答案:labels_已知x=np.array((1,2,3,4,5)),那么表達(dá)式(x//5).sum()的值為____________。

答案:1已知x=np.array((1,2,3,4,5)),那么表達(dá)式(x**2).max()的值為____________。

答案:25使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置每個扇形區(qū)域偏離圓心的程度?

答案:explode表達(dá)式{40,50,60}&{40,60,70}的值為______________。

答案:{40,60}使用可視化擴展庫matplotlib的模塊pyplot中的xlabel()函數(shù)設(shè)置x軸標(biāo)簽時,下面哪個參數(shù)可以用來設(shè)置字號?

答案:fontsize已知x=np.array((1,2,3,4,5)),那么表達(dá)式sum(x*x)的值為____________。

答案:55已知x=np.array([3,5,1,9,6,3]),那么表達(dá)式np.argmax(x)的值為____________。

答案:3表達(dá)式np.ones((3,4)).sum()的值為____________。

答案:12表達(dá)式{40,50,60}-{40,60,70}的值為____________。

答案:{50}已知x=np.array([3,5,1,9,6,3]),那么表達(dá)式x[x>5].sum()的值為____________。

答案:15使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的邊框顏色?

答案:edgecolor已知x=[1,2,3]和y=[4,5,6],那么表達(dá)式sum(map(lambdai,j:i*j,x,y))的值為?

答案:32已知x=np.array([3,5,1,9,6,3]),那么表達(dá)式np.where(x>5,1,0).sum()的值為____________。

答案:2使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的背景顏色?

答案:facecolorPython的主程序文件python.exe屬于二進制文件。

答案:對函數(shù)內(nèi)部定義的局部變量當(dāng)函數(shù)調(diào)用結(jié)束后被自動刪除。

答案:對使用可視化擴展庫matplotlib的模塊pyplot中的legend()函數(shù)創(chuàng)建和顯示圖例時,下面哪個參數(shù)可以用來設(shè)置圖例的字體?

答案:prop使用可視化擴展庫matplotlib的模塊pyplot中的bar()函數(shù)繪制柱狀圖時,下面哪個參數(shù)可以用來設(shè)置柱的位置?

答案:left擴展庫matplotlib.pyplot中的函數(shù)bar()可以用來繪制哪種圖形?

答案:柱狀圖假設(shè)已使用importmatplotlibasmpl導(dǎo)入可視化擴展庫,那么mpl.rcParams['legend.fontsize']=10語句的功能是設(shè)置圖例的字號。

答案:對使用可視化擴展庫matplotlib的模塊pyplot中的pie()函數(shù)繪制餅狀圖時,下面哪個參數(shù)用來設(shè)置餅狀圖的半徑?

答案:radius可視化擴展庫matplotlib的模塊pyplot中哪個函數(shù)可以用來設(shè)置同一個畫布中多個子圖之間的水平間距和垂直間距?

答案:subplots_adjust()擴展庫matplotlib.pyplot中的函數(shù)scatter()可以用來繪制哪種圖形?

答案:散點圖使用可視化擴展庫matplotlib的模塊pyplot中的bar()函數(shù)繪制柱狀圖時,下面哪個參數(shù)可以用來設(shè)置柱的內(nèi)部填充符號?

答案:hatch擴展庫matplotlib.pyplot中的函數(shù)plot()可以用來繪制哪種圖形?

答案:折線圖使用可視化擴展庫matplotlib的模塊pyplot中的xticks()函數(shù)設(shè)置x軸刻度時,下面哪個參數(shù)用來設(shè)置刻度文本的旋轉(zhuǎn)角度?

答案:rotation圖例往往位于圖形繪制結(jié)果的一角或一側(cè),也可以根據(jù)圖形的特點來設(shè)置位置以及背景色等其他樣式,主要用于對所繪制的圖形中使用的各種符號和顏色進行說明,對于理解圖形有重要的作用。

答案:對使用樸素貝葉斯算法進行分類時,分別計算未知樣本屬于每個已知類的概率,然后選擇其中概率最大的類作為分類結(jié)果。

答案:對在機器學(xué)習(xí)擴展庫sklearn中,Lasso是可以估計稀疏系數(shù)的線性模型,尤其適用于減少給定解決方案依賴的特征數(shù)量的場合。如果數(shù)據(jù)的特征過多,而其中只有一小部分是真正重要的,此時選擇Lasso比較合適。

答案:對DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)屬于密度聚類算法,把類定義為密度相連對象的最大集合,通過在樣本空間中不斷搜索高密度的核心樣本并擴展得到最大集合完成聚類,能夠在帶有噪點的樣本空間中發(fā)現(xiàn)任意形狀的聚類并排除噪點。

答案:對在樣本的眾多特征中,并不是每個特征都對要分析的問題有貢獻(xiàn)。即使是對問題有貢獻(xiàn)的若干特征,每個特征的重要程度可能也不一樣。

答案:對KNN算法是k-NearestNeighbor的簡稱,叫作k近鄰算法,屬于有監(jiān)督學(xué)習(xí)算法,既可以用于分類,也可以用于回歸。

答案:對DBSCAN算法不需要預(yù)先指定聚類數(shù)量,但對用戶設(shè)定的參數(shù)非常敏感。當(dāng)空間聚類的密度不均勻、聚類間距相差很大時,聚類質(zhì)量較差。

答案:對支持向量機(SupportVectorMachine,SVM)是通過尋找超平面對樣本進行分隔從而實現(xiàn)分類或預(yù)測的算法,分隔樣本時的原則是使得間隔最大化,尋找間隔最大的支持向量。

答案:對如果DataFrame對象中索引是日期時間數(shù)據(jù),或者包含日期時間類型數(shù)據(jù)列,可以使用resample()方法進行重采樣,實現(xiàn)按時間段進行統(tǒng)計查看員工業(yè)績的功能。

答案:對擴展庫pandas中DataFrame對象的drop_duplicates()方法可以用來刪除重復(fù)的數(shù)據(jù)。

答案:對使用擴展庫pandas的函數(shù)read_excel()讀取Excel文件時,可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論