第一講 數(shù)據(jù)整理與描述_第1頁(yè)
第一講 數(shù)據(jù)整理與描述_第2頁(yè)
第一講 數(shù)據(jù)整理與描述_第3頁(yè)
第一講 數(shù)據(jù)整理與描述_第4頁(yè)
第一講 數(shù)據(jù)整理與描述_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一講數(shù)據(jù)整理與描述第一頁(yè),共三十四頁(yè),2022年,8月28日第一部分:各講學(xué)習(xí)概要第一講:數(shù)據(jù)的整理與描述第二講:統(tǒng)計(jì)指數(shù)第三講:動(dòng)態(tài)數(shù)列第四講:抽樣調(diào)查及估計(jì)第五講:假設(shè)檢驗(yàn)第六講:相關(guān)分析與回歸分析第二頁(yè),共三十四頁(yè),2022年,8月28日第一講數(shù)據(jù)整理與描述在日常用語(yǔ)中,術(shù)語(yǔ)“統(tǒng)計(jì)學(xué)”稱為數(shù)字事實(shí)。然而,統(tǒng)計(jì)學(xué)所涉及到的領(lǐng)域或?qū)W科比數(shù)字事實(shí)要多得多。從廣義上來(lái)說(shuō),統(tǒng)計(jì)是收集、分析、列示和解釋數(shù)據(jù)的一門藝術(shù)和科學(xué)。特別是在商務(wù)和經(jīng)濟(jì)中,對(duì)數(shù)據(jù)進(jìn)行收集、分析、列示和解釋的一個(gè)主要原因,是它可以使經(jīng)理和決策者們更好地理解商業(yè)和經(jīng)濟(jì)環(huán)境,得到更多的信息,做出更好的決策。一、統(tǒng)計(jì)在商務(wù)中經(jīng)濟(jì)中的應(yīng)用在當(dāng)代全球性商務(wù)和經(jīng)濟(jì)環(huán)境中,可以獲取大量的統(tǒng)計(jì)信息。最成功的管理者和決策者是那些能夠理解和有效地運(yùn)用統(tǒng)計(jì)信息的人。第三頁(yè),共三十四頁(yè),2022年,8月28日(一)會(huì)計(jì)當(dāng)會(huì)計(jì)師事務(wù)所為其客戶進(jìn)行審計(jì)時(shí),他們要利用統(tǒng)計(jì)抽樣方法。例如,假定一家會(huì)計(jì)師事務(wù)所想要確定某客戶資產(chǎn)負(fù)債表中所顯示的應(yīng)收賬款余額是否公允地反映了其真實(shí)的應(yīng)收賬款余額。通常,審計(jì)人員抽取一個(gè)樣本。在對(duì)被抽取賬戶的正確性進(jìn)行了審查后,審計(jì)人員就可以得出關(guān)于該客戶資產(chǎn)負(fù)債表中所列示的應(yīng)收賬款余額是否屬實(shí)的結(jié)論。(二)金融金融顧問(wèn)們利用各種統(tǒng)計(jì)數(shù)據(jù)來(lái)引導(dǎo)投資。拿股票投資來(lái)說(shuō),顧問(wèn)們檢查包括市盈率和紅利在內(nèi)的一系列金融數(shù)據(jù)。通過(guò)將某只個(gè)股的數(shù)據(jù)與股票市場(chǎng)平均數(shù)進(jìn)行比較,金融顧問(wèn)們就能夠判斷該只股票的價(jià)值是被高估還是低估了。將幫助顧問(wèn)們做出買入、賣出還是繼續(xù)持有該股的建議。第四頁(yè),共三十四頁(yè),2022年,8月28日(三)營(yíng)銷裝在零售收銀臺(tái)的電子掃描設(shè)備是用來(lái)為各種各樣的營(yíng)銷研究的應(yīng)用收集資料的。例如,像尼爾森公司和數(shù)據(jù)資源公司等數(shù)據(jù)提供商從雜貨商店購(gòu)買關(guān)于銷售的掃描數(shù)據(jù),然后將其加工成綜合的統(tǒng)計(jì)數(shù)據(jù)賣給生產(chǎn)商。掃描獲得的統(tǒng)計(jì)數(shù)據(jù)和促銷活動(dòng)獲得的統(tǒng)計(jì)住處來(lái)更好地了解促銷活動(dòng)的銷售兩者之間的關(guān)系。這種分析對(duì)于各種產(chǎn)品將來(lái)的營(yíng)銷策略很有幫助。(四)生產(chǎn)由于現(xiàn)在非常強(qiáng)調(diào)產(chǎn)品的質(zhì)量,因此質(zhì)量控制是統(tǒng)計(jì)在生產(chǎn)中的一個(gè)重要應(yīng)用。許多統(tǒng)計(jì)質(zhì)量控制圖被用來(lái)控制某生產(chǎn)過(guò)程的產(chǎn)量,尤其是可以用χ條形圖來(lái)控制平均產(chǎn)量。第五頁(yè),共三十四頁(yè),2022年,8月28日(五)經(jīng)濟(jì)人們經(jīng)常要求經(jīng)濟(jì)學(xué)家們對(duì)將來(lái)的經(jīng)濟(jì)以及其他方面進(jìn)行預(yù)測(cè)。在進(jìn)行這些預(yù)測(cè)時(shí),他們要用到各種各樣的統(tǒng)計(jì)信息。例如,在預(yù)測(cè)通貨膨脹率時(shí),經(jīng)濟(jì)學(xué)家們就要用到諸如生產(chǎn)者價(jià)格指數(shù)、失業(yè)率和生產(chǎn)利用能力等方面的統(tǒng)計(jì)住處通常這些統(tǒng)計(jì)住處指標(biāo)被輸入到計(jì)算預(yù)測(cè)模型中來(lái)預(yù)測(cè)通貨膨脹率。二、數(shù)據(jù)的類型根據(jù)描述事物所采用的不同度量尺度,數(shù)據(jù)可分為分類型數(shù)據(jù)和數(shù)量型數(shù)據(jù)。分類型數(shù)據(jù)描述的是事物的品質(zhì)特征。例如,人的性別、民族、職業(yè)等。數(shù)據(jù)型數(shù)據(jù)說(shuō)明的是事物的數(shù)量特征。例如,產(chǎn)品的產(chǎn)量和壽命、企業(yè)的營(yíng)業(yè)額、股票的價(jià)格、產(chǎn)品的市場(chǎng)占有率、國(guó)民總產(chǎn)值、國(guó)家的人口等等,都是數(shù)量型數(shù)據(jù)。數(shù)量型數(shù)據(jù)用數(shù)值形式表示。第六頁(yè),共三十四頁(yè),2022年,8月28日數(shù)據(jù)按照被描述的對(duì)象與時(shí)間的關(guān)系分為截面數(shù)據(jù)、時(shí)間序列數(shù)據(jù)與平行數(shù)據(jù)。截面數(shù)據(jù)描述的是事物在某一時(shí)刻的變化情況,即所謂橫向數(shù)據(jù)。時(shí)間序列數(shù)據(jù)描述的是事物在一定的時(shí)間范圍內(nèi)的變化情況,即所謂縱向數(shù)據(jù)。平行數(shù)據(jù)是截面數(shù)據(jù)與時(shí)間序列數(shù)據(jù)的組合在統(tǒng)計(jì)中,我們把對(duì)事物現(xiàn)象特征的描述稱為變量。如果它是分類型數(shù)據(jù),稱為分類型變量;如果它是數(shù)量型數(shù)據(jù),則稱為數(shù)量型變量。很多情況下,我們所研究的變量都是數(shù)量型變量,大多數(shù)的統(tǒng)計(jì)分析方法也都是對(duì)于數(shù)量型變量的分析,因此有時(shí)把數(shù)量型變量簡(jiǎn)稱為變量。

第七頁(yè),共三十四頁(yè),2022年,8月28日三、數(shù)據(jù)的整理與圖表顯示(一)數(shù)據(jù)的分組與頻率直方圖統(tǒng)計(jì)分組是數(shù)據(jù)整理的一項(xiàng)初步工作,它是根據(jù)實(shí)際需要,將數(shù)據(jù)按照數(shù)據(jù)的某種特征或標(biāo)準(zhǔn)分成不同的組別。按照數(shù)據(jù)的某種特征對(duì)數(shù)據(jù)進(jìn)行分組后,再計(jì)算出所有類別或數(shù)據(jù)在各組中出現(xiàn)的次數(shù)或頻數(shù),就形成了頻數(shù)分布表。我們稱全部數(shù)據(jù)在各組內(nèi)的分配狀況為數(shù)據(jù)的頻數(shù)分布,分配在各組內(nèi)的數(shù)據(jù)個(gè)數(shù)為頻數(shù),頻數(shù)與全體數(shù)據(jù)個(gè)數(shù)之比稱為頻率。分類型數(shù)據(jù)按類計(jì)算出各類的頻數(shù)或頻率,就形成了頻數(shù)或頻率分布表。分類型數(shù)據(jù)按類分組時(shí),一定要注意既不能重?cái)?shù)也不能漏數(shù),這應(yīng)要求所有類別必須有明確的界定。對(duì)于數(shù)量型數(shù)據(jù),我們只簡(jiǎn)單介紹兩種方法——單變量值分組法和組距分組法。第八頁(yè),共三十四頁(yè),2022年,8月28日單變量值分組法就是把每一個(gè)變量值作為一個(gè)組。例:某單位有職工20人,下面是六月份該單位職工請(qǐng)假天數(shù)的記錄:

0,0,1,0,2,1,0,0,0,1,2,0,5,1,1,0,0,0,10,0觀察這個(gè)記錄,我們不難發(fā)現(xiàn),所有不同的請(qǐng)假天數(shù)一共只有5個(gè),即0、1、2、5和10。因此,采用單變量值分組方法分組的話,應(yīng)該發(fā)成5個(gè)組。請(qǐng)假天數(shù)頻數(shù)(人)頻率(%)累積頻率(%)0115555152580221090515951015100合計(jì)20100

第九頁(yè),共三十四頁(yè),2022年,8月28日在數(shù)據(jù)較多且比較分散的情況下,單變量值分組法由于組數(shù)過(guò)多,不便于觀察數(shù)據(jù)的分布特征和規(guī)律。因此,單變量值分組方法適用于數(shù)據(jù)較少或分布比較集中的情形。對(duì)于變量值較多的情況,可以采用組距分組法。確定組數(shù)的一般原則為:數(shù)據(jù)個(gè)數(shù)n分組數(shù)50以下5~650~1006~10100~2507~12250以上10~20第十頁(yè),共三十四頁(yè),2022年,8月28日

我國(guó)各地區(qū)2000年死亡率頻率分布表組號(hào)分組界限頻數(shù)頻率(%)組中值1[4.9,5.6]310.005.252[5.6,6.3]826.675.953[6.3,7.0]1240.006.654[7.0,7.7]516.677.355[7.7,8.4]13.338.056[8.4,9.1]13.338.75第十一頁(yè),共三十四頁(yè),2022年,8月28日(二)、數(shù)據(jù)的圖形顯示除去頻率直方圖以外,還有許多數(shù)據(jù)的圖形顯示方法。我們?cè)谶@里主要介紹餅形圖、條形圖、柱形圖、散點(diǎn)圖、折線圖、曲線圖和莖葉圖。1.餅形圖餅形圖一般用來(lái)描述和表現(xiàn)各成分或某一成分占全部的百分比。使用餅形圖時(shí)必須注意以下三點(diǎn):第一,餅形圖中的成分最好不要多于6個(gè),如果成分多于6個(gè)的話,一般的做法是從這些成分中選出5個(gè)最重要的,然后把剩下的成分全部合并成一個(gè)稱做“其他”的成分。第二,各成分份額的和必須是100%。第三,成分比例必須與扇形區(qū)域的面積比例一致。第十二頁(yè),共三十四頁(yè),2022年,8月28日第十三頁(yè),共三十四頁(yè),2022年,8月28日2.條形圖和柱形圖條形圖是用來(lái)對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行比較的。對(duì)于條形圖來(lái)說(shuō),它的縱坐標(biāo)沒(méi)有尺度,只用來(lái)標(biāo)注各項(xiàng)信息的名稱,比如:國(guó)家、行業(yè)、公司等等。例:2001年日本、美國(guó)、韓國(guó)和港澳臺(tái)地區(qū)來(lái)某市旅游的人數(shù)(單位:10萬(wàn)人)如下:

地區(qū)013245日本美國(guó)韓國(guó)港澳臺(tái)第十四頁(yè),共三十四頁(yè),2022年,8月28日例:下表列出的是2004-2010年某市接待的旅游人數(shù)(包括外國(guó)人、華僑、港澳臺(tái)胞)(單位:萬(wàn)人),用柱形圖顯示這些數(shù)據(jù)。年份2004200520062007200820092010人數(shù)10.0113.2117.4820.2720.2920.6921.892520151050040506070809102004-2010年某市接待的旅游人數(shù)

第十五頁(yè),共三十四頁(yè),2022年,8月28日3.折線圖由柱形圖,我們可以大致地看出縱坐標(biāo)變量隨橫坐標(biāo)變量變化的趨勢(shì)。一個(gè)更明顯的表示趨勢(shì)的圖示方法是折線圖法。2004-2010年來(lái)某市旅游人數(shù)的折線圖。

折線圖的優(yōu)點(diǎn)是簡(jiǎn)單、容易理解,并且對(duì)于同一組數(shù)據(jù),折線圖具有唯一性(兩點(diǎn)間有且只有一條直線)。92321171304050607080910第十六頁(yè),共三十四頁(yè),2022年,8月28日4.曲線圖商務(wù)和金融領(lǐng)域中許多事物不但其自身是逐漸變化的,而且連其變化的速度也是逐漸變化的。折線圖雖然展示了變量間變化的趨勢(shì),但是我們不難發(fā)現(xiàn),在各實(shí)心點(diǎn)處,數(shù)據(jù)變化的速度(線段的傾斜程度)會(huì)發(fā)生突變。曲線圖彌補(bǔ)了折線圖的這一不足,采用光滑的曲線段連接各實(shí)心點(diǎn),形成一條整體光滑的曲線。曲線圖雖然有更加自然的特點(diǎn),但是“光滑地連接各實(shí)心點(diǎn)”的方法很多,因此帶有一定的隨意性,即不是唯一的。5.散點(diǎn)圖散點(diǎn)圖一般表現(xiàn)兩個(gè)變量之間的相互關(guān)系。兩個(gè)變量的任何一對(duì)取值都在平面直角坐標(biāo)系上代表一個(gè)點(diǎn)。在平面坐標(biāo)系上將所有這樣的點(diǎn)描畫(huà)出來(lái)便形成了散點(diǎn)圖。第十七頁(yè),共三十四頁(yè),2022年,8月28日四、數(shù)據(jù)集中趨勢(shì)的度量下面將介紹數(shù)據(jù)集中趨勢(shì)(即數(shù)據(jù)集的中心位置)以及離散趨勢(shì)(即數(shù)據(jù)集的分散程度)的各種度量。這些度量是反映數(shù)據(jù)集主要特點(diǎn)的一些綜合數(shù)據(jù),掌握這些方法的定義和優(yōu)缺點(diǎn)就能使我們?cè)诖罅康臄?shù)據(jù)中抓住事物的本質(zhì),不至于毫無(wú)頭緒地迷失在數(shù)據(jù)的海洋中。數(shù)據(jù)集中趨勢(shì)主要介紹平均數(shù),中位數(shù),眾數(shù)的定義(計(jì)算),以及它們的應(yīng)用。(一)、平均數(shù)1.數(shù)據(jù)未分組時(shí)(簡(jiǎn)單平均數(shù))數(shù)據(jù)集中趨勢(shì)的最常用的度量就是平均數(shù),即若數(shù)據(jù)為,則這組數(shù)據(jù)的平均數(shù),記為為:第十八頁(yè),共三十四頁(yè),2022年,8月28日【例1】某工商管理碩士班30名學(xué)生“管理統(tǒng)計(jì)分析方法”課期末考試成績(jī)?nèi)缦拢?66584957269697063968773828885678186837772739370718290828787求他們的平均成績(jī)。解:這些學(xué)生的平均成績(jī)?yōu)槠骄鶖?shù)的優(yōu)點(diǎn)在于它容易理解,易于計(jì)算;它不偏不倚地對(duì)待數(shù)據(jù)集中的每一個(gè)數(shù)據(jù);它是數(shù)據(jù)集的“重心”,即:如果我們?cè)跀?shù)軸上各數(shù)據(jù)點(diǎn)處放置一個(gè)單位的重量,則平均數(shù)所處的位置正好是平衡點(diǎn)。平均數(shù)的一個(gè)主要缺點(diǎn)是它對(duì)極端值十分敏感。所謂極端值就是和數(shù)據(jù)集中大部分?jǐn)?shù)據(jù)相比,特別大或特別小的那些(個(gè)別)數(shù)據(jù)。下面的例子說(shuō)明了這一點(diǎn)。第十九頁(yè),共三十四頁(yè),2022年,8月28日職位實(shí)際收入(元)財(cái)務(wù)部經(jīng)理60000市場(chǎng)部經(jīng)理325000人事部經(jīng)理45000研發(fā)部經(jīng)理70000生產(chǎn)部經(jīng)理55000【例2】下表列出的是某公司中層干部2009年的實(shí)際收入:

不難注意到,市場(chǎng)部經(jīng)理的收入是一個(gè)極端值(與其他人的收入相比,它特別大)。我們來(lái)看看它對(duì)平均數(shù)的影響。解:如果計(jì)算上述5位經(jīng)理的平均收入,得到平均收入=111000(元)但是,如果不考慮市場(chǎng)部經(jīng)理的收入,只計(jì)算其余4人的平均收入,則平均收入為57500元。因此,市場(chǎng)部經(jīng)理收入的加入使得平均收入增加了近一倍。第二十頁(yè),共三十四頁(yè),2022年,8月28日2.分組數(shù)據(jù)的平均數(shù)(加權(quán)平均)前面我們已經(jīng)講過(guò),一個(gè)數(shù)據(jù)集的平均數(shù)是數(shù)據(jù)集中全體數(shù)據(jù)的和除以數(shù)據(jù)的個(gè)數(shù)。但是如果數(shù)據(jù)是以頻率分布表的形式出現(xiàn)的,我們就不知道每一個(gè)原始數(shù)據(jù)的數(shù)值。這時(shí),我們可以利用頻率分布表近似地計(jì)算平均數(shù)。具體做法是:平均數(shù)≈【例6】某大學(xué)管理學(xué)院管理科學(xué)與工程系有25名教師,下表是他們?cè)谠撛喝谓棠陻?shù)的頻率分布數(shù)據(jù)。求該系教師在該院任教的平均年數(shù)。第二十一頁(yè),共三十四頁(yè),2022年,8月28日任教年數(shù)人數(shù)組中值1~5年6~10年11~15年16~20年21~25年26~30年31~35年95530123813182328332740655402866總和25

280平均任教年數(shù)≈(年)。

不同的權(quán)重反映了數(shù)值所具有的不同重要性:重要的數(shù)據(jù)其權(quán)重比較大,不那么重要的數(shù)據(jù)其權(quán)重比較小。因此,分組數(shù)據(jù)的平均值就是把頻數(shù)作為組中值的權(quán)重的加權(quán)平均。第二十二頁(yè),共三十四頁(yè),2022年,8月28日(二)、中位數(shù)將數(shù)據(jù)集按上升順序排列,位于數(shù)列正中間的數(shù)值成為該數(shù)據(jù)集的中位數(shù)。【例3】以上例中的數(shù)據(jù),計(jì)算全班期末考試成績(jī)的中位數(shù)。解:將原數(shù)據(jù)按上升順序排列,得到

636567696970707172727373778182828283848586868787878890939596第二十三頁(yè),共三十四頁(yè),2022年,8月28日【例4】計(jì)算5位經(jīng)理年收入的中位數(shù)。解:將5位經(jīng)理的收入按上升順序排列得到45000550006000070000325000則中位數(shù)為60000。中位數(shù)將整個(gè)數(shù)據(jù)集一分為二,正好有一半的數(shù)據(jù)比中位數(shù)小,也正好有一半的數(shù)據(jù)比中位數(shù)大。從數(shù)據(jù)的個(gè)數(shù)來(lái)說(shuō),中位數(shù)正好位于數(shù)據(jù)集的中間。用中位數(shù)描述數(shù)據(jù)的集中趨勢(shì)的優(yōu)點(diǎn)是它對(duì)極端值不像平均數(shù)那么敏感,因此,對(duì)于包含極端值的數(shù)據(jù)集來(lái)說(shuō),用中位數(shù)來(lái)描述集中趨勢(shì)比用平均數(shù)更為恰當(dāng)。第二十四頁(yè),共三十四頁(yè),2022年,8月28日(三)、眾數(shù)眾數(shù)是數(shù)據(jù)集中出現(xiàn)次數(shù)最多的數(shù)值。眾數(shù)的英文是mode,它具有時(shí)尚、流行等含義,也就是說(shuō),有普及和常見(jiàn)的意思。眾數(shù)的主要缺點(diǎn)是一個(gè)數(shù)據(jù)集可能沒(méi)有眾數(shù),或眾數(shù)可能不唯一,而數(shù)據(jù)集的平均數(shù)和中位數(shù)都是存在且唯一的。如果一個(gè)數(shù)據(jù)集中每一個(gè)數(shù)值都只出現(xiàn)一次,則該數(shù)據(jù)集沒(méi)有眾數(shù);如果一個(gè)數(shù)據(jù)集中只有一個(gè)數(shù)據(jù)集中只有一個(gè)數(shù)值出現(xiàn)的次數(shù)最多,則該數(shù)據(jù)集具有唯一的眾數(shù);如果有兩個(gè)數(shù)值出現(xiàn)的次數(shù)最多,則稱該數(shù)據(jù)集具有雙眾數(shù);如果有兩個(gè)以上的數(shù)值出現(xiàn)的次數(shù)最多,則稱該數(shù)據(jù)集具有多眾數(shù)。眾數(shù)的優(yōu)點(diǎn)在于它反映了數(shù)據(jù)集中最常見(jiàn)的數(shù)值,即最普遍的數(shù)值。眾數(shù)的另一個(gè)優(yōu)點(diǎn)是它不僅對(duì)數(shù)量型數(shù)據(jù)集(數(shù)據(jù)都是數(shù)值)有意義,它對(duì)分類型數(shù)據(jù)集也有意義,下面的例子可以說(shuō)明這一點(diǎn)。第二十五頁(yè),共三十四頁(yè),2022年,8月28日【例5】某房地產(chǎn)開(kāi)發(fā)公司2010年售出的住房情況如下(單位:套):求該數(shù)據(jù)集的眾數(shù)。解:在這里,數(shù)據(jù)集不是數(shù)量型的,而是分類型的,并且已經(jīng)按類分組。由于有152戶購(gòu)買了三室兩廳兩衛(wèi)型住房,購(gòu)買其他戶型的住戶都少于152,因此,三室兩廳兩衛(wèi)戶型是這組數(shù)據(jù)的眾數(shù)。眾數(shù)的另一個(gè)優(yōu)點(diǎn)是能夠告訴我們最普遍、最流行的款式、尺寸、色彩等產(chǎn)品特征,從而幫助我們進(jìn)行生產(chǎn)計(jì)劃決策。如例5中,由于眾數(shù)是“三室兩廳兩衛(wèi)”,說(shuō)明這一戶型是當(dāng)前最受歡迎的,在未來(lái)計(jì)劃中應(yīng)當(dāng)考慮多建造三室兩廳兩衛(wèi)戶型的住房。第二十六頁(yè),共三十四頁(yè),2022年,8月28日五、數(shù)據(jù)離散趨勢(shì)的度量

【例7】為了考察燈泡質(zhì)量,隨機(jī)地從兩種品牌的燈泡中各抽取了10只,測(cè)得壽命如下(單位:小時(shí)):

品牌1995101010059901015985101010109751005品牌2102089011301050920870110093010701020

燈泡質(zhì)量的一個(gè)重要指標(biāo)就是燈泡的平均壽命。通過(guò)計(jì)算這兩組燈泡的平均壽命都是1000小時(shí)。因此,僅從平均壽命上看,這兩組品牌的燈泡質(zhì)量難分上下。但是不難發(fā)現(xiàn),第一組燈泡的壽命數(shù)據(jù)變化幅度不大,而第二組燈泡的壽命數(shù)據(jù)變化幅度很大,說(shuō)明第二組燈泡的質(zhì)量不如第一組那么穩(wěn)定。從例子可以看出,一個(gè)數(shù)據(jù)集各數(shù)據(jù)的分散情況,或離散的程度是該數(shù)據(jù)集的另一個(gè)重要特征,為此,在這里介紹度量數(shù)據(jù)離散程度的幾種方法,如方差、標(biāo)準(zhǔn)差。第二十七頁(yè),共三十四頁(yè),2022年,8月28日(一)、極差最簡(jiǎn)單、最直觀的度量數(shù)據(jù)離散程度的方法或許應(yīng)當(dāng)是數(shù)據(jù)集中最大數(shù)值的差,稱為極差(或全距),記為R,即:極差R=最大值-最小值很明顯,極差越大,說(shuō)明數(shù)據(jù)散布的范圍越廣,即數(shù)據(jù)越分散;極差越小,說(shuō)明數(shù)據(jù)越集中。但是它也極易受極端值的影響。如果數(shù)據(jù)存在著極端值,極差就不能反映數(shù)據(jù)一般性的離散趨勢(shì),這是它的主要缺點(diǎn)。(二)、四分位點(diǎn)和四分位極差四分位點(diǎn)是把數(shù)據(jù)集等分為四部分的那些數(shù)值。四分位點(diǎn)共有三個(gè),分別稱為第一四分位點(diǎn)(記為Q1),第二四分位點(diǎn)(記為Q2),第三四分位點(diǎn)(記為Q3)。在計(jì)算四分位點(diǎn)之前,應(yīng)先將數(shù)據(jù)集按上升順序重新排列。第二十八頁(yè),共三十四頁(yè),2022年,8月28日

由四分位點(diǎn)的定義,我們知道,有25%的數(shù)據(jù)小于Q1,有25%的數(shù)據(jù)大于Q3。四分位點(diǎn)的定義是:第二四分位點(diǎn)Q2就是整個(gè)數(shù)據(jù)集的中位數(shù);第一四分位點(diǎn)是所有小于Q2的數(shù)據(jù)所組成的數(shù)據(jù)集的中位數(shù);第三四分位點(diǎn)是所有大于Q2的數(shù)據(jù)所組成的數(shù)據(jù)集的中位數(shù)。第三四分位點(diǎn)Q3與第一四分位點(diǎn)Q1的差Q3-Q1稱為四分位極差。也就是說(shuō)有50%的數(shù)據(jù)散布在跨度為Q3-Q1的范圍內(nèi)。【例8】某商場(chǎng)經(jīng)理在分析近17周內(nèi)收到的顧客投訴數(shù)據(jù)時(shí),希望得到以下信息:星期1234567891011121314151617投訴次數(shù)13151091238497181671012615第二十九頁(yè),共三十四頁(yè),2022年,8月28日(1)求四分位點(diǎn),投訴次數(shù)15落在什么范圍?(2)求四分位極差。解:(1)首先將數(shù)據(jù)按上升順序重新排列,然后計(jì)算四分位點(diǎn)。排列后的數(shù)據(jù)為:34677899101012121315151618即Q1=7,Q2=10,Q3=14。投訴次數(shù)15落在上25%(大于Q3)的范圍內(nèi)。(2)四分位極差Q3-Q1=14-7=7。(三)、方差和標(biāo)準(zhǔn)差方差——記為第三十頁(yè),共三十四頁(yè),2022年,8月28日例如例7中兩組燈泡壽命的方差分別為[(995-1000)2+(1010-1000)2+…+(1005-1000)2]=155[(1020-1000)2+(890-1000)2+…+(1020-1000)2]=7540

很顯然,遠(yuǎn)大于,說(shuō)明第二組燈泡壽命的分散程度大于第一組燈泡。注意到燈泡壽命方差的單位為平方小時(shí),為了使離散度量的單位與原數(shù)據(jù)一致,我們令并稱為標(biāo)準(zhǔn)差。第一組燈泡壽命的標(biāo)準(zhǔn)差=12.45(小時(shí))第二組燈泡壽命的標(biāo)準(zhǔn)差=86.83(小時(shí))第三十一頁(yè),共三十四頁(yè),2022年,8月28日(四)、變異系數(shù)前面講到的方差、標(biāo)準(zhǔn)差、極差和四分位極差都只能用來(lái)比較同一屬性(具有相同單位)的兩組數(shù)據(jù)的離散程度,特別是當(dāng)兩組數(shù)據(jù)的平均數(shù)相等時(shí),我們可以

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論