定量分析方法第5章-2014年_第1頁
定量分析方法第5章-2014年_第2頁
定量分析方法第5章-2014年_第3頁
定量分析方法第5章-2014年_第4頁
定量分析方法第5章-2014年_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章統(tǒng)計(jì)數(shù)據(jù)的整理與顯示第一節(jié)數(shù)據(jù)的預(yù)處理第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示第三節(jié)數(shù)值型數(shù)據(jù)的整理與顯示第一節(jié)數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核數(shù)據(jù)的篩選數(shù)據(jù)的排序數(shù)據(jù)的審核

(原始數(shù)據(jù))審核數(shù)據(jù)準(zhǔn)確性的方法邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項(xiàng)目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對定類數(shù)據(jù)和定序數(shù)據(jù)的審核計(jì)算檢查檢查調(diào)查表中的各項(xiàng)數(shù)據(jù)在計(jì)算結(jié)果和計(jì)算方法上有無錯(cuò)誤主要用于對定距和定比數(shù)據(jù)的審核數(shù)據(jù)的審核

(第二手?jǐn)?shù)據(jù))適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要時(shí)效性審核應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)確認(rèn)是否必要做進(jìn)一步的加工整理數(shù)據(jù)的篩選對審核過程中發(fā)現(xiàn)的錯(cuò)誤應(yīng)盡可能予以糾正當(dāng)發(fā)現(xiàn)數(shù)據(jù)中的錯(cuò)誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時(shí),需要對數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出數(shù)據(jù)的排序

(要點(diǎn))按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計(jì)算機(jī)完成(SPSS--rankcases,sortcases)數(shù)據(jù)的排序的方法

定類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分定距和定比數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為X1,X2,…,XN,遞增排序后可表示為:X(1)<X(2)<…<X(N)遞減排序可表示為:X(1)>X(2)>…>X(N)第二節(jié)品質(zhì)數(shù)據(jù)的整理與顯示定類數(shù)據(jù)的整理與顯示定序數(shù)據(jù)的整理與顯示定類數(shù)據(jù)的整理與顯示

(基本問題)要弄清所面對的數(shù)據(jù)類型,因?yàn)椴煌愋偷臄?shù)據(jù),所采取的處理方式和方法是不同的對定類數(shù)據(jù)和定序數(shù)據(jù)主要是做分類整理對定距數(shù)據(jù)和定比數(shù)據(jù)則主要是做分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)定類數(shù)據(jù)的整理與顯示定類數(shù)據(jù)的整理

(基本過程)列出各類別計(jì)算各類別的頻數(shù)制作頻數(shù)分布表用圖形顯示數(shù)據(jù)

定類數(shù)據(jù)的整理

(可計(jì)算的指標(biāo))1.頻數(shù):落在各類別中的數(shù)據(jù)個(gè)數(shù)2.比例:某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3.百分比:將對比的基數(shù)作為100而計(jì)算的比值4.比率:不同類別數(shù)值的比值定類數(shù)據(jù)整理—頻數(shù)分布表

(實(shí)例)【例5.1】為研究咖啡市場的狀況,一家廣告公司在某城市隨機(jī)抽取4662人就廣告問題做了問卷調(diào)查,其中的一個(gè)問題是“您比較喜歡哪個(gè)牌子得咖啡?”

1.AA;2.BB;3.CC;4.DD;5.EE;6.FF。Samples-coffee.sav可以通過原始數(shù)據(jù)得頻數(shù)分布表得到表5-1喜歡的咖啡品牌的頻數(shù)表定類數(shù)據(jù)的圖示—條形圖

(條形圖的制作)條形圖是用寬度相同的條形的高度或長短來表示數(shù)據(jù)變動(dòng)的圖形條形圖有單式、復(fù)式等形式在表示定類數(shù)據(jù)的分布時(shí),是用條形圖的高度來表示各類別數(shù)據(jù)的頻數(shù)或頻率繪制時(shí),各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖定類數(shù)據(jù)的圖示—條形圖

(由SPSS繪制的條形圖)定類數(shù)據(jù)的圖示—圓形圖

(圓形圖的制作)也稱餅圖,是用圓形及園內(nèi)扇形的面積來表示數(shù)值大小的圖形主要用于表示總體中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用在繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示,這些扇形的中心角度,是按各部分百分比占3600的相應(yīng)比例確定的。定類數(shù)據(jù)的圖示—圓形圖

(由SPSS繪制的圓形圖)定類數(shù)據(jù)的圖示—環(huán)形圖

(環(huán)形圖的制作)環(huán)形圖中間有一個(gè)“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個(gè)總體各部分所占的比例環(huán)形圖則可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,每一個(gè)總體的數(shù)據(jù)系列為一個(gè)環(huán)環(huán)形圖可用于進(jìn)行比較研究環(huán)形圖可用于展示定類和定序的數(shù)據(jù)品質(zhì)數(shù)據(jù)的圖示—環(huán)形圖

(由Excel繪制的環(huán)形圖)8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

圖5-3甲乙兩城市家庭對住房狀況的評價(jià)定序數(shù)據(jù)的整理與顯示定序數(shù)據(jù)的整理

(可計(jì)算的指標(biāo))1.累計(jì)頻數(shù):將各類別的頻數(shù)逐級累加2.累計(jì)頻率:將各類別的頻率(百分比)逐級累加定序數(shù)據(jù)頻數(shù)分布表

(實(shí)例)【例5.2】在一項(xiàng)關(guān)于組織知識管理問題的研究中,研究人員調(diào)查了168位在政府部門和企業(yè)工作的員工,其中的一個(gè)問題是:“您通過書籍、期刊報(bào)紙等傳統(tǒng)媒介獲取信息和知識的頻率如何

?1.經(jīng)常;2.偶爾;3.很少;4.從來沒有表5-2通過傳統(tǒng)媒介獲取信息的頻數(shù)分布表第三節(jié)數(shù)值型數(shù)據(jù)的整理與顯示數(shù)據(jù)的分組數(shù)值型數(shù)據(jù)的圖示頻數(shù)分布的類型頻數(shù)分布表的編制編制頻數(shù)分布表的步驟確定組數(shù)編制頻數(shù)分布表的步驟確定組距計(jì)算頻數(shù)編制表格分組方法分組方法等距分組異距分組單變量值分組組距分組單變量值分組

(要點(diǎn))將一個(gè)變量值作為一組適合于離散變量適合于變量值較少的情況頻數(shù)分布表的編制

(實(shí)例)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例5.3】某政府機(jī)構(gòu)每月接待外賓人數(shù)如下(單位:個(gè))。試采用單變量值對數(shù)據(jù)進(jìn)行分組。

單變量值分組表

(實(shí)例)表5-4某政府機(jī)構(gòu)每月接待人數(shù)人數(shù)(個(gè))頻數(shù)(人)人數(shù)(個(gè))頻數(shù)(人)人數(shù)(個(gè))頻數(shù)(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組

(要點(diǎn))將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按Sturges提出的經(jīng)驗(yàn)公式來確定組數(shù)K確定各組的組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)根據(jù)分組整理成頻數(shù)分布表

組距分組

(幾個(gè)概念)下限:一個(gè)組的最小值上限:一個(gè)組的最大值組距:上限與下限之差組中值:下限與上限之間的中點(diǎn)值下限值+上限值2組中值=等距分組表

(上下組限重疊)表5-5某機(jī)構(gòu)接待人數(shù)分組表按人數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計(jì)50100等距分組表

(上下組限間斷)表5-6某機(jī)構(gòu)接待人數(shù)分組表按人數(shù)分組頻數(shù)(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計(jì)50100等距分組表

(使用開口組)表5-7某機(jī)構(gòu)接待人數(shù)分組表按人數(shù)分組頻數(shù)(人)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計(jì)50100組距分組與不等距分組

(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征和規(guī)律不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況分組技巧組距一般選擇5,10的倍數(shù)組距的確定要根據(jù)實(shí)際情況,力求使分布平滑可以先用窄間距分類,然后適當(dāng)放寬間距間距太小,頻數(shù)分布會顯得凌亂或不規(guī)則,間距太大,會損失大量信息。雖然有確定分組數(shù)的公式,但最佳決定要依據(jù)常識和頻數(shù)表的使用目的。分組技巧還可以使用不等距分組,即使用不同寬度的間距,讓某些特殊的間距比別的間距寬或者使用開放間距(會帶來很多麻煩)39.2%11.6%36.3%26.3%37.1%15.3%27.3%23.5%13.3%28.126.327.135.123.026.131.036.327.322.833.425.621.646.87.116.826.946.644.358.133.113.427.833.422.142.733.036.320.79.326.329.939.45.324.317.818.237.121.617.512.323.637.237.125.127.128.827.833.626.528.326.924.841.033.619.343.728.219.983.647.14.89.739.532.322.415.126.326.129.214.314.621.637.937.124.910.020.711.822.936.046.121.513.3例5.4下列數(shù)據(jù)是某城市教育委員會的選舉中,93個(gè)普查區(qū)合格選民實(shí)際參加選舉的比例:表5-8數(shù)據(jù)按5%的間距分類時(shí)的頻數(shù)分布間距頻數(shù)f間距頻數(shù)f0.0-4.9145.0-49.945.0-9.9450.0-54.9010.0-14.9955.0-59.9115.0-19.9860.0-64.9020.0-24.91665.0-69.9025.0-29.92370.0-74.9030.0-34.9875.0-79.9035.0-39.91480.0-84.9140.0-44.9493分布不太規(guī)則表5-9數(shù)據(jù)按10%的間距分類時(shí)的頻數(shù)分布間距頻數(shù)f0.0-9.9510.0-19.91720.0-29.93930.0-39.92240.0-49.9850.0-59.9160.0-69.9070.0-79.9080.0-89.9193分布較平滑表5-10數(shù)據(jù)按20%的間距分類時(shí)的頻數(shù)分布間距頻數(shù)f0.0-19.92220.0-39.96140.0-59.9960.0-79.9080.0-99.9193有些含糊不清組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按Sturges提出的經(jīng)驗(yàn)公式來確定組數(shù)K確定各組的組距:組距(ClassWidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)根據(jù)分組整理成頻數(shù)分布表

數(shù)值型數(shù)據(jù)的圖示分組數(shù)據(jù)—直方圖

(直方圖的制作)用矩形的寬度和高度來表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖(Histogram)分組數(shù)據(jù)—直方圖

(直方圖的繪制)頻數(shù)(人)1512963105110115120125130135140月接待人數(shù)(個(gè))圖5-5某機(jī)構(gòu)接待人數(shù)直方圖我一眼就看出來了,大多數(shù)的日子接待人數(shù)在120-125之間!分組數(shù)據(jù)—直方圖

(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列分組數(shù)據(jù)—折線圖

(折線圖的制作)折線圖也稱頻數(shù)多邊形圖(Frequencypolygon)是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的1512963105110115120125130135140接待人數(shù)(個(gè))頻數(shù)(人)分組數(shù)據(jù)—折線圖

(折線圖的繪制)圖5-6機(jī)構(gòu)接待人數(shù)折線圖時(shí)間序列數(shù)據(jù)—線圖

(實(shí)例)【例5.5】已知1991~1998年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù)如表5-11。試?yán)L制線圖¥

表5-111991~1998年城鄉(xiāng)居民家庭人均收入年份城鎮(zhèn)居民農(nóng)村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6784.0921.61221.01577.71926.12091.12162.0時(shí)間序列數(shù)據(jù)

(由SPSS繪制的線圖先定義日期definedates然后timeseries—sequencecharts)SPSS做圖表示定量變量常用的圖形:

直方圖、盒型圖、莖葉圖、散點(diǎn)圖直方圖

對于一個(gè)定量變量,比如某個(gè)地區(qū)(地區(qū)1)學(xué)校高三男生的身高;有163個(gè)度量。Spss選項(xiàng):Graphs-Histogram。橫坐標(biāo)是身高區(qū)間,而縱坐標(biāo)為各種身高區(qū)間的身高的頻數(shù)。圖5-8交互式直方圖interactive盒型圖比直方圖簡單一些的是盒形圖(boxplot,又稱箱圖).盒子的中間橫線是數(shù)據(jù)的中位數(shù)(median).即數(shù)據(jù)中占據(jù)中間位子的數(shù),即數(shù)據(jù)中有一半大于中位數(shù)(在其之上),另一半小于中位數(shù)(在其之下)。

Spss選項(xiàng):Graphs-Boxplot圖5-9莖葉圖(stem-and-leafplots)莖葉圖既展示了分布形狀又有原始數(shù)據(jù)。SPSS選項(xiàng):Analyze-DescriptiveStatistics-Explore。其中莖葉圖中莖的單位為10cm,而葉子為個(gè)位。地區(qū)1高三男生高度Stem-and-LeafPlot

Frequency

Stem&Leaf

9.00

15.001223344

17.00

15.55666667778899999

20.00

16.01112222223333333444

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論