應(yīng)用統(tǒng)計學復習student級_第1頁
應(yīng)用統(tǒng)計學復習student級_第2頁
應(yīng)用統(tǒng)計學復習student級_第3頁
應(yīng)用統(tǒng)計學復習student級_第4頁
應(yīng)用統(tǒng)計學復習student級_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用統(tǒng)計學:----數(shù)理統(tǒng)計方法、數(shù)據(jù)獲取與SPSS應(yīng)用cxf@復習課(一)古典統(tǒng)計學的萌芽時期(17世紀70年代至19世紀初期)1.政治算術(shù)學派2.國勢學派該學派產(chǎn)生于18世紀的德國3.古典概率論的應(yīng)用(二)近代統(tǒng)計學的形成時期(19世紀初至20世紀初)1.數(shù)理統(tǒng)計學派

2.社會統(tǒng)計學派第一章:統(tǒng)計學簡介10/9/20232(三)現(xiàn)代統(tǒng)計學的發(fā)展時期(20世紀初到現(xiàn)在)1.歐美數(shù)理統(tǒng)計學2.東方社會經(jīng)濟統(tǒng)計學(四)現(xiàn)代主流統(tǒng)計學有四個明顯趨勢:(1)隨著現(xiàn)代數(shù)學的發(fā)展,更廣泛地應(yīng)用數(shù)學方法;(2)統(tǒng)計學與其他新科學新理論的結(jié)合,不斷產(chǎn)生新的邊緣科學或新的統(tǒng)計分支;(3)借助電子計算機,使大量數(shù)理方法得以普及應(yīng)用,并已成為實證分析的主要工具;(4)統(tǒng)計的作用,從描述向推斷、預測及決策方向發(fā)展。第一章:統(tǒng)計學簡介10/9/20233(五)統(tǒng)計學的定義與分科統(tǒng)計學(statistics)是收集、分析、表述和解釋數(shù)據(jù)的科學,是研究統(tǒng)計方法與統(tǒng)計規(guī)律的科學。從不同角度可以進行分科:1.按統(tǒng)計方法的構(gòu)成:1)描述性統(tǒng)計(descriptivestatistics):是研究數(shù)據(jù)收集、整理和描述的統(tǒng)計學分支。2)推斷統(tǒng)計學(inferentialstatistics):是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學分支。3)應(yīng)用統(tǒng)計技術(shù):指在現(xiàn)代統(tǒng)計方法中,將描述統(tǒng)計方法與推斷統(tǒng)計方法有機結(jié)合,專職應(yīng)用于某一領(lǐng)域的專有統(tǒng)計方法。它不專屬于描述統(tǒng)計,也不專屬于推斷統(tǒng)計。如現(xiàn)代相關(guān)分析、統(tǒng)計預測和統(tǒng)計決策等。第一章:統(tǒng)計學簡介10/9/202342.按統(tǒng)計研究的性質(zhì)分:1)理論統(tǒng)計學:是以統(tǒng)計學的基本原理(即一般理論和方法)為主要研究內(nèi)容的統(tǒng)計學。如統(tǒng)計學原理、數(shù)理統(tǒng)計學和多元統(tǒng)計學等。2)應(yīng)用統(tǒng)計學:是指以統(tǒng)計方法在各專業(yè)領(lǐng)域中的應(yīng)用和在各專業(yè)的數(shù)量規(guī)律性研究中所呈現(xiàn)的特有統(tǒng)計方法為對象的統(tǒng)計學科。如生物統(tǒng)計學、經(jīng)濟統(tǒng)計學和人口統(tǒng)計學等。(計量經(jīng)濟學、質(zhì)量控制論、經(jīng)濟統(tǒng)計學、經(jīng)濟預測學和經(jīng)營決策論等都是財經(jīng)應(yīng)用統(tǒng)計學的獨立分支)。3.按統(tǒng)計學所研究的客體現(xiàn)象的性質(zhì)分:1)確定性統(tǒng)計2)概率統(tǒng)計3)模糊統(tǒng)計第一章:統(tǒng)計學簡介10/9/2023510/9/2023610/9/2023710/9/2023810/9/2023910/9/2023101、調(diào)查問卷的類型:A.根據(jù)調(diào)查中使用問卷方法的不同分類:

自填式問卷

代填式問卷B.根據(jù)問卷發(fā)放方式的不同分類

送發(fā)式問卷、郵寄式問卷、報刊式問卷

人員訪問式問卷、電話訪問式問卷、網(wǎng)上訪問式問卷

2、問卷的基本結(jié)構(gòu)一般包括三個部分:A.說明信B.調(diào)查內(nèi)容C.結(jié)束語第二章:數(shù)據(jù)的獲得(問卷調(diào)查部分)10/9/2023113、問卷設(shè)計的過程問卷設(shè)計過程的幾個步驟:(1)確定所需信息(2)確定問卷的類型(3)確定問題的內(nèi)容(4)確定問題的類型(開放型、封閉型,半開半閉型)(5)確定問題的順序(6)問卷的排版和布局(7)問卷的預試(8)問卷的定稿(9)問卷的評價10/9/202312用詞要確切、通俗請問您使用什么牌子的洗發(fā)水?請問您最近三個月使用什么牌子的洗發(fā)水?您最近一段時間使用什么品牌的化妝品?您最近一個月使用什么品牌的化妝品?您覺得這種電視機的畫面質(zhì)量怎么樣?您認為這種電視機的畫面是否清晰?

10/9/202313一項提問只包含一項內(nèi)容您覺得這種新款轎車的加速性能和制動性能怎么樣?

您覺得這種新款轎車的加速性能怎么樣?

您覺得這種新款轎車的制動性能怎么樣?10/9/202314避免誘導性提問人們認為長虹牌彩電質(zhì)量不錯,你覺得怎么樣?您覺得長虹牌彩電的質(zhì)量怎么樣?避免否定形式的提問你覺得這種產(chǎn)品的新包裝不美觀嗎?你覺得這種產(chǎn)品的新包裝美觀嗎?10/9/202315避免敏感性提問敏感性問題是被調(diào)查者不愿意讓別人知道答案的問題。如個人收入問題,個人生活問題,政治方面問題,信仰方面問題等。對于這類問題,被調(diào)查者可能拒絕回答,可能采用虛報、假報的方法來應(yīng)付回答,從而影響整個調(diào)查的質(zhì)量。敏感性問題要采用一些技巧來提問。“你丈夫的年收入是多少”,替代的做法是要求調(diào)查對象查出適當?shù)氖杖腩惸?如25000以下,25001-50000,50001-75000,75000(美元)以上.10/9/202316

(4)確定問題的類型封閉性問題的答案是選擇回答型,所以設(shè)計出的答案一定要窮盡和互斥。窮盡即要求列出問題的所有答案,不能遺漏。對有些問題不能窮盡時,可以加上“其他”一類的詞,以保證被調(diào)查者能有所選擇或回答。互斥即要求各答案間不能相互重疊或包容。封閉性問題的回答方法主要有以下五種:兩項選擇法、多項選擇法、順序選擇法、評定尺度法、雙向列聯(lián)法。10/9/202317比如下列問題的答案就是窮盡的:您的文化程度是?(請在所選答案的號碼上打√)①

小學及以下②初中③高中或中專④大專以上您的性別(請在所選答案的號碼上打√)①男②女下列問題的答案就是不窮盡的:你的年收入是多少元(人民幣)?(請在所選答案的號碼上打√)

①25000以下,②25001-50000,③60001-75000,④75000(美元)以上.③50000-7500010/9/2023181、兩項選擇法2、多項選擇法3、順序選擇法4、評定尺度法5、雙向列聯(lián)法評定尺度法中的問題答案由表示不同等級的形容詞組成,并按照一定的程度排序,由被調(diào)查者依次選擇。例如:您對這種新款轎車是否感到滿意?1、非常滿意;2、比較滿意;3、一般;4、不太滿意;5、不滿意封閉性問題的回答方法10/9/202319(5)確定問題的順序>先易后難的排列方法:a.先列被調(diào)查者較熟悉的問題,再列較生疏的問題;

b.先問事實,行為方面的問題,然后再問觀念,情感,態(tài)度等方面的問題;

c.先問一般性問題,后問特殊性問題,或者說先問能引起被調(diào)查者興趣的問題,然后再問容易引起他們緊張,顧慮,厭煩的問題;

d.開放式問題盡量安排在問卷的后面.>按問題的時間先后順序排列次序

:>相同性質(zhì)或同類問題盡量集中排列

如果問卷中出現(xiàn)相同性質(zhì)或同類問題,應(yīng)想辦法盡量安排在一起,這樣便于被調(diào)查者作答時,其思路不至于經(jīng)常被不同性質(zhì)的問題所隔斷,也不至于過分頻繁地在不同內(nèi)容之間跳躍,從而減少或預防被調(diào)查者的疲勞程度和厭煩情緒,提高問卷的回收率和作答質(zhì)量.10/9/20232010/9/20232110/9/20232210/9/202323獲得數(shù)據(jù)的方法1、獲得數(shù)據(jù)的抽樣調(diào)查方法抽樣方法:1、分層(分類)抽樣2、整群抽樣3、系統(tǒng)抽樣(等距抽樣)調(diào)查方法:電話訪談、郵件訪談、人員訪談、電子郵件訪談、網(wǎng)站問卷和BBS等2、獲得數(shù)據(jù)的實驗方法10/9/202324第三章樣本數(shù)據(jù)特征的初步分析特征┉特征的數(shù)學描述┉特征的直觀描述基本特征

頻率,頻次

┉條形圖,餅圖,直方圖位置特征

中位數(shù),眾數(shù),均值離散特征┉

極值,分位點,極差,四分距,離差┉箱形圖討論:順序級數(shù)據(jù)能夠計算累積頻率嗎?名義級數(shù)據(jù)能夠計算累計頻率嗎?YES,NO10/9/2023253.3.1樣本眾數(shù)(SampleMode)1、樣本眾數(shù)定義:樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的哪個樣本值,稱為樣本眾數(shù),簡稱“眾數(shù)”。若一個樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的樣本值只有一個時,則稱為單一眾數(shù),簡稱眾數(shù)。若一個樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的樣本值有多個時,稱為復眾數(shù)。說明:也存在無眾數(shù)的樣本數(shù)據(jù)集合。眾數(shù)可以從條形圖、頻次表、頻率表、直方圖等來判斷。10/9/2023263.3.2樣本中位數(shù)(SampleMedian)10/9/2023273.4.3離散狀態(tài)的統(tǒng)計描述1:樣本方差(SampleVariance)10/9/202328第四章SPSS的簡單應(yīng)用SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。數(shù)據(jù)編輯窗口可以顯示兩張表,分別是DataView和VariableViewDataView表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù);VariableView表用來定義和修改變量的名稱、類型及其他屬性10/9/202329Label:變量標簽。關(guān)于變量涵義的詳細說明。由于變量名的長度有限,變量名常常不能清楚地表明變量的意義,SPSS設(shè)計了Lable欄目,在其中可以進一步說明有關(guān)變量的詳細含義。如:變量“土流態(tài)度”,可在Lable中鍵入漢字“對土地使用權(quán)流轉(zhuǎn)的態(tài)度”。變量標簽可長達120個字符。可顯示大小寫。10/9/20233010/9/2023312.給變量值排序在讀入數(shù)據(jù)后,點擊:Data→Sortcases,彈出窗口3.給變量值排名次(1)直接排名次讀入數(shù)據(jù)后,點擊Transform→RankCases,系統(tǒng)彈出一個窗口,要求從左框的變量清單中,選取所要排序的變量,點擊OK。10/9/202332§4.2SPSS的簡單應(yīng)用2.給變量值排名次(3)對相同數(shù)據(jù)的其他幾種排名次方法A.Mean選項(默認值)。其含義是:如果有n個值相同,那么在假設(shè)這n個值有微小差異時,它們就有一串連號的名次。把這些連號名次加起來,再除以n,就是這n個相同值的共同名次。例如2個值都是最小的,它們的連號就是1、2,這兩個相同值的共同的名次就是(1+2)/2=1.5;而排在這2個值后面第三名(假設(shè)沒有與第三名相同的值),仍然保持名次3,并不改變。此時,前3名的名次為:1.5,1.5,3。10/9/20233310/9/20233410/9/20233510/9/20233610/9/20233710/9/20233810/9/202339§6.3兩個正態(tài)總體下的參數(shù)假設(shè)檢驗1.相互獨立的兩組樣本的T檢驗(IndependentSampleTtest)10/9/20234010/9/202341§6.3兩個正態(tài)總體下的參數(shù)假設(shè)檢驗2.配對樣本的T檢驗(Paired-SampleTtest)10/9/20234210/9/20234310/9/20234410/9/20234510/9/202346第七章SPSS在方差分析中的應(yīng)用§7.1方差分析的基本概念§7.2單因素方差分析的思想§7.3雙因素方差分析的思想1.無重復實驗2.有重復實驗§7.4單因素方差分析SPSS實現(xiàn)§7.5雙因素方差分析SPSS實現(xiàn)10/9/202347§7.1方差分析的基本概念方差分析的基本思想:方差分析是從觀測變量的方差入手,研究控制變量中哪些變量對觀測變量有顯著影響。同時也研究有顯著影響的各個控制變量其不同水平以及各水平的交互搭配是如何影響觀測變量的。10/9/20234810/9/202349表4多重比較結(jié)果在表4中,分析變量在每個類別上的均值都與其它類別進行了一一對應(yīng)的成對比較。表中的第二列是比較的兩個類別的均值差。如第二列第一個數(shù)據(jù)-40,666.785表示的是一線工人的當前工資減去科級以上干部當前工資的差。在這一列的數(shù)據(jù)中,后面帶﹡號表示的是均值差在0.05的水平上是顯著的。10/9/20235010/9/20235110/9/202352由于P=0.105>0.05,接受零假設(shè),認為本問題具有方差齊性。方差齊性檢驗10/9/202353含交叉項的雙因素方差分析輸出組間因素效應(yīng)檢驗結(jié)果.該部分是雙因素方差分析的主要部分。由于指定建立飽和模型,因此總的離差平方和被分解為3部分:多個控制變量對觀測變量的獨立作用部分、多個控制變量交互作用部分以及隨機變量影響部分。10/9/202354●“學校類型”的F統(tǒng)計量的值為8.661,相應(yīng)的顯著性概率P=0.001<0.05,說明學校類型對學校的指標U的差異是顯著的?!瘛罢咦饔谩钡腇統(tǒng)計量的值為13.379,相應(yīng)的顯著性概率P=0.000<0.05,說明政策對學校的指標U的作用是顯著的?!瘛罢咦饔门c學校類型的交互作用”的F值為1.925,顯著性概率P=0.135>0.05,沒有顯著性差異,說明交互作用對學校的指標U沒有影響。含交叉項的雙因素方差分析10/9/202355第八章相關(guān)分析一、簡單相關(guān)分析(Pearson)二、非線性相關(guān)三、等級相關(guān)分析(Spearman/Kendalltau-b)四、偏相關(guān)分析(Partial)五、點雙列相關(guān)系數(shù)(PointBiserialCorelation)六、Ф相關(guān)系數(shù)10/9/202356§8.2簡單相關(guān)分析(積差相關(guān))-Pearson“證券市場以外年收入”與“投入證券市場總資金”的皮爾遜相關(guān)系數(shù)0.393,顯著性水平為0.00

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論