第十一章定量資料分析詳解演示文稿_第1頁
第十一章定量資料分析詳解演示文稿_第2頁
第十一章定量資料分析詳解演示文稿_第3頁
第十一章定量資料分析詳解演示文稿_第4頁
第十一章定量資料分析詳解演示文稿_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十一章定量資料分析詳解演示文稿本文檔共81頁;當前第1頁;編輯于星期三\13點46分優(yōu)選第十一章定量資料分析本文檔共81頁;當前第2頁;編輯于星期三\13點46分在資料審核中,如發(fā)現(xiàn)問題,可以分別不同情況予以處理:(1)調查中已發(fā)現(xiàn)并經(jīng)認真核實后確認的錯誤,可由調查者代為更正。(2)資料中的可疑之處或明確有錯誤與出入的地方,應設法進行補充調查。(3)無法進行或無需進行補充調查的情況下,剔除那些明顯錯誤的或無把握的資料,保證真實性和準確性。本文檔共81頁;當前第3頁;編輯于星期三\13點46分資料審核的方法主要有兩種,即邏輯審核與計算審核。邏輯審核,即核查資料的內容是否合乎邏輯和常識,項目之間有無互相矛盾之處,與其他有關資料進行對照是否有明顯出入等等。計算審核,是針對數(shù)字資料進行的審查。要檢查計算有無錯誤。度量單位有沒有錯,前后數(shù)字之間有無相互矛盾之處等等。本文檔共81頁;當前第4頁;編輯于星期三\13點46分數(shù)據(jù)的審核

(原始數(shù)據(jù))審核的內容完整性審核檢查應調查的單位或個體是否有遺漏所有的調查項目或指標是否填寫齊全準確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內容是否符合實際檢查數(shù)據(jù)是否有錯誤,計算是否正確等本文檔共81頁;當前第5頁;編輯于星期三\13點46分數(shù)據(jù)的審核

(原始數(shù)據(jù))審核數(shù)據(jù)準確性的方法邏輯檢查從定性角度,審核數(shù)據(jù)是否符合邏輯,內容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象主要用于對定類數(shù)據(jù)和定序數(shù)據(jù)的審核計算檢查檢查調查表中的各項數(shù)據(jù)在計算結果和計算方法上有無錯誤主要用于對定距和定比數(shù)據(jù)的審核本文檔共81頁;當前第6頁;編輯于星期三\13點46分數(shù)據(jù)的審核

(第二手數(shù)據(jù))適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要時效性審核應盡可能使用最新的統(tǒng)計數(shù)據(jù)確認是否必要做進一步的加工整理本文檔共81頁;當前第7頁;編輯于星期三\13點46分數(shù)據(jù)的篩選對審核過程中發(fā)現(xiàn)的錯誤應盡可能予以糾正當發(fā)現(xiàn)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調查的要求而又無法彌補時,需要對數(shù)據(jù)進行篩選數(shù)據(jù)篩選的內容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔出本文檔共81頁;當前第8頁;編輯于星期三\13點46分資料審核的方式:實地審核:收集資料的過程中進行的審核,即邊收集邊審核。一旦發(fā)現(xiàn)填答錯誤,或漏填誤填,或其他可疑現(xiàn)象,就及時進行詢問核實。其優(yōu)點是及時、效果好;困難在于資料收集時組織安排特別周密,調查員個人處理能力較強。系統(tǒng)審核(集中審核):先將資料全部收回,然后集中時間進行審核。其優(yōu)點是便于統(tǒng)一安排和管理,檢查標準統(tǒng)一。但整個周期拉長,且有些核實工作往往那個難以落實。本文檔共81頁;當前第9頁;編輯于星期三\13點46分二、資料轉換將被調查者對問卷中問題的回答轉換成供計算機識別和統(tǒng)計的數(shù)字。三、數(shù)據(jù)錄入數(shù)據(jù)錄入的方式主要有兩種:一是直接從問卷上將編好碼的數(shù)據(jù)輸入計算機;另一種是先將問卷上編好碼的數(shù)據(jù)轉錄到專門的登錄表上,然后再從登錄表上將數(shù)據(jù)輸入計算機。本文檔共81頁;當前第10頁;編輯于星期三\13點46分四、數(shù)據(jù)清理1有效范圍清理問卷中任何一個變量的編碼值都有一定的范圍,當數(shù)據(jù)中數(shù)字超出這一范圍時,肯定是錯誤的。2邏輯一致性清理依據(jù)問卷中問題相互之間存在的某種內在的邏輯聯(lián)系,檢查前后數(shù)據(jù)之間的合理性。3數(shù)據(jù)質量抽查本文檔共81頁;當前第11頁;編輯于星期三\13點46分統(tǒng)計分析概述統(tǒng)計分析就是運用統(tǒng)計學的方法對調查得到的數(shù)據(jù)資料進行定量分析,以揭示事物內在的數(shù)量關系、規(guī)律和發(fā)展的一種資料分析方法。其主要作用:1為研究提供一種清晰準確的形式化語言,對資料進行簡化和描述。如對人們在一胎化政策實行前的行為進行研究,可以發(fā)現(xiàn)生育行為受文化程度的影響。從總體上看,文化程度高的婦女其子女數(shù)量少于文化程度低的婦女。用定性分析的方法只能得出這樣一個概略的認識。采用定量方法進行分析就可以將這種關系提煉成一個數(shù)學方程式:Y=4.38-0.16X。Y代表任何一個婦女生育子女的數(shù)量,X代表文化程度。從這個方程中可以看出,每提高一組文化程度,就可以少生0.16個孩子。本文檔共81頁;當前第12頁;編輯于星期三\13點46分2統(tǒng)計分析時進行科學預測、探索未來的重要方法統(tǒng)計分析可以使人發(fā)現(xiàn)直覺所不能悟察到的規(guī)律,進行科學的預測。3對變量關系進行深入分析,通過樣本推論總體統(tǒng)計分析提供參數(shù)估計、假設檢驗等手段將樣本推論到總體的方法。

本文檔共81頁;當前第13頁;編輯于星期三\13點46分統(tǒng)計分析的特點1統(tǒng)計分析要以定性分析為基礎首先,統(tǒng)計分析是根據(jù)數(shù)據(jù)資料進行的,但這些數(shù)據(jù)本身不是抽象的數(shù)字而是反映了事物屬性的統(tǒng)計指標。定性分析要為定量分析規(guī)定方向,劃分范疇。其次,統(tǒng)計分析是依據(jù)一定公式計算的,公式的選擇依賴于一定的理論知識、專業(yè)知識和必要的經(jīng)驗。事實上在定量分析之前已經(jīng)通過定性分析,從理論和經(jīng)驗上判明了事物之間的聯(lián)系,決定了要采用的公式。本文檔共81頁;當前第14頁;編輯于星期三\13點46分2統(tǒng)計分析方法必須和其他分析方法結合運用數(shù)量關系只是客觀事物存在的諸種關系中的一種,而不是全部。統(tǒng)計分析方法不是萬能的,它有自身獨特的長處。也有無法克服的局限性,它不能代替其他分析方法。其次,統(tǒng)計分析方法能夠幫助發(fā)現(xiàn)社會現(xiàn)象中不易察覺的規(guī)律,但對規(guī)律的揭示要借助于有關學科的理論。本文檔共81頁;當前第15頁;編輯于星期三\13點46分3統(tǒng)計分析有一套專門的方法和技術統(tǒng)計學是對社會現(xiàn)象作定量研究和分析的科學武器;計算機技術是進行統(tǒng)計研究的技術工具;統(tǒng)計分析的數(shù)字成果是運用數(shù)字模型來描述、解釋、預測社會現(xiàn)象。本文檔共81頁;當前第16頁;編輯于星期三\13點46分第二節(jié)單變量統(tǒng)計分析主要分為兩個大的方面,即描述統(tǒng)計和推論統(tǒng)計。描述統(tǒng)計的主要目的在于用最簡單的概括形式反映出大量數(shù)據(jù)資料所容納的基本信息。包括集中趨勢分析、離散趨勢分析等。推論統(tǒng)計的主要目的,是從樣本中所得到的數(shù)據(jù)資料來推斷總體的情況,它主要包括區(qū)間估計和假設檢驗等。本文檔共81頁;當前第17頁;編輯于星期三\13點46分描述統(tǒng)計內容搜集數(shù)據(jù)整理數(shù)據(jù)展示數(shù)據(jù)

目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105本文檔共81頁;當前第18頁;編輯于星期三\13點46分推斷統(tǒng)計內容參數(shù)估計假設檢驗目的對總體特征作出推斷樣本總體本文檔共81頁;當前第19頁;編輯于星期三\13點46分描述統(tǒng)計與推斷統(tǒng)計的關系反映客觀現(xiàn)象的數(shù)據(jù)總體內在的數(shù)量規(guī)律性推斷統(tǒng)計(利用樣本信息和概率論對總體的數(shù)量特征進行估計和檢驗等)概率論(包括分布理論、大數(shù)定律和中心極限定理等)描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整理、顯示和分析等)總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計學探索現(xiàn)象數(shù)量規(guī)律性的過程本文檔共81頁;當前第20頁;編輯于星期三\13點46分一、單變量描述統(tǒng)計1集中趨勢分析集中趨勢分析指的是用一個典型值來反映一組數(shù)據(jù)的一般水平,或者是反映這組數(shù)據(jù)向這個典型值集中的情況。這樣一個典型值就被稱為集中統(tǒng)計量。本文檔共81頁;當前第21頁;編輯于星期三\13點46分按照處理方式不同集中統(tǒng)量可分為幾類,兩最常見的集中趨勢有算術平均值、眾數(shù)和中位數(shù)三種。用得最多的是平均數(shù)。1定類層次:眾值(眾數(shù))其意義為,在眾多數(shù)值中,出現(xiàn)次數(shù)最多的一個數(shù)值。(1)原始資料,求眾值例如:2,3,5,5,5,6,6,7,8出現(xiàn)次數(shù)最多的是5,其M0=5本文檔共81頁;當前第22頁;編輯于星期三\13點46分(2)次數(shù)資料,求眾值例如:江村女青年找對象的標準標準相貌人品文化健康職業(yè)能力經(jīng)濟條件政治條件家庭背景感情人數(shù)551225110413291613682其次數(shù)最多的為人品122人次,所以M0=人品本文檔共81頁;當前第23頁;編輯于星期三\13點46分(3)分組的頻數(shù)表中,頻數(shù)最大的區(qū)間的組中值就是眾值區(qū)間組中值頻數(shù)75-7977170-7472365-6967560-64621055-5957450-54522表中頻數(shù)最大的為10,對應的區(qū)間是60-64,其組中值是62,所以眾值=62。如果在一個次數(shù)中出現(xiàn)兩個鄰近的次數(shù)較多者,眾數(shù)是二次數(shù)多的組中值的平均值本文檔共81頁;當前第24頁;編輯于星期三\13點46分2定序層次:中位值(中位數(shù))(單選)其意義為按大小順序排列,處在一群數(shù)據(jù)中央位置的數(shù)值。(1)原始資料,求中位值例如:有9個人,他們的月工資分別如下:47,42,50,51,92,112,71,83,108首先作排列處理,從小到大排列42,47,50,51,71,83,92,108,112其次求中央位置Md的位置=(N+1)÷2=(9+1)÷2=5最后求中位置Md=71本文檔共81頁;當前第25頁;編輯于星期三\13點46分(3)定距層次:算術平均數(shù)通常稱平均數(shù),又稱均數(shù)或均值。英文為Mean,故以M表示。如果是由變量X計算得來的就記為(讀X杠),現(xiàn)在一般都以表示樣本的平均數(shù),以U表示總體的平均數(shù)。算術平均數(shù)就是各個變量值相加求和再除以變量的總次數(shù)。==本文檔共81頁;當前第26頁;編輯于星期三\13點46分算術平均數(shù)的計算方法1、用原始數(shù)據(jù)計算平均數(shù)。當一組數(shù)據(jù)個數(shù)不多時,可直接用原始數(shù)據(jù)來計算。如某實驗小組10人的實驗成績?yōu)?1,13,15,16,16,16,17,18,18,20。其平均數(shù)為:===16本文檔共81頁;當前第27頁;編輯于星期三\13點46分2、用頻數(shù)分布表求平均數(shù)。如果樣本的數(shù)據(jù)很多,達到數(shù)十個或數(shù)百個,則需編制頻數(shù)分布表,用頻數(shù)分布表求平均數(shù)。=Xc為各組的組中值,f為各組的頻數(shù),N為總次數(shù)()

本文檔共81頁;當前第28頁;編輯于星期三\13點46分例調查某企業(yè)100名職工的收入,得到表中資料,計算他們的平均收入。收入(元)職工數(shù)(人)組中值xf100-199101501500200-299102502500300-3994035014000400-499204509000500-5992055011000合計10038000平均收入=∑xf/n=38000/100=380(元)本文檔共81頁;當前第29頁;編輯于星期三\13點46分2.離散量數(shù)分析

離散趨勢指的是測量值圍繞中心值——比如平均值——的分布。極差就是個簡單例子。如我們可以報告說平均年齡是37.9,范圍是從12到89歲。離散(中)量數(shù)分析

指的是用一個特別的數(shù)值來反映一組數(shù)據(jù)相互之間的離散(中)程度.即各組數(shù)據(jù)相對于平均數(shù)的差異程度(離中程度)。差異程度小,平均數(shù)的代表性高;差異程度大,代表性低。它與集中量數(shù)一起分別從兩個不同的側面描述和揭示一組數(shù)據(jù)的分布情況。共同反映出資料分布的全面特征,同時它還對現(xiàn)各集中量數(shù)的代表性做出補充說明。本文檔共81頁;當前第30頁;編輯于星期三\13點46分示例:某三個班各選5名同學參加測試.他們的成績分別如下中文系:78,79,80,81.82X=80數(shù)學系:65,72,80,88,95X=80外語系:35,78,89,98,100X=80

如果僅以集中量數(shù)來衡量,這三個隊的水平一樣高,但是很明顯.這80分對中文系隊的同學代表性最高,而對外語系的同學代表性最低.本文檔共81頁;當前第31頁;編輯于星期三\13點46分離散程度表示一組數(shù)值的差異情況,測量的是分配的離中趨勢。反映數(shù)據(jù)對于集中趨勢的偏離程度的量稱為離散程度統(tǒng)計量。常見的離散量數(shù)統(tǒng)計量有全距,標準差,異眾比率,和四分位差。本文檔共81頁;當前第32頁;編輯于星期三\13點46分全距(R)全距也叫極差,它是一組數(shù)據(jù)中,最大值與最小值之差.

它是表示數(shù)據(jù)分布離散程度最簡單的方式,即一組數(shù)據(jù)中最大數(shù)與最小數(shù)差,故稱兩極差。R=Xmax-Xmin當數(shù)據(jù)較多時,應用頻數(shù)分布表求全距。其方法為:最大組與最小組的組中值之差或最大組上限與最小組下限之差。R=Xcmax-XcminR=Umax-Lmin本文檔共81頁;當前第33頁;編輯于星期三\13點46分標準差

對于定距定比變量,可以采用標準差的測量法標準差:一組數(shù)據(jù)對其平均數(shù)的偏差平方的算術平均數(shù)的平方根。一般以S(或來表示)式中S(樣本統(tǒng)計值)為標準差,X為各學生的成績分數(shù),為學生成績的平均數(shù),x為各學生成績分數(shù)的離差,n為學生(數(shù)據(jù))數(shù)。S==本文檔共81頁;當前第34頁;編輯于星期三\13點46分例:某校三個系各選5名同學,參加智力競賽,他們的成績分別如下:中文系:7879808182數(shù)學系:6572808895英語系:35788998100平均成績=80

標準差:一組數(shù)據(jù)對其平均數(shù)的偏差平方的算術平均數(shù)的平方根。S(中文系)=1.414(分)S(數(shù)學系)=10.8(分)S(英語系)=23.8(分)S=本文檔共81頁;當前第35頁;編輯于星期三\13點46分

由10個家庭每個月比前兩年增加開支的情況是:85,63,50,46,37,34,28,25,22,20。(1)先計算10個家庭平均每月開支多少?用集中趨勢表示∑X/n=41元(2)對這10個家庭講,對這個平均值(41元)的偏差程度如何?往往用標準差表示。S≈19.5這表示,這10個人家,每個月增長消費支出的標準差是19.5。假如有另10戶人家,其標準差是7.8,在這種情況下,說明前10戶人家支出的分布比較分散,用的多得很多,用得少的人家則十分節(jié)儉。而后10戶人家則指出比較平均。因此,標準差越大,表示分布越分散;而標準差越小,表示分布越集中。本文檔共81頁;當前第36頁;編輯于星期三\13點46分相對差異(離散或離中)量數(shù)

1.離散系數(shù)

離散系數(shù)是一種相對的離散量數(shù)統(tǒng)計量,它使我們能夠對同一總體中的兩種不同的離散量數(shù)進行比較,或者對兩個不同總體中的同一離散量數(shù)進行比較。。離散系數(shù)的定義是:標準差與平均數(shù)的比值,用百分比表示。CV=×100%(CV為離散系數(shù))本文檔共81頁;當前第37頁;編輯于星期三\13點46分例1:一項調查得到下列結果,某市人均平均收入為92元,標準差為17元,人均住房面積7.5平方米,標準差為1.8平方米。試比較該市人均收入和人均住房情況哪一個差異程度比較大。[解]人均收入的離散系數(shù)為CV=S/×100%=18.5%人均住房面積的離散系數(shù)為CV=1.8/7.5×100%=24%例2:對廣州和武漢兩地居民生活質量調查發(fā)現(xiàn),廣州居民平均收入為680元,標準差為120元;武漢居民平均收入為360元,標準差為80元。問廣州居民相互之間的差異程度,與武漢居民相互之間在收入上的差異程度哪一個更大一些?(應用題)[解]廣州居民收入的離散系數(shù)為CV=120/680×100%=17.6%武漢居民收入的離散系數(shù)為CV=80/360×100%=22.2%本文檔共81頁;當前第38頁;編輯于星期三\13點46分標準分數(shù)

是用來描述變量分布中某一分數(shù)在整個分布中所處的位置,它是以標準差為單位的相對量數(shù)。其計算公式為:

z

==從公式可以得知標準分數(shù)是一個分數(shù)與其平均數(shù)之差除以標準差所得的商。平均數(shù)以上各點的分數(shù)為正值,平均數(shù)以下各點的分數(shù)為負值,平均數(shù)的分數(shù)為零。本文檔共81頁;當前第39頁;編輯于星期三\13點46分例如:某班語文平均考試成績?yōu)?5分,標準差為8.5分。甲生得92分,乙生得70分,問甲乙二生的分數(shù)各為多少?

Z甲=Z乙=

=2=-.59據(jù)正態(tài)分布理論可知的取值范圍在-3到+3之間。為了使標準分數(shù)變成正值并減少小數(shù)位數(shù),以便于比較,我們可將標準分數(shù)進一步經(jīng)線性轉換成標準分數(shù)。其計算公式為:T=10Z+50

本文檔共81頁;當前第40頁;編輯于星期三\13點46分例:有某生三次數(shù)學考試的成績分別為70、57、45,三次考試的班平均為70、55、42,標準差分別為8、4、5。如何看待該生的三次考試成績的地位?(如果僅從原始分數(shù)看,肯定認為第一次最好,其實不然,要計算出各次的標準分數(shù),才能說明問題。)Z1=(70-70)/8=0Z2=(57-55)/4=0.5Z3=(45-42)/5=0.6這說明,原始分數(shù)為70,其位置正在平均線上,而原始分數(shù)為57的,其位置在平均線上0.5處,而原始分數(shù)為45的,其位置在平均線上0.6處。本文檔共81頁;當前第41頁;編輯于星期三\13點46分目前,我國各類學校招考新生和對學生進行學習成績考查評定的主要手段是考試。而對考試成績的評分一般是用百分制來表示,并用各科成績相加按總分來決定被試者的優(yōu)劣取舍。這種做法開來似乎公平,實際上很不合理。因為各科試題的難易程度不同,造成評分標準的寬嚴不一,因此各科考試成績的統(tǒng)計量數(shù),如平均數(shù)、標準差也不相等。我們不能說語文的考分80分等價于數(shù)學的考分的80分,也不能說英語考分75分等價于物理的考分75分,在這種情況下,把考生的各科考分等量齊觀地相加起來,憑個考生的總分來決定優(yōu)劣取舍,顯然是十分不合理的。科學的方法,就是把考生是各科分數(shù),經(jīng)過一個標準化的轉化過程,把每個考生的各科分數(shù)變成標準分數(shù),然后再進行相加和比較。本文檔共81頁;當前第42頁;編輯于星期三\13點46分練習在一個社區(qū)診所,10天內來排隊看病的人數(shù)分別是52,68,39,47,57,32,75,25,31和93,求算術平均數(shù)和中位數(shù),以及標準差本文檔共81頁;當前第43頁;編輯于星期三\13點46分二單變量推論統(tǒng)計推論統(tǒng)計,是指根據(jù)樣本所提供的統(tǒng)計值,運用概率的理論進行分析、論證,在一定的可靠程度上,對總體分布的特征進行估計、推測。具體內容包括:(一)區(qū)間估計(二)假設檢驗本文檔共81頁;當前第44頁;編輯于星期三\13點46分(一)區(qū)間估計

以樣本統(tǒng)計量的抽樣分布為理論依據(jù),按一定概率要求,由樣本統(tǒng)計量的值來估計總體參數(shù)的值所在的范圍,叫做總體參數(shù)的區(qū)間估計。區(qū)間估計的實質就是在一定的可信度(置信度)下,用樣本統(tǒng)計值的某個范圍來估價總體的參數(shù)值。范圍的大小反映的是這種估計的精確性問題,而可信度高低反映的是這種估計的可靠性或和握性問題。本文檔共81頁;當前第45頁;編輯于星期三\13點46分間估計的可靠性或把握性是指用某個區(qū)間去估計總體參數(shù)時,成功的可能性有多大??梢越忉尀椋喝绻麖目傮w中重復抽取100次,約有95%次所抽取樣本的統(tǒng)計值的某個區(qū)間中都將包含總體的參數(shù)值,那么就說這個區(qū)間估計的可靠性為95%。區(qū)間估計的結果通??梢杂孟率龇绞絹肀硎觯骸拔覀冇?5%的把握認為,全市職工的月工資收入在182元至218元之間?!被蛘摺叭∪丝谥校哉?0%-52%的可能性為99%”。本文檔共81頁;當前第46頁;編輯于星期三\13點46分社會統(tǒng)計分析中,常用的置信度a分別為90%、95%和99%,與他們所對應的允許誤差分別為10%、5%和1%。。在計算中,置信度常用1-a來表示。本文檔共81頁;當前第47頁;編輯于星期三\13點46分總體均值的區(qū)間估計總體均值的區(qū)間估計公式為:-Z+Z其中,為樣本平均數(shù);S為樣本標準差;Z(1-a)為置信度為1-a的Z值;n為樣本規(guī)模。本文檔共81頁;當前第48頁;編輯于星期三\13點46分(2)總體百分數(shù)的區(qū)間估計公式為p+本文檔共81頁;當前第49頁;編輯于星期三\13點46分課堂練習題例:調查某廠職工的工資狀況,隨機抽取900名工人做樣本,調查得到他們的月平均工資為186元,標準差為42元。求95%的置信度下,全廠職工的月平均工資的置信區(qū)間是多少?[解]將調查資料代入總體均值的區(qū)間估計公式得當將置信度提高到99%,總體的置信區(qū)間為182.39-189.61元(隨著可靠性的提高,所估計的區(qū)間擴大了,但估計的精確性就相應地降低了。例:從某工廠隨機抽取400名工人進行調查,結果表明女工的比例為20%?,F(xiàn)在要求在90%的置信度下,估計全廠工人中女工比例的置信區(qū)間。[解]帶入總體百分數(shù)的區(qū)間估計公式得16.7%-23.%本文檔共81頁;當前第50頁;編輯于星期三\13點46分小結:要對總體均數(shù)進行區(qū)間估計,即在一定的可靠程度上求出總體均數(shù)的置信區(qū)間的上下限,首先,要知道與所要估計的參數(shù)相對應的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的抽樣分布;其次,要求出該統(tǒng)計量的標準誤;最后,要明確在多大的可靠度上對總體均數(shù)作估計,再通過查抽樣分布概率分布表,找出與該可靠度所對應的該分布在橫軸上記分的臨界值,從而計算出總體均數(shù)的置信區(qū)間。本文檔共81頁;當前第51頁;編輯于星期三\13點46分(二)假設檢驗

利用樣本信息,根據(jù)一定的概率,對總體參數(shù)或分布的某一假設作出拒絕或保留的決斷,稱為假設檢驗。假設是對總體參數(shù)的一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述本文檔共81頁;當前第52頁;編輯于星期三\13點46分假設檢驗的基本思想...因此我們拒絕假設

=50...如果這是總體的真實均值樣本均值m=50抽樣分布H0這個值不像我們應該得到的樣本均值...20本文檔共81頁;當前第53頁;編輯于星期三\13點46分總體假設檢驗的過程

(提出假設→抽取樣本→作出決策)抽取隨機樣本均值

X=20我認為人口的平均年齡是50歲

提出假設

拒絕假設!別無選擇.作出決策本文檔共81頁;當前第54頁;編輯于星期三\13點46分當對某一總體參數(shù)進行假設檢驗時,首先從該總體中隨機抽取一個樣本,然后計算統(tǒng)計量的值,并根據(jù)經(jīng)驗對相應的總體參數(shù)提出一個假設值,這個假設是說這個樣本統(tǒng)計量的值是由這個假設總體參數(shù)值的一個隨機樣本,即這個樣本來源于這個總體,而樣本統(tǒng)計量的值與總體參數(shù)值之間的差異是由抽樣誤差所致。根據(jù)這一假設,可以認為像這樣的一切可能樣本統(tǒng)計量的值應當以總體參數(shù)值(假設的)為中心形成該統(tǒng)計量的一個抽樣分布。如果這個隨機樣本統(tǒng)計量的值在其抽樣分布上出現(xiàn)的概率較大時,就得保留這個假設,即承認這個樣本來自這個總體,而樣本統(tǒng)計量的值與總體參數(shù)值之間的差異是由抽樣誤差所致。此時稱樣本統(tǒng)計量的總體參數(shù)與假設的總體參數(shù)差異不顯著。否則就拒絕這個假設,否認這個樣本來自這個總體,樣本統(tǒng)計量的總體參數(shù)與總體參數(shù)值之間有顯著差異。本文檔共81頁;當前第55頁;編輯于星期三\13點46分假設檢驗先對總體的某一參數(shù)作出假設,然后用樣本的統(tǒng)計量去進行驗證,以決定假設是否為總體做接受。依據(jù)的概率論中的小概率原理,即“小概率事件在一次觀察中不可能出現(xiàn)”的原理。本文檔共81頁;當前第56頁;編輯于星期三\13點46分步驟:(1)建立虛無假設和研究假設,通常是將原假設作為虛無假設;(2)根據(jù)需要選擇適當?shù)娘@著性水平α(即概率的大?。?,通常有α=0.01等;(3)根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計值,并根據(jù)顯著性水平查出對應的臨界值;(4)將臨界值與統(tǒng)計值進行比較,若臨界值大于統(tǒng)計值的絕對值,則接受虛無假設;反之,則接受研究假設。本文檔共81頁;當前第57頁;編輯于星期三\13點46分什么是原(虛無)假設?(NullHypothesis)1. 待檢驗的假設,又稱“0假設”2. 如果錯誤地作出決策會導致一系列后果3. 總是有等號=,≦

或≧4. 表示為H0H0:

某一數(shù)值指定為=號,即≦

或≧

例如,H0:

=3190(克)本文檔共81頁;當前第58頁;編輯于星期三\13點46分什么是備擇(研究)假設?1. 與原假設對立的假設2. 總是有不等號:

﹤,﹥或≠。3. 表示為H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:<3910(克),或H1:

3910(克)本文檔共81頁;當前第59頁;編輯于星期三\13點46分什么顯著性水平?1. 是一個概率值2. 原假設為真時,拒絕原假設的概率被稱為抽樣分布的拒絕域3. 表示為(alpha)常用的值有0.01,0.05,0.104. 由研究者事先確定本文檔共81頁;當前第60頁;編輯于星期三\13點46分什么檢驗統(tǒng)計量?1.用于假設檢驗問題的統(tǒng)計量2.選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本總體方差已知還是未知檢驗統(tǒng)計量的基本形式為本文檔共81頁;當前第61頁;編輯于星期三\13點46分例:某單位職工上月平均收入為210元,標準差為15元。問該單位職工本月平均收入與上月相比是否有變化?[解]建立虛無假設(H0)和研究假設H1

H0:μ=210H1:μ≠210選擇顯著性水平a=0.05,帶入樣本數(shù)據(jù)計算統(tǒng)計值Z,得=6.67>1.96所以拒絕虛無假設,接受研究假設,即從總體上來說,該單位職工月平均收入與上月相比有變化。本文檔共81頁;當前第62頁;編輯于星期三\13點46分【例】某批發(fā)商欲從生產(chǎn)廠家購進一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時。已知燈泡使用壽命服從正態(tài)分布,標準差為20小時。在總體中隨機抽取100只燈泡,測得樣本均值為960小時。批發(fā)商是否應該購買這批燈泡?(=0.05)屬于檢驗聲明的有效性!本文檔共81頁;當前第63頁;編輯于星期三\13點46分H0:1000H1:<1000=0.05n=100臨界值(s):檢驗統(tǒng)計量:在=0.05的水平上拒絕H0有證據(jù)表明這批燈泡的使用壽命低于1000小時決策:結論:-1.645Z0拒絕域本文檔共81頁;當前第64頁;編輯于星期三\13點46分第三節(jié)雙變量統(tǒng)計分析一、相關的意義及類型對兩變量間關系進行描述,最常用的是相關量。相關就是指二列變量之間的相互關系。如身高和體重、學習成績與思想品德等的相互關系。統(tǒng)計相關分析的目的就是要(1)確定現(xiàn)象的變化之間是否存在相關關系,并且找出合適的數(shù)學表達式。(2)測定現(xiàn)象之間相關的密切關系(3)研究相關關系中哪些是主要因素,哪些是次要因素,這些因素之間的關系是如何。本文檔共81頁;當前第65頁;編輯于星期三\13點46分一種是兩列變量的變動方向相同,即一種變量變動時,另一種變量也發(fā)生或大或小的相同方向的變動,如身高與體重的關系,一般來說,身高越高,體重越重,這叫正相關;另一種相關情況是當一種變量變動時另一種變量是或大或小地向相反方向變動,如身體健康狀況與患病率的關系,身體越好,患病率越小,這叫負相關。第三種是零相關,即兩列變量變化方向無一定規(guī)律,一個變量變動時,另一變量的變動方向可能與其相同,也可能與其相反,且相同與相反的機會趨于相等,如人的相貌與其思想品德之間是毫無關系的零相關。本文檔共81頁;當前第66頁;編輯于星期三\13點46分二、交互分類交互分類是一種專門用來分析兩個定類變量(或一個定類變量,一個定序變量)之間關系的統(tǒng)計分析方法。它是同時依據(jù)兩個變項的值,將所研究的個案分類,其結果通常以交互分類表的形式反映出來。本文檔共81頁;當前第67頁;編輯于星期三\13點46分某次調查樣況的構成情況統(tǒng)計表性別年齡青年中年老年合計男706050180女504030120合計12010080300上表是對總數(shù)為300人的調查樣本按年齡和性別兩個變量進行交互分類的結果。通過這種交互分類表,不僅可以知道樣本中男性、女性各有多少,或者青年、中年、老年各有多少,同時還可以知道男性青年、男性中年等等各有多少。因此,交互分類可以較為深入地描述樣本資料的分布狀況和內在結構,進而對變量之間的關系進行分析和解釋。本文檔共81頁;當前第68頁;編輯于星期三\13點46分X2檢驗本文檔共81頁;當前第69頁;編輯于星期三\13點46分Z檢驗Z檢驗是用正態(tài)分布的理論差異發(fā)生的概率(誤差發(fā)生的概率),從而比較兩個平均數(shù)(樣本平均數(shù)與總體平均數(shù)或兩個樣本平均數(shù))的差異是否顯著。Z檢驗適用于大樣本(n>30)Z檢驗可分為單總體檢驗和雙總體檢驗。本文檔共81頁;當前第70頁;編輯于星期三\13點46分t

檢驗單總體的檢驗

單總體的檢驗是檢驗一個樣本平均數(shù)與一已知的總體平均數(shù)的差異是否顯著。其檢驗統(tǒng)計量的計算公式為:

式中t為檢驗的樣本平均數(shù)與已知總體平均數(shù)的標準離差分數(shù),df為t分布的自由度。

本文檔共81頁;當前第71頁;編輯于星期三\13點46分例如:某校初中三年級學生期中英語考試成績平均數(shù)為73分,標準差為17分。期終考試后,從該年級學生中隨機抽取20人的英語成績,其平均數(shù)為79.4分,問該年級學生的英語成績是否真有進步?本文檔共81頁;當前第72頁;編輯于星期三\13點46分一、相關系數(shù)◆相關系數(shù)是用來表示相關程度的量的指標,用r表示。其數(shù)值范圍在-1至+1之間,◆r的正負號表示變化的方向,

正號表示變化的方向相同,是正相關;負號表示變化的方向相反,是負相關。

◆r的絕對值表示兩變量之間的密切程度(強度),

絕對值越接近1,表示兩變量之間的關系越密切;越接近0,表示兩變量之間的關系越不密切?!羧鐁=1表示

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論