




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
目錄內(nèi)容簡(jiǎn)介目錄第一部分復(fù)習(xí)筆記第一篇導(dǎo)論第一章科學(xué)方法與社會(huì)研究歷程第二篇統(tǒng)計(jì)敘述:?jiǎn)巫冺?xiàng)與雙變項(xiàng)第二章簡(jiǎn)化一個(gè)變項(xiàng)之分布第三章簡(jiǎn)化兩個(gè)變項(xiàng)之分布第四章相關(guān)測(cè)量法與測(cè)量層次第三篇統(tǒng)計(jì)推論:?jiǎn)巫冺?xiàng)與雙變項(xiàng)第五章抽樣與統(tǒng)計(jì)推論第六章參數(shù)值的估計(jì)第七章假設(shè)檢定:均值與百分率第八章假設(shè)的檢定:兩個(gè)變項(xiàng)之相關(guān)第四篇多變項(xiàng)分析第九章詳析模式與統(tǒng)計(jì)控制第十章多因分析第十一章因徑分析第十二章定類或定序依變項(xiàng)回歸分析第十三章多項(xiàng)互關(guān)分析第五篇社會(huì)變遷分析第卜四章趨勢(shì)資料分析法第十五章同組分析第二部分典型題(含考研真題)詳解一、名詞解釋二、簡(jiǎn)答題三、論述題第一部分復(fù)習(xí)筆記第一篇導(dǎo)論第一章科學(xué)方法與社會(huì)研究歷程「社會(huì)學(xué)三先的受念/社會(huì)學(xué)航允歷程的來(lái)龍去肱1 「等劃〔社會(huì)學(xué)研究的步驟《執(zhí)行I息結(jié)(選定所允題目初步探索成立假設(shè)理論貂茗與澄涌蛻念科學(xué)方法與社會(huì)研究方程號(hào)劃] (研究設(shè)計(jì)科學(xué)方法與社會(huì)研究方程-定類層次定字層次定及百次一定比廛次界定母體和決定抽樣的步零【統(tǒng)計(jì)分忻f訪問(wèn)法f抽取樣本.收兵交。(觀察法執(zhí)行? 〔檔累資料〔至理資料J校對(duì)I魂明[統(tǒng)計(jì)分析.將眾多的資料作海合運(yùn)算'總結(jié)J敏恭用先絕果'說(shuō)明用咒玲果的貢蛾〔受柒若干新的斫克題目【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、社會(huì)學(xué)研究歷程的來(lái)龍去脈社會(huì)學(xué)研究的概念社會(huì)學(xué)研究,是指運(yùn)用科學(xué)的方法來(lái)搜集和分析社會(huì)事實(shí),以理解社會(huì)現(xiàn)象之間的關(guān)系,尤其是因果關(guān)系。社會(huì)學(xué)研究采用科學(xué)方法來(lái)敘述和解釋社會(huì)現(xiàn)象間的關(guān)系。2.社會(huì)學(xué)研究的步驟采用科學(xué)方法的社會(huì)學(xué)研究的整個(gè)歷程,大致上可分為三個(gè)階段:(1)籌劃:研究題目初步探索、成立假設(shè)、理論解釋與澄清概念及研究策略。(2)執(zhí)行:試點(diǎn)研究、抽取樣本、收集資料及整理資料。(3)總結(jié):統(tǒng)計(jì)分析、解釋研究結(jié)果及理論與實(shí)際貢獻(xiàn)。二、籌劃在規(guī)劃一項(xiàng)研究時(shí),大致上可以分為下面的五個(gè)步驟:.選定研究題目開始一項(xiàng)研究時(shí),選定研究題目是非常重要的。.初步探索(1)收集有關(guān)的文獻(xiàn);(2)咨詢對(duì)研究的題目有經(jīng)驗(yàn)、有知識(shí)的人,進(jìn)行了解;(3)觀察個(gè)案,即挑選一些較為典型的個(gè)案,親自觀察所要研究的現(xiàn)象。.成立假設(shè)(1)變項(xiàng)是指社會(huì)學(xué)研究的社會(huì)現(xiàn)象。假設(shè)是指根據(jù)研究者對(duì)問(wèn)題的了解,假定現(xiàn)象與現(xiàn)象之間的關(guān)系。假設(shè)的形式包括函數(shù)式和差異式。(2)在成立假設(shè)時(shí),必須盡可能說(shuō)清楚變項(xiàng)與變項(xiàng)之間的關(guān)系。研究假設(shè),一般是說(shuō)明兩個(gè)變項(xiàng)的關(guān)系,但也可以只假定一個(gè)變項(xiàng)的情況或假定多個(gè)變項(xiàng)的相關(guān)情況。(3)不是所有的社會(huì)學(xué)研究都成立假設(shè)。但當(dāng)前的社會(huì)學(xué)研究,大部分是爭(zhēng)取先成立假設(shè),再搜集事實(shí)來(lái)加以驗(yàn)證,并且重復(fù)測(cè)驗(yàn)。.理論解釋與澄清概念在成立假設(shè)以后,便要予以解釋。另外,對(duì)假設(shè)中的變項(xiàng)所包含的概念,要清楚界定它們的意義,以免發(fā)生誤解。.研究策略要證明假設(shè),必須首先設(shè)計(jì)研究方式,然后確定每個(gè)變項(xiàng)的測(cè)量方法及其測(cè)量層次,最后計(jì)劃抽取樣本和選擇統(tǒng)計(jì)方法。(1)研究設(shè)計(jì)較為常用的研究方式有實(shí)驗(yàn)法和社會(huì)調(diào)查法,二者皆可驗(yàn)證假設(shè)。①實(shí)驗(yàn)法實(shí)驗(yàn)法的基本邏輯,是有意地改變A變項(xiàng),然后看看B變項(xiàng)是否隨著變化;如果B變項(xiàng)顯然是隨著A變項(xiàng)的變化而變化,即說(shuō)明A變項(xiàng)對(duì)B變項(xiàng)有影響。實(shí)驗(yàn)法的邏輯很嚴(yán)密,其操作程序?yàn)椋篴.將研究對(duì)象分為實(shí)驗(yàn)組和控制組。兩組的成員在實(shí)驗(yàn)前的情況要基本相同,尤其是那些會(huì)影響實(shí)驗(yàn)效果的情況。使兩組情況相同有兩種方法:隨機(jī)法和配對(duì)法。b.為證明假設(shè):A-B,要改變實(shí)驗(yàn)組的A變項(xiàng),但不改變控制組的A變項(xiàng),然后比較兩組的B變項(xiàng)在實(shí)驗(yàn)前、后的變化。如果變化的程度不同,表示A對(duì)B有影響;如果相同,則表示無(wú)影響。②社會(huì)調(diào)查法社會(huì)調(diào)查法的特點(diǎn),是在研究過(guò)程中不改變社會(huì)現(xiàn)狀,只求就地取材,然后以統(tǒng)計(jì)方法推算變項(xiàng)與變項(xiàng)之間的關(guān)系。社會(huì)調(diào)查法可以分為敘述性調(diào)查和解釋性調(diào)查兩大類。a.一般的社區(qū)調(diào)查或民意調(diào)查屬于敘述性調(diào)查。當(dāng)代的社會(huì)學(xué)研究,偏重因果關(guān)系,較常進(jìn)行解釋性調(diào)查。b.解釋性的社會(huì)調(diào)查研究,目的是要證明不同的變項(xiàng)之間是否有因果關(guān)系。③實(shí)驗(yàn)法與社會(huì)調(diào)查法的比較a.如果證明因果關(guān)系,社會(huì)調(diào)查法在邏輯上不及實(shí)驗(yàn)法嚴(yán)謹(jǐn)。嚴(yán)格來(lái)說(shuō),調(diào)查法只能確定變項(xiàng)之間是否相關(guān)。b.進(jìn)行社會(huì)調(diào)查時(shí),可作全體調(diào)查,也可作抽樣調(diào)查。在某一個(gè)時(shí)期進(jìn)行的社會(huì)調(diào)查是橫剖調(diào)查;在不同的時(shí)期重復(fù)的社會(huì)調(diào)查是縱貫調(diào)查。縱貫調(diào)查又分趨勢(shì)研究和同組研究。③個(gè)案研究個(gè)案研究是指選擇一個(gè)或幾個(gè)個(gè)案,作深入的接觸和觀察,目的是對(duì)所研究的問(wèn)題作深入的了解。個(gè)案研究不適宜用作證明假設(shè)。(2)測(cè)量變項(xiàng)①選擇指標(biāo)確定如何測(cè)量變項(xiàng),是指采用哪些事實(shí)作為變項(xiàng)的指標(biāo)。每個(gè)社會(huì)現(xiàn)象都有許多不同的數(shù)值或?qū)傩?,這些不同的值便構(gòu)成了一個(gè)變項(xiàng)。任何一個(gè)變項(xiàng)都可能有許多不同的指標(biāo),因此選擇指標(biāo)的標(biāo)準(zhǔn)必須符合變項(xiàng)的含義,同時(shí)又易于搜集所需的事實(shí)。②指標(biāo)的合并對(duì)于簡(jiǎn)單的變項(xiàng),用一個(gè)指標(biāo)便足夠。對(duì)于較復(fù)雜的變項(xiàng),可能要用上多個(gè)指標(biāo),為便于分析,有時(shí)需要將各項(xiàng)指標(biāo)合并起來(lái)。合并的方法,主要有類型法、指數(shù)構(gòu)成法和尺度法二坐一—類型法是將各指標(biāo)交互分類。型-類法數(shù)成指拗法指數(shù)構(gòu)成法是用簡(jiǎn)明而合理的公式,來(lái)綜合各指標(biāo)。度尺法尺度法是根據(jù)各指標(biāo)之間的關(guān)系來(lái)計(jì)算總值,使研究對(duì)象高低有序??偤统叨确ㄗ顬楹?jiǎn)單易行,也最常用,計(jì)算總值的方法是將各指標(biāo)的數(shù)值相加起來(lái)。③研究單位在測(cè)量變項(xiàng)時(shí),要注意研究單位的性質(zhì)。以個(gè)人為研究單位的變項(xiàng),稱為個(gè)人變項(xiàng);以地區(qū)或群體為研究單位的,稱為群體變項(xiàng)。在測(cè)量變項(xiàng)時(shí),要清楚說(shuō)明研究單位是個(gè)人還是群體。推論的兩種錯(cuò)誤:—將以群體研究單位研究得出的結(jié)論推論到以個(gè)人為研究單位時(shí)的情況。區(qū)群謬誤微體謬誤將以個(gè)人為研究單位的研究結(jié)論推論及于群體或整個(gè)地區(qū)。(3)測(cè)量層次變項(xiàng)在測(cè)量以后,會(huì)有不同的數(shù)值或?qū)傩?。根?jù)這些值的數(shù)學(xué)特質(zhì),可以將它們由低至高分為四個(gè)層次:定類、定序、定距和定比。①定類層次,是指變項(xiàng)的值只能把研究對(duì)象分類,即只能決定研究對(duì)象是同類抑或不同類,具有=與#的數(shù)學(xué)特質(zhì)。分類時(shí),要注意互斥性和無(wú)遺性兩個(gè)原則。②定序?qū)哟?,是能確定值的次序,即變項(xiàng)的值能把研究對(duì)象排列高低或大小,具有,與V的數(shù)學(xué)特質(zhì)。定序?qū)哟伟硕悓哟蔚奶刭|(zhì)。③定距層次,是指能確定值與值之間的距離,即變項(xiàng)之值與值間的距離是可以知道的,因而具有加與減的數(shù)學(xué)特質(zhì)。定距層次包括了定序和定類層次的特質(zhì)。④定比層次,是最高的測(cè)量層次,其數(shù)值中的零值是絕對(duì)的、固定的,除了定類、定序和定距層次的特質(zhì)以外,也具有乘與除(X、+)的數(shù)學(xué)特質(zhì)。(4)界定母體和決定抽樣的步驟界定母體,是指清楚說(shuō)明研究對(duì)象的范圍,即所研究的人物、時(shí)間和地點(diǎn)。母體的定義愈清楚愈好。如果所界定的母體范圍過(guò)大,不容易全部研究,就需要采取抽樣的方法。(5)統(tǒng)計(jì)分析統(tǒng)計(jì)方法分兩大類:敘述統(tǒng)計(jì)法和推論統(tǒng)計(jì)法。①敘述統(tǒng)計(jì)法就是幫助簡(jiǎn)化資料的方法。②推論統(tǒng)計(jì)法是根據(jù)抽樣取出的資料推論出母體的情況。三、執(zhí)行為保證研究質(zhì)量,應(yīng)該首先做小規(guī)模的試點(diǎn)研究,即抽取若干研究對(duì)象來(lái)試驗(yàn)整套計(jì)劃是否可行。根據(jù)試點(diǎn)研究的結(jié)果和經(jīng)驗(yàn)修改原來(lái)的計(jì)劃以后,就可以進(jìn)行大規(guī)模的研究工作。.抽取樣本,收集資料依據(jù)抽樣的計(jì)劃,從全部研究對(duì)象中抽取樣本。抽取樣本以后,向每一個(gè)樣本單位收集所需的資料。搜集資料的方法,可以歸為三大類:訪問(wèn)、觀察和檔案資料。(1)訪問(wèn)法①訪問(wèn)法在社會(huì)學(xué)研究中最常用,它可以在較短時(shí)間內(nèi)獲取大量資料。訪問(wèn)之前,一般是預(yù)先設(shè)計(jì)好一組問(wèn)題,稱為問(wèn)卷。答案的方式主要有固定答題和自由答題兩種:a.固定答題,由研究員預(yù)先設(shè)計(jì)了若干可能的答案,由答者選擇。固定答題便于統(tǒng)計(jì)分析,但所提供的答案不一定適當(dāng)。b.自由答題,讓答者隨著自己的意思回答,研究員不提供可能的答案。自由答題能夠讓答者充分表達(dá)他的意思,較為準(zhǔn)確,但答者可能哆嗦和花樣眾多,訪問(wèn)費(fèi)時(shí)且分析起來(lái)也不容易。②用問(wèn)卷收集資料的方式可以分為兩類:自填和對(duì)答。自填是指把問(wèn)卷交給答者,由他自己填寫答案。這種方式又分為郵寄和當(dāng)面填寫兩類:a.郵寄方式的好處是節(jié)省人力,但問(wèn)題是寄回來(lái)的問(wèn)卷可能很少。b.當(dāng)面填寫是指把研究對(duì)象集合起來(lái),在研究員面前自己填寫問(wèn)卷。自填的方式要求答者懂得文字和J'解問(wèn)題的意思,難以在教育落后的地區(qū)應(yīng)用。對(duì)答是指由研究員詢問(wèn),答者作口頭答復(fù),然后研究員作記錄。這種方式又分為電話訪問(wèn)與面對(duì)面訪問(wèn)兩類:a.電話訪問(wèn)是指研究員用電話詢問(wèn)研究對(duì)象,可以節(jié)省交通費(fèi)用和時(shí)問(wèn),但只能提出少量問(wèn)題,而且在電話普遍地區(qū)才可進(jìn)行,否則樣本的代表性有疑問(wèn)。b.面對(duì)面訪問(wèn)是指登門拜訪,直接訪問(wèn)研究對(duì)象,此方法耗費(fèi)人力和時(shí)間多,但可以避免自填方式以及電話訪問(wèn)的短處,而且有較長(zhǎng)的訪問(wèn)時(shí)間,搜集大量資料。③設(shè)計(jì)問(wèn)卷時(shí),切忌太長(zhǎng),要盡可能精簡(jiǎn),要經(jīng)過(guò)反復(fù)考慮,力求去蕪存菁。同時(shí),每個(gè)問(wèn)題所用的詞語(yǔ),要具體和明確,不能模棱兩可或有雙重含義。所用的詞語(yǔ),也不可影響答者的意見。(2)觀察法觀察法即是以耳聞目睹的方式,實(shí)地了解研究對(duì)象的行為。觀察法分為參與觀察法和非參與觀察法兩種。參與觀察法是指研究員要參加所研究的活動(dòng),從而獲取資料。非參與觀察法是指研究員的身份是旁觀者。(3)檔案資料檔案資料,包括報(bào)紙、雜志、機(jī)關(guān)文件與書信等。這是現(xiàn)有的資料,所以一般來(lái)說(shuō),花的時(shí)間最少,代價(jià)最小。.整理資料整理資料一般分為校對(duì)和編碼兩步。(1)校對(duì)是指查看所收集的資料有沒(méi)有錯(cuò),有沒(méi)有錯(cuò)漏和是否清楚。有錯(cuò)漏或不清楚的,就要馬上補(bǔ)上或更正。(2)編碼是指把資料作簡(jiǎn)明的記錄和分類。記錄資料時(shí),可用簡(jiǎn)單的數(shù)碼表示。四、總結(jié)統(tǒng)計(jì)分析,將眾多的資料作綜合運(yùn)算(1)運(yùn)用適當(dāng)?shù)臄⑹鼋y(tǒng)計(jì)方法,把所得到的資料簡(jiǎn)化,使之易于理解。如果所研究的是一個(gè)樣本,要運(yùn)用適當(dāng)?shù)耐普摻y(tǒng)計(jì)方法,用樣本的研究結(jié)果來(lái)推論總體的情況。一個(gè)嚴(yán)謹(jǐn)?shù)难芯?,在未分析變?xiàng)與變項(xiàng)之間的關(guān)系之前,應(yīng)該先檢驗(yàn)每個(gè)變項(xiàng)的測(cè)量信度和測(cè)量效度,再開始運(yùn)用統(tǒng)計(jì)方法分析資料以求驗(yàn)證假設(shè)。測(cè)量信度是指用相同的方法重復(fù)測(cè)量變項(xiàng)時(shí)所得的資料與原有資料的吻合程度。測(cè)量效度是指所得資料與測(cè)量的目標(biāo)的吻合程度。.解釋研究結(jié)果研究者提出更精確和更周詳?shù)慕忉?。如果研究結(jié)果是否定原來(lái)的假設(shè),須解釋其原因。.說(shuō)明研究結(jié)果的貢獻(xiàn)研究結(jié)果的貢獻(xiàn)包括理論的貢獻(xiàn)和實(shí)際的貢獻(xiàn)。.提供若干新的研究題目提供若干新的研究題目,即使自己未能解答,也要提議別人去尋求答案。第二篇統(tǒng)計(jì)敘述:?jiǎn)巫冺?xiàng)與雙變項(xiàng)第二章簡(jiǎn)化一個(gè)變項(xiàng)之分布
,次致分布
比例/定類層次《比室至示【對(duì)比值C累加次效/基本技術(shù),定字星決〔累tn百分率f次數(shù)的計(jì)算[矩形田,定距縣次《為示法I多魚淺虱優(yōu)化一個(gè)變項(xiàng)之分布"形宸淺優(yōu)化一個(gè)變項(xiàng)之分布1一些的我的嗝念Jc形腔淺‘峰狀曲畿I對(duì)稱與不對(duì)稱曲線「定類變項(xiàng):眾值勇士趨勢(shì)更量法1定字變項(xiàng):中也值〔定距至項(xiàng):均值「定類變項(xiàng):稟異比軍或靈異指歟要歌迨勢(shì)出量法,定字變項(xiàng):四分也差I(lǐng)定域變項(xiàng):標(biāo)準(zhǔn)差『正態(tài)曲線及正態(tài)分布1正態(tài)分布與標(biāo)準(zhǔn)值?I標(biāo)鹿正態(tài)分布【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、基本技術(shù)定類層次【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、基本技術(shù)定類層次適用于簡(jiǎn)化一個(gè)定類變項(xiàng)資料的方法,有次數(shù)分布、比例、比率、對(duì)比值和圖示法等。次數(shù)分布①次數(shù)分布法是指統(tǒng)計(jì)變項(xiàng)內(nèi)每一個(gè)值的原資料出現(xiàn)多少次。②次數(shù)分布可以把原資料作初步的簡(jiǎn)化,但不能用來(lái)比較不同的樣本。如要比較,可以計(jì)算比例或比率。比例比例是指將每類的次數(shù)(/)除以總數(shù)(.V)。比例是使兩個(gè)樣本的總數(shù)變成同一個(gè)基數(shù),即都是以1為基數(shù),就可以進(jìn)行比較。公式:比率①比率是把計(jì)算比例時(shí)所用的基數(shù)變大,使之容易領(lǐng)會(huì)。比率的公式是:..—Z.X100一ZxlOOO_,qZ-X10000a.百分率:.Vb.千分率:.V C.萬(wàn)分率:.V②社會(huì)學(xué)研究最常用的是百分率(%)。一般來(lái)說(shuō),要求精確程度愈高或樣本愈大,可以保留的小數(shù)愈多。社會(huì)學(xué)研究通常是保留小數(shù)點(diǎn)以后的一位或兩位數(shù)字。③對(duì)數(shù)值中的小數(shù)作取舍,通俗的做法是“四舍五入”。近代統(tǒng)計(jì)學(xué)有一項(xiàng)新原則,就是“前單五人”,即“五”前面是單數(shù)就進(jìn)位,若是雙數(shù)就舍掉(0也算雙數(shù))。④如果百分率的數(shù)值也太小,可以用千分率、萬(wàn)分率等。如犯罪研究的統(tǒng)計(jì),通常是用十萬(wàn)為基數(shù);人口學(xué)的研究則較常用千分率。1r分析定類層次資料時(shí),也可以計(jì)算兩數(shù)值的對(duì)比值。A數(shù)值與B數(shù)值的對(duì)比值,即A除以B。圖示法圖示法是以圖形來(lái)簡(jiǎn)化資料。在社會(huì)學(xué)研究中比較多用的有長(zhǎng)條圖和圓瓣圖。①長(zhǎng)條圖是以長(zhǎng)方形的長(zhǎng)度(寬度相同)來(lái)表示次數(shù)或百分率的多少;②圓瓣圖是把一個(gè)圓形平面按數(shù)值的比例分割。2.定序?qū)哟卫奂哟螖?shù)和累加百分率適用于定序?qū)哟味豢捎糜诙悓哟巍#?)累加次數(shù)(簡(jiǎn)寫cf)累加次數(shù)是把次數(shù)逐級(jí)相加起來(lái)。分為向上累加和向下累加兩種。它們的作用是使研究者容易知道某值以下或以上之次數(shù)總和。(2)累加百分率(簡(jiǎn)寫c%)累加百分率是將各級(jí)的百分率數(shù)值逐級(jí)相加。3.定距層次累加次數(shù)或累加百分率的方法,即可以分析定序資料,也可以用于分析定距資料。(1)次數(shù)的計(jì)算一般是先將各值分成若干組,然后計(jì)算每組的次數(shù)。分組時(shí),要留意每組的界限、寬度和斷點(diǎn)。①組限,即每組的范圍,包括上限和下限。②每個(gè)組的寬度,簡(jiǎn)稱組距,即組的真實(shí)上限與真實(shí)下限之差。組中點(diǎn)即真實(shí)上限與真實(shí)下限的平均數(shù)。(2)圖示法較常用于社會(huì)學(xué)研究的有矩形圖和多角線圖。①矩形圖以一個(gè)矩形的面積(長(zhǎng)X寬)表示每組數(shù)值之次數(shù)或百分率的多少。繪制矩形圖時(shí),通常是以一個(gè)坐標(biāo)的橫軸的寬度表示組距,以縱軸的長(zhǎng)度表示次數(shù)或百分率,二者的乘積就是該組之次數(shù)或百分率。矩形圖與長(zhǎng)條圖的區(qū)別包括:a.長(zhǎng)條圖只講長(zhǎng)度,寬度則固定;矩形圖則是計(jì)算面積,長(zhǎng)度與寬度均有意義。b.長(zhǎng)條圖可以分開;而矩形圖由于數(shù)值有連續(xù)性,各個(gè)矩形要相連排列,不可以分開。②多角線圖多角線圖是把各個(gè)矩形頂端的中點(diǎn)用直線連結(jié)起來(lái)。其作用是使各組的次數(shù)(或百分率)的分布情況更顯而易見。(3)一些曲線的概念整理定距資料時(shí),可將資料分組,然后用多角線顯示分布情況。但各組距的大小,會(huì)影響線條的平滑程度。一般是組距愈小,線條就愈平滑。社會(huì)學(xué)研究常用平滑曲線來(lái)表示定距變項(xiàng)的資料分布,如下列一些曲線:①J形曲線下降時(shí)先急后緩或上升時(shí)先緩后急,如圖2-1所示。圖2-1J型曲線②U形曲線先降后升或先升后降,如圖2-2所示。ff圖2-2U型曲線如圖2-3所示。③峰狀曲線如圖2-3所示。③峰狀曲線圖2-3峰狀曲線④對(duì)稱與不對(duì)稱曲線如果把曲線從中央分割,兩邊的資料分布完全相同,且圖形對(duì)稱就是對(duì)稱曲線,否則就稱為不對(duì)稱曲線。不對(duì)稱曲線顯示資料作偏態(tài)分布,分為正向(即向右)偏態(tài)和負(fù)向(即向圖2-4對(duì)稱與不對(duì)稱曲線二、集中趨勢(shì)測(cè)量法集中趨勢(shì)測(cè)量法是指找出一個(gè)數(shù)值來(lái)代表變項(xiàng)的資料分布,以反映資料的集結(jié)情況。.定類變項(xiàng):眾值眾值(簡(jiǎn)寫"。)即次數(shù)最多之值。因?yàn)楸娭底钣写硇?,因此具有估?jì)或預(yù)測(cè)的意義,長(zhǎng)遠(yuǎn)來(lái)說(shuō),以眾值作預(yù)測(cè)所犯的錯(cuò)誤總數(shù)是最小的。眾值適合于分析定類變項(xiàng),當(dāng)然也可用來(lái)分析定序或定距變項(xiàng)的資料。.定序變項(xiàng):中位值中位值(簡(jiǎn)寫以,)為一個(gè)序列的中央位置之值,即高于此值的有50%的研究個(gè)案,低于此值的也有50%o計(jì)算中位值有用原資料和用分組資料計(jì)算兩種情況。(1)根據(jù)原資料求出中位值計(jì)算方法是將各個(gè)個(gè)案由低至高排列起來(lái),居序列中央位置的個(gè)案的值就是中位值。其公式為:M位置=亍,其中”是個(gè)案數(shù)目。如果”是偶數(shù)時(shí),通常的做法,是將位于最中央的兩個(gè)數(shù)值的平均值作為中位值。(2)用分組資料來(lái)求出中位值首先將分組資料中各組的次數(shù)(,)向上累加起來(lái)(//、
寧日
M=z+--:—h-T),再求出中位值的位置。公式如下:其中,工=中位值組之真實(shí)下限;/=中位值組之次數(shù);“=中位值組之組距;可=低于中位值組真實(shí)下限之累加次數(shù);”全部個(gè)案數(shù)目。中位值具有估計(jì)或預(yù)測(cè)的意義。長(zhǎng)遠(yuǎn)來(lái)說(shuō),以中位值去估計(jì)定序變項(xiàng)的數(shù)值,所犯的錯(cuò)誤總數(shù)是最小的。.定距變項(xiàng):均值定距資料可以作加減運(yùn)算,故可以將變項(xiàng)的各個(gè)數(shù)值相加起來(lái),求取一個(gè)平均的數(shù)值,即均值(簡(jiǎn)寫了)。計(jì)算的方法,也分為兩種情況,即用原資料和用分組資料。(1)根據(jù)原資料求出均值Yx公式:~其中,E'表示各個(gè)個(gè)案數(shù)值之和,”表示全部個(gè)案數(shù)目。均值表明了資料的集中趨勢(shì),可作估計(jì)或預(yù)測(cè)之用。長(zhǎng)遠(yuǎn)來(lái)說(shuō),以均值估計(jì)定距變項(xiàng)的資料,錯(cuò)誤最小。如果某個(gè)變項(xiàng)值重復(fù)出現(xiàn)許多次,可以先統(tǒng)計(jì)每個(gè)值(X)之次數(shù)(/),再求取次數(shù)與相應(yīng)變項(xiàng)值之間的乘積(戶),然后利用各個(gè)乘積之總和求出均值。(2)根據(jù)分組資料求出均值_工一?公式:”其中,/表示每組的次數(shù),X.表示組中點(diǎn),'表示個(gè)案數(shù)目??偟膩?lái)說(shuō),如要測(cè)量集中趨勢(shì),即找出一個(gè)最有代表性之值,定類變項(xiàng)的資料可用眾值(乂。);定序變項(xiàng)可用眾值(M。),但以中位值(乂,)較適宜。定距變項(xiàng)可用眾值(乂。),也可用中位值(?",),但以均值(了)最適宜。然而,有兩種情況下不宜用均值:①在分組資料中的極端組沒(méi)有組限時(shí),不能求出均值,只能用中位值;②在變項(xiàng)中有個(gè)別的數(shù)值非常特殊(過(guò)高或過(guò)低),則均值的代表性就有疑問(wèn),用中位值較為適合。三、離散趨勢(shì)測(cè)量法離散趨勢(shì)測(cè)量法,是要求出一個(gè)值來(lái)表示個(gè)案與個(gè)案之間的差異情況。.定類變項(xiàng):離異比率或質(zhì)異指數(shù)(1)離異比率離異比率(簡(jiǎn)寫V)是指非眾值的次數(shù)與全部個(gè)案數(shù)目的比率。公式如下:其中“是全部個(gè)案數(shù)目,加。是眾值的次數(shù),二者之差(n一九)就是非眾值的次數(shù)。V愈大,就表示眾值的代表性愈小,以之作估計(jì)或預(yù)測(cè)時(shí)所犯的錯(cuò)誤也就愈大。(2)質(zhì)異指數(shù)由于離異比率的方法過(guò)于粗略,另一個(gè)較為精確和常用的方法是質(zhì)異指數(shù)(簡(jiǎn)寫IQV),其作用是求出各個(gè)類別之間在理論上最多的可能差異中(以M代表)實(shí)際上出現(xiàn)了多少差異(以A代表)。公式如下:命-"jZOF--.J'n4(k-l)其中,〃=全部個(gè)案數(shù)目,k=變項(xiàng)的類別數(shù)目,/=每個(gè)類別的實(shí)際次數(shù).定序變項(xiàng):四分位差四分位差的計(jì)算方法,是將個(gè)案由低至高排列,然后分為四個(gè)等分(即每個(gè)等分包括25%的個(gè)案),則第一個(gè)四分位置的值(2)與第三個(gè)四分位置的值(2)的差異,即四分位差(簡(jiǎn)寫。),公式為:Q=Q「Q\計(jì)算四分位差時(shí),先要求出。的位置和2的位置,然后計(jì)算在這兩個(gè)位置上的值的差異。實(shí)際做法,分為原資料與分組資料兩種情況。(1)根據(jù)原資料求出9與Q的位置公式為:W+19位置=丁3(?+1)△位置=1~其中“是全部個(gè)案數(shù)目。(2)根據(jù)分組資料來(lái)計(jì)算四分位差步驟①計(jì)算向上累加次數(shù)。②求出白和烏的位置,公式如下:9位置=]3n口位置=丁其中”是全部個(gè)案數(shù)目。③參考累加次數(shù)分布,決定烏和。的位置應(yīng)屬于哪一組。④從所屬的組中,計(jì)算a位置和a位置的數(shù)值。公式如下:其中屬組之真實(shí)下限;4=0屬組之真實(shí)下限;工=9屬組之次數(shù);工=烏屬組之次數(shù);%=低于a屬組下限之累加次數(shù);%=低于2屬組下限之累加次數(shù);丐屬組之組距;%=烏屬組之組距;”全部個(gè)案數(shù)目。3.定距變項(xiàng):標(biāo)準(zhǔn)差全距即最大數(shù)值與最小數(shù)值之差,精確性甚有疑問(wèn)。分析定距變項(xiàng)的離散情況,最常用的方法是標(biāo)準(zhǔn)差(簡(jiǎn)寫S),即將各數(shù)值(X)與其均值(工)之差的平方和除以全部個(gè)案數(shù)目(〃),然后取其平方根。公式如下:公式中X與jf的相差,即表示以均值作為代表值時(shí)會(huì)引起的偏差或錯(cuò)誤。如果各個(gè)實(shí)際數(shù)值與均值之相差的總和很大,就表示變項(xiàng)數(shù)值的離勢(shì)度很大,即均值的代表性很小。公式以〃為分母,是要求出各個(gè)個(gè)案的數(shù)值與均值之間的差異"平均''有多少,反映均值的代表性。計(jì)算標(biāo)準(zhǔn)差,可以根據(jù)原資料,也可以根據(jù)分組資料。(1)原資料公式:V?標(biāo)準(zhǔn)差的數(shù)值在相互比較時(shí)更能突出其意義。標(biāo)準(zhǔn)差也有另一種意義,即表示用均值作估計(jì)或預(yù)測(cè)變項(xiàng)值時(shí)所犯錯(cuò)誤的大小。同理,可以計(jì)算次數(shù)資料的標(biāo)準(zhǔn)差。(2)分組資料公式:,=感亙尸其中。是每組的組中點(diǎn),/是該組的次數(shù)。表示定距資料的離散程度,另一種常用的方法是方差。方差(簡(jiǎn)寫S:)即標(biāo)準(zhǔn)差的平方值,其意義與標(biāo)準(zhǔn)差相同??傮w來(lái)說(shuō),質(zhì)異指數(shù)(或離異比率)最適合于分析定類變項(xiàng),也可用于分析定序或定距變項(xiàng)。四分位差(或十分位差)最適合用來(lái)分析定序變項(xiàng),也可分析定距變項(xiàng)。標(biāo)準(zhǔn)差(或方差)則只能用于分析定距變項(xiàng)。這些離勢(shì)測(cè)量法與集中趨勢(shì)測(cè)量法作用互補(bǔ)。測(cè)量方法與測(cè)量層次的關(guān)系可以綜合如表2-1所示:表2-1測(cè)量方法與測(cè)量層次的關(guān)系定類變項(xiàng)定序變項(xiàng)定距.變項(xiàng)集中趨勢(shì)余值中位值均值離散趨勢(shì)質(zhì)異指數(shù)四分位差新準(zhǔn)姜四、正態(tài)分布與標(biāo)準(zhǔn)值正態(tài)曲線及正態(tài)分布定距資料可用一條平滑的曲線表示,如正態(tài)曲線。此曲線呈鐘形,如圖2-5所示:圖2-5正態(tài)曲線(1)正態(tài)分布的公式其中x=變項(xiàng)的數(shù)值;/⑴=該變項(xiàng)值的次數(shù);$=標(biāo)準(zhǔn)差;爪=3.1416;3=2.7183;『=均值。(2)正態(tài)分布的特點(diǎn)①正態(tài)分布的眾值、中位值和均值相同。②正態(tài)分布的x值與均值三差異愈大,其次數(shù)會(huì)愈少,但不會(huì)等于零。③在正態(tài)曲線下每一部分的面積(即次數(shù)總和)都可以計(jì)算出來(lái)。2.標(biāo)準(zhǔn)正態(tài)分布將正態(tài)分布的數(shù)值改用標(biāo)準(zhǔn)差為單位,可以將不同形態(tài)的正態(tài)分布?xì)w納為一種分布。這個(gè)以標(biāo)準(zhǔn)差為單位的正態(tài)分布,一般稱為標(biāo)準(zhǔn)正態(tài)分布,其每個(gè)變項(xiàng)值(x)變?yōu)椋?/p>
x-x上式的z稱為“標(biāo)準(zhǔn)值”,代表每個(gè)X值在標(biāo)準(zhǔn)正態(tài)分布上的數(shù)值。標(biāo)準(zhǔn)正態(tài)分布的均值是0,標(biāo)準(zhǔn)差是1。例如,Z=2.4,就表示該值與均值(等于0)的距離是2.4個(gè)標(biāo)準(zhǔn)差。每個(gè)標(biāo)準(zhǔn)值所表示的面積,可用下圖的斜線部分來(lái)表示,如圖2-6所示。由于正態(tài)分布是對(duì)稱的,因此標(biāo)準(zhǔn)值其實(shí)是絕對(duì)值,只要是數(shù)值相同,則無(wú)論是正值或負(fù)值,所表示的面積大小都相同。標(biāo)準(zhǔn)值是正數(shù)時(shí),所表示的面積是在均值右邊;Z>|Z>|1.65|,Z>|1.96|,Z>|2.33|,Z>|2.40|,Z>|2.58|,Z>|3.09|,Z>|3.30|,標(biāo)準(zhǔn)值是負(fù)數(shù),則在左邊。圖2-6標(biāo)準(zhǔn)正態(tài)分布既然可以知道每個(gè)標(biāo)準(zhǔn)值所表示的面積,那么也可以求得任何兩個(gè)標(biāo)準(zhǔn)值之間所包括的面積,或是超越這個(gè)標(biāo)準(zhǔn)值的面積。因此可以算得如下的數(shù)值(在社會(huì)學(xué)研究中常用):比例是0.05;比例是0.025;比例是0.01;比例是0.0082;比例是0.005:比例是0.001;比例是0.0005。
第三章簡(jiǎn)化兩個(gè)變項(xiàng)之分布
「統(tǒng)計(jì)相關(guān)的概念簡(jiǎn)化兩個(gè)變項(xiàng)之分布(統(tǒng)計(jì)相關(guān)的性質(zhì)?相關(guān)程度與相關(guān)方向
I相關(guān)程度與方向的測(cè)量簡(jiǎn)化兩個(gè)變項(xiàng)之分布「列聯(lián)表及其相關(guān)概念1交互分類與百分表\列聯(lián)表的計(jì)算I條件百分表及其制定準(zhǔn)則
r相關(guān)測(cè)量法
I筒化相關(guān)與消減誤差t消減誤差比例【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、統(tǒng)計(jì)相關(guān)的性質(zhì)統(tǒng)計(jì)相關(guān)的概念相關(guān),是指一個(gè)變項(xiàng)的值與另一個(gè)變項(xiàng)的值有連帶性。即如果一個(gè)變項(xiàng)的值發(fā)生變化,另一個(gè)變項(xiàng)的值也有變化,則兩個(gè)變項(xiàng)就是相關(guān)了。.相關(guān)程度與相關(guān)方向(1)變項(xiàng)與變項(xiàng)之間的相關(guān)程度,可用統(tǒng)計(jì)法予以測(cè)量。大多數(shù)的統(tǒng)計(jì)法是以0代表無(wú)相關(guān),以1代表全相關(guān)。介于0與1之間的數(shù)值如果愈大,就表示相關(guān)的程度愈強(qiáng)。(2)相關(guān)方向,也可用統(tǒng)計(jì)方法予以測(cè)量。變項(xiàng)與變項(xiàng)之間的關(guān)系,可以分為正與負(fù)兩個(gè)方向,即正相關(guān)(又稱正比)與負(fù)相關(guān)(又稱反比)。正相關(guān)是指一個(gè)變項(xiàng)的值增加時(shí),另一變項(xiàng)的值也增加。負(fù)相關(guān)是指一個(gè)變項(xiàng)的值增加時(shí),另一變項(xiàng)的值卻減少。相關(guān)方向的分析只限于定序或定距變項(xiàng)。.相關(guān)程度與方向的測(cè)量尤拉Q系數(shù),特別適合于分析兩個(gè)二分變項(xiàng)的關(guān)系。表3-1變量示例1 a c2b~~dT?ad^bc如表3-1所示,X與丫都是二分變項(xiàng),可計(jì)算Q系數(shù)如下:Q值是0則表示兩個(gè)變項(xiàng)沒(méi)有關(guān)系,愈大則表示關(guān)系愈強(qiáng),但不會(huì)大于1。Q值可以是正數(shù)或負(fù)數(shù),前者表示正相關(guān),后者表示負(fù)相關(guān)。此外,分析兩個(gè)變項(xiàng)的關(guān)系時(shí),還需注意兩個(gè)變項(xiàng)是否有因果關(guān)系。許多社會(huì)學(xué)研究在成立假設(shè)時(shí),會(huì)假定某變項(xiàng)是因,稱為自變項(xiàng);另一變項(xiàng)是果,后者稱為依變項(xiàng)。自變項(xiàng)(X)與依變項(xiàng)(Y)的關(guān)系,可表示為:X-Y。相關(guān)的兩個(gè)變項(xiàng),不一定有因果之分,可能是共同變化。不對(duì)稱關(guān)系是指X影響Y,而丫不會(huì)影響X;對(duì)稱關(guān)系是指不確定或不區(qū)分影響的方向。二、交互分類與百分表列聯(lián)表及其相關(guān)概念交互分類,是指同時(shí)依據(jù)兩個(gè)變項(xiàng)的值,將所研究的個(gè)案分類。綜合了兩個(gè)變項(xiàng)的共同分布的統(tǒng)計(jì)表,通常稱為列聯(lián)表,又稱條件次數(shù)表。在表的最下端是對(duì)應(yīng)變項(xiàng)各級(jí)水平的總次數(shù),稱為邊緣次數(shù),它們的分布情況稱為邊緣分布。表中的其他次數(shù),稱為條件次數(shù),表示在自變項(xiàng)的每個(gè)值(條件)的情況下依變項(xiàng)的各個(gè)值的個(gè)案數(shù)目(次數(shù))。.列聯(lián)表的計(jì)算列聯(lián)表有大小之分。計(jì)算的方法,通常是將依變項(xiàng)值的數(shù)目乘上自變項(xiàng)值的數(shù)目。如果將依變項(xiàng)放于表的旁邊,將自變項(xiàng)放于表的上端,則表的大小=rxc(r為橫行數(shù)目,c為縱列數(shù)目)。先后次序表示前者(依變項(xiàng))受后者(自變項(xiàng))的影響。rxc表與cxr表是不同的o因?yàn)榍昂髢蓚€(gè)數(shù)值代表不同的變項(xiàng),包含不同類別數(shù)。.條件百分表及其制定準(zhǔn)則為求相互比較從而知道兩個(gè)變項(xiàng)間的關(guān)系,需將各個(gè)基數(shù)標(biāo)準(zhǔn)化。最常用的標(biāo)準(zhǔn)化方法,是將所有基數(shù)都變成100,各個(gè)條件次數(shù)變?yōu)榘俜致?。這樣制成的表,稱為條件百分表。制定條件百分表的依據(jù)準(zhǔn)則:(1)每個(gè)表的頂端要有表號(hào)和標(biāo)題。(2)繪表時(shí)所用的線條,要盡可能簡(jiǎn)潔。(3)在表上層的自變項(xiàng)每個(gè)值下的%號(hào),表示下列的數(shù)值都是百分率。(4)表下層括弧內(nèi)的數(shù)值,表示在計(jì)算百分率時(shí)所根據(jù)的個(gè)案總數(shù)。在研究報(bào)告中,如果有條件百分表,便不需要有條件次數(shù)表。(5)表內(nèi)百分率數(shù)值的小數(shù)位要保留多少,視乎研究的需要,但最好是有一致性。在繪制條件百分表時(shí),通常是根據(jù)自變項(xiàng)的方向來(lái)計(jì)算百分率;但如果依變項(xiàng)在樣本內(nèi)的分布不能代表其在總體內(nèi)的分布,則百分率的計(jì)算要根據(jù)依變項(xiàng)的方向。三、簡(jiǎn)化相關(guān)與消減誤差相關(guān)測(cè)量法相關(guān)測(cè)量法,是指以一個(gè)統(tǒng)計(jì)值表示變項(xiàng)與變項(xiàng)之間的關(guān)系。這個(gè)值,通常稱為相關(guān)系數(shù)。選擇相關(guān)測(cè)量法時(shí),應(yīng)注意以下三點(diǎn):(1)變項(xiàng)的測(cè)量層次:定類、定序和定距。(2)兩個(gè)變項(xiàng)間之關(guān)系是否對(duì)稱。(3)統(tǒng)計(jì)值的意義:最好選用統(tǒng)計(jì)值有意義的相關(guān)測(cè)量法,如PRE測(cè)量法,其統(tǒng)計(jì)值具有消減誤差比例的意義,因此常用于社會(huì)學(xué)研究中。2.消減誤差比例現(xiàn)假定X的值未知,預(yù)測(cè)丫值時(shí)所產(chǎn)生的全部誤差是身;若X的值已知,則可根據(jù)X的每個(gè)值來(lái)預(yù)測(cè)丫值,假定誤差的總數(shù)是J則以X值來(lái)預(yù)測(cè)丫值時(shí)所減少的誤差為:鳥一層。這個(gè)數(shù)值(瑪一44)與原來(lái)的全部誤差(耳)相比,即為消減誤差比例。公式如下:PRE的數(shù)值愈大,表示以X值預(yù)測(cè)丫值時(shí)能夠減少的誤差所占的比例愈大,即X與丫的關(guān)系愈強(qiáng)。PRE的數(shù)值在。與1之間,如果冬=0,則PRE=1,反映X與丫是全相關(guān);如果瑪=瑪,則PRE=O,反映X與丫是無(wú)相關(guān)。第四章相關(guān)測(cè)量法與測(cè)量層次rLambda相關(guān)測(cè)量法C\系數(shù),兩個(gè)定類變項(xiàng):Lambda,Tau-y? &一系數(shù)、Tau-y相關(guān)測(cè)量法zGamma相關(guān)測(cè)量法相關(guān)測(cè)量法與測(cè)量層次兩個(gè)定序變項(xiàng):Gainna.d.ci,相關(guān)沌量法相關(guān)測(cè)量法與測(cè)量層次Gamma或《系數(shù)值在次數(shù)表中的求辭
(tau系數(shù)和rho系數(shù)
「簡(jiǎn)單線性回歸分析兩個(gè)定距變項(xiàng):演單線性七積矩相關(guān)測(cè)量法定類變項(xiàng)與定距變項(xiàng):相關(guān)比率與非線性相關(guān)定類變項(xiàng)與定序變項(xiàng):Lambda,Tau-y系數(shù)定序變項(xiàng)與定距變項(xiàng):相關(guān)比率I綜合【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、兩個(gè)定類變項(xiàng):Lambda,Tau-y如果兩個(gè)變項(xiàng)都屬于定類測(cè)量層次,可用Lambda相關(guān)測(cè)量法,也可用古德曼和古魯斯卡的Tau-y相關(guān)測(cè)量法。其統(tǒng)計(jì)值都具有PRE意義。Lambda相關(guān)測(cè)量法(1)Lambda相關(guān)測(cè)量法的含義Lambda相關(guān)測(cè)量法,又稱格特曼的可預(yù)測(cè)度系數(shù),其基本邏輯是計(jì)算以一個(gè)定類變項(xiàng)的值來(lái)預(yù)測(cè)另一個(gè)定類變項(xiàng)的值時(shí),如果以眾值作為預(yù)測(cè)的準(zhǔn)則,可以減除多少誤差。消減的誤差在全部誤差中所占的比例愈大,就表示這兩個(gè)變項(xiàng)的相關(guān)愈強(qiáng)。)Lambda相關(guān)測(cè)量法的兩種形式①對(duì)稱形式,簡(jiǎn)寫入系數(shù),其特點(diǎn)是假定兩個(gè)變項(xiàng)間的關(guān)系是對(duì)稱的,即不分自變項(xiàng)或依變項(xiàng)。②不對(duì)稱形式,簡(jiǎn)寫々系數(shù),即要求一個(gè)是自變項(xiàng)(X)而另一個(gè)是依變項(xiàng)(Y)。公式如下:(對(duì)稱) 2AM+MJ(不對(duì)稱)’T其中,以,=丫變項(xiàng)的眾值次數(shù),m.=x變項(xiàng)的眾值次數(shù),w,=x變項(xiàng)的每個(gè)值(類別)之下丫變項(xiàng)的眾值次數(shù),也=丫變項(xiàng)的每個(gè)值(類別)之下X變項(xiàng)的眾值次數(shù),n=全部個(gè)案數(shù)目。入系數(shù)與4系數(shù)的統(tǒng)計(jì)值均介于o與1之間,且都具有消減誤差比例的意義。)Lambda相關(guān)測(cè)量法的特點(diǎn)Lambda相關(guān)測(cè)量法的特點(diǎn)是以眾值作為預(yù)測(cè)的準(zhǔn)則,因此,如果全部眾值集中在條件次數(shù)表的同一列或同一行中,則Lambda系數(shù)便會(huì)等于0。2.Tau-y相關(guān)測(cè)量法Tau-y系數(shù)屬于不對(duì)稱相關(guān)測(cè)量法,要求兩個(gè)定類變項(xiàng)中有一個(gè)是自變項(xiàng)(X),另一個(gè)是依變項(xiàng)(Y)。其系數(shù)值介于0與1之間,具有消減誤差比例的意義。公式如下:£ )4其中?「乙——,即不知X而預(yù)測(cè)丫時(shí)的全部誤差;F.,即知道X預(yù)測(cè)丫時(shí)所犯的錯(cuò)誤;”=全部個(gè)案數(shù)目;/=某條件次數(shù);尸,7變項(xiàng)的某個(gè)邊緣次數(shù);月=工變項(xiàng)的某個(gè)邊緣次數(shù)。由于Tau-y測(cè)量法是考慮全部的次數(shù),故其敏感度高于Lambda測(cè)量法。二、兩個(gè)定序變項(xiàng):Gamma,<如要以一個(gè)統(tǒng)計(jì)值來(lái)簡(jiǎn)化一個(gè)定序變項(xiàng)與另一個(gè)定序變項(xiàng)的關(guān)系,可應(yīng)用古德曼和古魯斯卡的Gamma系數(shù),適用于分析對(duì)稱的關(guān)系;也可應(yīng)用薩默斯的4系數(shù),適用于不對(duì)稱的關(guān)系。兩者的系數(shù)值都是由-1至+1,既表示相關(guān)的程度,也表示相關(guān)的方向,而且都有消減誤差比例的意義。由于Gamma系數(shù)與4系數(shù)的目標(biāo)都是分析兩列等級(jí)的關(guān)系,故可統(tǒng)稱為級(jí)序相關(guān)法。級(jí)序相關(guān)法是以每對(duì)個(gè)案之間的相對(duì)等級(jí)作為預(yù)測(cè)的準(zhǔn)則。假如樣本的全部個(gè)案數(shù)目是“,則會(huì)組成5獻(xiàn)“一"對(duì)個(gè)案。同序?qū)κ侵改硨?duì)個(gè)案在兩個(gè)變項(xiàng)上的相對(duì)等級(jí)是相同的;異序?qū)κ侵改硨?duì)個(gè)案在兩個(gè)變項(xiàng)上的相對(duì)等級(jí)是不同的。通常以N代表同序?qū)倲?shù),以區(qū)代表異序?qū)倲?shù),Gamma系數(shù)與4系數(shù)就是根據(jù)這兩個(gè)數(shù)值來(lái)計(jì)算兩個(gè)定序變項(xiàng)的相關(guān)程度和相關(guān)方向。Gamma相關(guān)測(cè)量法計(jì)算Gamma系數(shù)(簡(jiǎn)寫G)的公式如下:其中M是同序?qū)?shù),也是異序?qū)?shù)。Gamma系數(shù)值具有消減誤差比例的意義。G是負(fù)值,即表示從樣本中任意取出兩個(gè)個(gè)案時(shí),如果知道他們?cè)谀硞€(gè)變項(xiàng)上的相對(duì)等級(jí),就應(yīng)該估計(jì)他們?cè)诹硪蛔冺?xiàng)上的相對(duì)等級(jí)是相反的,而G的絕對(duì)值愈大,就表示估計(jì)時(shí)所犯的錯(cuò)誤可能性愈小。另外,Q系數(shù)是Gamma系數(shù)的一種特殊方式,倘若兩個(gè)定序變項(xiàng)都是二分的,則、=6。4相關(guān)測(cè)量法—公式:-N+M+芍其中叱是同序?qū)?shù),M是異序?qū)?shù),4是只在依變項(xiàng)(Y)上同分的對(duì)數(shù)。<的系數(shù)值通常小于Gamma系數(shù)值,因?yàn)樵?公式中分母的數(shù)值較大。Gamma或4系數(shù)值在次數(shù)表中的求解在次數(shù)表中計(jì)算Gamma或4系數(shù)值的程序如下:(1)在次數(shù)表中,X的值(i)分為1與2兩個(gè)等級(jí),丫的值(J)也一樣。交互分類后的次數(shù)(人)分布如表4-1所示:表4-12x2表示例□ILY12fll(2)上表中的左上角次數(shù)乘上其右下角的次數(shù),就是同序?qū)?shù)。即:乂=正(左)上表中的右上角次數(shù)乘上其左下角的次數(shù),就是異序?qū)?shù)。即:N-f6上表中同一縱列的次數(shù)的乘積,就是只在X變項(xiàng)上同分的對(duì)數(shù)。即:工=為左)上表中同一橫行的次數(shù)的乘積,就是只在丫變項(xiàng)上同分的對(duì)數(shù)。即:W=65AMM至于在兩個(gè)變項(xiàng)上都是同分的對(duì)數(shù),先要計(jì)算每個(gè)方格內(nèi)的個(gè)案所組成對(duì)數(shù),然后將各方T一工15-1),工:(,:-,(t左(左一。壬2 2 2 2格的對(duì)數(shù)相加起來(lái)。即:(3)根據(jù)公式計(jì)算Gamma或4系數(shù)值。同理,可以從任何的rxc表中求出Gamma或4的系數(shù)值。tau系數(shù)和rho系數(shù)級(jí)序相關(guān)測(cè)量法,除了Gamma系數(shù)與4系數(shù),還有肯德爾的tau系數(shù)和斯皮爾曼的rho系數(shù)。(1)肯德爾的tau系數(shù)的三種形式肯德爾的tau系數(shù)有三種形式,分別稱為tau-a、tau-b和tau-c,都是適宜于分析對(duì)稱的關(guān)系。tau系數(shù)的基本邏輯,是計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部的可能對(duì)數(shù)中所占的比例。公式如下:tau系數(shù)計(jì)算公式區(qū)別tau-a■ v-乂tau-a- 2' ,如果在兩個(gè)變項(xiàng)上都沒(méi)有同分對(duì),則tau-a的統(tǒng)計(jì)值是由-1至+1。tau-bh Nf_如有同分對(duì),可用lau?b,只有在交互分類表行數(shù)與列數(shù)相同(即r=c)的情況下,tau-b系數(shù)值才由-1至+1otau-c2m(N-N八tau-c?——;一i -無(wú)論有無(wú)同分對(duì)和無(wú)論行數(shù)與列數(shù)是多少,tau-c系數(shù)值都是由-1至+1。tau系數(shù)中以tau-c最常適合社會(huì)學(xué)研究,但tau-c沒(méi)有消減誤差比例的含義。其中凡是同序?qū)?shù),M是異序?qū)?shù),”是全部個(gè)案數(shù)目,m是交互分類表的行數(shù)(r)與列數(shù)(c)中的較小者。(2)斯皮爾曼rho系數(shù)斯皮爾曼rho系數(shù)的特點(diǎn)是在計(jì)算每個(gè)個(gè)案在兩個(gè)變項(xiàng)上的等級(jí)時(shí),不僅要區(qū)別二者的高低差異,而且還要計(jì)算二者差異的確切數(shù)值。這個(gè)公式的基本邏輯,是求出在最大可能的=-等級(jí)差異總值中,實(shí)際的等級(jí)差異所占的比例是多少。公式如下:其中D表示每個(gè)個(gè)案在兩列級(jí)序上的差異值,”表示全部個(gè)案數(shù)目。D-可以避免正負(fù)值相抵消。rho是對(duì)稱相關(guān)測(cè)量法。其統(tǒng)計(jì)值是由-1至+1,表示相關(guān)的程度和方向,其平方值可以有消減誤差比例的意義。三、兩個(gè)定距變項(xiàng):簡(jiǎn)單線性如果所研究的變項(xiàng)都是屬于定距測(cè)量層次,可以用簡(jiǎn)單線性回歸分析法來(lái)以自變項(xiàng)的數(shù)值預(yù)測(cè)或估計(jì)依變項(xiàng)的數(shù)值,而用積矩相關(guān)系數(shù)來(lái)測(cè)量?jī)蓚€(gè)變項(xiàng)的相關(guān)程度和方向。.簡(jiǎn)單線性回歸分析(1)簡(jiǎn)單線性回歸分析法是指根據(jù)一個(gè)直線方程式,以一個(gè)自變項(xiàng)(X)的數(shù)值來(lái)預(yù)測(cè)Y'=bX+a一個(gè)依變項(xiàng)(丫)的數(shù)值。方程式為:其中X是自變項(xiàng)數(shù)值;方是回歸系數(shù),表示回歸線的斜率;4是截距,即回歸線與y軸的交點(diǎn);尸是根據(jù)回歸方程式所預(yù)測(cè)的y變項(xiàng)值。(2)回歸法在繪制回歸線時(shí)所根據(jù)的準(zhǔn)則是最小平方,依此推算出回歸直線的位置。其斜率(b)與截距(a)的數(shù)值如下:a=F-留=三 J—n其中x是自變項(xiàng)值,了是自變項(xiàng)的均值,y是依變項(xiàng)值,?是依變項(xiàng)的均值,?是全部個(gè)案數(shù)目。如果知道b與a的數(shù)值,則可以在坐標(biāo)圖上定出直線的位置。把這兩個(gè)數(shù)值代入簡(jiǎn)單線性回歸方程式,便可以用X值預(yù)測(cè)y值。(3)回歸方程式中的回歸系數(shù)。),其值大小表示x對(duì)y的影響有多少;其值符號(hào)表示x對(duì)y的影響方向。用公式表示為:總,即每增加一個(gè)單位的x值時(shí),y值變化的大小。.積矩相關(guān)測(cè)量法要測(cè)量?jī)蓚€(gè)定距變項(xiàng)間的相關(guān)強(qiáng)弱,最好應(yīng)用皮爾遜(Pearson)的積矩相關(guān)系數(shù)(簡(jiǎn)寫’"㈤八球血一):’厘下t歹而產(chǎn)-(?/,),其公式如下:其中X與y分別代表兩個(gè)變項(xiàng)之值,它們的均值分別是了與手。,系數(shù)假定X與y的關(guān)系是對(duì)稱的,且,的統(tǒng)計(jì)值是由-1至+1,同時(shí),的平方值具有消減誤差的意義。八值,稱為決定系數(shù),其具有消減誤差比例的意義。積矩相關(guān)系數(shù)(,)與簡(jiǎn)單線性回歸分析(F=V+a)有密切的關(guān)系:如果,系數(shù)值愈大,就表示線性回歸方程式的預(yù)測(cè)能力愈強(qiáng)。四、定類變項(xiàng)與定距變項(xiàng):相關(guān)比率與非線性相關(guān)相關(guān)比率,又稱eta平方系數(shù)(簡(jiǎn)寫E:),是以一個(gè)定類變項(xiàng)(X)為自變項(xiàng),以一個(gè)定距變項(xiàng)(Y)為依變項(xiàng)。eta系數(shù)值(£:二—一門:-與廣行=E)由0至1,其平方值(無(wú))具有消減誤差比例的意義。公式如下:其中y是依變項(xiàng)的數(shù)值,F(xiàn)是依變項(xiàng)的均值,K是在每個(gè)自變項(xiàng)值(X)上各依變項(xiàng)值的均值;”是全部個(gè)案數(shù)目,國(guó)是每個(gè)自變項(xiàng)值(茍)的個(gè)案數(shù)目。另外,相關(guān)比率系數(shù)還有一個(gè)作用,即分析兩個(gè)定距變項(xiàng)之間的非線性關(guān)系。因此,如果兩個(gè)定距變項(xiàng)之間的關(guān)系是非線性的,則可將其中的一個(gè)變項(xiàng)看做是定類變項(xiàng),然后用e系數(shù)來(lái)測(cè)量相關(guān)情況。五、定類變項(xiàng)與定序變項(xiàng):Lambda,Tau-y系數(shù)最適合分析一個(gè)定類變項(xiàng)與一個(gè)定序變項(xiàng)的關(guān)系的統(tǒng)計(jì)法是威爾科森的區(qū)分系數(shù),又稱theta系數(shù)(簡(jiǎn)寫9)。其基本邏輯是根據(jù)各個(gè)個(gè)案在定類變項(xiàng)上所屬的類別來(lái)估計(jì)他們?cè)诙ㄐ蜃冺?xiàng)上的相對(duì)等級(jí),屬于不對(duì)稱相關(guān)的測(cè)量法。其系數(shù)值由。至1,但沒(méi)有消減誤差比例的意義。由于定序測(cè)量層次具有定類測(cè)量層次的數(shù)學(xué)特質(zhì),大部分社會(huì)學(xué)研究都是采用Lambda或Tau-y系數(shù)來(lái)測(cè)量一個(gè)定類變項(xiàng)與一個(gè)定序變項(xiàng)的關(guān)系,即將定序變項(xiàng)作為定類變項(xiàng)看待。六、定序變項(xiàng)與定距變項(xiàng):相關(guān)比率相關(guān)比率,即將定序變項(xiàng)看做是定類變項(xiàng)。在分析一個(gè)定序變項(xiàng)與一個(gè)定距變項(xiàng)的相關(guān)時(shí),除了可以應(yīng)用相關(guān)比率系數(shù)以外,也有些社會(huì)學(xué)研究會(huì)將定序變項(xiàng)看做是定距變項(xiàng),因此采用積矩相關(guān)系數(shù),甚至進(jìn)行線性回歸分析。同理,如果兩個(gè)變項(xiàng)都是定序變項(xiàng),理應(yīng)用Gamma或4,但也有不少研究是采用,系數(shù)或回歸分析。七、綜合社會(huì)學(xué)研究中進(jìn)行統(tǒng)計(jì)分析的步驟主要包括:(1)簡(jiǎn)化每一個(gè)變項(xiàng)的分布??梢赃\(yùn)用次數(shù)、百分率、集中趨勢(shì)測(cè)量法和離勢(shì)測(cè)量法等統(tǒng)計(jì)技術(shù)。(2)敘述兩個(gè)變量之間的關(guān)系。要把它變成條件百分表,使各類的個(gè)案能夠在相同的基礎(chǔ)上作比較。(3)選擇相關(guān)測(cè)量法。在選擇相關(guān)測(cè)量法時(shí),首要的準(zhǔn)則是變項(xiàng)的測(cè)量層次,次要的考慮是關(guān)系的對(duì)稱與否。當(dāng)前的社會(huì)學(xué)研究,較常采用具有消減誤差比例意義的相關(guān)測(cè)量法,尤其是以下幾種方法:
Lambda系數(shù)統(tǒng)計(jì)值由0至1,適用于分析兩個(gè)定類變項(xiàng)的關(guān)系,也有用來(lái)分析一個(gè)定類變項(xiàng)與一個(gè)定序變項(xiàng)的關(guān)系。這種測(cè)量法有兩種形式:入假定是對(duì)稱關(guān)系;4則假定是不對(duì)稱關(guān)系。Tau-y系數(shù)統(tǒng)計(jì)值的范圍和變項(xiàng)的測(cè)量層次,都與Lambda系數(shù)相同。但這種方法,只適合于分析不對(duì)稱的關(guān)系。在分析兩變項(xiàng)問(wèn)的相關(guān)時(shí),Tan-y的敏感度高于Lambda。Gamma系數(shù)統(tǒng)計(jì)值由-1至+1.表示相關(guān)的程度與方向,最適用于分析兩個(gè)定序變項(xiàng)之間的對(duì)稱關(guān)系。家數(shù)統(tǒng)計(jì)值的范圍和變項(xiàng)的測(cè)量層次,與Gamma系數(shù)相同。不同的是這種方法假定兩變項(xiàng)之間的關(guān)系不對(duì)稱。單性歸析簡(jiǎn)線回分要求兩個(gè)變項(xiàng)都是定距變項(xiàng),而且彼此的關(guān)系是不對(duì)稱的。其作用是以直線回歸方程式(『=S+a)來(lái)運(yùn)算自變項(xiàng)(X)的數(shù)值,從而預(yù)測(cè)或估計(jì)依變項(xiàng)(Y)的數(shù)值。矩關(guān)數(shù)積機(jī)系適合于分析兩個(gè)定距變項(xiàng)的對(duì)稱關(guān)系,統(tǒng)計(jì)值由-1至+1,其平方值(rO有消減誤差比例的意義。除了表示相關(guān)的程度與方向以外,I?系數(shù)值也可表示簡(jiǎn)單線性回歸方程式在預(yù)測(cè)時(shí)的準(zhǔn)確程度。但r系數(shù)是假定兩個(gè)變項(xiàng)之間具有直線關(guān)系,如果兩者的關(guān)系顯然是非直線性,則要用其他方法,如相關(guān)比率(E2)o相關(guān)比率適用于分析一個(gè)定類變項(xiàng)與一個(gè)定距變項(xiàng)的不對(duì)稱關(guān)系,也有用來(lái)分析定序變項(xiàng)與定距變項(xiàng)的關(guān)系。這種方法的統(tǒng)計(jì)值是由。至1,其數(shù)值(日)具有消減誤差的意義。第三篇統(tǒng)計(jì)推論:?jiǎn)巫冺?xiàng)與雙變項(xiàng)第五章抽樣與統(tǒng)計(jì)推論「抽樣的意義(抽樣的意義與問(wèn)題?I抽樣的問(wèn)題r界定總體根據(jù)總體的定義,收集一份全部個(gè)案的名單抽樣的歷程i決定樣本的大小設(shè)計(jì)抽樣的方法,從抽樣根架中選取所需的個(gè)案數(shù)目抽樣與統(tǒng)計(jì)推論i評(píng)估樣本之正誤抽樣與統(tǒng)計(jì)推論?■立意抽樣法(非隨機(jī)抽樣法《偶遇抽樣法〔定額抽樣法陵機(jī)與非港機(jī)抽樣法《 (葡單R8機(jī)抽樣系統(tǒng)隨機(jī)抽樣〔冏機(jī)抽樣法J分層的機(jī)抽樣/定比分層抽樣‘集體抽樣法t異比分層抽憚方法多段抽樣I多期抽樣「二項(xiàng)抽樣分布1機(jī)率與抽樣分布?I均值抽樣分布【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、抽樣的意義與問(wèn)題抽樣的意義(1)社會(huì)學(xué)研究關(guān)心的是總體的情況,不是樣本的情況。(2)節(jié)省在搜集資料和分析資料時(shí)所需的代價(jià),包括人力、物力和時(shí)間。(3)由于樣本的個(gè)案數(shù)目較少,可以集中時(shí)間和人力,作詳細(xì)的調(diào)查和深入的分析2.抽樣的問(wèn)題統(tǒng)計(jì)值是指從樣本中計(jì)算出來(lái)的數(shù)值;參數(shù)值是指在總體中的數(shù)值。抽樣的問(wèn)題是:怎樣運(yùn)用樣本的統(tǒng)計(jì)值來(lái)推測(cè)總體的參數(shù)值。這就要應(yīng)用推論統(tǒng)計(jì)法,又稱歸納統(tǒng)計(jì)法。二、抽樣的歷程代表性樣本是指樣本統(tǒng)計(jì)值近似總體參數(shù)值的樣本。求取有代表性樣本的步驟包括:界定總體;搜集全部名單;決定樣本的大??;選取樣本個(gè)案;在收集資料以后,評(píng)估樣本之正誤。具體如下:.界定總體界定總體是指清楚地說(shuō)明全部研究對(duì)象的范圍,包括時(shí)間、地點(diǎn)和人物。由樣本所得的研究結(jié)果,原則上只能推論到這個(gè)所界定的總體范圍。.根據(jù)總體的定義,收集一份全部個(gè)案的名單抽樣框架是指包含總體的名單。.決定樣本的大小決定樣本的大小時(shí)需要考慮以下內(nèi)容:(1)樣本大小與抽樣誤差、代價(jià)①樣本的大小是與抽樣誤差成反比的,樣本愈大便愈有代表性,但所需的研究代價(jià)(包括人力、資金和時(shí)間)也愈大。在決定樣本的大小時(shí),必須同時(shí)考慮抽樣誤差和研究代價(jià)這兩個(gè)因素,盡可能均衡二者的要求。②考慮總體的情況,如果成分復(fù)雜,相互差異大,則樣本就要加大,才能抽取出各式各樣的個(gè)案。③日后的資料分析計(jì)劃,也會(huì)影響樣本的大小。繁復(fù)和精細(xì)的統(tǒng)計(jì)分析需要較大的樣本。(2)決定樣本大小的準(zhǔn)則決定樣本大小的一般的準(zhǔn)則是:根據(jù)所能付出的研究代價(jià)的最大限度抽取最大的樣本。決定樣本的大小以后,可以計(jì)算抽樣比例: N其中n是樣本的個(gè)案數(shù)目,N是總體的個(gè)案數(shù)目。抽樣比例愈大,則樣本的代表性就愈大。.設(shè)計(jì)抽樣的方法,從抽樣框架申選取所需的個(gè)案數(shù)目假定樣本的個(gè)案數(shù)目是固定的,則不同的抽樣方法所犯的抽樣誤差會(huì)不相同,所需求的研究代價(jià)也不相同。因此,在抽樣時(shí),要小心選擇一種較為適當(dāng)?shù)姆椒ā?評(píng)估樣本之正誤(1)抽樣誤差一項(xiàng)良好的研究,必須盡可能評(píng)估樣本的正誤,如果總體的資料分布與樣本的資料分布基本上一致,則樣本的代表性較好。(2)非抽樣誤差在調(diào)查樣本個(gè)案時(shí),可能發(fā)生非抽樣誤差,如調(diào)查員可能有偏見或犯錯(cuò)誤。最常見的非抽樣誤差是由遺失或無(wú)回應(yīng)的問(wèn)題引發(fā),如有些個(gè)案因健康問(wèn)題不能接受調(diào)查,有些個(gè)案沒(méi)法找到,或有些個(gè)案拒絕合作,這些遺失的個(gè)案可能使樣本有偏差。三、隨機(jī)與非隨機(jī)抽樣法抽樣的方法可以分為隨機(jī)抽樣法與非隨機(jī)抽樣法兩大類。.非隨機(jī)抽樣法(1)非隨機(jī)抽樣的方法非隨機(jī)抽樣不受機(jī)率的限制,主要包括以下三種方法:意樣匚立抽法立意抽樣法又稱判定抽樣法,是依據(jù)研究員的主觀見解和判斷,選取他認(rèn)為是典型的個(gè)案。遇樣偶抽法偶遇抽樣法又稱方便抽樣法,是選取一些偶然遇見的個(gè)案作為樣本。這種抽樣方法很容易進(jìn)行,但樣本的代表性卻有疑問(wèn)。電臺(tái)或報(bào)章記者所做的訪問(wèn),頗多是用偶遇抽樣方法,取其方便易做。定額抽樣法定額抽樣法是根據(jù)某些標(biāo)準(zhǔn)將總體分組,然后用立意或偶遇抽樣法由每組中選取樣本個(gè)案。用定額抽樣法取得的樣本,由于包括了各組的個(gè)案,故其代表性通常高于單純用立意或偶遇抽樣法。(2)非隨機(jī)抽樣的優(yōu)缺點(diǎn)①優(yōu)點(diǎn):簡(jiǎn)便,用較少的代價(jià)便能找到所需的樣本個(gè)案,故常用于探討性或試點(diǎn)性的研究中。②缺點(diǎn):不能用統(tǒng)計(jì)方法來(lái)推測(cè)總體的情況。.隨機(jī)抽樣法隨機(jī)抽樣法,是指根據(jù)已知的機(jī)率來(lái)抽取樣本個(gè)案,可作統(tǒng)計(jì)推論。隨機(jī)抽樣方法主要包括以下幾種:(1)簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣,通常采用不回置方式,即選出的個(gè)案,不用放回總體中再抽取。這種方法最簡(jiǎn)單,最基本。它要求每個(gè)個(gè)案被選取的機(jī)會(huì)是相同的。抽樣比率,即£=!!/?4。社會(huì)學(xué)研究,一般應(yīng)用隨機(jī)數(shù)表來(lái)抽取樣本的個(gè)案。使用隨機(jī)數(shù)表進(jìn)行抽樣的步驟包括:①先將所有的個(gè)案編號(hào)。②從隨機(jī)數(shù)表中任意地選定一個(gè)數(shù)字作為起點(diǎn),順序選出一系列的號(hào)碼,號(hào)碼的多少,視乎樣本的大小。③這組號(hào)碼的相應(yīng)個(gè)案,就構(gòu)成一個(gè)簡(jiǎn)單隨機(jī)樣本。(2)系統(tǒng)隨機(jī)抽樣系統(tǒng)隨機(jī)抽樣的步驟包括:①將全部個(gè)案排列起來(lái)。②按抽樣比例分成間隔,并在第一個(gè)間隔內(nèi)選取第一個(gè)個(gè)案。③每經(jīng)一個(gè)間隔就選取一個(gè)個(gè)案。這樣選出的個(gè)案,就是所需的樣本。在大規(guī)模的研究中,這種抽樣方法較為簡(jiǎn)便快捷。在應(yīng)用系統(tǒng)隨機(jī)抽樣法時(shí),要考察樣本是否具有周期性的特征。較為安全的做法,是經(jīng)過(guò)若干間隔以后,再用隨機(jī)方式抽取個(gè)案,以新的秩序取代原來(lái)的秩序。(3)分層隨機(jī)抽樣分層隨機(jī)抽樣分為采用相同比例抽樣和采用不同比例抽樣兩種。①定比分層抽樣在社會(huì)學(xué)研究中較為常用的是定比分層隨機(jī)抽樣法。定比分層隨機(jī)抽樣法是指在各組中按同樣的比例抽取樣本個(gè)案。具體步驟包括:首先將總體按某些標(biāo)準(zhǔn)分組,然后在每組中按照相同的比例用簡(jiǎn)單隨機(jī)或系統(tǒng)隨機(jī)抽樣法選取個(gè)案。②異比分層抽樣方法異比分層隨機(jī)抽樣是指在不同的組中用不同的比例來(lái)抽樣。有兩種情況適宜采用異比分層隨機(jī)抽樣:a.某些組的個(gè)案數(shù)量特別少,按相同比例抽取的樣本個(gè)案數(shù)量就會(huì)很少,以致影響統(tǒng)計(jì)分析的準(zhǔn)確性。b.某組個(gè)案的內(nèi)部差異頗大,便要擴(kuò)大抽樣比例,以求選出不同意見者。采用異比分層隨機(jī)抽樣方法,在統(tǒng)計(jì)分析時(shí)頗為麻煩。由于各組的抽樣比例不同,用樣本資料來(lái)統(tǒng)計(jì)數(shù)值時(shí)就必須加以修正。(4)集體抽樣法集體隨機(jī)抽樣法是指隨機(jī)地抽取若干集體,然后以它們所包括的全部個(gè)案作為研究的樣本o選取集體時(shí),可用簡(jiǎn)單隨機(jī)抽樣法,也可以將集體分組以后才隨機(jī)抽取,后者所犯的抽樣誤差比較小。各個(gè)集體所包括的個(gè)案數(shù)量可以相同,也可以不相同。集體抽樣的優(yōu)點(diǎn)是代價(jià)比較少,特別適用于大規(guī)模的抽樣調(diào)查;缺點(diǎn)是所犯的抽樣誤差會(huì)比較大,樣本的代表性通常比不上用簡(jiǎn)單或分層隨機(jī)抽樣法。在采用集體抽樣法之前,最好先了解各個(gè)個(gè)案在集體內(nèi)和在集體間的差異情況。(5)多段抽樣
多段抽樣法是指先抽取若干集體,然后從所選取的集體中再抽取若干較小的單位。在每個(gè)階段抽樣時(shí),可以用簡(jiǎn)單隨機(jī)抽樣法,也可以較為精密地采用分層隨機(jī)抽樣法。在大規(guī)模的抽樣調(diào)查中,尤其是地域分布廣泛,采用多段抽樣可以節(jié)省很多研究代價(jià),包括人力、資金和時(shí)間。但每一個(gè)階段的抽樣都會(huì)有誤差,經(jīng)過(guò)多個(gè)階段才抽出來(lái)的樣本,誤差就會(huì)頗大。(6)多期抽樣多期抽樣是指從樣本中抽取分樣本,分期收集和累積資料的方法。一般來(lái)說(shuō),較為重要的資料,應(yīng)在前期較大和較有代表性的樣本中收集。這種抽樣方法,一方面可以搜集大量資料,另一方面可以減少對(duì)頗多被研究者的滋擾。當(dāng)然,愈后期的樣本個(gè)案受滋擾愈大,抽樣誤差也愈大。四、機(jī)率與抽樣分布以樣本的數(shù)值來(lái)推算總體的情況,只能作“或然”的說(shuō)法,不能說(shuō)是“必然”如此。統(tǒng)計(jì)推論是“機(jī)率”論為基礎(chǔ)的。抽樣分布是指根據(jù)機(jī)率的原則而成立的理論性分布,顯示由同一總體中反復(fù)不斷抽取不同樣本時(shí),各個(gè)可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布情況。.二項(xiàng)抽樣分布(1)二項(xiàng)分布的計(jì)算公式二項(xiàng),是指所研究的變項(xiàng)只有兩個(gè)值。假定在總體內(nèi)這兩個(gè)值的個(gè)案數(shù)目是相同的,即各占半數(shù)的個(gè)案,同時(shí)假定抽樣是隨機(jī)的,則從總體中一次一次地抽取個(gè)案時(shí),每一次的成功機(jī)會(huì)(P)應(yīng)是1/2,失敗機(jī)會(huì)(Q)也是1/2。r!(n-r)?尸‘?!?r!(n-r)?尸‘?!?當(dāng)從n個(gè)個(gè)案中獲得r次成功的計(jì)算公式為:其中n是樣本大小,r是成功的數(shù)目,P是每次的成功機(jī)會(huì),Q是每次的失敗機(jī)會(huì),p(r)是獲得r次成功個(gè)案的機(jī)率。其實(shí),只要是P+Q=l,P與Q可以是任何數(shù)值。把這P、Q代入前述的數(shù)學(xué)公式中,就可計(jì)算得在不同樣本大小的情況下的二項(xiàng)抽樣分布。當(dāng)然,由于PRQ,抽樣分布是不對(duì)稱的。(2)二項(xiàng)抽樣分布的特質(zhì)①當(dāng)P=Q=1/2的二項(xiàng)抽樣分布是對(duì)稱的;②各個(gè)機(jī)率是可以相加的。.均值抽樣分布(1)均值抽樣分布均值抽樣分布是指從總體中不斷地抽取大小相同的隨機(jī)樣本,分別計(jì)算每個(gè)樣本的均值X,并把每個(gè)均值的出現(xiàn)次數(shù)相加起來(lái),得到樣本均值的次數(shù)分布情況。用矩形圖來(lái)表示均值分布的情況,然后以多角線來(lái)連接各矩形的頂端的中點(diǎn)。由于所計(jì)算的是定距資料,各個(gè)矩形的寬度可以無(wú)限小,因而連接各個(gè)矩形頂端的中點(diǎn)的多角線,理應(yīng)是一條平滑的曲線,如圖5-1所示。圖中的橫軸表示各個(gè)樣本的均值X,縱軸表示每個(gè)均值的次數(shù)(f)O圖5-1均值之抽樣分布(正態(tài))(2)均值抽樣分布的特征根據(jù)數(shù)學(xué)上的中央極限定理,均值的抽樣分布具有如下特征:①如果樣本相當(dāng)大(通常是指n不可少于30,最好是應(yīng)100),則抽樣分布接近正態(tài)分布o(jì)其特點(diǎn)是單峰和對(duì)稱,因而眾值、中位值與均值都相同。②抽樣分布之均值就是總體之均值。如果樣本相當(dāng)大,通常是以樣本的標(biāo)準(zhǔn)差(s)作為總體的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤差是指抽樣分布的標(biāo)準(zhǔn)差,可以用樣本的標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差來(lái)估計(jì)標(biāo)準(zhǔn)誤差(SE),公式如下:③抽樣分布的均值(M)兩旁的樣本均值次數(shù)所占的比例是可以知道的。在社會(huì)學(xué)研究中,下面幾項(xiàng)數(shù)值較為常用,值得注意:a.有90%在M±1.65(SE);b.有95%在M±1.96(SE);c.有98%在M±2.33(SE);d.有99%在M±2.58(SE).(3)統(tǒng)計(jì)推論統(tǒng)計(jì)推論,是根據(jù)抽樣分布的原理來(lái)進(jìn)行的,而抽樣分布與機(jī)率的概念密切相關(guān)。只要研究者采用隨機(jī)抽樣法,就可以根據(jù)抽樣分布,以樣本的數(shù)值來(lái)推測(cè)總體的情況。統(tǒng)計(jì)推論一般可分為兩大類:參數(shù)估計(jì)和假設(shè)檢定。①參數(shù)估計(jì),是指根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)估計(jì)總體參數(shù)值。②假設(shè)檢定,是首先假設(shè)總體的情況,然后以一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來(lái)檢驗(yàn)這個(gè)假設(shè)是否正確。第六章參數(shù)值的估計(jì)丁點(diǎn)值估計(jì)參數(shù)值的估計(jì),點(diǎn)值估計(jì)與間距估計(jì)t間距估計(jì)參數(shù)值的估計(jì)「均值的間距估計(jì)間能估計(jì):均值、百分率、程矩相關(guān)4百分率(或比例)的間距估計(jì)I估計(jì)程矩相關(guān)系數(shù)值(r)「決定樣本的準(zhǔn)則及問(wèn)題I決定樣本的大小4所能容忍的錯(cuò)混量I推斷樣本大小的困難及做法【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、點(diǎn)值估計(jì)與間距估計(jì)以樣本的統(tǒng)計(jì)值來(lái)估計(jì)總體的參數(shù)值,有兩大類做法:點(diǎn)值估計(jì)和間距估計(jì)。二者皆要求樣本是以隨機(jī)方法抽取的。.點(diǎn)值估計(jì)點(diǎn)值估計(jì),是指以一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值來(lái)代表總體的參數(shù)值。一般來(lái)說(shuō),如果樣本愈大,且抽樣方法愈嚴(yán)謹(jǐn),這種估計(jì)方法愈可信。但無(wú)論如何,抽樣誤差總是難免的,加之由點(diǎn)值估計(jì)法得到的估計(jì)值的可信程度很難確定。因此在社會(huì)學(xué)研究中,通常多采用間距估計(jì)法。.間距估計(jì)間距估計(jì),是指以兩個(gè)數(shù)值之間的間距來(lái)估計(jì)參數(shù)值。間距的大小取決于在估計(jì)時(shí)所要求的可信程度。在樣本大小相同的情況下,如果要求的可信度愈大,則間距就會(huì)愈大。這個(gè)間距,通常稱為“可信間距”。應(yīng)用間距估計(jì)法時(shí),可以選定任何的可信度,但一般用95%或99%。決定可信度以后,就可以計(jì)算間距的大小。
二、間距估計(jì):均值、百分率、積矩相關(guān)均值的間距估計(jì)^-1.96(X)<JZ<^+1.96(-L)(1)如果可信度為95%,可信間距的計(jì)算公式為:_s—SX-2.58(-=)<M<X+2.58(5=)y/n yfn(2)(2)如果可信度是99%,可信間距的計(jì)算為:其中又是樣本的均值,M是總體的均值,S是樣本的標(biāo)準(zhǔn)差,n是隨機(jī)樣本的大小。(3)間距的大小與可信度的高低成正比,可信間距的大小與樣本的大小成反比。在可信度已經(jīng)確定的前提下,提高間距估計(jì)的精確性的方法是加大樣本容量。.百分率(或比例)的間距估計(jì)(1)如果要求95%的可信度,則計(jì)算可信間距的公式為p±1.96(SE),即:,.QAIpO-P)p+『一「(2)如果要求99%的可信度,則計(jì)算可信間距的公式為p±2.58(SE),即:p+2%尹Vn其中p是樣本中的比例(即百分率),SE是抽樣分布的標(biāo)準(zhǔn)誤差,n是隨機(jī)樣本的大小。如果樣本頗大,百分率(或比例)的抽樣分布會(huì)近似正態(tài)分布,各個(gè)樣本的百分率都是對(duì)稱地散布于總體百分率的兩旁,其標(biāo)準(zhǔn)誤差是:其中P是總體的比例(即百分率)。由于難以知道P的數(shù)值,可以改用樣本的比例(p)。(3)如果樣本相當(dāng)大,可以用樣本p值代替總體P值。另一個(gè)較為保守的做法,是以p=0.50代入SE公式,使SE達(dá)到最大值,再將SE值代入可信間距公式就獲得最大的間距。.估計(jì)積矩相關(guān)系數(shù)值(r)計(jì)算總體相關(guān)系數(shù)的步驟為:Z'=1.1511og(1)將樣本的積矩相關(guān)系數(shù)(r)轉(zhuǎn)化為值,公式如下:(2)在Z,值的抽樣分布(正態(tài))中的標(biāo)準(zhǔn)誤差,可用下面公式計(jì)算:其中n是樣本的大小。(3)假定要求的司信度是95%,則可信間距是:Z'±1.96(SE)。(4)查數(shù)學(xué)用表可知計(jì)算得到的可信間距對(duì)應(yīng)的r值區(qū)間,由此可得在可信度95%的情況下,總體的積矩相關(guān)系數(shù)區(qū)間。三、決定樣本的大小決定樣本的準(zhǔn)則(1)在能夠付出的研究代價(jià)的限度內(nèi),選取最大的樣本。(2)研究可以容忍的錯(cuò)誤愈小,樣本就要愈大。(3)所研究個(gè)案之間的相互差異愈大,樣本就要愈大。2.樣本大小的計(jì)算公式研究中的錯(cuò)誤為:其中,e為錯(cuò)誤,M為總體均值,了為一個(gè)隨機(jī)樣本(n)中計(jì)算出來(lái)的均值。^-1,964=<M<X+1.96之假定總體的標(biāo)準(zhǔn)差(S)已知,則在估計(jì)總體的均值時(shí),95%的可信度間距應(yīng)為因?yàn)閒l.96SV
n= 可推算出如果把可信度提高為99%,則公式是:由此可知,可信度愈高,樣本就要愈大。以統(tǒng)計(jì)公式來(lái)推斷樣本的大小通常只作為參考。第七章假設(shè)檢定:均值與百分率「研究限設(shè)與虛無(wú)假設(shè)否定域與顯著度基本知識(shí)一端與二端檢定假設(shè)檢定:制值與百分率,甲種誤篁與乙種誤差假設(shè)檢定:制值與百分率檢定力:參數(shù)與非參數(shù)法I檢定假設(shè)的步驟jZ檢定法(大樣本)(單均值tt檢定法(小樣本)單均值與均值差異[ 「Z檢定法I兩個(gè)均值的差異tt檢定法I多個(gè)均值的差異「單百分率(或比例)單百分率與百分率差異,兩個(gè)百分率(或比例)的差異
I多個(gè)百分率的差異【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、基本知識(shí)在統(tǒng)計(jì)推論上較為常用的是檢定假設(shè)的方法。假設(shè)檢定,是指先成立一個(gè)關(guān)于總體情況的假設(shè),繼而抽取一個(gè)隨機(jī)樣本,然后以樣本的統(tǒng)計(jì)值來(lái)驗(yàn)證假設(shè)。.研究假設(shè)與虛無(wú)假設(shè)(1)研究假設(shè)科學(xué)的研究一般是先成立假設(shè),即假定在總體中存在某些情況,這個(gè)假設(shè),稱為研究假設(shè)(簡(jiǎn)寫HD。(2)虛無(wú)假設(shè)虛無(wú)假設(shè)(簡(jiǎn)寫H))是指與研究假設(shè)相對(duì)立的假設(shè)。檢定假設(shè)的基本原則是直接檢定H。,因而間接地檢定H”目的是排除抽樣誤差的可能性。否定Ho,也不能說(shuō)Hi一定對(duì),只能說(shuō)“可能”對(duì),因?yàn)镠。被否定是由于它在抽樣分布中出現(xiàn)的可能性很小,但不是完全沒(méi)有可能性。同時(shí),除了抽樣誤差以外,也可能有其他因素引起錯(cuò)誤。.否定域與顯著度(1)否定域否定域是指在未分析資料之前,研究者決定的否定虛無(wú)假設(shè)(H。)的區(qū)域。確切地說(shuō),否定域(簡(jiǎn)寫CR),是指抽樣分布內(nèi)一端或兩端的小區(qū)域,如果樣本的統(tǒng)計(jì)值在此區(qū)域范圍內(nèi),則否定虛無(wú)假設(shè)。否定域在抽樣分布的一端還是二端,則要視研究假設(shè)(H)的性質(zhì)而定。否定域的大小,取決予研究的需要。(2)顯著度顯著度是指表示否定域在整個(gè)抽樣分布中所占的比例,即表示樣本的統(tǒng)計(jì)值落在否定域內(nèi)CH的機(jī)會(huì),如圖7-1所示。圖7-1否定域(CR)與顯著度(p).一端與二端檢定一端檢定是指否定域只在一端(可以在右端,也可在左端)。二端檢定是指否定域在兩端的位置。如果所選定的顯著度相同,二端檢定比一端檢定更難否定虛無(wú)假設(shè)(H。)。一端或二端檢定取決于是否可以確定研究假設(shè)(H)的方向。.甲種誤差與乙種誤差(1)甲種誤差甲種誤差,是指否定H。,但實(shí)際上H。是對(duì)的錯(cuò)誤可能性。這個(gè)可能性,就是研究者所選定的顯著度。(2)乙種誤差乙種誤差,是指不否定H。,但實(shí)際上H。是不對(duì)的錯(cuò)誤可能性。.檢定力:參數(shù)與非參數(shù)法用作檢定假設(shè)的推論統(tǒng)計(jì)法可以分為兩大類:參數(shù)檢定法和非參數(shù)檢定法。統(tǒng)計(jì)法的檢定力,是指該統(tǒng)計(jì)法能夠準(zhǔn)確地判斷虛無(wú)假設(shè)(H。)的正誤之能力。由于在統(tǒng)計(jì)推論之前,已決定顯著度(即甲種誤差)的大小,故檢定力的大小其實(shí)是指乙種誤差的大?。喝绻诮y(tǒng)計(jì)推論時(shí)所犯的乙種誤差愈小,該統(tǒng)計(jì)法的檢定力就愈大。兩者的關(guān)系,可以表示為:檢定力=1一乙種誤差之機(jī)會(huì)。參數(shù)檢定法的檢定力大于非參數(shù)檢定法是因?yàn)樵瓌t上其在檢定假設(shè)時(shí)所犯的乙種誤差較小。(1)參數(shù)檢定法參數(shù)檢定法的特點(diǎn),是要求總體具備某些條件,如正態(tài)分布或標(biāo)準(zhǔn)差相等。參數(shù)檢定法,一般也要求變項(xiàng)的數(shù)值具有定距測(cè)量層次的特質(zhì)。參數(shù)檢定法包括z檢定、t檢定和F檢定等。(2)非參數(shù)檢定法非參數(shù)檢定法,又稱分布自由檢定法,一般不要求是定距測(cè)量層次,因而適用于推論定類或定序資料。但是,由于非參數(shù)檢定法不理會(huì)總體的情況,在推論時(shí)就較為困難,準(zhǔn)確性也會(huì)因此而影響。.檢定假設(shè)的步驟(1)根據(jù)研究假設(shè)(H)成立與其對(duì)立的虛無(wú)假設(shè)(H。)。明確檢定的目的就是要否定Ho,從而知道Hi是對(duì)的可能性。(2)選擇適當(dāng)?shù)臋z定統(tǒng)計(jì)法,并要列舉其假定或要求。(3)確定抽樣分布。(4)決定顯著度,并依據(jù)Hi的性質(zhì)選用一端或二端檢定,然后從抽樣分布中求出否定域的位置和大小。(5)根據(jù)樣本的資料計(jì)算檢定值,從而作出決策。倘若檢定值是在否定域的范圍內(nèi),可以否定H。,即Hi可能是對(duì)的;否則的話,就不能否定H。,也即Hi可能是錯(cuò)誤的。二、單均值與均值差異單均值當(dāng)研究假設(shè)是總體中的一個(gè)均值時(shí),樣本相當(dāng)大時(shí)可用Z檢定法;樣本較小時(shí)則用t檢定法o二者都屬于參數(shù)檢定法,要求包括:定距變項(xiàng);隨機(jī)抽樣;總體呈正態(tài)分布。Z檢定法(大樣本)這種檢定法要求樣本是以隨機(jī)方法抽取的,而且相當(dāng)大(通常后100)。在這種情況之下,便可應(yīng)用均值抽樣分布來(lái)檢定虛無(wú)假設(shè)(H。)。Z檢定法的步驟包括:①?zèng)Q定顯著度和否定域的大小,并考慮選擇一端或二端檢定的問(wèn)題。②設(shè)立H。,即總體中的均值是M,進(jìn)而以此為基礎(chǔ)來(lái)確定抽樣分布。③如果是大樣本,則無(wú)限個(gè)樣本均值的抽樣分布會(huì)近似正態(tài)分布,其均值就等于M,而標(biāo)準(zhǔn)誤差(SE)則等于總體的標(biāo)準(zhǔn)差除以樣本大小的平方根,但此可以使用下式估算:④查數(shù)學(xué)用表可知計(jì)算得到的Z值對(duì)應(yīng)的正態(tài)曲線下各部分面積的比例數(shù)值。⑤將計(jì)算得到的均值又落在否定區(qū)域的機(jī)會(huì),與顯著度進(jìn)行比較。t檢定法(小樣本)如果是小樣本,尤其是當(dāng)吐30,就要改用t檢定法。以t值來(lái)表示樣本的均值在標(biāo)準(zhǔn)化抽樣X(jué)-MX-MSE~S!y[n-1分布中的位置。公式如下:其中M是所假定的總體均值,n是樣本大小,SE是標(biāo)準(zhǔn)誤差,X和S分別是樣本均值和標(biāo)準(zhǔn)差。t的抽樣分布形狀取決于自由度。自由度(簡(jiǎn)寫df)是指有多少個(gè)案的數(shù)值可以隨意變更°df=n-1,df愈小則t分布愈扁平,df愈大則t分布愈高聳而且接近正態(tài)分布。不同顯著度和自由度對(duì)應(yīng)的t值均可在數(shù)學(xué)用表中查得。.兩個(gè)均值的差異Z檢定法如果兩個(gè)樣本的個(gè)案總數(shù)額大,一般在(m+m)N100時(shí),則可用下面的公式:其中京和&分別代表第一個(gè)樣本(n.)的均值和標(biāo)準(zhǔn)差,而K和工分別是第二個(gè)樣本(m)的均值和標(biāo)準(zhǔn)差。t檢定法倘若兩個(gè)隨機(jī)樣本的個(gè)案總數(shù)較小,即:(m十m)<100,則用下面的公式:上式中的SE是兩個(gè)樣本均值相差之抽樣分布的標(biāo)準(zhǔn)誤差,可作如下的估計(jì):
SE=附+峪:區(qū)+叱df=(%-1)+(%—1)=/+-2由于有兩個(gè)樣本,故此自由度是:在實(shí)驗(yàn)研究中,由于樣本一般都較小,t檢定法是經(jīng)常被采用的。.多個(gè)均值的差異研究時(shí)可能有三個(gè)或以上的樣本,如以M代表總體的均值,X代表樣本均值,則研究假設(shè)和虛無(wú)假設(shè)為:而研究者就要根據(jù)正、乂和工等數(shù)值的相互差異來(lái)檢定H。的正確性。常用的方法是F檢定,又稱方差分析法。Z檢定法與t檢定法的區(qū)別主要包括:Z檢定法基于正態(tài)抽樣分布,要求大樣本;t檢定法基于t值抽樣分布,可用于小樣本。(2)當(dāng)樣本增大時(shí),t值分布會(huì)逐漸接近正態(tài)分布,這時(shí)t檢定法與Z檢定法的分別就不大oZ檢定法可以說(shuō)是t檢定法的一種特殊(大樣本)情況。在近代社會(huì)研究中,t檢定法的應(yīng)用更為廣泛。三、單百分率與百分率差異單百分率(或比例)如果研究假設(shè)(H)是總體的一個(gè)百分率(或比例),可用Z檢定法來(lái)驗(yàn)證虛無(wú)假設(shè)(H“z=p-pz=p-p-P-pSE尸(1一尸)),其公式如下:其中P是所假設(shè)的總體百分率(或比例),p是樣本中算出的百分率(或比例),n是樣本大小,SE是標(biāo)準(zhǔn)誤差。應(yīng)用這個(gè)公式時(shí),最好是樣本較大。.兩個(gè)百分率(或比例)的差異寸均七如要檢定兩個(gè)樣本的百分率(pi和戶)在其總體中是否有差異,可用下面的Z檢定公式:兩個(gè)隨機(jī)樣本百分率之相差的抽樣分布接近正態(tài)分布,故可用Z檢定法。公式中的分母就是標(biāo)準(zhǔn)誤差。.多個(gè)百分率的差異如要檢定三個(gè)或以上的百分率在其總體中是否有差異,可以用X,檢定。X,檢定屬于非參數(shù)檢定法,而且也可用來(lái)檢定兩個(gè)百分率的差異,是當(dāng)前社會(huì)學(xué)研究常用的推論統(tǒng)計(jì)法。X?的作用,是檢定兩個(gè)或以上的隨機(jī)樣本的次數(shù)分布是否有差別。第八章假設(shè)的檢定:兩個(gè)變項(xiàng)之相關(guān)JX?檢定法的步孩/X;檢定及其相關(guān)測(cè)量法I根據(jù)X:數(shù)值測(cè)量?jī)蓚€(gè)定類變項(xiàng)的相關(guān),Gamma系數(shù)的應(yīng)用jZ檢定法Gamn1a及其他級(jí)字相關(guān)的檢定J 't檢定法〔檢定S因子數(shù)值的方法假設(shè)的檢定:兩個(gè)變質(zhì)之相關(guān)(單因方差中F檢定的應(yīng)用
運(yùn)用F檢定的要求假設(shè)的檢定:兩個(gè)變質(zhì)之相關(guān)單因方差分析與F檢定<F檢定公式求解否定域的范圍*檢定的另一種推算方法兩個(gè)定更變項(xiàng)成直淺關(guān)系程矩相關(guān)與回歸系數(shù)的檢定?I兩個(gè)定定變頊成非直線關(guān)系[非參數(shù)檢定法非參數(shù)檢定:I.檢定與H檢定■I.檢定〔H檢定?檢定假設(shè)方法的共同點(diǎn)i總結(jié),檢定法總結(jié)I超機(jī)抽樣旃定兩變項(xiàng)之間的關(guān)系的步驟【知識(shí)框架】【重點(diǎn)難點(diǎn)歸納】一、x?檢定及其相關(guān)測(cè)量法如果兩個(gè)變項(xiàng)都是定類變項(xiàng),可用片檢定來(lái)推論在總體中兩者是否相關(guān)。這是非參數(shù)檢定法的一種,基本上只要求:樣本是用隨機(jī)方法抽取的;兩個(gè)變項(xiàng)都具有定類的性質(zhì)。.X?檢定法的步驟(1)建立假設(shè)關(guān)于總體的情況,研究假設(shè)(H)與虛無(wú)假設(shè)(H。)分別是:Hl:X與丫相關(guān)(總體中);Ho:X與丫不相關(guān)(總體中)。(2)計(jì)算X2值表8-1是據(jù)樣本的資料而成立的一個(gè)條件次數(shù)表:表8-1條件次數(shù)表□X121fnfl2Bl2fixfllB2AlA2nXZ檢定的公式如下:自由度df=(r—1)(c—1)其中f是根據(jù)所抽取的樣本而計(jì)算出來(lái)的實(shí)際次數(shù),e是與每個(gè)實(shí)際次數(shù)相應(yīng)的預(yù)期次數(shù),A與B分別是X與丫這兩個(gè)變項(xiàng)的邊緣次數(shù),n是樣本大小,r與c則分別是表的行數(shù)與列數(shù)。預(yù)期次數(shù)(e),是指在總體中兩個(gè)變項(xiàng)沒(méi)有關(guān)系(即H。是對(duì))時(shí),上面的表內(nèi)每格所應(yīng)有的次數(shù)。倘若X與丫確實(shí)是不相關(guān),即e”和已2所占的比例應(yīng)該相同,而和心所占的比例也相同。表中每格的預(yù)期次數(shù)(e),就是相應(yīng)的兩個(gè)邊緣次數(shù)(B與A)的乘積除以樣本的大小(n)o片數(shù)值愈大,就表示在總體中X與丫不相關(guān)的可能性愈大,即表示愈能否定虛無(wú)假設(shè)(H(>)o(3)查數(shù)學(xué)用表確定否定虛無(wú)假設(shè)的X?值犬的抽樣分布取決于自由度,在決定顯著度以后是否能夠否定Ho,就要視乎自由度的大小。犬抽樣分布的自由度是據(jù)表的行數(shù)(r)與列數(shù)(c)來(lái)計(jì)算的,公式是:df=(r-1)(c-1),表示表中各個(gè)方格內(nèi)的預(yù)期次數(shù)有多少個(gè)是可以自由決定的。在數(shù)學(xué)用表中可查到不同自由度的X?分布的值。自由度愈大,X?分布的偏態(tài)度愈小。倘若一個(gè)是定類變項(xiàng),另一個(gè)是定序變項(xiàng),通常亦是用犬檢定,即將定序變項(xiàng)看作是定類變項(xiàng)。(4)得到研究結(jié)論若樣本中算得的檢定值在否定域的范國(guó)內(nèi),則可否定虛無(wú)假設(shè),得到研究結(jié)論。.根據(jù)代數(shù)值測(cè)量?jī)蓚€(gè)定類變項(xiàng)的相關(guān)據(jù)力數(shù)值也可以測(cè)量?jī)蓚€(gè)定類變項(xiàng)的相關(guān)。較為常見的方法有:Phi相關(guān)系數(shù):(2)列聯(lián)相關(guān)系數(shù):(3)克拉默的V相關(guān)系數(shù):其中,n是樣本的大小,m是表的行數(shù)(r)與列數(shù)(c)中較小的數(shù)目。這些相關(guān)測(cè)量法的系數(shù)值愈大,就表示兩個(gè)變項(xiàng)的相關(guān)程度愈強(qiáng)。但是,這三種系數(shù)值都沒(méi)有消滅誤差比例的意義。V系數(shù)值則是由0至1,不受表的大小所影響,最適用于社會(huì)學(xué)研究。二、Gamma及其他級(jí)序相關(guān)的檢定Gamma系數(shù)的應(yīng)用如果兩個(gè)變項(xiàng)都是定序變項(xiàng),可以用Gamma系數(shù)(簡(jiǎn)寫G)來(lái)測(cè)量相關(guān)的程度和方向。但倘若所研究的是一個(gè)隨機(jī)樣本,就要設(shè)法推論總體的情況。以Gamma系數(shù)來(lái)求出樣本中X與丫的相關(guān),然后以Z檢定法或t檢定法來(lái)推論在總體中的Gamma是否等于0。研究假設(shè)(HI)與虛無(wú)假設(shè)(Hu)分別是:Hi:總體中Gamma〉或<0;H。:總體中Gamma=0。Z檢定法使用Gamma系數(shù)的條件包括:①兩個(gè)變項(xiàng)都具有定序的特質(zhì);②采用隨機(jī)抽樣;③樣本較大(最好是應(yīng)100)。G值標(biāo)準(zhǔn)化的公式如下:
其中G是隨機(jī)樣本的Gamma系數(shù)值,N,是同序?qū)?shù),N4是異序?qū)?shù),n是樣本的大小。t檢定法如研究假設(shè)(Hi)是總體中Gamma>0或Gamma<0,可用一端檢定;如是Gamma/),則要用二端檢定。如果是小樣本,就要改用t檢定法,公式如下:df=N.^Ni-l2.檢定S因子數(shù)值的方法較為精確的做法,是不用理會(huì)G值,而是直接檢定“N,—NJ這個(gè)稱為S因子的數(shù)值。可以通過(guò)檢定S來(lái)間接檢定G。檢定S的方法如下:s'=IW2(r-lXc-l)s'=IW2(r-lXc-l)(1)為使S的抽樣分布近似正態(tài)分布,要把S的數(shù)值修正為S,,公式如下:其中n是樣本大小,r與C分別是表的行數(shù)與列數(shù)。SE=&2+ ].土區(qū)yw-1 破1)(2)(2)要用下面的公式來(lái)計(jì)算修正值(S')的標(biāo)準(zhǔn)誤差:其中:A2:相應(yīng)于X變項(xiàng)的邊緣次數(shù)中兩個(gè)數(shù)值之乘積的總和;B::相應(yīng)于丫變項(xiàng)的邊緣次數(shù)中兩個(gè)數(shù)值之乘積的總和;A3:相應(yīng)于X變項(xiàng)的邊緣次數(shù)中三個(gè)數(shù)值之乘積的總和;B3:相應(yīng)于丫變項(xiàng)的邊緣次數(shù)中三個(gè)數(shù)值之乘積的總和。(3)計(jì)算檢定值(Z),公式如下:(4)根據(jù)顯著度,查表判斷是否否定虛無(wú)假設(shè)。三、單因方差分析與F檢定單因方差中F檢定的應(yīng)用分析一個(gè)定類變項(xiàng)(X)和一個(gè)定距變項(xiàng)(Y)的關(guān)系,可用相關(guān)比率(即eta平方系數(shù))測(cè)量法來(lái)求出相關(guān)的程度。倘若所研究的是一個(gè)隨機(jī)樣本,推論總體情況時(shí)較為常用的是單因方差分析中的F檢定,其目的是要推算在各組總體中的均值是否相等。.運(yùn)用F檢定的要求F檢定是參數(shù)檢定法的一種,其具體要求如下:(1)隨機(jī)樣本;(2)有一個(gè)變項(xiàng)是定距變項(xiàng);(3)各組的總體都是正態(tài)分布和具有相等的方差。.F檢定公式計(jì)算檢定值的F檢定公式如下:dfx=k-\dfz=n-k其中E?是樣本的相關(guān)比率,n是樣本的大小,k是分組數(shù)目。計(jì)算出來(lái)的檢定值F,通常稱為F比率。F的抽樣分布取決于兩個(gè)自由度,可以dfi和dfZ分別表示。.求解否定域的范圍F的分布情況取決于兩個(gè)自由度:(1)計(jì)算消減誤差(ED時(shí)的自由度,df,=k-lo(2)計(jì)算剩余誤差(1—E2)時(shí)的自由度,df2=n—ko可由兩個(gè)自由度查表知F值在不同顯著度下的否定域的臨界值。.F檢定的另一種推算方法
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文化藝術(shù)品市場(chǎng)交易數(shù)據(jù)概覽表
- 2025年市場(chǎng)調(diào)研與分析職稱考試試題及答案
- 2025年人力資源開發(fā)與管理碩士專業(yè)考試試題及答案
- 2025年家政服務(wù)職業(yè)技能鑒定考試題及答案
- 2025年國(guó)際營(yíng)銷策略與實(shí)踐考試試題及答案
- 2025年電氣工程師考試模擬試卷及答案
- 2025年甘肅省民航機(jī)場(chǎng)集團(tuán)校園招聘45人筆試參考題庫(kù)及答案詳解1套
- 物資采購(gòu)規(guī)章管理制度
- 特教機(jī)構(gòu)老師管理制度
- 特殊醫(yī)療設(shè)備管理制度
- MOOC 區(qū)塊鏈技術(shù)與應(yīng)用-西南交通大學(xué) 中國(guó)大學(xué)慕課答案
- 護(hù)理質(zhì)量安全與風(fēng)險(xiǎn)管理的信息安全與數(shù)據(jù)保護(hù)
- 【課件】宣紙的工藝講解
- 雙J管患者護(hù)理查房
- 光伏發(fā)電鈣鈦礦光伏組件技術(shù)要求
- 心理健康與睡眠的關(guān)系
- 部編版四年級(jí)下冊(cè)語(yǔ)文寫字表生字加拼音組詞
- 激發(fā)銷售潛能
- 原告 代理人 授權(quán)委托書
- 法治基地管理制度
- HG T 3690-2022 工業(yè)用鋼骨架聚乙烯塑料復(fù)合管
評(píng)論
0/150
提交評(píng)論