社會(huì)統(tǒng)計(jì)學(xué)(第一講)_第1頁
社會(huì)統(tǒng)計(jì)學(xué)(第一講)_第2頁
社會(huì)統(tǒng)計(jì)學(xué)(第一講)_第3頁
社會(huì)統(tǒng)計(jì)學(xué)(第一講)_第4頁
社會(huì)統(tǒng)計(jì)學(xué)(第一講)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

社會(huì)統(tǒng)計(jì)學(xué)

(SocialStatistics)引子:在學(xué)統(tǒng)計(jì)學(xué)之前,我們需要了解……為什么要學(xué)統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是什么?如何學(xué)習(xí)統(tǒng)計(jì)學(xué)?科學(xué)只有當(dāng)它利用了數(shù)學(xué)的時(shí)候,它才達(dá)到了完善的程度?!R克思

對(duì)于追求效率的公民而言,統(tǒng)計(jì)思維總有一天會(huì)和讀寫能力一樣必要。

——H.G.Wells社會(huì)統(tǒng)計(jì)學(xué)是社會(huì)學(xué)十門必修課中的一門,它與“社會(huì)學(xué)調(diào)查研究方法”結(jié)合起來,完整的介紹了當(dāng)代社會(huì)調(diào)查研究的科學(xué)方法與資料處理技術(shù)。社會(huì)統(tǒng)計(jì)學(xué)側(cè)重于介紹資料的收集、整理、分析和推論的處理技術(shù)。社會(huì)統(tǒng)計(jì)學(xué)的發(fā)展統(tǒng)計(jì)學(xué)的兩大流派:數(shù)理統(tǒng)計(jì)學(xué)派和社會(huì)統(tǒng)計(jì)學(xué)派數(shù)理統(tǒng)計(jì)學(xué)派的原創(chuàng)始人是比利時(shí)的A·凱特靳,其最大的貢獻(xiàn)就是將法國(guó)的古典概率引入統(tǒng)計(jì)學(xué),用純數(shù)學(xué)的方法對(duì)社會(huì)現(xiàn)象進(jìn)行研究;社會(huì)統(tǒng)計(jì)學(xué)派的首倡者是德國(guó)的K·克尼斯,他認(rèn)為統(tǒng)計(jì)研究的對(duì)象是社會(huì)現(xiàn)象,研究方法為大量觀察法。社會(huì)統(tǒng)計(jì)學(xué)的兩大流派社會(huì)指標(biāo)學(xué)派描述統(tǒng)計(jì)學(xué)派統(tǒng)計(jì)學(xué)是什么?——概念與內(nèi)涵

統(tǒng)計(jì)學(xué)是描述一系列可用于描述、整理和解釋資料或數(shù)據(jù)的統(tǒng)計(jì)工具和技術(shù)。社會(huì)統(tǒng)計(jì)學(xué)是運(yùn)用統(tǒng)計(jì)的一般原理,對(duì)社會(huì)各種靜態(tài)結(jié)構(gòu)與動(dòng)態(tài)趨勢(shì)進(jìn)行定量描述或推斷的一種專門方法與技術(shù)。

統(tǒng)計(jì)學(xué)的基本分類:描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)

描述統(tǒng)計(jì)(DescriptiveStatistics):用于整理、描述所收集的數(shù)據(jù)的特征推論統(tǒng)計(jì)(InferentialStatistics):利用較小群體的數(shù)據(jù)(樣本)來推論可能的較大群體(總體),通過推論統(tǒng)計(jì),我們可以解釋數(shù)據(jù)。社會(huì)統(tǒng)計(jì)的方法1.大量觀察法所謂大量觀察,即是就總體中足夠多的單位進(jìn)行調(diào)查和綜合分析,用以反映社會(huì)總體的數(shù)量特征。

2.大數(shù)規(guī)律隨機(jī)現(xiàn)象出現(xiàn)的基本規(guī)律,其一般意義是:觀察過程中每次取得的結(jié)果可能不同(因?yàn)榫哂信既恍?,但大量重復(fù)觀察結(jié)果的平均值卻幾乎接近某個(gè)確定的數(shù)值。所謂描述統(tǒng)計(jì)就是討論范圍僅以搜集資料本身為限,而不予以擴(kuò)大。

所謂推論統(tǒng)計(jì),主要是依據(jù)概率論,研究如何依據(jù)有限資料對(duì)總體性質(zhì)作推斷,從而使統(tǒng)計(jì)的功能大為擴(kuò)充。

假設(shè)檢驗(yàn)

參數(shù)估計(jì)

社會(huì)統(tǒng)計(jì)工作的程序制定計(jì)劃

統(tǒng)計(jì)調(diào)查統(tǒng)計(jì)整理統(tǒng)計(jì)分析統(tǒng)計(jì)報(bào)告如何學(xué)習(xí)統(tǒng)計(jì)學(xué)?樹立信心培養(yǎng)興趣由淺入深,逐步推進(jìn)。仔細(xì)閱讀你的教材按時(shí)完成練習(xí)。多多留意報(bào)刊、雜志甚至學(xué)術(shù)期刊上的統(tǒng)計(jì)實(shí)例。多多使用統(tǒng)計(jì)軟件練習(xí)數(shù)據(jù)分析。第一章社會(huì)學(xué)研究與統(tǒng)計(jì)分析第一節(jié)社會(huì)學(xué)研究的科學(xué)性

科學(xué)的研究邏輯操作化通過對(duì)理論的演繹建立研究假設(shè)科學(xué)實(shí)驗(yàn)得出結(jié)論社會(huì)科學(xué)研究的一般過程確定課題、了解情況建立研究假設(shè)概念的操作化設(shè)計(jì)問卷、抽樣調(diào)查統(tǒng)計(jì)分析假設(shè)檢驗(yàn)、得出結(jié)論案例:在校大學(xué)生的戀愛行為是否存在性別差異?——誰更需要愛情?男生還是女生?事實(shí)上,社會(huì)調(diào)查與統(tǒng)計(jì)推論是大多數(shù)“社會(huì)科學(xué)”之所以稱之為“科學(xué)”的基石!概念(Concept):人們對(duì)事物本質(zhì)的認(rèn)識(shí),是研究的基本單位,具有抽象性。定義(Definition):將概念呈現(xiàn)、描述出來,從而明確認(rèn)識(shí)對(duì)象。操作化定義(Operationaldefinition):用一系列可以觀察、可以測(cè)量的指標(biāo)來模擬或表述定義,使得非量化的概念得以運(yùn)算并得以操作測(cè)量。概念抽象定義操作化定義都市化現(xiàn)代都市的生活形態(tài)婦女就業(yè)人數(shù)、子女?dāng)?shù)、交通;通訊手段等個(gè)人現(xiàn)代化一個(gè)人由于經(jīng)濟(jì)、工業(yè)等現(xiàn)代因素所產(chǎn)生的內(nèi)部變化對(duì)時(shí)間、效率、家庭、親屬、消費(fèi)、自信等具體問題的看法子代偏重經(jīng)濟(jì)上、感情上和生活上對(duì)子代過分的偏重子代撫育費(fèi)與家庭平均消費(fèi)的比較、子代過生日的花費(fèi)與長(zhǎng)輩生日花費(fèi)的比較、花在子代閑暇時(shí)間的多少等開始學(xué)習(xí)社會(huì)統(tǒng)計(jì)學(xué)之前的知識(shí)儲(chǔ)備什么是變量?變量有哪些層次?不同類型變量的統(tǒng)計(jì)表制作方法?總體與單位所謂總體,就是作為統(tǒng)計(jì)研究對(duì)象的、由許多具有共性的單位構(gòu)成的整體??傮w也有人稱之為母體。構(gòu)成總體的每一個(gè)個(gè)體稱為總體單位,簡(jiǎn)稱單位,也稱為個(gè)體。

有限總體與無限總體可加總體與不可加總體

總體在抽樣調(diào)查及推論統(tǒng)計(jì)中,還引出了它與樣本總體這個(gè)概念的聯(lián)系與區(qū)別。推論統(tǒng)計(jì)有“部分推斷總體”的特征。通過抽樣得到的用以推斷總體特征的那個(gè)“部分”,在統(tǒng)計(jì)學(xué)上稱為樣本或樣本總體。樣本中所含的單位數(shù),在統(tǒng)計(jì)學(xué)上稱為樣本大小,也叫做樣本容量。從總體抽選出樣本的過程叫抽樣,也有叫取樣的。二者是互為存在條件地聯(lián)結(jié)在一起的,二者的地位在某種意義上不是固定不變的。

1、相互依存關(guān)系。

2、當(dāng)研究目的和研究范圍變動(dòng),總體和個(gè)體可以相互轉(zhuǎn)化。總體的特征:大量性、同質(zhì)性和差異性??傮w的這三個(gè)特征是缺一不可的。大量性是條件、同質(zhì)性是基礎(chǔ),差異性是前提。樣本

樣本是從總體中抽取的一部分個(gè)體所組成的集合,也稱子樣。樣本容量是指樣本所包含的個(gè)體數(shù)。當(dāng)樣本容量大于30時(shí),為大樣本。樣本個(gè)數(shù)是指從總體中最多可以抽取的不同樣本的套數(shù)。樣本容量用n表示。樣本個(gè)數(shù)用m表示。

總體與樣本的關(guān)系1、總體是所要研究的對(duì)象,而樣本則是所要觀測(cè)的對(duì)象。2、樣本是用來推斷總體的。3、總體和樣本的角色是可以改變的。4、總體與樣本都有大量性,同質(zhì)性和差異性的特征。樣本容量用n表示。樣本個(gè)數(shù)用m表示。

變量(Variables)——在統(tǒng)計(jì)學(xué)中表示研究對(duì)象的特征,變量下的各種表現(xiàn)形式或不同取值,就是變量值。變量變量變量值性別家庭子女?dāng)?shù)重要性文化程度男;女1個(gè);2個(gè);3個(gè);…非常重要;一般;不重要大學(xué);中學(xué);小學(xué);文盲變量取值時(shí)注意的問題:完備性互斥性單變量分析——變量的分布(frequencydistribution)分布——某個(gè)變量的變量值出現(xiàn)的次數(shù)或頻次,也稱頻次分布。例:家庭結(jié)構(gòu)(變量X)可能的取值包括:X1——由父母和未婚子女組成的核心家庭X2——由父母和單一已婚子女組成的三代人家庭,即主干家庭X3——由父母和多對(duì)已婚子女所組成的三代人家庭,即聯(lián)合家庭

如果我們將調(diào)查結(jié)果按照被訪人的回答,分別歸入上述三類,于是有以下三對(duì)數(shù)據(jù):(X1,n1)(X2,n2)(X3,n3)

(Xk,nk)

其中Xi表示變量X的第i個(gè)取值;ni表示該取值所對(duì)應(yīng)的次數(shù)所謂分布,實(shí)際上就是這些對(duì)數(shù)據(jù)的集合。當(dāng)n代表不同的含義時(shí),表示不同的分布如:當(dāng)n表示概率時(shí),稱作概率分布當(dāng)n表示頻次時(shí),稱作頻次分布當(dāng)n表示百分比時(shí),稱作頻率或相對(duì)頻次分布家庭結(jié)構(gòu)頻次核心家庭1050主干家庭720聯(lián)合家庭110其他250總數(shù)2130家庭結(jié)構(gòu)的頻次分布(XX地,XX年XX月)家庭結(jié)構(gòu)百分比核心家庭49.3主干家庭33.8聯(lián)合家庭5.2其他11.7總和百分比100家庭結(jié)構(gòu)的百分比分布(XX地,XX年XX月,N=2130)正面次數(shù)概率0123456789100.000.010.040.120.210.250.210.120.040.010.00拋10次硬幣正面出現(xiàn)次數(shù)的概率分布第二節(jié)社會(huì)調(diào)查資料的特點(diǎn)和統(tǒng)計(jì)學(xué)的運(yùn)用一、社會(huì)調(diào)查資料的特點(diǎn):(一)隨機(jī)性確定性現(xiàn)象:“若A,則必有B”,A與B之間,存在確定性的函數(shù)關(guān)系。非確定性現(xiàn)象:若A,則可能有B,或者C;D;E。f(A)BA●●●●●●●●●●●●●●●●●●●●●BA(二)統(tǒng)計(jì)規(guī)律性表面雜亂無章的隨機(jī)現(xiàn)象,實(shí)際上是有內(nèi)在規(guī)律性的。統(tǒng)計(jì)規(guī)律性表現(xiàn)為大量觀察或試驗(yàn)中隨機(jī)事件發(fā)生的頻率的穩(wěn)定性,即一個(gè)隨機(jī)事件發(fā)生的頻率經(jīng)常在某個(gè)定值附近擺動(dòng),而且,試驗(yàn)次數(shù)越多,一般擺動(dòng)越少。二、統(tǒng)計(jì)學(xué)的運(yùn)用介紹有關(guān)社會(huì)調(diào)查資料收集、整理、分析和推論的統(tǒng)計(jì)方法。社會(huì)統(tǒng)計(jì)學(xué)的特點(diǎn):抽象概念向操作化定義,設(shè)計(jì)好調(diào)查問卷;被測(cè)量對(duì)象是人,主觀意識(shí)影響資料收集;低層次變量占較大比重。三、統(tǒng)計(jì)分析的作用及主要內(nèi)容統(tǒng)計(jì)分析在社會(huì)調(diào)查研究中的功用,主要表現(xiàn)在經(jīng)驗(yàn)層次的大面積數(shù)據(jù)處理方面。統(tǒng)計(jì)結(jié)果不能輕率的作出因果的結(jié)論。例:(P15-表1-10和表1-11)社會(huì)科學(xué)研究的一般過程確定課題、了解情況建立研究假設(shè)概念的操作化設(shè)計(jì)問卷、抽樣調(diào)查統(tǒng)計(jì)分析假設(shè)檢驗(yàn)、得出結(jié)論統(tǒng)計(jì)分析內(nèi)容主要分為:統(tǒng)計(jì)描述和統(tǒng)計(jì)推論第三節(jié)怎樣選用統(tǒng)計(jì)分析方法

一、全面調(diào)查和非全面調(diào)查全面調(diào)查是對(duì)所研究全部對(duì)象進(jìn)行觀察與調(diào)查,從而掌握整個(gè)單位的全部資料。對(duì)全面調(diào)查,一般可用統(tǒng)計(jì)描述。統(tǒng)計(jì)描述是將所觀察的數(shù)據(jù)、資料,進(jìn)行整理、歸納和分析,以期找到某種規(guī)律。非全面調(diào)查是在全部研究對(duì)象中只調(diào)查其中的一部分。在非全面調(diào)查中,以概率抽樣法最重要。抽樣調(diào)查是在一定條件下,科學(xué)、客觀的抽取總體中一部分單位來加以研究,其目的是獲得對(duì)于總體性質(zhì)的正確敘述。二、單變量和多變量單變量主要調(diào)查的內(nèi)容是一個(gè)或多個(gè)相互獨(dú)立的概念,需要對(duì)每個(gè)獨(dú)立的變量研究其變動(dòng)情況和頻次,及集中和分散的特征。二變量研究?jī)蓚€(gè)變量之間是否存在關(guān)系及關(guān)系密切程度,及研究結(jié)論是否可以推斷整體。多變量研究多種關(guān)系,一因多果和一果多因。單變量分析——變量的分布(frequencydistribution)分布——某個(gè)變量的變量值出現(xiàn)的次數(shù)或頻次,也稱頻次分布。例:家庭結(jié)構(gòu)(變量X)可能的取值包括:X1——由父母和未婚子女組成的核心家庭X2——由父母和單一已婚子女組成的三代人家庭,即主干家庭X3——由父母和多對(duì)已婚子女所組成的三代人家庭,即聯(lián)合家庭

兩變量關(guān)系——命題的研究?jī)蓚€(gè)變量之間是否存在關(guān)系?關(guān)系的密切程度(強(qiáng)度)如何?自變量(independentvariable):也叫獨(dú)立變量,由研究者主動(dòng)操縱,或被研究者界定為不受其他變量影響,獨(dú)立變化的變量。因變量(dependentvariable):也叫依變量,指受其他變量影響,隨其他變量變化的變量。

自變量與因變量是就因果關(guān)系而言的,判斷自變量與因變量的標(biāo)準(zhǔn):(1)時(shí)間的先后。由于后發(fā)生者無法影響先發(fā)生者,所以先發(fā)生者是自變量;(2)變量的不變性與可變性。在社會(huì)研究中常將一些具有固定性、持久性的變量作為自變量。對(duì)于多變量的研究,情況更為復(fù)雜,它們除了兩兩之間可能存在聯(lián)系,而且還可能存在網(wǎng)狀、鏈狀、一因多果或一果多因等多種聯(lián)系,這些都屬于更高層次的統(tǒng)計(jì)技巧。1、定類層次變量(NominalVariable):變量取值只有類別屬性之分,根據(jù)變量值,只能知道研究對(duì)象是相同或是不同。從數(shù)學(xué)運(yùn)算特征來看,只具有等于或不等于(=、≠)的性質(zhì)。例如:性別。變量層次2、定序?qū)哟巫兞浚∣rdinalVariable):變量取值除了有類別屬性之外,還有等級(jí),次序的差別,其數(shù)學(xué)特性除了(=、≠)之外,還有大于或小于(><)之分。例如文化程度、社會(huì)經(jīng)濟(jì)地位等。2011中國(guó)大學(xué)排行榜10中山大學(xué)廣東綜合33.7734.4729.6042.6128華南理工大學(xué)廣東理工16.7315.3614.1033.2163暨南大學(xué)廣東綜合8.206.947.0318.7971華南師范大學(xué)廣東師范6.644.037.7413.3474華南農(nóng)業(yè)大學(xué)廣東農(nóng)林6.156.175.856.03102南方醫(yī)科大學(xué)廣東醫(yī)藥4.363.784.545.46108深圳大學(xué)廣東綜合3.944.212.807.26128廣州中醫(yī)藥大學(xué)廣東醫(yī)藥3.162.831.6411.76173廣州大學(xué)廣東綜合1.842.061.213.40名次學(xué)校名稱所在省市類型總分科學(xué)研究人才培養(yǎng)綜合聲譽(yù)3、定距層次變量(IntervalVariable):變量取值除了有類別、次序?qū)傩灾?,取值之間的距離還可以用標(biāo)準(zhǔn)化的距離去量度。其數(shù)學(xué)特性除了(=、≠;><)之外,還可以進(jìn)行加或減(+,-)。例如智商。4、定比層次變量(RatioVariable):變量取值除了有上述三種屬性之外,其取值還可以構(gòu)成一個(gè)有意義的比率,其數(shù)學(xué)特性除了(=、≠;><;+,-)之外,還可以進(jìn)行除法運(yùn)算。例如年齡。定比變量和定距變量的差別在于前者有一個(gè)真正有意義的零點(diǎn)。1、高層次的變量包含低層次變量的數(shù)學(xué)特征。

變量層次的比較2、在社會(huì)學(xué)研究中,一般不區(qū)分定距和定比變量,而是當(dāng)作一類,稱作定距變量。4、變量的層次與社會(huì)實(shí)際衡量之間有可能存在著差距或不一致性。5、根據(jù)研究?jī)?nèi)容不同,變量的層次也可能不同3、一個(gè)變量的層次并不是唯一的。高層次的變量可以作為低層次變量來使用,但是會(huì)使資料的信息使用不完全。層次數(shù)學(xué)運(yùn)算特征定類定序定距定比=,≠√√√√<,>√√√+,-√√×,÷√統(tǒng)計(jì)分析全面調(diào)查多變量單變量定距定序定類定距定序定類抽樣調(diào)查其他非概率抽樣多變量定距定序定類單變量定距定序定類統(tǒng)計(jì)描述統(tǒng)計(jì)推論應(yīng)用——如何制作不同類型的單變量統(tǒng)計(jì)表?1、定類單變量統(tǒng)計(jì)表性別頻次百分比男女2747155963.836.2總計(jì)4306100表1:微博用戶的性別統(tǒng)計(jì)表(N=4306)(資料來源:SSI在線樣本庫,調(diào)查地包括北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)

表頭

表號(hào)標(biāo)識(shí)行

主體行表尾2、定序單變量統(tǒng)計(jì)表表2:微博用戶的教育程度統(tǒng)計(jì)(N=4306)受教育程度頻數(shù)百分比初中及以下高中、職高、技校大專大學(xué)本科研究生及以上1723786627524340.45.520.163.910.1總計(jì)4306100(資料來源:SSI在線樣本庫,調(diào)查地包括北京、上海、廣州、深圳、成都、沈陽、西安、杭州八市)3、定距和定比單變量統(tǒng)計(jì)表定距和定比變量的兩種類型:離散型變量——取值為有限個(gè)或列為有限個(gè),如子女?dāng)?shù)連續(xù)型變量——取值為有限或無限區(qū)間內(nèi)的任意實(shí)數(shù),即變量的取值連續(xù),如身高若變量為離散型變量,且取值相對(duì)較少,可以按照定類或定序統(tǒng)計(jì)表方式統(tǒng)計(jì)頻次或百分比。若變量為連續(xù)型變量,則需要將變量值分為若干個(gè)區(qū)間或組,統(tǒng)計(jì)每一個(gè)組內(nèi)的頻次或百分比。數(shù)據(jù)分組時(shí)需要考慮的幾個(gè)問題:

A組數(shù)B組距C組限如何制作分組統(tǒng)計(jì)表1、確定組數(shù):一般調(diào)查總數(shù)N與分組數(shù)有如下經(jīng)驗(yàn)關(guān)系調(diào)查總數(shù)N分組數(shù)K50~1006~10100~2507~12250以上10~202、確定組距:分為等距分組與非等距分組,一般來說為等距分組等距分組組距計(jì)算公式:組距(h)=(最大值-最小值)/組數(shù)斯特格斯(Sturges)經(jīng)驗(yàn)公式確定組數(shù):K=1+3.322lgN3、確定組限:一個(gè)組的最小值叫下限,最大值叫上限各組中心值bi計(jì)算公式4、分組原則:不重復(fù)、不遺漏,組上限不在內(nèi)5、中心值計(jì)算缺上限開口組組中值bi=下限+鄰組組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論