版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、符號(hào)說(shuō)明: 重點(diǎn) 引導(dǎo)語(yǔ) 派生概念或() 派生分析語(yǔ)句第 部分 簡(jiǎn)介與描述性統(tǒng)計(jì)首先提出了1 平均數(shù)(集中趨勢(shì))2 對(duì)變異性的測(cè)量(描述了數(shù)據(jù)是怎樣分布在平均數(shù)附近的)第一章 統(tǒng)計(jì)學(xué)入門 統(tǒng)計(jì) 總體與樣本 統(tǒng)計(jì)的作用: 1 整理和總結(jié)信息,使研究者看出在研究中發(fā)生了什么,并和其他研究者交流結(jié)果。 2 統(tǒng)計(jì)幫助研究者回答了引出研究的普遍問題,它根據(jù)獲得的結(jié)果來(lái)確定結(jié)論是什么。研究開始于一個(gè) 關(guān)于總體的 普遍問題。 為回答這個(gè)問題,研究者研究了一個(gè)樣本 將結(jié)果從樣本推廣到整個(gè)總體。統(tǒng)計(jì) 是指,整理、總結(jié)并解釋信息的一系列數(shù)學(xué)過程??傮w 在一個(gè)特定研究中所有感興趣個(gè)體的集合。 (是研究者希望研究的整
2、個(gè)組。 ) 參數(shù) 用來(lái)描述總體的特性。通常是一個(gè)數(shù)字值。參數(shù)可以從單個(gè)測(cè)量中得到,或從對(duì)總體的一組測(cè)量中推導(dǎo)。 樣本 從一個(gè)總體中選擇出來(lái)的個(gè)體的集合,通常在研究中被期望代表總體。統(tǒng)計(jì)量 用來(lái)描述樣本的特性。 通常是一個(gè)數(shù)字值。統(tǒng)計(jì)量可以從單個(gè)測(cè)量中得到,或從對(duì)樣本的一組測(cè)量中推 導(dǎo)出來(lái)。(通常,每個(gè)總體參數(shù)都與一個(gè)樣本統(tǒng)計(jì)量相對(duì)應(yīng)。 ) 數(shù)據(jù) 從個(gè)體中得到的測(cè)量或觀察(其中測(cè)量、觀察均為名詞。 ) 它通常被稱為一個(gè)分?jǐn)?shù)或原始分?jǐn)?shù)。統(tǒng)計(jì)分為兩類:1 描述性統(tǒng)計(jì) 是用于總結(jié)、組織并簡(jiǎn)化數(shù)據(jù)的統(tǒng)計(jì)過程。 它是一種技術(shù),把原始數(shù)據(jù)組織總結(jié)成更易處理的形式。 (通常被組織成表或圖,或用計(jì)算平均數(shù)的方法
3、總結(jié)一組數(shù)據(jù)。 ) 2 推論性統(tǒng)計(jì) 是先研究樣本,然后將結(jié)果推廣到 樣本來(lái)自的總體 的技術(shù)。 (通常使用樣本統(tǒng)計(jì)量 作為推論總體參數(shù)的基礎(chǔ)。 ) (它通?;卮疬@個(gè)問題: 到底是 1 還是 2 其中 1 是樣本中的結(jié)果差異只是取樣誤差。 2 是 樣板間的教學(xué)差異是由于樣本性質(zhì)(如書中例子中:教學(xué)方法)造成的。樣本只提供了關(guān)于總體的有限信息。 即使樣本可以代表它們來(lái)自的總體, 但我們不期望一 個(gè)樣本可以給出關(guān)于整個(gè)總體的精確描述。通常,在樣本統(tǒng)計(jì)量 和 總體參數(shù)間 存在一些差異,叫取樣誤差。 取樣誤差 存在于樣本統(tǒng)計(jì)量 和總體參數(shù) 間的差異或誤差的數(shù)量。 每個(gè)樣本都包含具有不同性質(zhì)的不同個(gè)體。 由
4、于樣本由不同人組成, 樣本統(tǒng)計(jì)量也從一 個(gè)樣本變化到另一個(gè)。并且沒有一個(gè)樣本統(tǒng)計(jì)量 和 總體參數(shù) 完全一致。取樣誤差的基本理念: 樣本統(tǒng)計(jì)量通常與其相應(yīng)的總體參數(shù)不同,并且根據(jù)樣本的不同而變化。數(shù)據(jù)結(jié)構(gòu)、研究方法與統(tǒng)計(jì)變量 是一種 針對(duì)不同個(gè)體具有不同值的 特性或條件。常量 是一種 不會(huì)變化,且對(duì)每個(gè)個(gè)體都相同的 特性或條件。 相關(guān)法 觀察兩個(gè)變量并確定它們之間是否存在關(guān)系。(2X2 表格數(shù)據(jù)中,對(duì)于每個(gè)個(gè)體,研究者都有兩個(gè)測(cè)量,且所有的測(cè)量都是個(gè)數(shù)。這種表 示個(gè)數(shù)的數(shù)據(jù)的變量之間的關(guān)系,可以用卡方檢驗(yàn)。 )對(duì)兩組或多組測(cè)量來(lái)說(shuō),會(huì)存在其中一個(gè)變量被用來(lái)定義組別。(例如早餐成績(jī)問題, 變量 1
5、吃不吃早餐被用來(lái)定義組, 變量 2 學(xué)習(xí)成績(jī)被用來(lái)得到每個(gè)組 的數(shù)據(jù))并且,如果測(cè)量過程產(chǎn)生數(shù)字值,那么統(tǒng)計(jì)評(píng)估會(huì)包括計(jì)算每組的平均數(shù),并比較它們。 如果測(cè)量過程僅僅將個(gè)體歸入非數(shù)字的類別中,那么統(tǒng)計(jì)評(píng)估常包括計(jì)算每個(gè)組的比例。(例如, 產(chǎn)生數(shù)字值的兒童早餐與成績(jī)問題, 學(xué)習(xí)成績(jī)被用來(lái)計(jì)算平均值。 而城鄉(xiāng)居民的政 策接受研究中,數(shù)字值被用來(lái)計(jì)算比例。 ) 實(shí)驗(yàn)法 操縱一個(gè)變量并觀察或測(cè)量另一個(gè)變量。并且為了建立兩個(gè)變量間的因果關(guān)系,實(shí) 驗(yàn)需要控制所有其他變量,使它們不會(huì)影響結(jié)論。實(shí)驗(yàn)法的兩個(gè)特性:1 操縱: 研究者操縱一個(gè)變量, 將它的值從一個(gè)水平變化到另一水平。 然后觀察或測(cè)量第二 個(gè)變量,
6、來(lái)確定這種操縱是否導(dǎo)致了變化的產(chǎn)生。2 控制:研究者必須控制研究情況,使其他無(wú)用的變量不能影響需要研究的變量關(guān)系。 通常研究者需要考慮的兩種變量:1 被試變量一些特性會(huì) 隨個(gè)體的不同 而變化,如年齡性別和智力。只要實(shí)驗(yàn)是比較兩組個(gè)體的差異, 就必須保證兩組的被試變量完全相同。2 環(huán)境變量通常使用三種技術(shù)控制其他變量:1 隨機(jī)分派 目的是,使每個(gè)被試有相同的機(jī)會(huì)被分派到每個(gè)處理?xiàng)l件中, 以使被試的特性在兩組中均勻分布。2 匹配通過匹配來(lái)保證參與組或環(huán)境的同質(zhì)性。 (如測(cè)量所有被試 IQ 后,將被試匹配地分派到兩組 中,使兩組有基本相等的 IQ)3 將變量控制成常量 例如,只使用 10 歲兒童做被
7、試。實(shí)驗(yàn)法的術(shù)語(yǔ)自變量 被研究者操縱的變量。 (在行為研究中, 自變量通常由被試參與的兩個(gè)或多個(gè)處理?xiàng)l 件組成。) 自變量由 在觀察因變量之前就操縱好的前條件組成。因變量 即被觀察的變量,用于評(píng)估處理 效應(yīng)。(或:被觀察并用來(lái)評(píng)估可能存在操縱效應(yīng) 的變量)在心理學(xué)研究中,因變量通常是經(jīng)過測(cè)量后從每個(gè)被試中得到的數(shù)據(jù)。注意,在實(shí)驗(yàn)法,事實(shí)上只測(cè)量了一個(gè)變量。 (因?yàn)槭遣倏v一個(gè)觀察另一個(gè)) 它和相關(guān)法有本質(zhì)區(qū)別 后者兩個(gè)變量均被測(cè)量,數(shù)據(jù)由每個(gè)個(gè)體的兩個(gè)不同分?jǐn)?shù)組成??刂茥l件與實(shí)驗(yàn)條件通常,實(shí)驗(yàn)將 沒有接受任何處理的被試的分?jǐn)?shù),與接受處理的被試分?jǐn)?shù)進(jìn)行比較。 這是通過 證明處理?xiàng)l件造成的分?jǐn)?shù)與不處
8、理造成的分?jǐn)?shù)的不同,而說(shuō)明存在處理效應(yīng)。 這種研究中,出現(xiàn)了:1 控制條件 指?jìng)€(gè)體不接受實(shí)驗(yàn)處理。 或者不接受處理,或者接受中性或安慰劑性處理。 控制條件的目的是提供與實(shí)驗(yàn)條件相比較的基準(zhǔn)。2 實(shí)驗(yàn)條件 指?jìng)€(gè)體接受實(shí)驗(yàn)處理。注意:自變量通常由至少兩個(gè)值組成。 (因?yàn)橹辽賾?yīng)有兩個(gè)值才能稱為變量) 有的實(shí)驗(yàn),自變量是簡(jiǎn)單的數(shù)值。由實(shí)驗(yàn)組和控制組組成的實(shí)驗(yàn),自變量應(yīng)該是處理與非處理。非實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)法準(zhǔn)自變量 是指在非實(shí)驗(yàn)中那些決定了組別的變量。在非實(shí)驗(yàn)中僅僅對(duì)兩個(gè)組進(jìn)行比較,但這兩組卻不是通過操縱自變量所得到 通常是 由被試變量或時(shí)間變量(如處理前與處理后)決定。p17 的兩個(gè)例子,均是無(wú)法操縱變量
9、 1(可視為準(zhǔn)自變量,準(zhǔn)在它為改變因變量而生,卻無(wú) 法被操縱),這種變量 1 叫做準(zhǔn)自變量。分割線開始 對(duì)于例子 2 的 “研究者無(wú)法操縱時(shí)間 ”,這里有兩個(gè)問題:1 為什么它這樣說(shuō), “無(wú)法操縱時(shí)間,但是用它來(lái)劃分兩組數(shù)據(jù) ” 這里面其實(shí)強(qiáng)調(diào)了兩個(gè)因果關(guān)系,即:a)如果這是一個(gè)實(shí)驗(yàn),那么自變量一定為研究者所操縱。 b)如果一個(gè)變量是一個(gè)實(shí)驗(yàn)里的自變量, 那么 “分組 ”這個(gè)過程一定是由操縱自變量造成的。 (因?yàn)樽宰兞客ǔS杀辉噮⑴c的處理?xiàng)l件組成,而處理?xiàng)l件決定了分組。 ) 所以才有這種暗含因果關(guān)系的用詞 “但是用它 ”。2 為什么這是個(gè)非實(shí)驗(yàn) 因?yàn)檫@個(gè)實(shí)驗(yàn)的分組是源于時(shí)間變量 治療前治療后是
10、兩個(gè)時(shí)間點(diǎn), 而它并沒有得到研究 者的操縱。如果是對(duì)時(shí)間操縱后才導(dǎo)致這種分組, 才能說(shuō)時(shí)間是實(shí)驗(yàn)的自變量, 而這個(gè)實(shí)驗(yàn)才能是實(shí)驗(yàn)。 注:切莫糾結(jié)于, 為什么說(shuō)它沒有操縱時(shí)間這種思維是在假定了時(shí)間是此實(shí)驗(yàn)的自變 量導(dǎo)致的,而時(shí)間僅僅是導(dǎo)致分組的原因,只能稱為準(zhǔn)自變量。分割線結(jié)束 變量與測(cè)量有些變量?jī)H僅是假設(shè)出來(lái)的概念(即構(gòu)念)從而無(wú)法直接觀察,對(duì)它們的研究需要測(cè)量。 構(gòu)念 是內(nèi)部屬性或特性,它不能被直接觀察到,但可以描述并解釋行為。操作定義 是一個(gè)測(cè)量過程。它測(cè)量了外部行為,并 使用測(cè)量結(jié)果作為定義 和對(duì)假設(shè)的構(gòu) 念的測(cè)量。操作定義有兩個(gè)部分 1 描述了一系列測(cè)量構(gòu)念的操作; 2 用測(cè)量結(jié)果定義
11、了構(gòu)念。根據(jù)變量值的類型,分為兩種變量:1 離散變量 由不同的、不可分割的類別組成。在兩個(gè)相鄰類別之間不存在其他值。 它們通常限于整數(shù)。2 連續(xù)變量在任意兩個(gè)觀察到的值之間都存在無(wú)限多個(gè)可能的值。 一個(gè)連續(xù)變量可以被分割成無(wú)限個(gè)小 數(shù)部分。連續(xù)變量的兩個(gè)因素1)兩個(gè)不同個(gè)體很少會(huì)得到完全一樣的測(cè)量。若有,可以合理懷疑測(cè)量過程過于粗糙,或 變量可能不是真的連續(xù)的。2)測(cè)量連續(xù)變量時(shí),每個(gè)測(cè)量類別實(shí)際上都是一個(gè)區(qū)間,需要用邊界來(lái)定義。 一個(gè)數(shù)值其實(shí)是一個(gè)區(qū)間,而非量表上一個(gè)點(diǎn)。在量表上對(duì)其設(shè)定邊界,有以下概念:實(shí)限 指一條連續(xù)數(shù)據(jù)線上數(shù)值組成的區(qū)間的界限。將兩個(gè)相鄰數(shù)值分開的實(shí)限恰好位于兩 個(gè)數(shù)值
12、的中點(diǎn)。每個(gè)數(shù)值都有兩個(gè)實(shí)限:上實(shí)限和下實(shí)限。收集數(shù)據(jù)需要測(cè)量觀察。 而測(cè)量包括將事物分類(定性測(cè)量)和使用數(shù)字描述事物大小(定量測(cè)量) 。 介紹四種測(cè)量量表:1 稱名量表 由一系列具有不同名稱的類別組成。 稱名量表的測(cè)量將觀察的對(duì)象分類并貼標(biāo)簽,但不對(duì)觀察做任何定量的區(qū)分。 (稱名量表的類別不是量化值, 但它可以用數(shù)字代表, 并依然不能代表任何量化差異。 如房 間 100 和房間 109 這條信息無(wú)法得出任何量化結(jié)論。 )2 順序量表由一組 按順序排列的類別 組成。順序量表的測(cè)量將觀察對(duì)象按大小排序。 例如,類別可以是大中小,但不能是1cm2cm3cm 。類別組成了序列這個(gè)事實(shí)意味著在類別間
13、存在方向性。 可以用順序量表的測(cè)量, 來(lái)確定 兩個(gè)個(gè)體是否不同并確定差異的方向,但無(wú)法確定兩個(gè)個(gè)體間的差異大小。等距量表和等比量表它們都由一系列排序的類別組成,并且這些類別組成了一系列相同大小的區(qū)間。大小相同的區(qū)間,代表可以利用此量表來(lái)確定兩個(gè)測(cè)量間的差異的大小和方向。 它們的區(qū)別在于零點(diǎn)的性質(zhì)。3 等距量表 由排序的類別組成,這些類別都是完全相同大小的區(qū)間。等距量表具有隨意的零點(diǎn),并且零值不代表被測(cè)量的變量不存在。 在等距量表中,量表數(shù)字間的差異等價(jià)于量的差異,但大小的比例沒有意義。4 等比量表 是一種等距量表。它有一個(gè)絕對(duì)零值,代表沒有測(cè)量的變量。 等比量表絕對(duì)的、非任意的零點(diǎn),使我們可以
14、測(cè)量變量的絕對(duì)值。 等比量表中數(shù)字的比例可以反映量上的比例。關(guān)于判斷是等距還是等比(自推) :1 等距量表的零點(diǎn)沒有意義, 等比量表的零點(diǎn)則代表了一個(gè) “沒有測(cè)量 ”的變量 (我把測(cè)量視 為名詞,大約代表 “值 ”)。所以等距的零點(diǎn)才能隨便換,且只為衡量測(cè)量值的差值。 SAT就是一個(gè)等距量表,因?yàn)榱阒凳菫楹饬繙y(cè)量值之差而存在。 每個(gè)人的感冒次數(shù)則是等比量表,因?yàn)榱阒涤幸饬x且不能變動(dòng)。因此: 2 等距量表的重點(diǎn)在于測(cè)量之間的差值,等比量表則是比例。 例如 SAT測(cè)試就是等距量表,重點(diǎn)在于測(cè)量間的差值而非比例。(并不排除等比量表中測(cè)量間差值的意義,但由于等比本也是等距,因此舍棄比例并無(wú)意 義。)統(tǒng)
15、計(jì)符號(hào)分?jǐn)?shù) 指研究中對(duì)因變量的觀察后得到的每個(gè)被試的值。原始分?jǐn)?shù) 指研究中最初得到的、沒有改變過的一組數(shù)據(jù)。 特定變量的值用 X 表示。(注意: X又叫一個(gè)量表,可視為是一類數(shù)據(jù)之意。在 p48 圖上三行有明確的表達(dá))第二章 頻數(shù)分布概述原始數(shù)據(jù)通常不會(huì)顯示任何明顯的模式。研究者依靠描述性統(tǒng)計(jì)來(lái)總結(jié)和組織他們的結(jié) 果,使得當(dāng)真的存在某些模式時(shí),它們更易被發(fā)現(xiàn)。描述性統(tǒng)計(jì)的任務(wù):簡(jiǎn)化結(jié)構(gòu)并整理組織數(shù)據(jù)。 最常用過程是將數(shù)據(jù)放入一個(gè)頻數(shù)分布。頻數(shù)分布 是一種組織好的關(guān)于位于測(cè)量量表每個(gè)類別上的個(gè)體數(shù)目的數(shù)據(jù)表。 頻數(shù)分布顯示了個(gè)體得分在測(cè)量量表上的分布情況頻數(shù)分布可以是表或圖,但均有如下兩個(gè)相同因
16、素:1 組成最初測(cè)量量表的類別2 頻數(shù)的記錄(每個(gè)類別中的個(gè)體數(shù)目)頻數(shù)分布表頻數(shù)分布表的特點(diǎn):1 表中的第一列,列出了所有可能的值,即使此類別的頻數(shù)為0。對(duì)于順序、等距、等比量表,類別被按從高到低的順序排列。對(duì)于稱名量表,類別可以按任意順序排列。2 第二列記錄每個(gè)數(shù)值的頻數(shù)。3 第一列的值 (如 X)指的是測(cè)量量表, 并非真實(shí)數(shù)據(jù)。 比如 X=5 但此類別的個(gè)體并不存在。4 頻數(shù)可以用于求出分布中的數(shù)據(jù)個(gè)數(shù)。將頻數(shù)相加可以得到個(gè)體個(gè)數(shù)的總和。除了頻數(shù)分布的兩個(gè)基本列之外,還有其他描述數(shù)據(jù)分布的測(cè)量。 最常用的是比例和百分率。比例 用 p 表示。 p=f/N 。 百分率 %=p( 100) =
17、f/N (100) 由于比例 p 描述了頻數(shù)( f)和數(shù)據(jù)數(shù)目( N )的關(guān)系,故比例又可稱為相對(duì)頻數(shù)。 比例通常表示為小數(shù)。當(dāng)一個(gè)數(shù)據(jù)組涵蓋范圍過大時(shí),為了不必列出所有數(shù)據(jù),可以使用如下辦法: 分組頻數(shù)分布表 將數(shù)據(jù)分成區(qū)間組,然后將區(qū)間列在表中,用區(qū)間代替每個(gè)數(shù)據(jù)。這里的組(即區(qū)間) ,叫組距。 它有四個(gè)規(guī)則:1)應(yīng)該具有大約 10 個(gè)組距。只是大約。2)每個(gè)區(qū)間的寬度應(yīng)為相對(duì)簡(jiǎn)單的數(shù)字。特別的,5 和 10 可以簡(jiǎn)化計(jì)算。3)每個(gè)組距的最小數(shù)值應(yīng)為寬度的倍數(shù)。如以10 為區(qū)間寬度,則這些區(qū)間應(yīng)從 20, 30 等開始。4)所有區(qū)間應(yīng)有相同寬度。 它們應(yīng)當(dāng)無(wú)間斷無(wú)重復(fù)涵蓋 所有數(shù)值, 使任
18、意特定數(shù)值恰好只 屬于一個(gè)區(qū)間。在分組頻率分布表中,頻數(shù)是對(duì)組距的描述,即這個(gè)組距的頻數(shù)為f=xxx。并且, 當(dāng)分?jǐn)?shù)被放入一個(gè)分組表后, 會(huì)失去關(guān)于特定分?jǐn)?shù)值的信息。 通常組距越寬失去的信 息越多。當(dāng)測(cè)量一個(gè)連續(xù)變量時(shí),得到的測(cè)量對(duì)應(yīng)的是線上的區(qū)間,而不是單個(gè)的點(diǎn)。 例如一個(gè)連續(xù)變量的 X=8的頻數(shù) f=3,其實(shí)是代表有 3個(gè)數(shù)在 之間。 同樣的,頻數(shù)分布表中也存在實(shí)限概念。表面界限 比如 4049 的組距中, 40 和 49 為區(qū)間的表面界限。 但是這個(gè)區(qū)間的實(shí)限則是 40 的下實(shí)限和 49 的上實(shí)限, 即:這個(gè)組距的實(shí)限是和。并且組距的兩實(shí)限間的距離,就是區(qū)間的寬度。 每?jī)蓚€(gè)組距會(huì)在實(shí)限處
19、交匯,因此量表中沒有中斷。注意,回答 “該組距的值域 ”時(shí),需要回答出表面界限和實(shí)限。 分布表中最后一個(gè)區(qū)間是最小的區(qū)間。因?yàn)椤霸陧樞?、等距、等比量表中,類別被按順序排列通常是由高到低 ”。頻數(shù)分布圖對(duì)于用 稱名量表或順序量表 測(cè)量的數(shù)據(jù),用柱形圖。 對(duì)于用 等距或等比量表 測(cè)量的數(shù)據(jù),有兩種圖。1 直方圖首先將數(shù)字(測(cè)量類別)沿 X 軸列出,然后畫出位于每個(gè) X值上的一個(gè)矩形,使得:a. 矩形的高度對(duì)應(yīng)每個(gè)類別的頻數(shù)b. 矩形的寬度為每個(gè)類別的實(shí)限。 另外,修正的直方圖中,頻數(shù)用方塊代替,故不再需要顯示頻數(shù)的 Y 軸??偨Y(jié)(自推) : 注意 p39 圖的組距畫法。第一個(gè)矩形寬架設(shè)在至之間,
20、把刻度標(biāo)在中點(diǎn)上。即恰好代表了組距1。對(duì)于圖, 7578組和 8184 組之間沒有空隙,是為了看齊分組頻數(shù)分布表的 “無(wú)縫 ”。 它說(shuō)明 7881 組之間沒有數(shù)據(jù) 這是組距的寬度決定的現(xiàn)象。2 折線圖 首先將數(shù)字(測(cè)量類別)沿著 X 軸列出,然后1)每個(gè)坐標(biāo)的中心上方有一個(gè)點(diǎn),它的垂直位置對(duì)應(yīng)這一類別的頻數(shù)。2)點(diǎn)和點(diǎn)之間的連續(xù)線段將這一系列點(diǎn)連在一起3)最后,在分?jǐn)?shù)全距(看坐標(biāo)系內(nèi),別看軸)的兩端各畫一條直線與X 軸相交(其實(shí)是零點(diǎn)和 X 最大值那點(diǎn),看圖) 對(duì)于一個(gè)分組分布,可以將每個(gè)點(diǎn)直接畫在組距的中點(diǎn)處(中點(diǎn)為區(qū)間兩實(shí)限的平均值) 。對(duì)于總體分布的頻數(shù)分布圖 由于其個(gè)體數(shù)過大,這種圖有
21、兩個(gè)特點(diǎn):1 相對(duì)頻數(shù) 在圖中(可視為柱形圖)只有分組( X 軸)和相對(duì)頻數(shù)( Y 軸),沒有顯示絕對(duì)數(shù)目。2 平滑曲線 當(dāng)一個(gè)總體由 等比量表 的數(shù)字分?jǐn)?shù)構(gòu)成時(shí), 常用平滑曲線代替直方圖或折線圖的階梯或鋸 齒狀。平滑曲線并非是將一系列點(diǎn) (真實(shí)頻數(shù)) 連在一起, 而是展示從一個(gè)分?jǐn)?shù)到另一個(gè)分?jǐn)?shù)的相 對(duì)變化。頻數(shù)分布的形狀完整描述任意分布, 有三種特性:形狀、集中趨勢(shì)和變異性 集中趨勢(shì) 指分布中心的位置變異性 指數(shù)據(jù)是分散在廣大區(qū)域還是集中在一起 形狀 理論上分布的形狀被定義為一個(gè)方程。 而大部分分布的形狀是:1 對(duì)稱分布 可以通過中心畫一條垂直線使分布的一側(cè)為另一側(cè)的鏡像2 偏態(tài)分布 分?jǐn)?shù)傾
22、向于堆積在量表的一端并向另一端逐漸變細(xì) 另:尾 指分?jǐn)?shù)逐漸向分布一段變細(xì)的部位 a)正偏態(tài)分布:尾在右側(cè)的偏態(tài)分布(即尾指向X 軸正方向)b)負(fù)偏態(tài)分布:尾在左側(cè)的偏態(tài)分布(即尾指向X 軸負(fù)方向)百分位數(shù)、百分等級(jí)和內(nèi)插法 頻數(shù)分布除了描述整組數(shù)據(jù),也可以用來(lái)描述整組數(shù)據(jù)中的個(gè)體位置。 原始分?jǐn)?shù) 個(gè)體分?jǐn)?shù)或 X 值。原始分?jǐn)?shù)本身不能提供個(gè)體位置。 其中一個(gè)變化是 將原始分?jǐn)?shù)轉(zhuǎn)化為百分位數(shù)。注意:可見,百分位數(shù)就是原始分?jǐn)?shù)的一個(gè)變化。1 一個(gè)特定分?jǐn)?shù)的等級(jí)(百分等級(jí)) 指在分布中低于或等于該特定分?jǐn)?shù)的個(gè)體的百分率。 等級(jí)一定是一個(gè)百分率。 例如,全班有 60%的人分?jǐn)?shù)在 43 以下,那么分?jǐn)?shù) X
23、=43 具有百分等級(jí) 60%。2 百分位數(shù)當(dāng)一個(gè)分?jǐn)?shù)被它的百分等級(jí)確定后,這個(gè)分?jǐn)?shù)就叫百分位數(shù)。 它依然是一個(gè)原始分?jǐn)?shù)。 如上例, X=43 可以被稱為第 60 個(gè)百分位數(shù)。在頻數(shù)分布表中,為了確定百分位數(shù)或百分等級(jí): 累積頻數(shù)( cf) 計(jì)算量表中位于或低于每個(gè)類別的個(gè)體數(shù)目。因?yàn)樗鼈儽硎玖搜刂勘硐蛏蠒r(shí)積累的個(gè)體個(gè)數(shù)。 (累積頻數(shù)顯示了處于或低于每個(gè)分?jǐn)?shù)的個(gè)體個(gè)數(shù)。 ) 累積百分率( c%) 將累積頻數(shù)轉(zhuǎn)化成百分率 因?yàn)樗鼈冿@示了沿著量表向上時(shí)的累積的個(gè)體百分率。注意,頻數(shù)分布表中的 X 值仍是區(qū)間,并非一個(gè)個(gè)點(diǎn)。 所以,當(dāng) X=2的 cf=2,c%=10%時(shí),指的是: 在達(dá)到區(qū)間 X=2
24、的上限前積累了 2 個(gè),且占 10%。內(nèi)插法 具體步驟略 注意:內(nèi)插法的基本假定是,一個(gè)區(qū)間從一端到另一端的變化是正常的線性變化。莖葉圖略第三章 集中趨勢(shì)集中趨勢(shì) 是一個(gè)統(tǒng)計(jì)測(cè)量,它確定了 能夠代表分布中心的 一個(gè)數(shù)值。集中趨勢(shì)的目的 找到最典型或最能代表整個(gè)組 的單個(gè)數(shù)值即 確認(rèn)每一個(gè)分布的 “中心 ”或 “最具代表性的數(shù)值 ”。) 集中趨勢(shì)描述了一個(gè)大型總體的典型特征,使得大量數(shù)據(jù)更容易被理解。 )三種測(cè)量集中趨勢(shì)的方法:1 平均數(shù) 也叫算數(shù)平均數(shù),是將分布中的所有數(shù)據(jù)相加并除以數(shù)據(jù)的個(gè)數(shù)得到的。一個(gè)總體的平均數(shù)用 表示,一個(gè)樣本的平均數(shù)用 M 表示。(通常,使用希臘字母代表總體的特性,用
25、英文字母代表一個(gè)樣本的特性。 )我們經(jīng)常需要將兩組數(shù)據(jù)組合,并找出合并組的整體平均數(shù)。 整體平均數(shù)并非原先兩個(gè)樣本的平均數(shù)中心。 由于兩個(gè)樣本大小不同, 其中一個(gè)對(duì)整體組做 出了更大貢獻(xiàn)。因此,決定整體平均數(shù)時(shí)占了更大權(quán)數(shù)。因此,整體平均數(shù)也叫加權(quán)平均數(shù)。 加權(quán)平均數(shù) 等于 數(shù)據(jù)總和 / 數(shù)據(jù)個(gè)數(shù)。2 中數(shù) 中數(shù) 是恰好將一個(gè)分布一分為二的數(shù)值。這個(gè)值也相當(dāng)于第 50 個(gè)百分位數(shù) (中數(shù)不存在特殊符號(hào)和記號(hào),對(duì)于樣本和總體來(lái)說(shuō),中數(shù)的定義和計(jì)算相同。 ) (在圖形中,中數(shù)恰好將圖形的面積分成兩部分。 )3 眾數(shù)眾數(shù) 是具有最大頻率的 分?jǐn)?shù)或類別 眾數(shù)可以用于確認(rèn)任何測(cè)量量表的典型值或平均值,包
26、括稱名量表。 眾數(shù)是一個(gè)分?jǐn)?shù)或一個(gè)類別。但絕不是頻數(shù)。一個(gè)分布只有一個(gè)平均數(shù),一個(gè)中數(shù)。但它可能有一個(gè)眾數(shù)、多個(gè)眾數(shù),或沒有眾數(shù)。 具有兩個(gè)眾數(shù)的分布被稱為雙峰分布,具有多于兩個(gè)眾數(shù)的分布為多峰分布。 有時(shí),具有數(shù)個(gè)等高點(diǎn)的分布叫無(wú)眾數(shù)。(通常雙峰分布說(shuō)明在同一個(gè)總體或樣本里,存在兩個(gè)不同的、有區(qū)別的個(gè)體組。 ) 通常,眾數(shù)是具有絕對(duì)最高頻數(shù)的數(shù)值。但有時(shí)也表示具有相對(duì)高頻數(shù)的值。此時(shí)這個(gè)分布有兩個(gè)不同的峰值,每一個(gè)值都是這個(gè)分布的眾數(shù)。 較高的叫主要眾數(shù),較矮的叫次要眾數(shù)。選擇一種最適合的集中趨勢(shì)測(cè)量1 平均數(shù) 優(yōu)點(diǎn):用到了分布中的每個(gè)數(shù)值,通常具有很好的代表性。與最常見的變異性測(cè)量有緊密聯(lián)
27、系(如平均數(shù)和方差等) 缺點(diǎn):極易受極端值影響而位移,而不能較好代表整個(gè)分布。2 中數(shù)1)極端數(shù)值和偏態(tài)分布 中樞不易受極端值影響。 即使極端值再變大,中數(shù)也不會(huì)因此改變。2)未確定數(shù)值 比如有一個(gè)被試從未完成實(shí)驗(yàn),只好1 小時(shí)后停止實(shí)驗(yàn),其時(shí)間則無(wú)法確定。注意:對(duì)于未確定數(shù)值第一, 不能不要這個(gè)數(shù)值。 因?yàn)槭褂脴颖镜哪康氖前盐湛傮w, 這個(gè)數(shù)據(jù)告訴我們有一部分總 體不能解決問題。第二,不能記錄為 60 分鐘。要記錄的是完成所需時(shí)間,個(gè)體從未完成任務(wù),則無(wú)法記錄。 綜上所述,存在未確定數(shù)值則無(wú)法計(jì)算平均值。我們選擇中數(shù)。3)尾端開放式分布指 一個(gè)分布的類別 沒有上限和下限。例如孩子的個(gè)數(shù)量表中,
28、存在類別 “5或更多 ”。 這樣就無(wú)法計(jì)算 X,更無(wú)法計(jì)算平均數(shù)。4)順序量表注意: 由于平均數(shù)是 根據(jù)距離 來(lái)定義集中趨勢(shì), 而中數(shù)是用方向定義的 一半分?jǐn)?shù)大 于中數(shù),一半小于中數(shù) 因此不能用平均數(shù),而用中數(shù)來(lái)報(bào)告順序量表的平均數(shù)。3 眾數(shù)1)稱名量表 因?yàn)榉Q名量表不能測(cè)量數(shù)量,因此不能計(jì)算平均值和中數(shù)。2)離散變量3)描述形狀 在一個(gè)頻數(shù)分布圖中,眾數(shù)表示了高峰的位置。集中趨勢(shì)和分布形狀1 對(duì)稱分布 一個(gè)對(duì)稱的單峰分布:平均數(shù)、中數(shù)、眾數(shù)重合于中點(diǎn)。 一個(gè)對(duì)稱的雙峰分布:平均數(shù)和中數(shù)處于中點(diǎn),眾數(shù)位于兩側(cè)。2 偏態(tài)分布正偏態(tài)分布:從左到右為 眾數(shù),中數(shù),平均數(shù) 負(fù)偏態(tài)分布:從左到右為 平均
29、數(shù),中數(shù),眾數(shù)第四章 變異性 變異性: 提供了 對(duì)一個(gè)分布中的數(shù)據(jù) 分散程度或聚集程度 的數(shù)量測(cè)量。 測(cè)量變異性的目的:獲得分?jǐn)?shù)在分布中的離散型的客觀測(cè)量一個(gè)好的變異性的目的:1 描述了分布。 (表示了數(shù)據(jù)是否聚集在一起 或分布在較大區(qū)域內(nèi)。 ) 通常變異性是根據(jù)距離定義的。2 測(cè)量了單個(gè)或一組數(shù)據(jù)能否很好地代表整個(gè)分布。3 提供了在使用一個(gè)樣本代表總體時(shí) 預(yù)期誤差值的信息全距和四分位距全距 Xmax 的上實(shí)限( URL)和 Xmin 的下實(shí)限( LRL)的差值。四分位距 被分布的中間 50%所覆蓋的距離。等于 Q3-Q1。其中 Q1Q3 為第一四分位數(shù)和第三四分位數(shù),指分布最低的25%和分布
30、最高的 25%與其余值分隔開的界限(是一個(gè)界限) 。一般會(huì)把它轉(zhuǎn)換為半四分位距,它測(cè)量了從分布中心到50%的分布邊界的距離。由于它始于分布中央的 50%,因此不易受極端值影響。但它不能考慮單個(gè)數(shù)據(jù)間的真實(shí)距離,不能給出數(shù)據(jù)如何分散或聚集的全景??傮w的標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差 離差的平方和除以總體大?。ɑ驑颖镜淖杂啥龋┑乃銛?shù)平方根。 標(biāo)準(zhǔn)差的目的:對(duì)分?jǐn)?shù)到平均數(shù)的標(biāo)準(zhǔn)距離的測(cè)量。標(biāo)準(zhǔn)差推導(dǎo)過程里的中間量1)離差)離差 是每個(gè)數(shù)與平均數(shù)之間的距離。并且有正負(fù)。數(shù)據(jù)的離差總和為零。 這也是標(biāo)準(zhǔn)差計(jì)算需要將離差平方的原因 引入離差的平方,使得對(duì)變異性的測(cè)量基于距離的平方之上。結(jié)果:給每個(gè)數(shù)據(jù)增減一個(gè)常量,標(biāo)準(zhǔn)差不變。 給每個(gè)數(shù)據(jù)增減一個(gè)倍數(shù),標(biāo)準(zhǔn)差依同樣倍數(shù)增減。2)方差 是離差平方和除以總體大?。ɑ驑颖咀杂啥龋┑纳?。對(duì)標(biāo)準(zhǔn)差的解析1)估計(jì) 對(duì)于一個(gè)分布,標(biāo)準(zhǔn)差的范圍在( a, b)區(qū)間。其中 a,b 分別為距平均數(shù)最近和最遠(yuǎn)的數(shù) 據(jù)與平均數(shù)的距離。大約在( a+b)/2 處。2)圖示 標(biāo)準(zhǔn)差線大約為從平均數(shù)到最極端值的一半3)計(jì)算公式 標(biāo)準(zhǔn)差和方差在概念上,對(duì)于總體和樣本完全相同。對(duì)于總體:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文物古建培訓(xùn)課程設(shè)計(jì)
- 小班科學(xué)探索類課程設(shè)計(jì)
- 完全最短路徑課程設(shè)計(jì)
- 材料力學(xué)課程設(shè)計(jì)
- 機(jī)械cad課程設(shè)計(jì)小結(jié)
- 打造業(yè)務(wù)團(tuán)隊(duì)課程設(shè)計(jì)
- 無(wú)人化物流課程設(shè)計(jì)
- 小班風(fēng)車線上課程設(shè)計(jì)
- 2024年版專業(yè)幼兒園保育員勞務(wù)協(xié)議范本版
- 幼兒足球游戲化課程設(shè)計(jì)
- 既有線換枕施工方案
- 2024版【教科版】小學(xué)綜合實(shí)踐活動(dòng)四年級(jí)上冊(cè)教案
- 小學(xué)英語(yǔ)試卷分析存在問題及整改措施4篇
- 計(jì)算機(jī)應(yīng)用基礎(chǔ)練習(xí)題庫(kù)(含答案)
- 初中語(yǔ)文2024屆中考修改病句選擇題練習(xí)(共15道-附參考答案和解析)
- 小學(xué)英語(yǔ)單詞大全打印
- 2024年信息技術(shù)基礎(chǔ)考試復(fù)習(xí)題庫(kù)(含答案)
- 《單片機(jī)項(xiàng)目化教程(C語(yǔ)言版)(第2版)》全套教學(xué)課件
- GB/T 44360-2024風(fēng)能發(fā)電系統(tǒng)智能風(fēng)力發(fā)電場(chǎng)數(shù)據(jù)采集技術(shù)規(guī)范
- 雅馬哈RX-V365使用說(shuō)明書
- 陽(yáng)光食品APP培訓(xùn)考核題庫(kù)(含答案)食品生產(chǎn)企業(yè)端
評(píng)論
0/150
提交評(píng)論