![行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/13/b7c08f63-7d8c-4b7a-a234-6654d3671692/b7c08f63-7d8c-4b7a-a234-6654d36716921.gif)
![行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/13/b7c08f63-7d8c-4b7a-a234-6654d3671692/b7c08f63-7d8c-4b7a-a234-6654d36716922.gif)
![行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/13/b7c08f63-7d8c-4b7a-a234-6654d3671692/b7c08f63-7d8c-4b7a-a234-6654d36716923.gif)
![行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/13/b7c08f63-7d8c-4b7a-a234-6654d3671692/b7c08f63-7d8c-4b7a-a234-6654d36716924.gif)
![行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-6/13/b7c08f63-7d8c-4b7a-a234-6654d3671692/b7c08f63-7d8c-4b7a-a234-6654d36716925.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、符號說明: 重點(diǎn) 引導(dǎo)語 派生概念或() 派生分析語句第 部分 簡介與描述性統(tǒng)計(jì)首先提出了1 平均數(shù)(集中趨勢)2 對變異性的測量(描述了數(shù)據(jù)是怎樣分布在平均數(shù)附近的)第一章 統(tǒng)計(jì)學(xué)入門 統(tǒng)計(jì) 總體與樣本 統(tǒng)計(jì)的作用: 1 整理和總結(jié)信息,使研究者看出在研究中發(fā)生了什么,并和其他研究者交流結(jié)果。 2 統(tǒng)計(jì)幫助研究者回答了引出研究的普遍問題,它根據(jù)獲得的結(jié)果來確定結(jié)論是什么。研究開始于一個 關(guān)于總體的 普遍問題。 為回答這個問題,研究者研究了一個樣本 將結(jié)果從樣本推廣到整個總體。統(tǒng)計(jì) 是指,整理、總結(jié)并解釋信息的一系列數(shù)學(xué)過程。總體 在一個特定研究中所有感興趣個體的集合。 (是研究者希望研究的整
2、個組。 ) 參數(shù) 用來描述總體的特性。通常是一個數(shù)字值。參數(shù)可以從單個測量中得到,或從對總體的一組測量中推導(dǎo)。 樣本 從一個總體中選擇出來的個體的集合,通常在研究中被期望代表總體。統(tǒng)計(jì)量 用來描述樣本的特性。 通常是一個數(shù)字值。統(tǒng)計(jì)量可以從單個測量中得到,或從對樣本的一組測量中推 導(dǎo)出來。(通常,每個總體參數(shù)都與一個樣本統(tǒng)計(jì)量相對應(yīng)。 ) 數(shù)據(jù) 從個體中得到的測量或觀察(其中測量、觀察均為名詞。 ) 它通常被稱為一個分?jǐn)?shù)或原始分?jǐn)?shù)。統(tǒng)計(jì)分為兩類:1 描述性統(tǒng)計(jì) 是用于總結(jié)、組織并簡化數(shù)據(jù)的統(tǒng)計(jì)過程。 它是一種技術(shù),把原始數(shù)據(jù)組織總結(jié)成更易處理的形式。 (通常被組織成表或圖,或用計(jì)算平均數(shù)的方法
3、總結(jié)一組數(shù)據(jù)。 ) 2 推論性統(tǒng)計(jì) 是先研究樣本,然后將結(jié)果推廣到 樣本來自的總體 的技術(shù)。 (通常使用樣本統(tǒng)計(jì)量 作為推論總體參數(shù)的基礎(chǔ)。 ) (它通常回答這個問題: 到底是 1 還是 2 其中 1 是樣本中的結(jié)果差異只是取樣誤差。 2 是 樣板間的教學(xué)差異是由于樣本性質(zhì)(如書中例子中:教學(xué)方法)造成的。樣本只提供了關(guān)于總體的有限信息。 即使樣本可以代表它們來自的總體, 但我們不期望一 個樣本可以給出關(guān)于整個總體的精確描述。通常,在樣本統(tǒng)計(jì)量 和 總體參數(shù)間 存在一些差異,叫取樣誤差。 取樣誤差 存在于樣本統(tǒng)計(jì)量 和總體參數(shù) 間的差異或誤差的數(shù)量。 每個樣本都包含具有不同性質(zhì)的不同個體。 由
4、于樣本由不同人組成, 樣本統(tǒng)計(jì)量也從一 個樣本變化到另一個。并且沒有一個樣本統(tǒng)計(jì)量 和 總體參數(shù) 完全一致。取樣誤差的基本理念: 樣本統(tǒng)計(jì)量通常與其相應(yīng)的總體參數(shù)不同,并且根據(jù)樣本的不同而變化。數(shù)據(jù)結(jié)構(gòu)、研究方法與統(tǒng)計(jì)變量 是一種 針對不同個體具有不同值的 特性或條件。常量 是一種 不會變化,且對每個個體都相同的 特性或條件。 相關(guān)法 觀察兩個變量并確定它們之間是否存在關(guān)系。(2X2 表格數(shù)據(jù)中,對于每個個體,研究者都有兩個測量,且所有的測量都是個數(shù)。這種表 示個數(shù)的數(shù)據(jù)的變量之間的關(guān)系,可以用卡方檢驗(yàn)。 )對兩組或多組測量來說,會存在其中一個變量被用來定義組別。(例如早餐成績問題, 變量 1
5、吃不吃早餐被用來定義組, 變量 2 學(xué)習(xí)成績被用來得到每個組 的數(shù)據(jù))并且,如果測量過程產(chǎn)生數(shù)字值,那么統(tǒng)計(jì)評估會包括計(jì)算每組的平均數(shù),并比較它們。 如果測量過程僅僅將個體歸入非數(shù)字的類別中,那么統(tǒng)計(jì)評估常包括計(jì)算每個組的比例。(例如, 產(chǎn)生數(shù)字值的兒童早餐與成績問題, 學(xué)習(xí)成績被用來計(jì)算平均值。 而城鄉(xiāng)居民的政 策接受研究中,數(shù)字值被用來計(jì)算比例。 ) 實(shí)驗(yàn)法 操縱一個變量并觀察或測量另一個變量。并且為了建立兩個變量間的因果關(guān)系,實(shí) 驗(yàn)需要控制所有其他變量,使它們不會影響結(jié)論。實(shí)驗(yàn)法的兩個特性:1 操縱: 研究者操縱一個變量, 將它的值從一個水平變化到另一水平。 然后觀察或測量第二 個變量,
6、來確定這種操縱是否導(dǎo)致了變化的產(chǎn)生。2 控制:研究者必須控制研究情況,使其他無用的變量不能影響需要研究的變量關(guān)系。 通常研究者需要考慮的兩種變量:1 被試變量一些特性會 隨個體的不同 而變化,如年齡性別和智力。只要實(shí)驗(yàn)是比較兩組個體的差異, 就必須保證兩組的被試變量完全相同。2 環(huán)境變量通常使用三種技術(shù)控制其他變量:1 隨機(jī)分派 目的是,使每個被試有相同的機(jī)會被分派到每個處理?xiàng)l件中, 以使被試的特性在兩組中均勻分布。2 匹配通過匹配來保證參與組或環(huán)境的同質(zhì)性。 (如測量所有被試 IQ 后,將被試匹配地分派到兩組 中,使兩組有基本相等的 IQ)3 將變量控制成常量 例如,只使用 10 歲兒童做被
7、試。實(shí)驗(yàn)法的術(shù)語自變量 被研究者操縱的變量。 (在行為研究中, 自變量通常由被試參與的兩個或多個處理?xiàng)l 件組成。) 自變量由 在觀察因變量之前就操縱好的前條件組成。因變量 即被觀察的變量,用于評估處理 效應(yīng)。(或:被觀察并用來評估可能存在操縱效應(yīng) 的變量)在心理學(xué)研究中,因變量通常是經(jīng)過測量后從每個被試中得到的數(shù)據(jù)。注意,在實(shí)驗(yàn)法,事實(shí)上只測量了一個變量。 (因?yàn)槭遣倏v一個觀察另一個) 它和相關(guān)法有本質(zhì)區(qū)別 后者兩個變量均被測量,數(shù)據(jù)由每個個體的兩個不同分?jǐn)?shù)組成??刂茥l件與實(shí)驗(yàn)條件通常,實(shí)驗(yàn)將 沒有接受任何處理的被試的分?jǐn)?shù),與接受處理的被試分?jǐn)?shù)進(jìn)行比較。 這是通過 證明處理?xiàng)l件造成的分?jǐn)?shù)與不處
8、理造成的分?jǐn)?shù)的不同,而說明存在處理效應(yīng)。 這種研究中,出現(xiàn)了:1 控制條件 指個體不接受實(shí)驗(yàn)處理。 或者不接受處理,或者接受中性或安慰劑性處理。 控制條件的目的是提供與實(shí)驗(yàn)條件相比較的基準(zhǔn)。2 實(shí)驗(yàn)條件 指個體接受實(shí)驗(yàn)處理。注意:自變量通常由至少兩個值組成。 (因?yàn)橹辽賾?yīng)有兩個值才能稱為變量) 有的實(shí)驗(yàn),自變量是簡單的數(shù)值。由實(shí)驗(yàn)組和控制組組成的實(shí)驗(yàn),自變量應(yīng)該是處理與非處理。非實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)法準(zhǔn)自變量 是指在非實(shí)驗(yàn)中那些決定了組別的變量。在非實(shí)驗(yàn)中僅僅對兩個組進(jìn)行比較,但這兩組卻不是通過操縱自變量所得到 通常是 由被試變量或時間變量(如處理前與處理后)決定。p17 的兩個例子,均是無法操縱變量
9、 1(可視為準(zhǔn)自變量,準(zhǔn)在它為改變因變量而生,卻無 法被操縱),這種變量 1 叫做準(zhǔn)自變量。分割線開始 對于例子 2 的 “研究者無法操縱時間 ”,這里有兩個問題:1 為什么它這樣說, “無法操縱時間,但是用它來劃分兩組數(shù)據(jù) ” 這里面其實(shí)強(qiáng)調(diào)了兩個因果關(guān)系,即:a)如果這是一個實(shí)驗(yàn),那么自變量一定為研究者所操縱。 b)如果一個變量是一個實(shí)驗(yàn)里的自變量, 那么 “分組 ”這個過程一定是由操縱自變量造成的。 (因?yàn)樽宰兞客ǔS杀辉噮⑴c的處理?xiàng)l件組成,而處理?xiàng)l件決定了分組。 ) 所以才有這種暗含因果關(guān)系的用詞 “但是用它 ”。2 為什么這是個非實(shí)驗(yàn) 因?yàn)檫@個實(shí)驗(yàn)的分組是源于時間變量 治療前治療后是
10、兩個時間點(diǎn), 而它并沒有得到研究 者的操縱。如果是對時間操縱后才導(dǎo)致這種分組, 才能說時間是實(shí)驗(yàn)的自變量, 而這個實(shí)驗(yàn)才能是實(shí)驗(yàn)。 注:切莫糾結(jié)于, 為什么說它沒有操縱時間這種思維是在假定了時間是此實(shí)驗(yàn)的自變 量導(dǎo)致的,而時間僅僅是導(dǎo)致分組的原因,只能稱為準(zhǔn)自變量。分割線結(jié)束 變量與測量有些變量僅僅是假設(shè)出來的概念(即構(gòu)念)從而無法直接觀察,對它們的研究需要測量。 構(gòu)念 是內(nèi)部屬性或特性,它不能被直接觀察到,但可以描述并解釋行為。操作定義 是一個測量過程。它測量了外部行為,并 使用測量結(jié)果作為定義 和對假設(shè)的構(gòu) 念的測量。操作定義有兩個部分 1 描述了一系列測量構(gòu)念的操作; 2 用測量結(jié)果定義
11、了構(gòu)念。根據(jù)變量值的類型,分為兩種變量:1 離散變量 由不同的、不可分割的類別組成。在兩個相鄰類別之間不存在其他值。 它們通常限于整數(shù)。2 連續(xù)變量在任意兩個觀察到的值之間都存在無限多個可能的值。 一個連續(xù)變量可以被分割成無限個小 數(shù)部分。連續(xù)變量的兩個因素1)兩個不同個體很少會得到完全一樣的測量。若有,可以合理懷疑測量過程過于粗糙,或 變量可能不是真的連續(xù)的。2)測量連續(xù)變量時,每個測量類別實(shí)際上都是一個區(qū)間,需要用邊界來定義。 一個數(shù)值其實(shí)是一個區(qū)間,而非量表上一個點(diǎn)。在量表上對其設(shè)定邊界,有以下概念:實(shí)限 指一條連續(xù)數(shù)據(jù)線上數(shù)值組成的區(qū)間的界限。將兩個相鄰數(shù)值分開的實(shí)限恰好位于兩 個數(shù)值
12、的中點(diǎn)。每個數(shù)值都有兩個實(shí)限:上實(shí)限和下實(shí)限。收集數(shù)據(jù)需要測量觀察。 而測量包括將事物分類(定性測量)和使用數(shù)字描述事物大?。ǘ繙y量) 。 介紹四種測量量表:1 稱名量表 由一系列具有不同名稱的類別組成。 稱名量表的測量將觀察的對象分類并貼標(biāo)簽,但不對觀察做任何定量的區(qū)分。 (稱名量表的類別不是量化值, 但它可以用數(shù)字代表, 并依然不能代表任何量化差異。 如房 間 100 和房間 109 這條信息無法得出任何量化結(jié)論。 )2 順序量表由一組 按順序排列的類別 組成。順序量表的測量將觀察對象按大小排序。 例如,類別可以是大中小,但不能是1cm2cm3cm 。類別組成了序列這個事實(shí)意味著在類別間
13、存在方向性。 可以用順序量表的測量, 來確定 兩個個體是否不同并確定差異的方向,但無法確定兩個個體間的差異大小。等距量表和等比量表它們都由一系列排序的類別組成,并且這些類別組成了一系列相同大小的區(qū)間。大小相同的區(qū)間,代表可以利用此量表來確定兩個測量間的差異的大小和方向。 它們的區(qū)別在于零點(diǎn)的性質(zhì)。3 等距量表 由排序的類別組成,這些類別都是完全相同大小的區(qū)間。等距量表具有隨意的零點(diǎn),并且零值不代表被測量的變量不存在。 在等距量表中,量表數(shù)字間的差異等價(jià)于量的差異,但大小的比例沒有意義。4 等比量表 是一種等距量表。它有一個絕對零值,代表沒有測量的變量。 等比量表絕對的、非任意的零點(diǎn),使我們可以
14、測量變量的絕對值。 等比量表中數(shù)字的比例可以反映量上的比例。關(guān)于判斷是等距還是等比(自推) :1 等距量表的零點(diǎn)沒有意義, 等比量表的零點(diǎn)則代表了一個 “沒有測量 ”的變量 (我把測量視 為名詞,大約代表 “值 ”)。所以等距的零點(diǎn)才能隨便換,且只為衡量測量值的差值。 SAT就是一個等距量表,因?yàn)榱阒凳菫楹饬繙y量值之差而存在。 每個人的感冒次數(shù)則是等比量表,因?yàn)榱阒涤幸饬x且不能變動。因此: 2 等距量表的重點(diǎn)在于測量之間的差值,等比量表則是比例。 例如 SAT測試就是等距量表,重點(diǎn)在于測量間的差值而非比例。(并不排除等比量表中測量間差值的意義,但由于等比本也是等距,因此舍棄比例并無意 義。)統(tǒng)
15、計(jì)符號分?jǐn)?shù) 指研究中對因變量的觀察后得到的每個被試的值。原始分?jǐn)?shù) 指研究中最初得到的、沒有改變過的一組數(shù)據(jù)。 特定變量的值用 X 表示。(注意: X又叫一個量表,可視為是一類數(shù)據(jù)之意。在 p48 圖上三行有明確的表達(dá))第二章 頻數(shù)分布概述原始數(shù)據(jù)通常不會顯示任何明顯的模式。研究者依靠描述性統(tǒng)計(jì)來總結(jié)和組織他們的結(jié) 果,使得當(dāng)真的存在某些模式時,它們更易被發(fā)現(xiàn)。描述性統(tǒng)計(jì)的任務(wù):簡化結(jié)構(gòu)并整理組織數(shù)據(jù)。 最常用過程是將數(shù)據(jù)放入一個頻數(shù)分布。頻數(shù)分布 是一種組織好的關(guān)于位于測量量表每個類別上的個體數(shù)目的數(shù)據(jù)表。 頻數(shù)分布顯示了個體得分在測量量表上的分布情況頻數(shù)分布可以是表或圖,但均有如下兩個相同因
16、素:1 組成最初測量量表的類別2 頻數(shù)的記錄(每個類別中的個體數(shù)目)頻數(shù)分布表頻數(shù)分布表的特點(diǎn):1 表中的第一列,列出了所有可能的值,即使此類別的頻數(shù)為0。對于順序、等距、等比量表,類別被按從高到低的順序排列。對于稱名量表,類別可以按任意順序排列。2 第二列記錄每個數(shù)值的頻數(shù)。3 第一列的值 (如 X)指的是測量量表, 并非真實(shí)數(shù)據(jù)。 比如 X=5 但此類別的個體并不存在。4 頻數(shù)可以用于求出分布中的數(shù)據(jù)個數(shù)。將頻數(shù)相加可以得到個體個數(shù)的總和。除了頻數(shù)分布的兩個基本列之外,還有其他描述數(shù)據(jù)分布的測量。 最常用的是比例和百分率。比例 用 p 表示。 p=f/N 。 百分率 %=p( 100) =
17、f/N (100) 由于比例 p 描述了頻數(shù)( f)和數(shù)據(jù)數(shù)目( N )的關(guān)系,故比例又可稱為相對頻數(shù)。 比例通常表示為小數(shù)。當(dāng)一個數(shù)據(jù)組涵蓋范圍過大時,為了不必列出所有數(shù)據(jù),可以使用如下辦法: 分組頻數(shù)分布表 將數(shù)據(jù)分成區(qū)間組,然后將區(qū)間列在表中,用區(qū)間代替每個數(shù)據(jù)。這里的組(即區(qū)間) ,叫組距。 它有四個規(guī)則:1)應(yīng)該具有大約 10 個組距。只是大約。2)每個區(qū)間的寬度應(yīng)為相對簡單的數(shù)字。特別的,5 和 10 可以簡化計(jì)算。3)每個組距的最小數(shù)值應(yīng)為寬度的倍數(shù)。如以10 為區(qū)間寬度,則這些區(qū)間應(yīng)從 20, 30 等開始。4)所有區(qū)間應(yīng)有相同寬度。 它們應(yīng)當(dāng)無間斷無重復(fù)涵蓋 所有數(shù)值, 使任
18、意特定數(shù)值恰好只 屬于一個區(qū)間。在分組頻率分布表中,頻數(shù)是對組距的描述,即這個組距的頻數(shù)為f=xxx。并且, 當(dāng)分?jǐn)?shù)被放入一個分組表后, 會失去關(guān)于特定分?jǐn)?shù)值的信息。 通常組距越寬失去的信 息越多。當(dāng)測量一個連續(xù)變量時,得到的測量對應(yīng)的是線上的區(qū)間,而不是單個的點(diǎn)。 例如一個連續(xù)變量的 X=8的頻數(shù) f=3,其實(shí)是代表有 3個數(shù)在 之間。 同樣的,頻數(shù)分布表中也存在實(shí)限概念。表面界限 比如 4049 的組距中, 40 和 49 為區(qū)間的表面界限。 但是這個區(qū)間的實(shí)限則是 40 的下實(shí)限和 49 的上實(shí)限, 即:這個組距的實(shí)限是和。并且組距的兩實(shí)限間的距離,就是區(qū)間的寬度。 每兩個組距會在實(shí)限處
19、交匯,因此量表中沒有中斷。注意,回答 “該組距的值域 ”時,需要回答出表面界限和實(shí)限。 分布表中最后一個區(qū)間是最小的區(qū)間。因?yàn)椤霸陧樞颉⒌染?、等比量表中,類別被按順序排列通常是由高到低 ”。頻數(shù)分布圖對于用 稱名量表或順序量表 測量的數(shù)據(jù),用柱形圖。 對于用 等距或等比量表 測量的數(shù)據(jù),有兩種圖。1 直方圖首先將數(shù)字(測量類別)沿 X 軸列出,然后畫出位于每個 X值上的一個矩形,使得:a. 矩形的高度對應(yīng)每個類別的頻數(shù)b. 矩形的寬度為每個類別的實(shí)限。 另外,修正的直方圖中,頻數(shù)用方塊代替,故不再需要顯示頻數(shù)的 Y 軸??偨Y(jié)(自推) : 注意 p39 圖的組距畫法。第一個矩形寬架設(shè)在至之間,
20、把刻度標(biāo)在中點(diǎn)上。即恰好代表了組距1。對于圖, 7578組和 8184 組之間沒有空隙,是為了看齊分組頻數(shù)分布表的 “無縫 ”。 它說明 7881 組之間沒有數(shù)據(jù) 這是組距的寬度決定的現(xiàn)象。2 折線圖 首先將數(shù)字(測量類別)沿著 X 軸列出,然后1)每個坐標(biāo)的中心上方有一個點(diǎn),它的垂直位置對應(yīng)這一類別的頻數(shù)。2)點(diǎn)和點(diǎn)之間的連續(xù)線段將這一系列點(diǎn)連在一起3)最后,在分?jǐn)?shù)全距(看坐標(biāo)系內(nèi),別看軸)的兩端各畫一條直線與X 軸相交(其實(shí)是零點(diǎn)和 X 最大值那點(diǎn),看圖) 對于一個分組分布,可以將每個點(diǎn)直接畫在組距的中點(diǎn)處(中點(diǎn)為區(qū)間兩實(shí)限的平均值) 。對于總體分布的頻數(shù)分布圖 由于其個體數(shù)過大,這種圖有
21、兩個特點(diǎn):1 相對頻數(shù) 在圖中(可視為柱形圖)只有分組( X 軸)和相對頻數(shù)( Y 軸),沒有顯示絕對數(shù)目。2 平滑曲線 當(dāng)一個總體由 等比量表 的數(shù)字分?jǐn)?shù)構(gòu)成時, 常用平滑曲線代替直方圖或折線圖的階梯或鋸 齒狀。平滑曲線并非是將一系列點(diǎn) (真實(shí)頻數(shù)) 連在一起, 而是展示從一個分?jǐn)?shù)到另一個分?jǐn)?shù)的相 對變化。頻數(shù)分布的形狀完整描述任意分布, 有三種特性:形狀、集中趨勢和變異性 集中趨勢 指分布中心的位置變異性 指數(shù)據(jù)是分散在廣大區(qū)域還是集中在一起 形狀 理論上分布的形狀被定義為一個方程。 而大部分分布的形狀是:1 對稱分布 可以通過中心畫一條垂直線使分布的一側(cè)為另一側(cè)的鏡像2 偏態(tài)分布 分?jǐn)?shù)傾
22、向于堆積在量表的一端并向另一端逐漸變細(xì) 另:尾 指分?jǐn)?shù)逐漸向分布一段變細(xì)的部位 a)正偏態(tài)分布:尾在右側(cè)的偏態(tài)分布(即尾指向X 軸正方向)b)負(fù)偏態(tài)分布:尾在左側(cè)的偏態(tài)分布(即尾指向X 軸負(fù)方向)百分位數(shù)、百分等級和內(nèi)插法 頻數(shù)分布除了描述整組數(shù)據(jù),也可以用來描述整組數(shù)據(jù)中的個體位置。 原始分?jǐn)?shù) 個體分?jǐn)?shù)或 X 值。原始分?jǐn)?shù)本身不能提供個體位置。 其中一個變化是 將原始分?jǐn)?shù)轉(zhuǎn)化為百分位數(shù)。注意:可見,百分位數(shù)就是原始分?jǐn)?shù)的一個變化。1 一個特定分?jǐn)?shù)的等級(百分等級) 指在分布中低于或等于該特定分?jǐn)?shù)的個體的百分率。 等級一定是一個百分率。 例如,全班有 60%的人分?jǐn)?shù)在 43 以下,那么分?jǐn)?shù) X
23、=43 具有百分等級 60%。2 百分位數(shù)當(dāng)一個分?jǐn)?shù)被它的百分等級確定后,這個分?jǐn)?shù)就叫百分位數(shù)。 它依然是一個原始分?jǐn)?shù)。 如上例, X=43 可以被稱為第 60 個百分位數(shù)。在頻數(shù)分布表中,為了確定百分位數(shù)或百分等級: 累積頻數(shù)( cf) 計(jì)算量表中位于或低于每個類別的個體數(shù)目。因?yàn)樗鼈儽硎玖搜刂勘硐蛏蠒r積累的個體個數(shù)。 (累積頻數(shù)顯示了處于或低于每個分?jǐn)?shù)的個體個數(shù)。 ) 累積百分率( c%) 將累積頻數(shù)轉(zhuǎn)化成百分率 因?yàn)樗鼈冿@示了沿著量表向上時的累積的個體百分率。注意,頻數(shù)分布表中的 X 值仍是區(qū)間,并非一個個點(diǎn)。 所以,當(dāng) X=2的 cf=2,c%=10%時,指的是: 在達(dá)到區(qū)間 X=2
24、的上限前積累了 2 個,且占 10%。內(nèi)插法 具體步驟略 注意:內(nèi)插法的基本假定是,一個區(qū)間從一端到另一端的變化是正常的線性變化。莖葉圖略第三章 集中趨勢集中趨勢 是一個統(tǒng)計(jì)測量,它確定了 能夠代表分布中心的 一個數(shù)值。集中趨勢的目的 找到最典型或最能代表整個組 的單個數(shù)值即 確認(rèn)每一個分布的 “中心 ”或 “最具代表性的數(shù)值 ”。) 集中趨勢描述了一個大型總體的典型特征,使得大量數(shù)據(jù)更容易被理解。 )三種測量集中趨勢的方法:1 平均數(shù) 也叫算數(shù)平均數(shù),是將分布中的所有數(shù)據(jù)相加并除以數(shù)據(jù)的個數(shù)得到的。一個總體的平均數(shù)用 表示,一個樣本的平均數(shù)用 M 表示。(通常,使用希臘字母代表總體的特性,用
25、英文字母代表一個樣本的特性。 )我們經(jīng)常需要將兩組數(shù)據(jù)組合,并找出合并組的整體平均數(shù)。 整體平均數(shù)并非原先兩個樣本的平均數(shù)中心。 由于兩個樣本大小不同, 其中一個對整體組做 出了更大貢獻(xiàn)。因此,決定整體平均數(shù)時占了更大權(quán)數(shù)。因此,整體平均數(shù)也叫加權(quán)平均數(shù)。 加權(quán)平均數(shù) 等于 數(shù)據(jù)總和 / 數(shù)據(jù)個數(shù)。2 中數(shù) 中數(shù) 是恰好將一個分布一分為二的數(shù)值。這個值也相當(dāng)于第 50 個百分位數(shù) (中數(shù)不存在特殊符號和記號,對于樣本和總體來說,中數(shù)的定義和計(jì)算相同。 ) (在圖形中,中數(shù)恰好將圖形的面積分成兩部分。 )3 眾數(shù)眾數(shù) 是具有最大頻率的 分?jǐn)?shù)或類別 眾數(shù)可以用于確認(rèn)任何測量量表的典型值或平均值,包
26、括稱名量表。 眾數(shù)是一個分?jǐn)?shù)或一個類別。但絕不是頻數(shù)。一個分布只有一個平均數(shù),一個中數(shù)。但它可能有一個眾數(shù)、多個眾數(shù),或沒有眾數(shù)。 具有兩個眾數(shù)的分布被稱為雙峰分布,具有多于兩個眾數(shù)的分布為多峰分布。 有時,具有數(shù)個等高點(diǎn)的分布叫無眾數(shù)。(通常雙峰分布說明在同一個總體或樣本里,存在兩個不同的、有區(qū)別的個體組。 ) 通常,眾數(shù)是具有絕對最高頻數(shù)的數(shù)值。但有時也表示具有相對高頻數(shù)的值。此時這個分布有兩個不同的峰值,每一個值都是這個分布的眾數(shù)。 較高的叫主要眾數(shù),較矮的叫次要眾數(shù)。選擇一種最適合的集中趨勢測量1 平均數(shù) 優(yōu)點(diǎn):用到了分布中的每個數(shù)值,通常具有很好的代表性。與最常見的變異性測量有緊密聯(lián)
27、系(如平均數(shù)和方差等) 缺點(diǎn):極易受極端值影響而位移,而不能較好代表整個分布。2 中數(shù)1)極端數(shù)值和偏態(tài)分布 中樞不易受極端值影響。 即使極端值再變大,中數(shù)也不會因此改變。2)未確定數(shù)值 比如有一個被試從未完成實(shí)驗(yàn),只好1 小時后停止實(shí)驗(yàn),其時間則無法確定。注意:對于未確定數(shù)值第一, 不能不要這個數(shù)值。 因?yàn)槭褂脴颖镜哪康氖前盐湛傮w, 這個數(shù)據(jù)告訴我們有一部分總 體不能解決問題。第二,不能記錄為 60 分鐘。要記錄的是完成所需時間,個體從未完成任務(wù),則無法記錄。 綜上所述,存在未確定數(shù)值則無法計(jì)算平均值。我們選擇中數(shù)。3)尾端開放式分布指 一個分布的類別 沒有上限和下限。例如孩子的個數(shù)量表中,
28、存在類別 “5或更多 ”。 這樣就無法計(jì)算 X,更無法計(jì)算平均數(shù)。4)順序量表注意: 由于平均數(shù)是 根據(jù)距離 來定義集中趨勢, 而中數(shù)是用方向定義的 一半分?jǐn)?shù)大 于中數(shù),一半小于中數(shù) 因此不能用平均數(shù),而用中數(shù)來報(bào)告順序量表的平均數(shù)。3 眾數(shù)1)稱名量表 因?yàn)榉Q名量表不能測量數(shù)量,因此不能計(jì)算平均值和中數(shù)。2)離散變量3)描述形狀 在一個頻數(shù)分布圖中,眾數(shù)表示了高峰的位置。集中趨勢和分布形狀1 對稱分布 一個對稱的單峰分布:平均數(shù)、中數(shù)、眾數(shù)重合于中點(diǎn)。 一個對稱的雙峰分布:平均數(shù)和中數(shù)處于中點(diǎn),眾數(shù)位于兩側(cè)。2 偏態(tài)分布正偏態(tài)分布:從左到右為 眾數(shù),中數(shù),平均數(shù) 負(fù)偏態(tài)分布:從左到右為 平均
29、數(shù),中數(shù),眾數(shù)第四章 變異性 變異性: 提供了 對一個分布中的數(shù)據(jù) 分散程度或聚集程度 的數(shù)量測量。 測量變異性的目的:獲得分?jǐn)?shù)在分布中的離散型的客觀測量一個好的變異性的目的:1 描述了分布。 (表示了數(shù)據(jù)是否聚集在一起 或分布在較大區(qū)域內(nèi)。 ) 通常變異性是根據(jù)距離定義的。2 測量了單個或一組數(shù)據(jù)能否很好地代表整個分布。3 提供了在使用一個樣本代表總體時 預(yù)期誤差值的信息全距和四分位距全距 Xmax 的上實(shí)限( URL)和 Xmin 的下實(shí)限( LRL)的差值。四分位距 被分布的中間 50%所覆蓋的距離。等于 Q3-Q1。其中 Q1Q3 為第一四分位數(shù)和第三四分位數(shù),指分布最低的25%和分布
30、最高的 25%與其余值分隔開的界限(是一個界限) 。一般會把它轉(zhuǎn)換為半四分位距,它測量了從分布中心到50%的分布邊界的距離。由于它始于分布中央的 50%,因此不易受極端值影響。但它不能考慮單個數(shù)據(jù)間的真實(shí)距離,不能給出數(shù)據(jù)如何分散或聚集的全景??傮w的標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差 離差的平方和除以總體大?。ɑ驑颖镜淖杂啥龋┑乃銛?shù)平方根。 標(biāo)準(zhǔn)差的目的:對分?jǐn)?shù)到平均數(shù)的標(biāo)準(zhǔn)距離的測量。標(biāo)準(zhǔn)差推導(dǎo)過程里的中間量1)離差)離差 是每個數(shù)與平均數(shù)之間的距離。并且有正負(fù)。數(shù)據(jù)的離差總和為零。 這也是標(biāo)準(zhǔn)差計(jì)算需要將離差平方的原因 引入離差的平方,使得對變異性的測量基于距離的平方之上。結(jié)果:給每個數(shù)據(jù)增減一個常量,標(biāo)準(zhǔn)差不變。 給每個數(shù)據(jù)增減一個倍數(shù),標(biāo)準(zhǔn)差依同樣倍數(shù)增減。2)方差 是離差平方和除以總體大?。ɑ驑颖咀杂啥龋┑纳獭?biāo)準(zhǔn)差的解析1)估計(jì) 對于一個分布,標(biāo)準(zhǔn)差的范圍在( a, b)區(qū)間。其中 a,b 分別為距平均數(shù)最近和最遠(yuǎn)的數(shù) 據(jù)與平均數(shù)的距離。大約在( a+b)/2 處。2)圖示 標(biāo)準(zhǔn)差線大約為從平均數(shù)到最極端值的一半3)計(jì)算公式 標(biāo)準(zhǔn)差和方差在概念上,對于總體和樣本完全相同。對于總體:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人民版道德與法治九年級上冊第七課《生命之間》配套聽課評課記錄
- 湘教版七年級數(shù)學(xué)下冊第2章2.1.2冪的乘方與積的乘方(第1課時)聽評課記錄
- 人教版七年級數(shù)學(xué)上冊:1.2.1《有理數(shù)》聽評課記錄
- 冀教版數(shù)學(xué)九年級上冊《平行線分線段成比例》聽評課記錄1
- 《兩漢的科技和文化》聽課評課記錄1(新部編人教版七年級上冊歷史)
- 蘇教版四年級數(shù)學(xué)下冊期末復(fù)習(xí)口算練習(xí)題三
- 湘教版數(shù)學(xué)八年級上冊《小結(jié)練習(xí)》聽評課記錄
- 聽評課記錄數(shù)學(xué)二年級
- 小學(xué)生營養(yǎng)餐飯?zhí)霉ぷ魅藛T聘用合同范本
- 人員派遣租賃協(xié)議書范本
- (正式版)FZ∕T 80014-2024 潔凈室服裝 通 用技術(shù)規(guī)范
- 新起點(diǎn)英語二年級下冊全冊教案
- 【幼兒園戶外體育活動材料投放的現(xiàn)狀調(diào)查報(bào)告(定量論文)8700字】
- 剪映專業(yè)版:PC端短視頻制作(全彩慕課版) 課件 第3章 短視頻剪輯快速入門
- 湖南省長沙市開福區(qū)青竹湖湘一外國語學(xué)校2023-2024學(xué)年九年級下學(xué)期一模歷史試題
- 帶狀皰疹與帶狀皰疹后遺神經(jīng)痛(HZ與PHN)
- 漢密爾頓抑郁和焦慮量表
- 風(fēng)電場事故案例分析
- 前列腺癌的診斷與治療
- 人教版八年級數(shù)學(xué)初中數(shù)學(xué)《平行四邊形》單元教材教學(xué)分析
- EPC項(xiàng)目設(shè)計(jì)及施工的配合
評論
0/150
提交評論