行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)

上傳人：a*** IP屬地：天津上傳時間：2021-10-10 格式：DOC 頁數(shù)：11 大小：62.50KB 積分：18 舉報(bào) 版權(quán)申訴

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第2頁

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第3頁

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第4頁

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)_第5頁

已閱讀5頁，還剩6頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、符號說明：重點(diǎn) 引導(dǎo)語派生概念或（）派生分析語句第部分簡介與描述性統(tǒng)計(jì)首先提出了1 平均數(shù)（集中趨勢）2 對變異性的測量（描述了數(shù)據(jù)是怎樣分布在平均數(shù)附近的）第一章統(tǒng)計(jì)學(xué)入門統(tǒng)計(jì) 總體與樣本統(tǒng)計(jì)的作用： 1 整理和總結(jié)信息，使研究者看出在研究中發(fā)生了什么，并和其他研究者交流結(jié)果。 2 統(tǒng)計(jì)幫助研究者回答了引出研究的普遍問題，它根據(jù)獲得的結(jié)果來確定結(jié)論是什么。研究開始于一個關(guān)于總體的普遍問題。為回答這個問題，研究者研究了一個樣本將結(jié)果從樣本推廣到整個總體。統(tǒng)計(jì) 是指，整理、總結(jié)并解釋信息的一系列數(shù)學(xué)過程。總體在一個特定研究中所有感興趣個體的集合。（是研究者希望研究的整

2、個組。）參數(shù) 用來描述總體的特性。通常是一個數(shù)字值。參數(shù)可以從單個測量中得到，或從對總體的一組測量中推導(dǎo)。樣本從一個總體中選擇出來的個體的集合，通常在研究中被期望代表總體。統(tǒng)計(jì)量用來描述樣本的特性。通常是一個數(shù)字值。統(tǒng)計(jì)量可以從單個測量中得到，或從對樣本的一組測量中推導(dǎo)出來。（通常，每個總體參數(shù)都與一個樣本統(tǒng)計(jì)量相對應(yīng)。）數(shù)據(jù) 從個體中得到的測量或觀察（其中測量、觀察均為名詞。）它通常被稱為一個分?jǐn)?shù)或原始分?jǐn)?shù)。統(tǒng)計(jì)分為兩類：1 描述性統(tǒng)計(jì) 是用于總結(jié)、組織并簡化數(shù)據(jù)的統(tǒng)計(jì)過程。它是一種技術(shù)，把原始數(shù)據(jù)組織總結(jié)成更易處理的形式。（通常被組織成表或圖，或用計(jì)算平均數(shù)的方法

3、總結(jié)一組數(shù)據(jù)。） 2 推論性統(tǒng)計(jì) 是先研究樣本，然后將結(jié)果推廣到樣本來自的總體的技術(shù)。（通常使用樣本統(tǒng)計(jì)量作為推論總體參數(shù)的基礎(chǔ)。）（它通常回答這個問題：到底是 1 還是 2 其中 1 是樣本中的結(jié)果差異只是取樣誤差。 2 是樣板間的教學(xué)差異是由于樣本性質(zhì)（如書中例子中：教學(xué)方法）造成的。樣本只提供了關(guān)于總體的有限信息。即使樣本可以代表它們來自的總體，但我們不期望一個樣本可以給出關(guān)于整個總體的精確描述。通常，在樣本統(tǒng)計(jì)量和總體參數(shù)間存在一些差異，叫取樣誤差。取樣誤差存在于樣本統(tǒng)計(jì)量和總體參數(shù) 間的差異或誤差的數(shù)量。每個樣本都包含具有不同性質(zhì)的不同個體。由

4、于樣本由不同人組成，樣本統(tǒng)計(jì)量也從一個樣本變化到另一個。并且沒有一個樣本統(tǒng)計(jì)量和總體參數(shù) 完全一致。取樣誤差的基本理念：樣本統(tǒng)計(jì)量通常與其相應(yīng)的總體參數(shù)不同，并且根據(jù)樣本的不同而變化。數(shù)據(jù)結(jié)構(gòu)、研究方法與統(tǒng)計(jì)變量是一種針對不同個體具有不同值的特性或條件。常量是一種不會變化，且對每個個體都相同的特性或條件。相關(guān)法觀察兩個變量并確定它們之間是否存在關(guān)系。（2X2 表格數(shù)據(jù)中，對于每個個體，研究者都有兩個測量，且所有的測量都是個數(shù)。這種表示個數(shù)的數(shù)據(jù)的變量之間的關(guān)系，可以用卡方檢驗(yàn)。）對兩組或多組測量來說，會存在其中一個變量被用來定義組別。（例如早餐成績問題，變量 1

5、吃不吃早餐被用來定義組，變量 2 學(xué)習(xí)成績被用來得到每個組的數(shù)據(jù)）并且，如果測量過程產(chǎn)生數(shù)字值，那么統(tǒng)計(jì)評估會包括計(jì)算每組的平均數(shù)，并比較它們。如果測量過程僅僅將個體歸入非數(shù)字的類別中，那么統(tǒng)計(jì)評估常包括計(jì)算每個組的比例。（例如，產(chǎn)生數(shù)字值的兒童早餐與成績問題，學(xué)習(xí)成績被用來計(jì)算平均值。而城鄉(xiāng)居民的政策接受研究中，數(shù)字值被用來計(jì)算比例。）實(shí)驗(yàn)法操縱一個變量并觀察或測量另一個變量。并且為了建立兩個變量間的因果關(guān)系，實(shí) 驗(yàn)需要控制所有其他變量，使它們不會影響結(jié)論。實(shí)驗(yàn)法的兩個特性：1 操縱：研究者操縱一個變量，將它的值從一個水平變化到另一水平。然后觀察或測量第二個變量，

6、來確定這種操縱是否導(dǎo)致了變化的產(chǎn)生。2 控制：研究者必須控制研究情況，使其他無用的變量不能影響需要研究的變量關(guān)系。通常研究者需要考慮的兩種變量：1 被試變量一些特性會隨個體的不同而變化，如年齡性別和智力。只要實(shí)驗(yàn)是比較兩組個體的差異，就必須保證兩組的被試變量完全相同。2 環(huán)境變量通常使用三種技術(shù)控制其他變量：1 隨機(jī)分派目的是，使每個被試有相同的機(jī)會被分派到每個處理?xiàng)l件中，以使被試的特性在兩組中均勻分布。2 匹配通過匹配來保證參與組或環(huán)境的同質(zhì)性。（如測量所有被試 IQ 后，將被試匹配地分派到兩組中，使兩組有基本相等的 IQ）3 將變量控制成常量例如，只使用 10 歲兒童做被

7、試。實(shí)驗(yàn)法的術(shù)語自變量被研究者操縱的變量。（在行為研究中，自變量通常由被試參與的兩個或多個處理?xiàng)l 件組成。）自變量由在觀察因變量之前就操縱好的前條件組成。因變量即被觀察的變量，用于評估處理效應(yīng)。（或：被觀察并用來評估可能存在操縱效應(yīng) 的變量）在心理學(xué)研究中，因變量通常是經(jīng)過測量后從每個被試中得到的數(shù)據(jù)。注意，在實(shí)驗(yàn)法，事實(shí)上只測量了一個變量。（因?yàn)槭遣倏v一個觀察另一個）它和相關(guān)法有本質(zhì)區(qū)別后者兩個變量均被測量，數(shù)據(jù)由每個個體的兩個不同分?jǐn)?shù)組成?？刂茥l件與實(shí)驗(yàn)條件通常，實(shí)驗(yàn)將沒有接受任何處理的被試的分?jǐn)?shù)，與接受處理的被試分?jǐn)?shù)進(jìn)行比較。這是通過證明處理?xiàng)l件造成的分?jǐn)?shù)與不處

8、理造成的分?jǐn)?shù)的不同，而說明存在處理效應(yīng)。這種研究中，出現(xiàn)了：1 控制條件指個體不接受實(shí)驗(yàn)處理。或者不接受處理，或者接受中性或安慰劑性處理。控制條件的目的是提供與實(shí)驗(yàn)條件相比較的基準(zhǔn)。2 實(shí)驗(yàn)條件指個體接受實(shí)驗(yàn)處理。注意：自變量通常由至少兩個值組成。（因?yàn)橹辽賾?yīng)有兩個值才能稱為變量）有的實(shí)驗(yàn)，自變量是簡單的數(shù)值。由實(shí)驗(yàn)組和控制組組成的實(shí)驗(yàn)，自變量應(yīng)該是處理與非處理。非實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)法準(zhǔn)自變量是指在非實(shí)驗(yàn)中那些決定了組別的變量。在非實(shí)驗(yàn)中僅僅對兩個組進(jìn)行比較，但這兩組卻不是通過操縱自變量所得到通常是由被試變量或時間變量（如處理前與處理后）決定。p17 的兩個例子，均是無法操縱變量

9、 1（可視為準(zhǔn)自變量，準(zhǔn)在它為改變因變量而生，卻無法被操縱），這種變量 1 叫做準(zhǔn)自變量。分割線開始對于例子 2 的 “研究者無法操縱時間 ”，這里有兩個問題：1 為什么它這樣說， “無法操縱時間，但是用它來劃分兩組數(shù)據(jù) ” 這里面其實(shí)強(qiáng)調(diào)了兩個因果關(guān)系，即：a）如果這是一個實(shí)驗(yàn)，那么自變量一定為研究者所操縱。 b）如果一個變量是一個實(shí)驗(yàn)里的自變量，那么 “分組 ”這個過程一定是由操縱自變量造成的。（因?yàn)樽宰兞客ǔＳ杀辉噮⑴c的處理?xiàng)l件組成，而處理?xiàng)l件決定了分組。）所以才有這種暗含因果關(guān)系的用詞 “但是用它 ”。2 為什么這是個非實(shí)驗(yàn) 因?yàn)檫@個實(shí)驗(yàn)的分組是源于時間變量治療前治療后是

10、兩個時間點(diǎn)，而它并沒有得到研究者的操縱。如果是對時間操縱后才導(dǎo)致這種分組，才能說時間是實(shí)驗(yàn)的自變量，而這個實(shí)驗(yàn)才能是實(shí)驗(yàn)。注：切莫糾結(jié)于，為什么說它沒有操縱時間這種思維是在假定了時間是此實(shí)驗(yàn)的自變量導(dǎo)致的，而時間僅僅是導(dǎo)致分組的原因，只能稱為準(zhǔn)自變量。分割線結(jié)束變量與測量有些變量僅僅是假設(shè)出來的概念（即構(gòu)念）從而無法直接觀察，對它們的研究需要測量。構(gòu)念是內(nèi)部屬性或特性，它不能被直接觀察到，但可以描述并解釋行為。操作定義是一個測量過程。它測量了外部行為，并使用測量結(jié)果作為定義和對假設(shè)的構(gòu) 念的測量。操作定義有兩個部分 1 描述了一系列測量構(gòu)念的操作； 2 用測量結(jié)果定義

11、了構(gòu)念。根據(jù)變量值的類型，分為兩種變量：1 離散變量由不同的、不可分割的類別組成。在兩個相鄰類別之間不存在其他值。它們通常限于整數(shù)。2 連續(xù)變量在任意兩個觀察到的值之間都存在無限多個可能的值。一個連續(xù)變量可以被分割成無限個小數(shù)部分。連續(xù)變量的兩個因素1）兩個不同個體很少會得到完全一樣的測量。若有，可以合理懷疑測量過程過于粗糙，或變量可能不是真的連續(xù)的。2）測量連續(xù)變量時，每個測量類別實(shí)際上都是一個區(qū)間，需要用邊界來定義。一個數(shù)值其實(shí)是一個區(qū)間，而非量表上一個點(diǎn)。在量表上對其設(shè)定邊界，有以下概念：實(shí)限指一條連續(xù)數(shù)據(jù)線上數(shù)值組成的區(qū)間的界限。將兩個相鄰數(shù)值分開的實(shí)限恰好位于兩個數(shù)值

12、的中點(diǎn)。每個數(shù)值都有兩個實(shí)限：上實(shí)限和下實(shí)限。收集數(shù)據(jù)需要測量觀察。而測量包括將事物分類（定性測量）和使用數(shù)字描述事物大?。ǘ繙y量）。介紹四種測量量表：1 稱名量表由一系列具有不同名稱的類別組成。稱名量表的測量將觀察的對象分類并貼標(biāo)簽，但不對觀察做任何定量的區(qū)分。（稱名量表的類別不是量化值，但它可以用數(shù)字代表，并依然不能代表任何量化差異。如房間 100 和房間 109 這條信息無法得出任何量化結(jié)論。）2 順序量表由一組按順序排列的類別組成。順序量表的測量將觀察對象按大小排序。例如，類別可以是大中小，但不能是1cm2cm3cm 。類別組成了序列這個事實(shí)意味著在類別間

13、存在方向性。可以用順序量表的測量，來確定兩個個體是否不同并確定差異的方向，但無法確定兩個個體間的差異大小。等距量表和等比量表它們都由一系列排序的類別組成，并且這些類別組成了一系列相同大小的區(qū)間。大小相同的區(qū)間，代表可以利用此量表來確定兩個測量間的差異的大小和方向。它們的區(qū)別在于零點(diǎn)的性質(zhì)。3 等距量表由排序的類別組成，這些類別都是完全相同大小的區(qū)間。等距量表具有隨意的零點(diǎn)，并且零值不代表被測量的變量不存在。在等距量表中，量表數(shù)字間的差異等價(jià)于量的差異，但大小的比例沒有意義。4 等比量表是一種等距量表。它有一個絕對零值，代表沒有測量的變量。等比量表絕對的、非任意的零點(diǎn)，使我們可以

14、測量變量的絕對值。等比量表中數(shù)字的比例可以反映量上的比例。關(guān)于判斷是等距還是等比（自推）：1 等距量表的零點(diǎn)沒有意義，等比量表的零點(diǎn)則代表了一個 “沒有測量 ”的變量（我把測量視為名詞，大約代表 “值 ”）。所以等距的零點(diǎn)才能隨便換，且只為衡量測量值的差值。 SAT就是一個等距量表，因?yàn)榱阒凳菫楹饬繙y量值之差而存在。每個人的感冒次數(shù)則是等比量表，因?yàn)榱阒涤幸饬x且不能變動。因此： 2 等距量表的重點(diǎn)在于測量之間的差值，等比量表則是比例。例如 SAT測試就是等距量表，重點(diǎn)在于測量間的差值而非比例。（并不排除等比量表中測量間差值的意義，但由于等比本也是等距，因此舍棄比例并無意義。）統(tǒng)

15、計(jì)符號分?jǐn)?shù) 指研究中對因變量的觀察后得到的每個被試的值。原始分?jǐn)?shù) 指研究中最初得到的、沒有改變過的一組數(shù)據(jù)。特定變量的值用 X 表示。（注意： X又叫一個量表，可視為是一類數(shù)據(jù)之意。在 p48 圖上三行有明確的表達(dá)）第二章頻數(shù)分布概述原始數(shù)據(jù)通常不會顯示任何明顯的模式。研究者依靠描述性統(tǒng)計(jì)來總結(jié)和組織他們的結(jié) 果，使得當(dāng)真的存在某些模式時，它們更易被發(fā)現(xiàn)。描述性統(tǒng)計(jì)的任務(wù)：簡化結(jié)構(gòu)并整理組織數(shù)據(jù)。最常用過程是將數(shù)據(jù)放入一個頻數(shù)分布。頻數(shù)分布是一種組織好的關(guān)于位于測量量表每個類別上的個體數(shù)目的數(shù)據(jù)表。頻數(shù)分布顯示了個體得分在測量量表上的分布情況頻數(shù)分布可以是表或圖，但均有如下兩個相同因

16、素：1 組成最初測量量表的類別2 頻數(shù)的記錄（每個類別中的個體數(shù)目）頻數(shù)分布表頻數(shù)分布表的特點(diǎn)：1 表中的第一列，列出了所有可能的值，即使此類別的頻數(shù)為0。對于順序、等距、等比量表，類別被按從高到低的順序排列。對于稱名量表，類別可以按任意順序排列。2 第二列記錄每個數(shù)值的頻數(shù)。3 第一列的值（如 X）指的是測量量表，并非真實(shí)數(shù)據(jù)。比如 X=5 但此類別的個體并不存在。4 頻數(shù)可以用于求出分布中的數(shù)據(jù)個數(shù)。將頻數(shù)相加可以得到個體個數(shù)的總和。除了頻數(shù)分布的兩個基本列之外，還有其他描述數(shù)據(jù)分布的測量。最常用的是比例和百分率。比例用 p 表示。 p=f/N 。百分率 %=p（ 100） =

17、f/N （100）由于比例 p 描述了頻數(shù)（ f）和數(shù)據(jù)數(shù)目（ N ）的關(guān)系，故比例又可稱為相對頻數(shù)。比例通常表示為小數(shù)。當(dāng)一個數(shù)據(jù)組涵蓋范圍過大時，為了不必列出所有數(shù)據(jù)，可以使用如下辦法：分組頻數(shù)分布表將數(shù)據(jù)分成區(qū)間組，然后將區(qū)間列在表中，用區(qū)間代替每個數(shù)據(jù)。這里的組（即區(qū)間），叫組距。它有四個規(guī)則：1）應(yīng)該具有大約 10 個組距。只是大約。2）每個區(qū)間的寬度應(yīng)為相對簡單的數(shù)字。特別的，5 和 10 可以簡化計(jì)算。3）每個組距的最小數(shù)值應(yīng)為寬度的倍數(shù)。如以10 為區(qū)間寬度，則這些區(qū)間應(yīng)從 20， 30 等開始。4）所有區(qū)間應(yīng)有相同寬度。它們應(yīng)當(dāng)無間斷無重復(fù)涵蓋所有數(shù)值，使任

18、意特定數(shù)值恰好只屬于一個區(qū)間。在分組頻率分布表中，頻數(shù)是對組距的描述，即這個組距的頻數(shù)為f=xxx。并且，當(dāng)分?jǐn)?shù)被放入一個分組表后，會失去關(guān)于特定分?jǐn)?shù)值的信息。通常組距越寬失去的信息越多。當(dāng)測量一個連續(xù)變量時，得到的測量對應(yīng)的是線上的區(qū)間，而不是單個的點(diǎn)。例如一個連續(xù)變量的 X=8的頻數(shù) f=3，其實(shí)是代表有 3個數(shù)在之間。同樣的，頻數(shù)分布表中也存在實(shí)限概念。表面界限比如 4049 的組距中， 40 和 49 為區(qū)間的表面界限。但是這個區(qū)間的實(shí)限則是 40 的下實(shí)限和 49 的上實(shí)限，即：這個組距的實(shí)限是和。并且組距的兩實(shí)限間的距離，就是區(qū)間的寬度。每兩個組距會在實(shí)限處

19、交匯，因此量表中沒有中斷。注意，回答 “該組距的值域 ”時，需要回答出表面界限和實(shí)限。分布表中最后一個區(qū)間是最小的區(qū)間。因?yàn)椤霸陧樞颉⒌染?、等比量表中，類別被按順序排列通常是由高到低 ”。頻數(shù)分布圖對于用稱名量表或順序量表測量的數(shù)據(jù)，用柱形圖。對于用等距或等比量表測量的數(shù)據(jù)，有兩種圖。1 直方圖首先將數(shù)字（測量類別）沿 X 軸列出，然后畫出位于每個 X值上的一個矩形，使得：a. 矩形的高度對應(yīng)每個類別的頻數(shù)b. 矩形的寬度為每個類別的實(shí)限。另外，修正的直方圖中，頻數(shù)用方塊代替，故不再需要顯示頻數(shù)的 Y 軸?？偨Y(jié)（自推）：注意 p39 圖的組距畫法。第一個矩形寬架設(shè)在至之間，

20、把刻度標(biāo)在中點(diǎn)上。即恰好代表了組距1。對于圖， 7578組和 8184 組之間沒有空隙，是為了看齊分組頻數(shù)分布表的 “無縫 ”。它說明 7881 組之間沒有數(shù)據(jù) 這是組距的寬度決定的現(xiàn)象。2 折線圖首先將數(shù)字（測量類別）沿著 X 軸列出，然后1）每個坐標(biāo)的中心上方有一個點(diǎn)，它的垂直位置對應(yīng)這一類別的頻數(shù)。2）點(diǎn)和點(diǎn)之間的連續(xù)線段將這一系列點(diǎn)連在一起3）最后，在分?jǐn)?shù)全距（看坐標(biāo)系內(nèi)，別看軸）的兩端各畫一條直線與X 軸相交（其實(shí)是零點(diǎn)和 X 最大值那點(diǎn)，看圖）對于一個分組分布，可以將每個點(diǎn)直接畫在組距的中點(diǎn)處（中點(diǎn)為區(qū)間兩實(shí)限的平均值）。對于總體分布的頻數(shù)分布圖由于其個體數(shù)過大，這種圖有

21、兩個特點(diǎn)：1 相對頻數(shù) 在圖中（可視為柱形圖）只有分組（ X 軸）和相對頻數(shù)（ Y 軸），沒有顯示絕對數(shù)目。2 平滑曲線當(dāng)一個總體由等比量表的數(shù)字分?jǐn)?shù)構(gòu)成時，常用平滑曲線代替直方圖或折線圖的階梯或鋸齒狀。平滑曲線并非是將一系列點(diǎn) （真實(shí)頻數(shù)）連在一起，而是展示從一個分?jǐn)?shù)到另一個分?jǐn)?shù)的相對變化。頻數(shù)分布的形狀完整描述任意分布，有三種特性：形狀、集中趨勢和變異性集中趨勢指分布中心的位置變異性指數(shù)據(jù)是分散在廣大區(qū)域還是集中在一起形狀理論上分布的形狀被定義為一個方程。而大部分分布的形狀是：1 對稱分布可以通過中心畫一條垂直線使分布的一側(cè)為另一側(cè)的鏡像2 偏態(tài)分布分?jǐn)?shù)傾

22、向于堆積在量表的一端并向另一端逐漸變細(xì) 另：尾指分?jǐn)?shù)逐漸向分布一段變細(xì)的部位 a）正偏態(tài)分布：尾在右側(cè)的偏態(tài)分布（即尾指向X 軸正方向）b）負(fù)偏態(tài)分布：尾在左側(cè)的偏態(tài)分布（即尾指向X 軸負(fù)方向）百分位數(shù)、百分等級和內(nèi)插法頻數(shù)分布除了描述整組數(shù)據(jù)，也可以用來描述整組數(shù)據(jù)中的個體位置。原始分?jǐn)?shù) 個體分?jǐn)?shù)或 X 值。原始分?jǐn)?shù)本身不能提供個體位置。其中一個變化是將原始分?jǐn)?shù)轉(zhuǎn)化為百分位數(shù)。注意：可見，百分位數(shù)就是原始分?jǐn)?shù)的一個變化。1 一個特定分?jǐn)?shù)的等級（百分等級）指在分布中低于或等于該特定分?jǐn)?shù)的個體的百分率。等級一定是一個百分率。例如，全班有 60%的人分?jǐn)?shù)在 43 以下，那么分?jǐn)?shù) X

23、=43 具有百分等級 60%。2 百分位數(shù)當(dāng)一個分?jǐn)?shù)被它的百分等級確定后，這個分?jǐn)?shù)就叫百分位數(shù)。它依然是一個原始分?jǐn)?shù)。如上例， X=43 可以被稱為第 60 個百分位數(shù)。在頻數(shù)分布表中，為了確定百分位數(shù)或百分等級：累積頻數(shù)（ cf）計(jì)算量表中位于或低于每個類別的個體數(shù)目。因?yàn)樗鼈儽硎玖搜刂勘硐蛏蠒r積累的個體個數(shù)。（累積頻數(shù)顯示了處于或低于每個分?jǐn)?shù)的個體個數(shù)。）累積百分率（ c%）將累積頻數(shù)轉(zhuǎn)化成百分率因?yàn)樗鼈冿@示了沿著量表向上時的累積的個體百分率。注意，頻數(shù)分布表中的 X 值仍是區(qū)間，并非一個個點(diǎn)。所以，當(dāng) X=2的 cf=2，c%=10%時，指的是：在達(dá)到區(qū)間 X=2

24、的上限前積累了 2 個，且占 10%。內(nèi)插法具體步驟略注意：內(nèi)插法的基本假定是，一個區(qū)間從一端到另一端的變化是正常的線性變化。莖葉圖略第三章集中趨勢集中趨勢是一個統(tǒng)計(jì)測量，它確定了能夠代表分布中心的一個數(shù)值。集中趨勢的目的找到最典型或最能代表整個組的單個數(shù)值即確認(rèn)每一個分布的 “中心 ”或 “最具代表性的數(shù)值 ”。）集中趨勢描述了一個大型總體的典型特征，使得大量數(shù)據(jù)更容易被理解。）三種測量集中趨勢的方法：1 平均數(shù) 也叫算數(shù)平均數(shù)，是將分布中的所有數(shù)據(jù)相加并除以數(shù)據(jù)的個數(shù)得到的。一個總體的平均數(shù)用表示，一個樣本的平均數(shù)用 M 表示。（通常，使用希臘字母代表總體的特性，用

25、英文字母代表一個樣本的特性。）我們經(jīng)常需要將兩組數(shù)據(jù)組合，并找出合并組的整體平均數(shù)。整體平均數(shù)并非原先兩個樣本的平均數(shù)中心。由于兩個樣本大小不同，其中一個對整體組做出了更大貢獻(xiàn)。因此，決定整體平均數(shù)時占了更大權(quán)數(shù)。因此，整體平均數(shù)也叫加權(quán)平均數(shù)。加權(quán)平均數(shù) 等于數(shù)據(jù)總和 / 數(shù)據(jù)個數(shù)。2 中數(shù) 中數(shù) 是恰好將一個分布一分為二的數(shù)值。這個值也相當(dāng)于第 50 個百分位數(shù) （中數(shù)不存在特殊符號和記號，對于樣本和總體來說，中數(shù)的定義和計(jì)算相同。）（在圖形中，中數(shù)恰好將圖形的面積分成兩部分。）3 眾數(shù)眾數(shù) 是具有最大頻率的分?jǐn)?shù)或類別眾數(shù)可以用于確認(rèn)任何測量量表的典型值或平均值，包

26、括稱名量表。眾數(shù)是一個分?jǐn)?shù)或一個類別。但絕不是頻數(shù)。一個分布只有一個平均數(shù)，一個中數(shù)。但它可能有一個眾數(shù)、多個眾數(shù)，或沒有眾數(shù)。具有兩個眾數(shù)的分布被稱為雙峰分布，具有多于兩個眾數(shù)的分布為多峰分布。有時，具有數(shù)個等高點(diǎn)的分布叫無眾數(shù)。（通常雙峰分布說明在同一個總體或樣本里，存在兩個不同的、有區(qū)別的個體組。）通常，眾數(shù)是具有絕對最高頻數(shù)的數(shù)值。但有時也表示具有相對高頻數(shù)的值。此時這個分布有兩個不同的峰值，每一個值都是這個分布的眾數(shù)。較高的叫主要眾數(shù)，較矮的叫次要眾數(shù)。選擇一種最適合的集中趨勢測量1 平均數(shù) 優(yōu)點(diǎn)：用到了分布中的每個數(shù)值，通常具有很好的代表性。與最常見的變異性測量有緊密聯(lián)

27、系（如平均數(shù)和方差等）缺點(diǎn)：極易受極端值影響而位移，而不能較好代表整個分布。2 中數(shù)1）極端數(shù)值和偏態(tài)分布中樞不易受極端值影響。即使極端值再變大，中數(shù)也不會因此改變。2）未確定數(shù)值比如有一個被試從未完成實(shí)驗(yàn)，只好1 小時后停止實(shí)驗(yàn)，其時間則無法確定。注意：對于未確定數(shù)值第一，不能不要這個數(shù)值。因?yàn)槭褂脴颖镜哪康氖前盐湛傮w，這個數(shù)據(jù)告訴我們有一部分總體不能解決問題。第二，不能記錄為 60 分鐘。要記錄的是完成所需時間，個體從未完成任務(wù)，則無法記錄。綜上所述，存在未確定數(shù)值則無法計(jì)算平均值。我們選擇中數(shù)。3）尾端開放式分布指一個分布的類別沒有上限和下限。例如孩子的個數(shù)量表中，

28、存在類別 “5或更多 ”。這樣就無法計(jì)算 X，更無法計(jì)算平均數(shù)。4）順序量表注意：由于平均數(shù)是根據(jù)距離來定義集中趨勢，而中數(shù)是用方向定義的一半分?jǐn)?shù)大于中數(shù)，一半小于中數(shù) 因此不能用平均數(shù)，而用中數(shù)來報(bào)告順序量表的平均數(shù)。3 眾數(shù)1）稱名量表因?yàn)榉Q名量表不能測量數(shù)量，因此不能計(jì)算平均值和中數(shù)。2）離散變量3）描述形狀在一個頻數(shù)分布圖中，眾數(shù)表示了高峰的位置。集中趨勢和分布形狀1 對稱分布一個對稱的單峰分布：平均數(shù)、中數(shù)、眾數(shù)重合于中點(diǎn)。一個對稱的雙峰分布：平均數(shù)和中數(shù)處于中點(diǎn)，眾數(shù)位于兩側(cè)。2 偏態(tài)分布正偏態(tài)分布：從左到右為眾數(shù)，中數(shù)，平均數(shù) 負(fù)偏態(tài)分布：從左到右為平均

29、數(shù)，中數(shù)，眾數(shù)第四章變異性變異性：提供了對一個分布中的數(shù)據(jù) 分散程度或聚集程度的數(shù)量測量。測量變異性的目的：獲得分?jǐn)?shù)在分布中的離散型的客觀測量一個好的變異性的目的：1 描述了分布。（表示了數(shù)據(jù)是否聚集在一起或分布在較大區(qū)域內(nèi)。）通常變異性是根據(jù)距離定義的。2 測量了單個或一組數(shù)據(jù)能否很好地代表整個分布。3 提供了在使用一個樣本代表總體時預(yù)期誤差值的信息全距和四分位距全距 Xmax 的上實(shí)限（ URL）和 Xmin 的下實(shí)限（ LRL）的差值。四分位距被分布的中間 50%所覆蓋的距離。等于 Q3-Q1。其中 Q1Q3 為第一四分位數(shù)和第三四分位數(shù)，指分布最低的25%和分布

30、最高的 25%與其余值分隔開的界限（是一個界限）。一般會把它轉(zhuǎn)換為半四分位距，它測量了從分布中心到50%的分布邊界的距離。由于它始于分布中央的 50%，因此不易受極端值影響。但它不能考慮單個數(shù)據(jù)間的真實(shí)距離，不能給出數(shù)據(jù)如何分散或聚集的全景?？傮w的標(biāo)準(zhǔn)差和方差標(biāo)準(zhǔn)差離差的平方和除以總體大?。ɑ驑颖镜淖杂啥龋┑乃銛?shù)平方根。標(biāo)準(zhǔn)差的目的：對分?jǐn)?shù)到平均數(shù)的標(biāo)準(zhǔn)距離的測量。標(biāo)準(zhǔn)差推導(dǎo)過程里的中間量1）離差）離差是每個數(shù)與平均數(shù)之間的距離。并且有正負(fù)。數(shù)據(jù)的離差總和為零。這也是標(biāo)準(zhǔn)差計(jì)算需要將離差平方的原因引入離差的平方，使得對變異性的測量基于距離的平方之上。結(jié)果：給每個數(shù)據(jù)增減一個常量，標(biāo)準(zhǔn)差不變。給每個數(shù)據(jù)增減一個倍數(shù)，標(biāo)準(zhǔn)差依同樣倍數(shù)增減。2）方差是離差平方和除以總體大?。ɑ驑颖咀杂啥龋┑纳獭?biāo)準(zhǔn)差的解析1）估計(jì) 對于一個分布，標(biāo)準(zhǔn)差的范圍在（ a， b）區(qū)間。其中 a，b 分別為距平均數(shù)最近和最遠(yuǎn)的數(shù) 據(jù)與平均數(shù)的距離。大約在（ a+b）/2 處。2）圖示標(biāo)準(zhǔn)差線大約為從平均數(shù)到最極端值的一半3）計(jì)算公式標(biāo)準(zhǔn)差和方差在概念上，對于總體和樣本完全相同。對于總體：

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評論

行為科學(xué)統(tǒng)計(jì)第七版考研復(fù)習(xí)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔