




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)統(tǒng)計(jì)分析基礎(chǔ):試驗(yàn)資料的整理與特征數(shù)的計(jì)算統(tǒng)計(jì)分析過(guò)程基于統(tǒng)計(jì)或?qū)嶋H觀察提出假設(shè)(問(wèn)題)概念的可操作型定義抽取樣本或受試者調(diào)查實(shí)驗(yàn)設(shè)計(jì)數(shù)據(jù)收集數(shù)據(jù)整理編制圖表、統(tǒng)計(jì)描述解釋數(shù)據(jù)是總體或樣本結(jié)果發(fā)現(xiàn),對(duì)總體進(jìn)行分析、總結(jié)統(tǒng)計(jì)推斷總體樣本統(tǒng)計(jì)數(shù)據(jù)的類型按計(jì)量尺度按收集方法按時(shí)間狀況分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值型數(shù)據(jù)觀測(cè)數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)截面數(shù)據(jù)序時(shí)數(shù)據(jù).分類數(shù)據(jù)(Categorical data)對(duì)事物進(jìn)行分類的結(jié)果。數(shù)據(jù)表現(xiàn)為類別,用文字表述。對(duì)事物應(yīng)進(jìn)行平行的分類。各類別可以指定數(shù)字代碼表示。分類數(shù)據(jù)舉例:性別,學(xué)歷,地區(qū)等。性別:男-1,女-0。一、分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)2.順序數(shù)據(jù)(Rank
2、 data)對(duì)事物進(jìn)行分類的結(jié)果,但類別有順序。比分類尺度精確。未測(cè)量出類別之間的準(zhǔn)確差值。順序數(shù)據(jù)舉例:考試成績(jī)、消費(fèi)者對(duì)產(chǎn)品的偏愛(ài)程度等。考試成績(jī):優(yōu)-5、良-4、中-3、及格-2、不及格-1。3.數(shù)值型數(shù)據(jù)(Metric data)使用自然或度量衡單位對(duì)事物進(jìn)行計(jì)量的結(jié)果。結(jié)果表現(xiàn)為具體數(shù)值,是最常見(jiàn)的數(shù)據(jù)類型。數(shù)值型數(shù)據(jù)舉例:污染物的濃度。分類數(shù)據(jù)和順序數(shù)據(jù):說(shuō)明的是事物的品質(zhì)特征,用文字表示-定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)。數(shù)值型數(shù)據(jù):說(shuō)明的是現(xiàn)象的數(shù)量特征,用數(shù)值表示-定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。定性數(shù)據(jù)和定量數(shù)據(jù)也可以相互轉(zhuǎn)化。如年齡:老年、中年、青年、兒童 學(xué)歷:大學(xué)-1、高中-2、初中-3、小學(xué)
3、-4三種類型數(shù)據(jù)的比較觀測(cè)數(shù)據(jù)(observational data):通過(guò)調(diào)查或觀測(cè)而收集到的數(shù)據(jù)社會(huì)經(jīng)濟(jì)領(lǐng)域?qū)嶒?yàn)數(shù)據(jù)(experimental data):在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)自然科學(xué)領(lǐng)域二、觀測(cè)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)截面數(shù)據(jù)(cross-sectional data):在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)。如2005年我國(guó)各地區(qū)的GDP數(shù)據(jù)。時(shí)間序列數(shù)據(jù)(time series data):在不同時(shí)間上收集的數(shù)據(jù)。如1996-2005年我國(guó)的GDP數(shù)據(jù)。三、截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)總體和個(gè)體總體(population):具有相同性質(zhì)的個(gè)體所組成的集合,它是指研究對(duì)象的全體。有限總體:
4、被研究對(duì)象是有限的,如:一批樣品的總數(shù)。無(wú)限總體:被研究對(duì)象是無(wú)限的,如:如企業(yè)生產(chǎn)以前、現(xiàn)在、將來(lái)全部的產(chǎn)品。個(gè)體(individual):組成總體的基本單元。總體含量:總體所含的個(gè)體數(shù),常用N來(lái)表示。樣本樣本(sample):從總體中隨機(jī)抽出,并要對(duì)其進(jìn)行詳細(xì)研究的一部分個(gè)體。樣本有一個(gè)或若干個(gè)樣品(個(gè)體)組成。樣本容量(n):樣本中所含個(gè)體的數(shù)目。n50015-30算術(shù)均數(shù)(arithmetic mean):全部數(shù)據(jù)的算術(shù)平均數(shù)計(jì)算公式:特點(diǎn):最常用的測(cè)度值均值利用了全體數(shù)據(jù)易受數(shù)據(jù)中極端值的影響用于數(shù)值型數(shù)據(jù),而不能用于分類數(shù)據(jù)和順序數(shù)據(jù)平均數(shù)(Mean)例:測(cè)得8只正常大鼠血清總酸性
5、磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。加權(quán)計(jì)算法:適合于頻數(shù)分布表資料求均數(shù)。式中k是組段;fi為每組段的頻數(shù);Xi為每組段的組中值。組中值等于本組段的下限和上限相加除以2。i=1,2 k 。 用加權(quán)法計(jì)算均數(shù)眾數(shù)(ode)定義:樣本數(shù)據(jù)中出現(xiàn)頻數(shù)最高的那個(gè)樣本值特點(diǎn):不受極端值的影響可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)(不唯一性)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)或數(shù)值型數(shù)據(jù)算例某城市居民關(guān)注廣告類型的頻數(shù)分布廣告類型人數(shù)比例頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其它廣告112519161020
6、.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計(jì)20011000商品廣告算例甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比()非常不滿意不滿意一般滿意非常滿意24108934530836311510合計(jì)300100M0不滿意中位數(shù)(Median)定義:對(duì)樣本數(shù)據(jù)由小到大排序,處于“正中間位置”上的數(shù)據(jù)特點(diǎn):不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù),各變量值與中位數(shù)的離差絕對(duì)值之和最小,即計(jì)算公式原始數(shù)據(jù):24,22,21,26,20個(gè)數(shù)據(jù)排序:20,21,22,24,26位置:1, 2, 3
7、, 4, 5位置(n+1)/2=(5+1)/2=322原始數(shù)據(jù):10,5,9,12,6,8個(gè)數(shù)據(jù)排序:5,6,8,9,10,12位置:1,2,3,4, 5, 6位置(n+1)/2=(6+1)/2=3.5(8+9)/2=8.5算例幾何平均數(shù)(geometric mean)定義:n個(gè)觀測(cè)值,其乘積開(kāi)n次方所得的值.特點(diǎn):適用于變量x為對(duì)數(shù)的正態(tài)分布。變異數(shù):用于度量變量的離散型前面講授的頻率分布有集中趨勢(shì)和離散趨勢(shì)兩個(gè)特征,說(shuō)明描述資料的全面變化規(guī)律需把二者結(jié)合起來(lái)。通過(guò)下例可說(shuō)明這個(gè)問(wèn)題。例:現(xiàn)有3組健康女大學(xué)生的口腔溫度測(cè)得值如下,試分析其集中趨勢(shì)和離散趨勢(shì)。1組 36.8 36.9 37.0
8、 37.1 37.22組 36.5 36.9 37.0 37.1 37.53組 36.5 36.7 37.0 37.3 37.5前面三組學(xué)生的平均口腔溫度都是37.0(),即集中趨勢(shì)相同,但能說(shuō)明三組數(shù)據(jù)的變化規(guī)律相同嗎?我們通過(guò)把上述三組數(shù)據(jù)轉(zhuǎn)化成數(shù)軸上的點(diǎn)看看這個(gè)問(wèn)題。顯然三組學(xué)生的口腔溫度值參差不齊的程度都各不相同。第1組數(shù)值較為集中,第2、3組數(shù)值較為發(fā)散。說(shuō)明三組數(shù)據(jù)的離散趨勢(shì)是不相同的。全距(極差)(ange):一組數(shù)據(jù)的最大值與最小值之差特征:離散程度的最簡(jiǎn)單測(cè)度值易受極端值的影響未考慮數(shù)據(jù)的分布方差(Variance)定義:各變量值與均值的平均差異特點(diǎn):最常用的離散程度的測(cè)度值反映了數(shù)據(jù)的分布標(biāo)準(zhǔn)差(Standard Deviation):定義:方差的算術(shù)平方根特點(diǎn):與變量值的計(jì)量單位相同比方差更常用變異系數(shù)當(dāng)平均
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)浴加盟合同范例
- 合肥鋼管出租合同范例
- 代建開(kāi)發(fā)合同范本
- 識(shí)字研究課題申報(bào)書
- 天津小學(xué)課題申報(bào)書格式
- 住房公積金優(yōu)化調(diào)整讓民生更加溫暖
- 農(nóng)業(yè)機(jī)具代理合同范本
- 合同范本正版
- 上海樓梯合同范本
- 人力公司墊資合同范本
- 勞動(dòng)用工協(xié)議書范本正規(guī)范本(通用版)1
- JCT640-2010 頂進(jìn)施工法用鋼筋混凝土排水管
- 英納能特種防護(hù)材料珠海產(chǎn)研生態(tài)基地建設(shè)項(xiàng)目(一期)環(huán)境影響報(bào)告表
- 小班安全《安安全全玩滑梯》
- 形式發(fā)票與商業(yè)發(fā)票的區(qū)別
- 人工智能在軟件缺陷預(yù)測(cè)中的應(yīng)用
- 03D501-1 防雷與接地安裝
- IPQC入職崗位培訓(xùn)
- 牛津自然拼讀
- 京東集團(tuán)員工手冊(cè)-京東
- 正確識(shí)記現(xiàn)代漢語(yǔ)常用字字形課件
評(píng)論
0/150
提交評(píng)論