版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)的統(tǒng)計(jì)描述1.1 統(tǒng)計(jì)描述及SAS過(guò)程1.1.1 描述性統(tǒng)計(jì)量1.1.1.1平均位置的度量1.1.1.2離散程度的度量1.1.1.3分布形狀的度量1.1.2 MEANS過(guò)程1.1.2.1 MEANS過(guò)程的格式及語(yǔ)句說(shuō)明1.1.2.2 SAS例子1.1.3 UNIVARIATE過(guò)程1.1.3.1格式及語(yǔ)句說(shuō)明1.1.3.2 語(yǔ)句說(shuō)明2.2 數(shù)據(jù)的圖形概括2.2.1概率密度函數(shù)及分布函數(shù)的圖形表示2.2.2探索性數(shù)據(jù)分析第2章 數(shù)據(jù)的統(tǒng)計(jì)描述目錄返回作業(yè)思考題1統(tǒng)計(jì)描述是對(duì)觀測(cè)數(shù)據(jù)進(jìn)行概括、整理,使人們對(duì)其規(guī)律有個(gè)基本了解,也是進(jìn)一步進(jìn)行統(tǒng)計(jì)推斷和分析的基礎(chǔ) 第2章 數(shù)據(jù)的統(tǒng)計(jì)描述采用相應(yīng)的統(tǒng)
2、計(jì)量和繪制統(tǒng)計(jì)圖等方式對(duì)數(shù)據(jù)進(jìn)行整理 SAS系統(tǒng)中的MEANS和UNIVARIATE過(guò)程可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的統(tǒng)計(jì)描述,本章目錄2描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 平均位置的度量1.均值本章目錄3描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 平均位置的度量2.中位數(shù)其做法是先將這n個(gè)數(shù)按從小到大的順序進(jìn)行排列得到: ,中位數(shù)是位于中間位置的數(shù)。 本章目錄4描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 平均位置的度量3.眾數(shù)表示觀測(cè)值中出現(xiàn)次數(shù)最多的數(shù)值,常用 表示 本章目錄5描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 平均
3、位置的度量4.分位數(shù)其中 表示 整數(shù)部分,且 。 分位數(shù)表示有100 %個(gè)觀測(cè)值不超過(guò) 分位數(shù)。故又稱 分位數(shù)為第100 個(gè)百分位數(shù),中位數(shù)即0.5分位數(shù).0.25分位數(shù)和0.75分位數(shù)分別稱為下四分位數(shù)和上四分位數(shù),并記為 和 。 本章目錄6描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 平均位置的度量以上幾個(gè)統(tǒng)計(jì)量中,均值易受極端值的影響,而眾數(shù)、中位數(shù)和分位數(shù)受極端值影響較小。因而這些量在實(shí)際應(yīng)用中要區(qū)別對(duì)待 本章目錄7描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 離散程度的度量 1.方差2.標(biāo)準(zhǔn)差3.標(biāo)準(zhǔn)誤(均值的標(biāo)準(zhǔn)差)本章目錄8描述性統(tǒng)計(jì)量1 描述性統(tǒng)
4、計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 離散程度的度量 4.極差5.四分位距(四分位極差)6.變異系數(shù)即:本章目錄9描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 離散程度的度量 方差是度量觀測(cè)值分散程度的常用統(tǒng)計(jì)量,但其量綱與觀測(cè)值的量綱不同,而標(biāo)準(zhǔn)差、極差及標(biāo)準(zhǔn)誤的單位與觀測(cè)值的量綱相同,而變異系數(shù)無(wú)量綱,因而便于不同量綱數(shù)據(jù)的分散性比較 通常在正態(tài)分布的情況下,我們用統(tǒng)計(jì)量均值和方差來(lái)描述分布的平均位置和變異程度,而對(duì)分布未知或分布不規(guī)則的觀測(cè)數(shù)據(jù)用統(tǒng)計(jì)量中位數(shù)和四分位距來(lái)度量其位置和變異 本章目錄10描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 分布形狀的度
5、量 1.偏度2.峰度其中 為標(biāo)準(zhǔn)差 本章目錄11描述性統(tǒng)計(jì)量1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程設(shè) 是一組觀測(cè)數(shù)據(jù) 分布形狀的度量 一個(gè)分布是否對(duì)稱,可通過(guò)計(jì)算偏度的值進(jìn)行判斷:若 ,可認(rèn)為分布對(duì)稱;若 ,則分布右偏(正偏),即均值右側(cè)的數(shù)據(jù)更分散;若 ,則分布左偏(負(fù)偏),即均值左側(cè)的數(shù)據(jù)更分散。峰度是以同方差正態(tài)分布為標(biāo)準(zhǔn),比較兩側(cè)極端數(shù)據(jù)分布情況的指標(biāo)。正態(tài)分布的 ;若均值兩側(cè)極端值數(shù)據(jù)較多,則峰度為正,此時(shí)分布有一厚重的尾巴,且 ;若均值兩側(cè)的極端值較少,則 。本章目錄12MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程可用來(lái)對(duì)數(shù)值變量計(jì)算其描述性統(tǒng)計(jì)量,該過(guò)程除不能給出眾數(shù)及分位
6、數(shù)外,其它描述性統(tǒng)計(jì)量均可給出。它可以通過(guò)VAR語(yǔ)句指定需要分析的變量,也可通過(guò)BY語(yǔ)句,將變量進(jìn)行分組計(jì)算其統(tǒng)計(jì)量,在BY組內(nèi)還可通過(guò)CLASS語(yǔ)句進(jìn)一步分組。此外該過(guò)程還可進(jìn)行T-檢驗(yàn)(其檢驗(yàn)假設(shè)為: )和總體均數(shù)的區(qū)間估計(jì),同時(shí)還可方便地將所分析的結(jié)果保存到SAS數(shù)據(jù)集中,方便以后進(jìn)一步使用。 本章目錄13MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 1.格式PROC MEANS 選擇項(xiàng); VAR 變量表; BY 變量表; CLASS 變量表; FREQ 變量表; WEIGHT 變量; ID 變量表; OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計(jì)量關(guān)鍵詞=變量名
7、表必需的語(yǔ)句可選擇語(yǔ)句本章目錄14MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 選擇項(xiàng) DATA=SAS數(shù)據(jù)集名,指明進(jìn)行分析的數(shù)據(jù)集名,其缺省值為最近建立的SAS數(shù)據(jù)集。NOPRINT不打印任何描述性統(tǒng)計(jì)量。此選項(xiàng)多用在將描述性統(tǒng)計(jì)量輸出到SAS數(shù)據(jù)集時(shí)。 缺省時(shí)的規(guī)定輸出描述統(tǒng)計(jì)量,即PRINT選項(xiàng)。MAXDEC=n指定輸出結(jié)果小數(shù)部分的最大位數(shù),n的取值范圍為08,缺省值為n=2ALPHA=值,指定顯著性水平的值。VARDEF=除數(shù) 指定計(jì)算方差所用的除數(shù)。除數(shù)可以用以下關(guān)鍵字表示: 1. DF 用自由度(N-1)做除數(shù),這是缺省設(shè)置。 2.
8、N 用觀測(cè)數(shù)做除數(shù)。 3. WEIGHT | WGT 用權(quán)重和做除數(shù)。 4. WDF 用權(quán)重和減1做除數(shù)。本章目錄15MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 選擇項(xiàng) 統(tǒng)計(jì)量用關(guān)鍵詞表示: N、mean、std、min、max、Nmiss、range、sum、var、uss、css、cv、stderr、t、prt、sumwgt、skewness、krutosis、clm、lclm、uclm等,其中前五個(gè)統(tǒng)計(jì)量為缺省時(shí)的值.要得到這些統(tǒng)計(jì)量,只需給出相關(guān)的關(guān)鍵詞即可.這此關(guān)鍵詞亦可用于OUTPUT語(yǔ)句中。clm是計(jì)算置信上限和下限;lclm計(jì)算置信
9、下限;uclm計(jì)算置信上限。本章目錄16MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 VAR 變量表 規(guī)定要進(jìn)行計(jì)算的數(shù)值變量及順序。該語(yǔ)句缺省時(shí),除由BY、CLASS、FREQ和WEIGHT指定的變量外,其余的數(shù)值變量均進(jìn)行計(jì)算。 BY 變量表 根據(jù)BY后指定的變量表形成多個(gè)觀測(cè)組,然后對(duì)每組分別計(jì)算相應(yīng)的統(tǒng)計(jì)量,不過(guò)在使用該語(yǔ)句之前,應(yīng)對(duì)BY后面指定的變量表進(jìn)行過(guò)排序。 本章目錄17MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 CLASS 變量表 此語(yǔ)句的作用與BY語(yǔ)句類(lèi)似,其不同之處是它不要求事先對(duì)C
10、LASS的變量表進(jìn)行排序,且在輸出時(shí),按CLASS變量的不同取值,以單頁(yè)輸出。 FREQ 變量 指定其后的變量代表的是頻數(shù),此語(yǔ)句當(dāng)數(shù)據(jù)集是頻數(shù)表資料時(shí)才使用。 用ID后面指定的變量表的值來(lái)標(biāo)識(shí)輸出的觀測(cè)。 ID 變量表 本章目錄18MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 指定其后的變量代表權(quán)重。該變量的值應(yīng)大于零,若某值小于零或缺失,則取該值為0。 WEIGHT 變量 例如,設(shè)變量X,其一組觀測(cè)值為 ,用WEIGHT語(yǔ)句規(guī)定權(quán)重變量為W,相應(yīng)的值為 ,( ), 則加權(quán)均值 和加權(quán)方差 為: ,其中除數(shù)由任選項(xiàng)VARDEF=確定。 本章目錄19
11、MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 該語(yǔ)句將結(jié)果輸出到某SAS數(shù)據(jù)集,其中OUT=SAS數(shù)據(jù)集指明將結(jié)果保存的數(shù)據(jù)集,若要?jiǎng)?chuàng)建永久數(shù)據(jù)集則要用兩級(jí)命名。統(tǒng)計(jì)量關(guān)鍵詞見(jiàn)選擇項(xiàng)中的說(shuō)明 OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計(jì)量關(guān)鍵詞=變量名表 本章目錄20MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 2.語(yǔ)句說(shuō)明 規(guī)定統(tǒng)計(jì)量并命名的形式有以下三種: OUTPUT OUT=SAS數(shù)據(jù)集 統(tǒng)計(jì)量關(guān)鍵詞=變量名表 關(guān)鍵詞=;或關(guān)鍵詞(變量表)=;表示輸出的數(shù)據(jù)集中計(jì)算由關(guān)鍵詞指定的 統(tǒng)計(jì)量,其名字仍為原變量名。前者要計(jì)
12、算的變量和順序由VAR語(yǔ)句指 定,而后者則由關(guān)鍵詞括號(hào)中的變量表指定。關(guān)鍵詞=名字列表;表示輸出的統(tǒng)計(jì)量的名字為等號(hào)右邊的名字列表指定, 計(jì)算的變量和順序也是由VAR語(yǔ)句指定。關(guān)鍵詞(變量表)=名字列表;這結(jié)合前面兩者的優(yōu)點(diǎn),既可控制要計(jì)算的 變量及順序,也可按自已的要求給計(jì)算的統(tǒng)計(jì)量取名字。 本章目錄21MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格式及語(yǔ)句說(shuō)明 3.例子 對(duì)120個(gè)爐鋼中的SI含量進(jìn)行檢驗(yàn),得數(shù)據(jù)如下:0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.81 0.79 0.74 0.82 0.78
13、 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.780.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74 0.81 0.710.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.780.77 0.81 0.71 0.79 0.95 0.77 0.78 0.78 0.81 0.81 0.79 0.870.80 0.83 0.77 0.65 0.76 0.64 0.82 0.78 0.80 0.75 0.82 0.820.84 0.80 0.79 0.80 0.90
14、 0.77 0.82 0.81 0.79 0.75 0.82 0.830.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75 0.780.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.850.83 0.84 0.89 0.82 0.81 0.85 0.86 0.84 0.82 0.78 0.82 0.78給出這組數(shù)據(jù)的描述統(tǒng)計(jì)量,樣本均值,樣本方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)誤差,極差,變異系數(shù),偏度系數(shù),峰度系數(shù)等 本章目錄22MEANS過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程MEANS過(guò)程的格
15、式及語(yǔ)句說(shuō)明 3.例子 data stat;input x;cards;0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.810.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.780.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74 0.81 0.710.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.780.77 0.81 0.71 0.79 0.95 0.7
16、7 0.78 0.78 0.81 0.81 0.79 0.870.80 0.83 0.77 0.65 0.76 0.64 0.82 0.78 0.80 0.75 0.82 0.820.84 0.80 0.79 0.80 0.90 0.77 0.82 0.81 0.79 0.75 0.82 0.830.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75 0.780.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.850.83 0.84 0.89 0.82 0.81 0.85 0.8
17、6 0.84 0.82 0.78 0.82 0.78;proc means data=stat mean var std stderr range cv skewness kurtosis;var x;run;演示本章目錄23univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程UNIVARIATE過(guò)程與MEANS過(guò)程一樣,能計(jì)算各種描述統(tǒng)計(jì)量,但它的功能比MEANS過(guò)程還要強(qiáng)大,除了可完成MEANS過(guò)程的基本統(tǒng)計(jì)量的計(jì)算外,還能計(jì)算眾數(shù)和分位數(shù),生成頻率表,以及進(jìn)行正態(tài)性檢驗(yàn)和繪制正態(tài)概率圖、莖葉圖和盒形圖等方面的功能(關(guān)于這部分的功能下章再說(shuō)明)。 本章目錄24univariate過(guò)程1
18、描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明1.格式PROC UNIVARIATE 選擇項(xiàng); VAR 變量表; BY 變量表; FREQ 變量; WEIGHT 變量; ID 變量表; OUTPUT OUT=輸出數(shù)據(jù)集 統(tǒng)計(jì)量關(guān)鍵詞=變量名表 必需的語(yǔ)句可選語(yǔ)句本章目錄25univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明選擇項(xiàng)常用的幾個(gè)選項(xiàng)如下:DATA=數(shù)據(jù)集 給出要計(jì)算的目標(biāo)數(shù)據(jù)集NOPRINT 要求不在OUTPUT窗中輸出.PLOT 給出三種圖形:莖葉圖、盒式圖、正態(tài)概率圖。FREQ 給出頻數(shù)分布表,表中包括變
19、量值、頻數(shù)、百分?jǐn)?shù)、累計(jì)百分?jǐn)?shù)等項(xiàng);NORMAL 進(jìn)行正態(tài)性檢驗(yàn),檢驗(yàn)的原假設(shè)是:數(shù)據(jù)來(lái)自正態(tài)總體。VARDEF=DF | WGT | N | WDF 規(guī)定計(jì)算方差的除數(shù)本章目錄26univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 OUTPUT語(yǔ)句建立包括UNIVARIATE過(guò)程分析結(jié)果的輸出數(shù)據(jù)集,其格式與MEANS過(guò)程的格式相同,但該語(yǔ)句必須與VAR語(yǔ)句聯(lián)用。 本章目錄27univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞
20、(1)系統(tǒng)給出的統(tǒng)計(jì)關(guān)鍵詞 N、NOBS、NMISS、MEAN、STDERR、SUM、STD、VAR、CV、USS、CSS、MAX、MIN、RANGE、SKEWNESS、KURTOSIS、SUMWGT、MODE、T、PRT。 本章目錄28univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞 (1)系統(tǒng)給出的統(tǒng)計(jì)關(guān)鍵詞 百分位數(shù)關(guān)鍵字: Q3 上四分位數(shù)(第75百分位數(shù)) Q1 下四分位數(shù)(第25百分位數(shù)) QRANGE Q3-Q1四分位距 MEDIAN 中位數(shù)(第50百分位數(shù)) P1 第1百分位數(shù) P5
21、 第5百分位數(shù) P10 第10百分位數(shù) P90 第90百分位數(shù) P95 第95百分位數(shù) P99 第99百分位數(shù)本章目錄29univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞 (1)系統(tǒng)給出的統(tǒng)計(jì)關(guān)鍵詞 其它:SIGNRANK 符號(hào)秩統(tǒng)計(jì)量PROBS 大于中心的符號(hào)統(tǒng)計(jì)量的絕對(duì)值的概率MSIGN 符號(hào)統(tǒng)計(jì)量PROBM 大于符號(hào)秩統(tǒng)計(jì)量的絕對(duì)值的概率NORMAL 正態(tài)檢驗(yàn)統(tǒng)計(jì)量(W、ProbD)。PROBN 檢驗(yàn)數(shù)據(jù)來(lái)自正態(tài)分布假設(shè)的概率值。 本章目錄30univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)
22、過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞 (2)自定義分位數(shù)的選項(xiàng) PCTLPTS=百分位數(shù)值表 如PCTLPTS=55 66.7 即要求計(jì)算第55、和第66.7百分位數(shù)。若不指定這2個(gè)百分位數(shù)的變量名,則系統(tǒng)會(huì)自動(dòng)地給出其變量名分別為55、和66_7。小數(shù)點(diǎn)用“_代替,若指定的百分位數(shù)有兩位小數(shù),給出的變量名截成一位 PCTLNAME=后綴名列表 給出要輸出的百分位數(shù)變量名的后綴 PCTLPRE=前綴名列表 給出要輸出的百分位數(shù)變量名的字頭 本章目錄31univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及
23、語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞 (2)自定義分位數(shù)的選項(xiàng) 自定義的百分位數(shù)的名字由定義的變量前綴和后綴確定或缺省名連接起來(lái)形成。以上三項(xiàng)常聯(lián)合起來(lái)使用,其效果見(jiàn)下例:PROC UNIVARIATE; VAR X Y Z; OUTPUT OUT=TESTOUT PCTLPTS=55 66.7 PCTLPRE=A B C PCTLNAME=P55 P66_7; run;本章目錄32univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明2.語(yǔ)句說(shuō)明OUTPUT語(yǔ)句 下面列出其統(tǒng)計(jì)關(guān)鍵詞 (2)自定義分位數(shù)的選項(xiàng) 此例中要求給出由VA
24、R語(yǔ)句中規(guī)定的三個(gè)變量X,Y,Z的第55%和66.7%百分位數(shù),則在輸出數(shù)據(jù)集中產(chǎn)生的變量AP55 AP66_7表示X的第55和66.7百分位數(shù); 變量BP55,BP66_7表示Y的第55和66.7百分位數(shù);變量CP55 CP66_7表示Z的第55 66.7百分位數(shù)。 本章目錄33univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明3.例子例 數(shù)據(jù)同上例,下面我們用UNIVARIATE過(guò)程給出另外的幾個(gè)描述性統(tǒng)計(jì)量,中位數(shù),眾數(shù),上四分位數(shù),下四分位數(shù),四分位距 proc univariate data=stat;var x;run; 本章目錄34un
25、ivariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明3.例子輸出結(jié)果為:Univariate ProcedureVariable=X Moments (I)N120Sum Wgts120Mean0.80275Sum96.33Std Dev0.044777Variance0.002005Skewness-0.33182Kurtosis2.287141USS77.5675CSS0.238593CV5.57795Std Mean0.004088T:Mean=0196.3885Pr|T|0.0001Num =0120Num0120M(Sign)60Pr=|M|0.
26、0001Sgn Rank3630Pr=|S|0.0001本章目錄35univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明3.例子輸出結(jié)果為: Quantiles(Def=5) (II) 100% Max 0.95 99% 0.9 75% Q3 0.83 95% 0.87 50% Med 0.81 90% 0.85 25% Q1 0.78 10% 0.75 0% Min 0.64 5% 0.735 1% 0.65 極差 0.31 Q3-Q1 0.05 眾數(shù) 0.78本章目錄36univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程
27、的格式及語(yǔ)句說(shuō)明3.例子輸出結(jié)果為: Extremes(III) Lowest Obs Highest Obs 0.64( 66) 0.88( 38) 0.65( 64) 0.89( 111) 0.71( 51) 0.9( 77) 0.71( 36) 0.9( 86) 0.73( 101) 0.95( 53) 本章目錄37univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明3.例子N:觀測(cè)的個(gè)數(shù)Sum Wgts:觀測(cè)的加權(quán)和Mean:均值 Sum:觀測(cè)值的總和Std Dev:標(biāo)準(zhǔn)差 Variance:方差Skewness:偏度 Kurtosis:峰度U
28、SS:觀測(cè)值平方和 CSS:離均差平方和CV:變異系數(shù) Std Mean:標(biāo)準(zhǔn)誤差(即均值的標(biāo)準(zhǔn)差)T:Mean=0:均值為0的假設(shè)下的T值 Pr|T|:大于T絕對(duì)值的概率Num =0:非零觀測(cè)的個(gè)數(shù) Num0:觀測(cè)值中大于零的個(gè)數(shù)M(Sign):中位數(shù)為0的假設(shè)下符號(hào)統(tǒng)計(jì)量M的值 Pr=|M|:不小于M絕對(duì)值的概率Sgn Rank:中位數(shù)為0的假設(shè)下符號(hào)秩和統(tǒng)計(jì)量S的值 Pr=|S|:不小于S絕對(duì)值的概率。*W:Normal:正態(tài)性檢驗(yàn)統(tǒng)計(jì)量W的值 PrW:小于W值的概率。本章目錄38univariate過(guò)程1 描述性統(tǒng)計(jì)及SAS相關(guān)過(guò)程Univariate過(guò)程的格式及語(yǔ)句說(shuō)明3.例子上面的
29、程序利用UNIVARIATE過(guò)程的缺省輸出,結(jié)果需要在輸出項(xiàng)中尋找才行,下面的程序直接將結(jié)果保存到SAS數(shù)據(jù)集中。proc univariate data=stat noprint;var x;output out=result1 mode=xmod median=xmed Q3=xq3 Q1=xq1 QRANGE=xq31;proc print data=result1;run;結(jié)果為: XQ3 XMED XQ1 XQ31 XMOD 0.83 0.81 0.78 0.05 0.78 示范本章目錄39圖形具有形象直觀的特點(diǎn),因此用適當(dāng)?shù)膱D形將數(shù)據(jù)的特征展示出來(lái),是非常有意義的。常用頻率直方圖和累計(jì)頻率直方圖來(lái)表示概率密度函數(shù)和分布函數(shù);對(duì)數(shù)據(jù)用莖葉圖和盒形圖來(lái)進(jìn)行探索分析等。 2 數(shù)據(jù)的圖形概括本章目錄401 概率密度函數(shù)及分布函數(shù)的圖形表示(CHART、GCHART過(guò)程) 2 數(shù)據(jù)的圖形概括 設(shè) 是取自總體 的樣本,總體的概率密度函數(shù)為 ,將 的取值范圍等分為 個(gè)區(qū)間,用 表示區(qū)間的長(zhǎng)度,用 表示落入第 個(gè)區(qū)間的樣品個(gè)數(shù)。另外由總體分布 及積分中值定理,有:用頻率 近似估計(jì)概率 的值,則有: ,因此當(dāng)區(qū)間很小且樣本容量 很大時(shí),則以
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度消防檢測(cè)服務(wù)外包合同勞動(dòng)廳制定2篇
- 2025年度石材行業(yè)市場(chǎng)調(diào)查與分析合同3篇
- 二零二五年度外墻巖棉板保溫材料采購(gòu)、施工及質(zhì)量監(jiān)管合同2篇
- 二零二五年度旅游行業(yè)SaaS解決方案銷(xiāo)售及服務(wù)協(xié)議3篇
- 二零二五年度波形護(hù)欄安裝及售后保養(yǎng)服務(wù)合同3篇
- 二零二五年度廣告發(fā)布合同:某品牌在央視春晚廣告投放3篇
- 編織紅繩課程設(shè)計(jì)
- 二零二五年度建筑膩?zhàn)赢a(chǎn)品進(jìn)出口代理合同3篇
- 二零二五年度彩鋼房租賃與投資合作協(xié)議3篇
- 課程設(shè)計(jì)怎么形容成語(yǔ)
- 高中數(shù)學(xué)人教A版必修第一冊(cè) 全冊(cè) 思維導(dǎo)圖
- 【基于自由現(xiàn)金流貼現(xiàn)法的企業(yè)估值的案例探析3300字(論文)】
- 鑄件工藝性分析報(bào)告
- 船舶維修搶修方案
- 九年級(jí)初三中考物理綜合復(fù)習(xí)測(cè)試卷3套(含答案)
- (正式版)JTT 1218.5-2024 城市軌道交通運(yùn)營(yíng)設(shè)備維修與更新技術(shù)規(guī)范 第5部分:通信
- 2023年人教版五年級(jí)上冊(cè)語(yǔ)文期末考試題(加答案)
- 新中國(guó)史智慧樹(shù)知到期末考試答案2024年
- 基于物聯(lián)網(wǎng)的智能衣柜
- 設(shè)備的故障管理
- 2024年計(jì)算機(jī)二級(jí)ms備考試題庫(kù)400題(含答案)
評(píng)論
0/150
提交評(píng)論