版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、統(tǒng)計(jì)學(xué)(第五版)賈俊平 課后思考題和練習(xí)題答案(最終完整版)第一部分思考題第一章思考題什么是統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)的一門學(xué)科,它收集,處理,分析,解釋來自各個(gè)領(lǐng)域的數(shù)據(jù)并從中得出結(jié)論。解釋描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)描述統(tǒng)計(jì);它研究的是數(shù)據(jù)收集,處理,匯總,圖表描述,概括與分析等統(tǒng)計(jì)方法。推斷統(tǒng)計(jì);它是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法。統(tǒng)計(jì)學(xué)的類型和不同類型的特點(diǎn)統(tǒng)計(jì)數(shù)據(jù);按所采用的計(jì)量尺度不同分;(定性數(shù)據(jù))分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對事物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述;(定性數(shù)據(jù))順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有類別的,但這些類別是
2、有序的。(定量數(shù)據(jù))數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值。統(tǒng)計(jì)數(shù)據(jù);按統(tǒng)計(jì)數(shù)據(jù)都收集方法分;觀測數(shù)據(jù):是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物人為控制的條件下得到的。實(shí)驗(yàn)數(shù)據(jù):在實(shí)驗(yàn)中控制實(shí)驗(yàn)對象而收集到的數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù);按被描述的現(xiàn)象與實(shí)踐的關(guān)系分;截面數(shù)據(jù):在相同或相似的時(shí)間點(diǎn)收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。時(shí)間序列數(shù)據(jù):按時(shí)間順序收集到的,用于描述現(xiàn)象隨時(shí)間變化的情況,也叫動(dòng)態(tài)數(shù)據(jù)。解釋分類數(shù)據(jù),順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)答案同1.3舉例說明總體,樣本,參數(shù),統(tǒng)計(jì)量,變量這幾個(gè)概念對一千燈泡進(jìn)行壽命測試,那么這千個(gè)燈泡就是總體,從中抽取一百個(gè)進(jìn)行檢測,這一百個(gè)燈
3、泡的集合就是樣本,這一千個(gè)燈泡的壽命的平均值和標(biāo)準(zhǔn)差還有合格率等描述特征的數(shù)值就是參數(shù),這一百個(gè)燈泡的壽命的平均值和標(biāo)準(zhǔn)差還有合格率等描述特征的數(shù)值就是統(tǒng)計(jì)量,變量就是說明現(xiàn)象某種特征的概念,比如說燈泡的壽命。變量的分類變量可以分為分類變量,順序變量,數(shù)值型變量。變量也可以分為隨機(jī)變量和非隨機(jī)變量。經(jīng)驗(yàn)變量和理論變量。舉例說明離散型變量和連續(xù)性變量離散型變量,只能取有限個(gè)值,取值以整數(shù)位斷開,比如“企業(yè)數(shù)”連續(xù)型變量,取之連續(xù)不斷,不能一一列舉,比如“溫度”。統(tǒng)計(jì)應(yīng)用實(shí)例人口普查,商場的名意調(diào)查等。統(tǒng)計(jì)應(yīng)用的領(lǐng)域經(jīng)濟(jì)分析和政府分析還有物理,生物等等各個(gè)領(lǐng)域。第二章思考題什么是二手資料?使用二手
4、資料應(yīng)注意什么問題與研究內(nèi)容有關(guān),由別人調(diào)查和試驗(yàn)而來已經(jīng)存在,并會(huì)被我們利用的資料為“二手資料” C使用時(shí)要進(jìn)行評估, 要考慮到資料的原始收集人,收集目的,收集途徑,收集時(shí)間使用時(shí)要注明數(shù)據(jù)來源。比較概率抽樣和非概率抽樣的特點(diǎn),指出各自適用情況概率抽樣:抽樣時(shí)按一定的概率以隨機(jī)原則抽取樣本。每個(gè)單位別抽中的概率已知或可以計(jì)算,當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)單位樣本被抽到的概率。技術(shù)含量和成本都比較高。如果調(diào)查目的在于掌握和研究對象總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣:操作簡單,時(shí)效快,成本低,而且對于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。它適合探索性
5、的研究, 調(diào)查結(jié)果用于發(fā)現(xiàn)問題, 為更深入的數(shù)量分析提供準(zhǔn)備。它同樣使用市場調(diào)查中的概念測試(不需要調(diào)查結(jié)果投影到總體的情況)。除了自填式,面訪式和電話式還有什么搜集數(shù)據(jù)的辦法試驗(yàn)式和觀察式等自填式,面訪式和電話式各自的長處和弱點(diǎn)自填式;優(yōu)點(diǎn):1調(diào)查組織者管理容易 2成本低,可進(jìn)行大規(guī)模調(diào)查3對被調(diào)查者,可選擇方便時(shí)間答卷,減少回答敏感問題壓力。缺點(diǎn): 1返回率低2不適合結(jié)構(gòu)復(fù)雜的問卷,調(diào)查內(nèi)容有限3調(diào)查周期長4在數(shù)據(jù)搜集過程中遇見問題不能及時(shí)調(diào)整。面訪式;優(yōu)點(diǎn):1回答率高2數(shù)據(jù)質(zhì)量高3在調(diào)查過程中遇見問題可以及時(shí)調(diào)整。缺點(diǎn): 1成本比較高2搜集數(shù)據(jù)的方式對調(diào)查過程白質(zhì)量控制有一定難度3對于敏
6、感問題,被訪者會(huì)有壓力。電話式;優(yōu)點(diǎn):1速度快2對調(diào)查員比較安全 3對訪問過程的控制比較容易。缺點(diǎn): 1實(shí)施地區(qū)有限2調(diào)查時(shí)間不能過長 3使用的問卷要簡單 4被訪者不愿回答時(shí),不易勸服。老師說這個(gè)內(nèi)容不講,應(yīng)該不會(huì)考實(shí)驗(yàn)數(shù)據(jù)的如何控制調(diào)查中的回答誤差對于理解誤差,我會(huì)去學(xué)習(xí)一定的心理學(xué)知識,對于記憶誤差,我會(huì)盡量去縮短所涉及的時(shí)間范圍,對于有意識的誤差,我要做好被調(diào)查者的心理工作,要遵守職業(yè)道德,為被調(diào)查者保密,盡量在問卷中不涉及敏感問題。怎么減少無回答對于隨機(jī)誤差,要提高樣本容量,對于系統(tǒng)誤差,只有做好準(zhǔn)備工作并做好補(bǔ)救措施。比如說要一百份的問卷回復(fù),就要做好一百二十到一百三十的問卷準(zhǔn)備,進(jìn)
7、行面訪式的時(shí)候要盡量的勸服不愿意回答的被訪者,以小物品的饋贈(zèng)提高回復(fù)率。第三章思考題數(shù)據(jù)預(yù)處理內(nèi)容數(shù)據(jù)審核(完整性和準(zhǔn)確性;適用性和實(shí)效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些分類數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率等進(jìn)行描述性分析??捎脳l形圖,帕累托圖和餅圖進(jìn)行圖示分析。順序數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率。累計(jì)頻數(shù)和累計(jì)頻率等進(jìn)行描述性分析??捎脳l形圖,帕累托圖和餅圖,累計(jì)頻數(shù)分布圖和環(huán)形圖進(jìn)行圖示分析。數(shù)據(jù)型數(shù)據(jù)的分組方法和步驟分組方法:單變量值分組和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數(shù)2確定各組組距3根據(jù)分組整理成
8、頻數(shù)分布表直方圖和條形圖的區(qū)別1條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,2直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。繪制線圖應(yīng)注意問題時(shí)間在橫軸,觀測值繪在縱軸。一般是長寬比例10 : 7的長方形,縱軸下端一般從 0開始,數(shù)據(jù)與0距離過大的話用折斷符號折斷。餅圖和環(huán)形圖的不同餅圖只能顯示一個(gè)樣本或總體各部分所占比例,環(huán)形圖可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列,其圖形中間有個(gè)“空洞”,每個(gè)樣本或總體的數(shù)據(jù)系類為一個(gè)環(huán)。莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合莖葉
9、圖既能給出數(shù)據(jù)的分布情況,又能給出每一個(gè)原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。鑒別圖標(biāo)優(yōu)劣的準(zhǔn)則P75明確有答案,我就不寫了。制作統(tǒng)計(jì)表應(yīng)注意的問題1 ,合理安排統(tǒng)af表結(jié)構(gòu) 2表頭一般包括表號,總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容3表中的上下兩條橫線一般用粗線,中間的其他用細(xì)線4在使用統(tǒng)計(jì)表時(shí),必要時(shí)可在下方加注釋,注明數(shù)據(jù)來源。公式:組中值二(上限+下限)/2第4章數(shù)據(jù)的概括性度量一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測度?數(shù)據(jù)分布特征可以從三個(gè)方面進(jìn)行測度和描述:一是分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或集中的程度; 二是分布的離散
10、程度, 反映各數(shù)據(jù)遠(yuǎn)離其中心值的趨勢; 三是分 布的形狀,反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)。怎樣理解平均數(shù)在統(tǒng)計(jì)學(xué)中的地位?平均數(shù)在統(tǒng)計(jì)學(xué)中具有重要的地位,是集中趨勢的最主要的測度,主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。簡述四分位數(shù)的計(jì)算方法。四分位數(shù)是一組數(shù)據(jù)排序后處于 25%和75%位置上的值。根據(jù)未分組數(shù)據(jù)計(jì)算四分位 數(shù)時(shí),首先對數(shù)據(jù)進(jìn)行排序,然后確定四分位數(shù)所在的位置, 該位置上的數(shù)值就是四分位數(shù)。 4.4對于比率數(shù)據(jù)的平均為什么采用幾何平均?在實(shí)際應(yīng)用中,對于比率數(shù)據(jù)的平均采用幾何平均要比算數(shù)平均更合理。從公式 n(1 G)n(i G)中也可看出,g就是平均增長率。i 1簡述眾
11、數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)和應(yīng)用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點(diǎn)是具有不唯一性。眾數(shù)只有在 數(shù)據(jù)量較多時(shí)才有意義,數(shù)據(jù)量較少時(shí)不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當(dāng)數(shù)據(jù)的分布偏斜較大時(shí), 使用中位數(shù)也許不錯(cuò)。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。平均數(shù)對數(shù)值型數(shù)據(jù)計(jì)算的, 而且利用了全部數(shù)據(jù)信息, 在實(shí)際應(yīng)用中最廣泛。 當(dāng)數(shù)據(jù) 呈對稱分布或近似對稱分布時(shí), 三個(gè)代表值相等或相近, 此時(shí)應(yīng)選擇平均數(shù)。 但平均數(shù)易受 極端值的影響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時(shí)應(yīng)考慮中位數(shù)或眾數(shù)。簡述異眾比率、四分
12、位差、方差或標(biāo)準(zhǔn)差的適用場合對于分類數(shù)據(jù),主要用異眾比率來測量其離散程度;對于順序數(shù)據(jù),雖然也可以計(jì)算異眾比率,但主要使用四分位差來測量其離散程度;對于數(shù)值型數(shù)據(jù),雖然可以計(jì)算異眾比率和四分位差,但主要使用方差或標(biāo)準(zhǔn)差來測量其離散程度。標(biāo)準(zhǔn)分?jǐn)?shù)有哪些用途?標(biāo)準(zhǔn)分?jǐn)?shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個(gè)具有不同量綱的變量進(jìn)行處理時(shí),常需要對各變量進(jìn)行標(biāo)準(zhǔn)化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。為什么要計(jì)算離散系數(shù)?方差和標(biāo)準(zhǔn)差是反映數(shù)據(jù)分散程度的絕對值,一方面其數(shù)值大小受原變量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān); 另一方面,它們與原變量的計(jì)量單位相同,采 用不同計(jì)量單
13、位的變量值,其離散程度的測度值也就不同。 因此,為消除變量值水平高低和 計(jì)量單位不同對離散程度測度值的影響,需要計(jì)算離散系數(shù)。測度數(shù)據(jù)分布形狀的統(tǒng)計(jì)量有哪些?對分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統(tǒng)計(jì)量是偏態(tài)系數(shù),測度峰態(tài)的統(tǒng)計(jì)量是峰態(tài)系數(shù)。第五章概率與概率分布頻率與概率有什么關(guān)系?在相同條件下隨機(jī)試驗(yàn) n次,某事件A出現(xiàn)m次,則比值m/n稱為事件A發(fā)生的頻 率。隨著n的增大,該頻率圍繞某一常數(shù)p波動(dòng),且波動(dòng)幅度逐漸減小,趨于穩(wěn)定,這個(gè)頻率的穩(wěn)定值即為該事件的概率。獨(dú)立性與互斥性有什么關(guān)系?互斥事件一定是相互依賴(不獨(dú)立)的,但相互依賴的事件不一定是互斥的。不互斥事件可能是獨(dú)立的,也可能是不
14、獨(dú)立的,但獨(dú)立事件不可能是互斥的。根據(jù)自己的經(jīng)驗(yàn)體會(huì)舉幾個(gè)服從泊松分布的隨機(jī)變量的實(shí)例。如某種儀器每月出現(xiàn)故障的次數(shù)、一本書一頁中的印刷錯(cuò)誤、某一醫(yī)院在某一天內(nèi)的急診病人數(shù)等根據(jù)自己的經(jīng)驗(yàn)體會(huì)舉幾個(gè)服從正態(tài)分布的隨機(jī)變量的實(shí)例。如某班某次的考試成績、某地區(qū)成年男性的身高、某公司年銷售量、同一車間產(chǎn)品的質(zhì) 量等第六章思考題統(tǒng)計(jì)量:設(shè)X1,X2,Xn是從總體X中抽取的容量為n的一個(gè)樣本,如果由此樣本構(gòu) 造一個(gè)函數(shù) T (X1,X2,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,Xn)是一個(gè)統(tǒng)計(jì)量。原因:為了使統(tǒng)計(jì)推斷成為可能。T1 和 T2 是P159統(tǒng)計(jì)量加工過程中一點(diǎn)信息都不損失的統(tǒng)計(jì)
15、量為充分統(tǒng)計(jì)量6.5 自由度:獨(dú)立變量的個(gè)數(shù)XZ N (0,1)cX N( )2分布:設(shè)X N(,則)F分布:設(shè)若U為服從自由度為ni的2分布,即U 2(ni), V為服從自由度為n2的2分布,即V 2(n2),且U和V相互獨(dú)立,則F 4V n2F F(ni,n/稱F為服從自由度ni和n2的F分布,記為抽樣分布:樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量中心極限定理:設(shè)從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為q方差為o2/n的正態(tài)分布第七章思考題估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具
16、體值評價(jià)估計(jì)量的標(biāo)準(zhǔn):無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)有效性:對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)置信區(qū)間:由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間95%的置信區(qū)間指用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值。含義:Za/2是標(biāo)準(zhǔn)正態(tài)分布上側(cè)面積為a/2的z值,公式是統(tǒng)計(jì)總體均值時(shí)的邊際誤差。獨(dú)立樣本:如果兩個(gè)樣本是從兩個(gè)總體中獨(dú)立抽取的,即一個(gè)樣本中的元素與另一個(gè)樣本中的元素相互獨(dú)立。匹配樣本:一個(gè)樣本中的數(shù)據(jù)與另一個(gè)樣本中的數(shù)據(jù)相對應(yīng)。(1)、兩個(gè)總體都服從正態(tài)分布(2
17、)、兩個(gè)隨即樣本獨(dú)立地分別抽自兩個(gè)總體樣本量越大置信水平越高,總體方差和邊際誤差越小第8章思考題假設(shè)檢驗(yàn)和參數(shù)估計(jì)有什么相同點(diǎn)和不同點(diǎn)?答:參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對總體進(jìn)行某種推斷,然而推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法,總體參數(shù)科在估計(jì)前是未知的。而在參數(shù)假設(shè)檢驗(yàn)中,則是先對科的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。什么是假設(shè)檢驗(yàn)中的顯著性水平?統(tǒng)計(jì)顯著是什么意思?答:顯著性水平是一個(gè)統(tǒng)計(jì)專有名詞,在假設(shè)檢驗(yàn)中,它的含義是當(dāng)原假設(shè)正確時(shí)卻被拒絕的概率和風(fēng)險(xiǎn)。統(tǒng)計(jì)顯著等價(jià)拒絕H0,指求出的值落在小概率的區(qū)間上,
18、一般是落在0.05或比0.05更小的顯著水平上。什么是假設(shè)檢驗(yàn)中的兩類錯(cuò)誤?答:假設(shè)檢驗(yàn)的結(jié)果可能是錯(cuò)誤的,所犯的錯(cuò)誤有兩種類型,一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯(cuò)誤的概率用a表示,所以也稱a錯(cuò)誤或棄真錯(cuò)誤;另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕,犯這種錯(cuò)誤的概論用3表示,所以也稱3錯(cuò)誤或取偽錯(cuò)誤。兩類錯(cuò)誤之間存在什么樣的數(shù)量關(guān)系?答:在假設(shè)檢驗(yàn)中,a與3是此消彼長的關(guān)系。如果減小a錯(cuò)誤,就會(huì)增大犯3錯(cuò)誤的機(jī)會(huì),若減小3錯(cuò)誤,也會(huì)增大犯”錯(cuò)誤的機(jī)會(huì)。解釋假設(shè)檢驗(yàn)中的 P值答:P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。(它的大小取決于三個(gè)因素,一個(gè)是樣本數(shù)據(jù)與
19、原假設(shè)之間的差異,一個(gè)是樣本量,再一個(gè)是被假設(shè)參數(shù)的總體分布。)顯著性水平與P值有何區(qū)別答:顯著性水平是原假設(shè)為真時(shí),拒絕原假設(shè)的概率,是一個(gè)概率值,被稱為抽樣分布的拒絕域,大小由研究者事先確定,一般為 0.05。而P只是原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率,被稱為觀察到的(或?qū)崪y的)顯著性水平假設(shè)檢驗(yàn)依據(jù)的基本原理是什么?答:假設(shè)檢驗(yàn)依據(jù)的基本原理是“小概率原理”,即發(fā)生概率很小的隨機(jī)事件在一次試驗(yàn)中是幾乎不可能發(fā)生的。根據(jù)這一原理,可以作出是否拒絕原假設(shè)的決定。你認(rèn)為單側(cè)檢驗(yàn)中原假設(shè)與備擇假設(shè)的方向如何確定?答:將研究者想收集證據(jù)予以支持的假設(shè)作為備擇假設(shè)Hi,將研究者想
20、收集證據(jù)證明其不正確的假設(shè)作為原假設(shè) H。,先確立備擇假設(shè) Hi,備擇假設(shè)的方向與想要證明其正確性的方向一致,原假設(shè)與備擇假設(shè)是互斥的,等號總在原假設(shè)上。(舉例說明,如下:“一項(xiàng)研究表明,采用新技術(shù)生產(chǎn)后,將會(huì)使產(chǎn)品的使用壽命明顯延長到1500小時(shí)以上。檢驗(yàn)這一結(jié)論是否成立,則備擇假設(shè)的方向?yàn)椤?”(壽命延長),建立的原假設(shè)與備擇假設(shè)應(yīng)為H0:W1500.又例,“一項(xiàng)研究表明,改進(jìn)生產(chǎn)工藝后,會(huì)使產(chǎn)品的廢品率降低到2%以下。檢驗(yàn)這一結(jié)論是否成立,則備擇假設(shè)的方向?yàn)椤?”(廢品率降低),建立的原假設(shè)與備擇假設(shè)應(yīng)為 H0:科溝 , H1:42%.)第10章思考題什么是方差分析?它研究的是什么?答:
21、方差分析就是通過檢驗(yàn)各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是非類型自變量對數(shù)值型因變量的影響。要檢驗(yàn)多個(gè)總體均值是否相等時(shí),為什么不作兩兩比較,而用方差分析方法?答:作兩兩比較十分繁瑣,進(jìn)行檢驗(yàn)的次數(shù)較多,隨著增加個(gè)體顯著性檢驗(yàn)的次數(shù),偶然因素導(dǎo)致差別的可能性也會(huì)增加。而方差分析方法則是同時(shí)考慮所有的樣本,因此排除了錯(cuò)誤累積的概率,從而避免拒絕一個(gè)真實(shí)的原假設(shè)。方差分析包括哪些類型?它們有何區(qū)別?答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個(gè)分類型自變量對一個(gè)數(shù)值型因變量的影響,而雙因素涉及兩個(gè)分類型自變量。方差分析中
22、有哪些基本假定?答:方差分析中有三個(gè)基本假定:(1 )每個(gè)總體都應(yīng)服從正態(tài)分布各個(gè)總體白方差b 2必須相同觀測值是獨(dú)立的簡述方差分析的基本思想。答:它是通過對數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進(jìn)而分析自變量對因變量是否有顯著影響。解釋因子與處理的含義。答:在方差分析中,所要檢驗(yàn)的對象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。解釋組內(nèi)誤差和組間誤差的含義。答:組內(nèi)誤差(SSE)是指每個(gè)水平或組的個(gè)樣本數(shù)據(jù)與其組平均值誤差的平方和,反映了每個(gè)樣本各觀測值的離散狀況;組間誤差( SSA)是指各組平均值 Xi與總平均值的誤差平方和,反映各樣本均值之間的差異程度。解釋組內(nèi)方差和組間方差
23、的含義。答:組內(nèi)方差指因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差, 組間方差指因素的不同水平(不同總體)下各樣本之間的方差。簡述方差分析的基本步驟。答:(1)提出假設(shè)(一般提法形式如下:H 0: (11= (12= (13=國=-j.仙,自變量對因變量沒有顯著影響,H 1: U (i=1,2,3.,k)不全相等,自變量對因變量有顯著影響)(2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量(包括:計(jì)算各樣本的均值,計(jì)算全部觀測值的總均值,計(jì)算各誤差平方和,計(jì)算統(tǒng)計(jì)量)(3)統(tǒng)計(jì)決策。(將統(tǒng)計(jì)量的值 F與給定的顯著性水平的臨界值F進(jìn)行比較,作出對原假設(shè)H 0的決策)方差分析中多重比較的作用是什么?答:通過對總體均值之間的配對
24、比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異。什么是交互作用?答:交互作用是指幾個(gè)因素搭配在一起會(huì)對因變量產(chǎn)生一種新的效應(yīng)的作用。解釋無交互作用和有交互作用的雙因素方差分析。答:在雙因素方差分析中, 如果兩個(gè)因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析;如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會(huì)對結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析。解釋R2的含義和作用。答:自變量平方和占總平方和的比例記為R2 ,即r2 SSA (組
25、間 SS)SST (總 SS)作用:其平方根R就可以用來測量兩個(gè)變量之間的關(guān)系強(qiáng)度。解釋試驗(yàn)、試驗(yàn)設(shè)計(jì)、試驗(yàn)單元的含義。答:試驗(yàn)是指收集樣本數(shù)據(jù)的過程。試驗(yàn)設(shè)計(jì)是指收集樣本數(shù)據(jù)的計(jì)劃。試驗(yàn)單元是指接受“處理”的對象或?qū)嶓w(“處理”指可控制的因素的各個(gè)水平)簡述完全隨機(jī)化設(shè)計(jì)、隨機(jī)化區(qū)組設(shè)計(jì)、因子設(shè)計(jì)的含義和區(qū)別。答:完全隨機(jī)化設(shè)計(jì)是將k種“處理”隨機(jī)地指派給試驗(yàn)單元的設(shè)計(jì)。隨機(jī)化區(qū)組設(shè)計(jì)是先按一定規(guī)則將試驗(yàn)單元?jiǎng)澐譃槿舾赏|(zhì)組,稱為“區(qū)組”,然后再將各種處理隨機(jī)地指派給各個(gè)區(qū)組。因子設(shè)計(jì)指考慮兩個(gè)因素(可推廣到多個(gè)因素)的搭配試驗(yàn)設(shè)計(jì)。第13章思考題簡述時(shí)間序列的構(gòu)成要素。時(shí)間序列的構(gòu)成要素:
26、趨勢,季節(jié)性,周期性,隨機(jī)性利用增長率分析時(shí)間序列時(shí)應(yīng)注意哪些問題。(1)當(dāng)時(shí)間序列中的觀察值出現(xiàn)0或負(fù)數(shù)時(shí),不宜計(jì)算增長率;(2)不能單純就增長率論增長率,要注意增長率與絕對水平的綜合分析;大的增長率背后,其隱含的絕對值可能很小,小的增長率背后其隱含的絕對值可能很大。簡述平穩(wěn)序列和非平穩(wěn)序列的含義。.平穩(wěn)序列(stationary series)基本上不存在趨勢的序列,各觀察值基本上在某個(gè)固定的水平上波動(dòng)或雖有波動(dòng),但并不存在某種規(guī)律,而其波動(dòng)可以看成是隨機(jī)的.非平穩(wěn)序歹U (non-stationary series)是包含趨勢、季節(jié)性或周期性的序列,它可能只含有其中的一種成分,也可能是幾
27、種成分的組合。因此,非平穩(wěn)序列又可以分為有趨勢的序列、有趨勢和季節(jié)性的序列、幾種成分混合而成的復(fù)合型序列。3.4簡述時(shí)間序列的預(yù)測程序。第一步:確定時(shí)間序列所包含的成分,也就是確定時(shí)間序列的類型。第二步:找出適合此類時(shí)間序列的預(yù)測方法。第三步:對可能的預(yù)測方法進(jìn)行評估,以確定最佳預(yù)測方案。第四步:利用最佳預(yù)測方案進(jìn)行預(yù)測。3.5簡述指數(shù)平滑法的含義。.是加權(quán)平均的一種特殊形式.對過去的觀察值加權(quán)平均進(jìn)行預(yù)測的一種方法.觀察值時(shí)間越遠(yuǎn),其權(quán)數(shù)也跟著呈現(xiàn)指數(shù)的下降,因而稱為指數(shù)平滑.有一次指數(shù)平滑、二次指數(shù)平滑、三次指數(shù)平滑等.該方法使用第T+1期的預(yù)測值等于T期的實(shí)際觀測值與第 T期預(yù)測值的加權(quán)
28、平均值.一次指數(shù)平滑法也可用于對時(shí)間序列進(jìn)行修勻,以消除隨機(jī)波動(dòng),找出序列的變化趨勢簡述復(fù)合型序列預(yù)測的步驟第一步:確定并分離季節(jié)成分,計(jì)算季節(jié)指數(shù),以確定時(shí)間序列中的季節(jié)成分。然后將季節(jié)性因素從時(shí)間序列中分離出去,以便觀察和分析時(shí)間序列的其他特征。第二步:對消除了季節(jié)成分的時(shí)間序列建立適當(dāng)預(yù)測模型,并進(jìn)行預(yù)測。第三步:計(jì)算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù),得到最終的預(yù)測值簡述季節(jié)指數(shù)的計(jì)算步驟.計(jì)算移動(dòng)平均值(季度數(shù)據(jù)采用4項(xiàng)移動(dòng)平均,月份數(shù)據(jù)采用12項(xiàng)移動(dòng)平均),并將其結(jié)果進(jìn)行“中心化”處理(將移動(dòng)平均的結(jié)果再進(jìn)行一次二項(xiàng)的移動(dòng)平均,即得出“中心化移動(dòng)平均值”(CMA).計(jì)算移動(dòng)
29、平均的比值,也成為季節(jié)比率(即將序列的各觀察值除以相應(yīng)的中心化移動(dòng)平均值,然后再計(jì)算出各比值的季度(或月份)平均值,即季節(jié)指數(shù)).季節(jié)指數(shù)調(diào)整(各季節(jié)指數(shù)的平均數(shù)應(yīng)等于1或100% ,若根據(jù)第二步計(jì)算的季節(jié)比率的平均值不等于1時(shí),則需要進(jìn)行調(diào)整。具體方法是:將第二步計(jì)算的每個(gè)季節(jié)比率的平均值除以它們的總平均值)第14章思考題解釋指數(shù)的含義。答:指數(shù)最早起源于測量物價(jià)的變動(dòng)。廣義上,是指任何兩個(gè)數(shù)值對比形成的相對數(shù);狹義上,是指用于測定多個(gè)項(xiàng)目在不同場合下綜合變動(dòng)的一種特殊相對數(shù)。實(shí)際應(yīng)用中使用的主要是狹義的指數(shù)。加權(quán)綜合指數(shù)和加權(quán)平均指數(shù)有何區(qū)別與聯(lián)系?加權(quán)綜合指數(shù):通過加權(quán)來測定一組項(xiàng)目的綜
30、合變動(dòng),有加權(quán)數(shù)量指數(shù)和加權(quán)質(zhì)量指數(shù)。使用條件:必須掌握全面數(shù)據(jù)(數(shù)量指數(shù),測定一組項(xiàng)目的數(shù)量變動(dòng),如產(chǎn)品產(chǎn)量指數(shù),商品銷售量指數(shù)等)(質(zhì)量指數(shù),測定一組項(xiàng)目的質(zhì)量變動(dòng),如價(jià)格指數(shù)、產(chǎn)品成本指數(shù)等)拉式公式:將權(quán)數(shù)的各變量值固定在基期。帕式公式:把作為權(quán)數(shù)的變量值固定在報(bào)告期。加權(quán)平均指數(shù):以某一時(shí)期的總量為權(quán)數(shù)對個(gè)體指數(shù)加權(quán)平均。使用條件:可以是全面數(shù)據(jù)、不完全數(shù)據(jù)。因權(quán)數(shù)所屬時(shí)期的不同,有不同的計(jì)算形式。有:算術(shù)平均形式、調(diào)和平均形解釋零售價(jià)格指數(shù)、消費(fèi)價(jià)格指數(shù)、生產(chǎn)價(jià)格指數(shù)、股票價(jià)格指數(shù)。答:零售價(jià)格指數(shù):反映城鄉(xiāng)商品零售價(jià)格變動(dòng)趨勢的一種經(jīng)濟(jì)指數(shù)。消費(fèi)價(jià)格指數(shù):反映一定時(shí)期內(nèi)消費(fèi)者所購
31、買的生活消費(fèi)品價(jià)格和服務(wù)項(xiàng)目價(jià)格的變動(dòng)趨勢和程度的一種相對數(shù)。生產(chǎn)價(jià)格指數(shù):測量在初級市場上出售的貨物(即在非零售市場上首次購買某種商品時(shí))的價(jià)格變動(dòng)的一種價(jià)格指數(shù)。股票價(jià)格指數(shù):反映某一股票市場上多種股票價(jià)格變動(dòng)趨勢的一種相對數(shù),簡稱股價(jià)指數(shù)。其單位一般用“點(diǎn)”(point)表示,即將基期指數(shù)作為100 ,每上升或下降一個(gè)單位稱為點(diǎn)”。消費(fèi)價(jià)格指數(shù)有哪些作用?答:消費(fèi)價(jià)格指數(shù)除了能反映城鄉(xiāng)居民所購買的生活消費(fèi)品價(jià)格和服務(wù)項(xiàng)目價(jià)格的變動(dòng)趨勢和程度外,還具有以下幾個(gè)方面的作用:(1)用于反映通貨膨脹狀況(2)用于反映貨幣購買力變動(dòng)(3)用于反映對職工實(shí)際工資的影響(4)用于縮減經(jīng)濟(jì)序列14.5在
32、構(gòu)建多指標(biāo)綜合評價(jià)指數(shù)時(shí),指標(biāo)的轉(zhuǎn)換方法有哪幾種形式?答:有以下3種形式:(1 )統(tǒng)計(jì)標(biāo)準(zhǔn)化。(2)極值標(biāo)準(zhǔn)化。(3)定基與環(huán)比轉(zhuǎn)換。具體公式見書上 P440.補(bǔ)充:.什么是指數(shù)體系?答:指數(shù)體系是指由總量指數(shù)及其若干個(gè)因素指數(shù)構(gòu)成的數(shù)量關(guān)系式??偭恐笖?shù)等于各因素指數(shù)的乘積總量的變動(dòng)差額等于各因素指數(shù)變動(dòng)差額之和兩個(gè)因素指數(shù)中通常一個(gè)為數(shù)量指數(shù),另一個(gè)為質(zhì)量指數(shù)各因素指數(shù)的權(quán)數(shù)必須是不同時(shí)期的.什么是加權(quán)綜合指數(shù)體系?答:由加權(quán)綜合指數(shù)及其各因素指數(shù)構(gòu)成的等式。比較常用的是基期權(quán)數(shù)加權(quán)的數(shù)量指數(shù)和報(bào)告期權(quán)數(shù)加權(quán)的質(zhì)量指數(shù)形成的指數(shù)體系。第二部分:練習(xí)題3. 1為評價(jià)家電行業(yè)售后服務(wù)的質(zhì)量,隨機(jī)
33、抽取了由100個(gè)家庭構(gòu)成的一個(gè)樣本。服務(wù)質(zhì)量的等級分別表示為:A .好;B.較好;C 一般;D.較差;E.差。調(diào)查結(jié)果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1)指出上面的數(shù)據(jù)屬于什么類型。順序數(shù)據(jù)(2)用Excel制作一張頻數(shù)分布表。用數(shù)據(jù)分析一一直方圖制作:接收頻率E16D17C32B21A14繪制一張條形圖,反映評價(jià)等級的分布。用數(shù)據(jù)分析一一直方圖制作:直方圖40 r率1一 一頻20 : |頻率0 E D C B A
34、接收(4)繪制評價(jià)等級的帕累托圖。逆序排序后,制作累計(jì)頻數(shù)分布表:接收頻數(shù)頻率(%)累計(jì)頻率()C323232B212153D171770E1616863. 2 某行業(yè)管理局所屬 40個(gè)企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126A1414100頻數(shù)一累計(jì)頻率()(1)根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計(jì)算出累積頻數(shù)和累積頻率。要求:1.602060.3010
35、36.32 ,取 k=61、確定組數(shù):K 1 ig(n)1 Ig 40Ig(2) ig 22、確定組距:組距=(最大值-最小值)+組數(shù)=(152-87 ) +6=10.83 ,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%累計(jì)頻數(shù)累計(jì)頻率%80.00 - 89.0025.025.090.00 - 99.0037.5512.5100.00 - 109.00922.51435.0110.00 - 119.001230.02665.0120.00 - 129.00717.53382.5130.00 - 139.00410.03792.5140.00 - 149.0025.03997.5150.00+12.5
36、40100.0總和40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進(jìn)企業(yè),115125萬元為良好企業(yè),105 115萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進(jìn)企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進(jìn)行分組。頻數(shù)頻率%累計(jì)頻數(shù)累計(jì)頻率先進(jìn)企業(yè)1025.01025.0良好企業(yè)1230.02255.0一般企業(yè)922.53177.5落后企業(yè)922.540100.0總和40100.03. 3某百貨公司連續(xù)40天的商品銷售額如下:單位:萬元4125294738343038434046364537373645433344352846343037442638444236373749394232363
37、5要求:根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。1、確定組數(shù):/lg(n)Jg40/1.60206 仃K 1號1 1 6.32,取k=6lg(2) lg2 0.301032、確定組距:組距=(最大值-最小值)+組數(shù)=(49-25 ) +6=4 ,取53、分組頻數(shù)表銷售收入(萬元)頻數(shù)頻率%累計(jì)頻數(shù)累計(jì)頻率%=2512.512.526 - 30512.5615.031 - 35615.01230.036 - 401435.02665.041 - 451025.03690.046+410.040100.0總和40100.0頻數(shù)銷售收入4利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。5729
38、2936312347232828355139184618265029332146415228214319422060_50-30-20-10-datadata Stem-and-Leaf PlotFrequencyStem &Leaf3.001 .8895.002 .011337.002 .68889992.003 .133.003 .5693.004 .1233.004 .6673.005 .0121.005 .7Stem width:10Each leaf:1 case(s)3. 6一種袋裝食品用生產(chǎn)線自動(dòng)裝填,每袋重量大約為50g,但由于某些原因, 每袋重量不會(huì)恰好是50g。下面是隨機(jī)抽
39、取的100袋食品,測得的重量數(shù)據(jù)如 下:單位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:構(gòu)建這些數(shù)據(jù)的頻數(shù)分布表。(2)繪制頻數(shù)分布的直方圖。說明數(shù)據(jù)分布的特征。解:(1)根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計(jì)算出累積頻數(shù)
40、和累積頻率。1、確定組數(shù):0.301036.64 ,取 k=6 或 7K 1 皿 1 1g 1。ig(2) ig 22、確定組距:組距=(最大值最小值)一組數(shù)=61-40 ) +6=3.5 ,取 3 或者 4、5組距=(最大值最小值)+組數(shù)=(61-40 ) +7=3 ,3、分組頻數(shù)表頻數(shù)百分比累計(jì)頻數(shù)累積百分比有效40.00 - 42.0033.033.043.00 - 45.0099.01212.046.00 - 48.002424.03636.049.00 - 51.001919.05555.052.00 - 54.002424.07979.055.00 - 57.001414.0939
41、3.058.00+77.0100100.0合計(jì)100100.0組距3,上限為小于直方圖:組距3,小于30Mean =5.22Std. Dev. =1.508N =100組距3,小于組距4,上限為小于等于頻數(shù)百分比累計(jì)頻數(shù)累積百分比有效=40.0011.011.041.00 - 44.0077.088.045.00 - 48.002828.03636.049.00 - 52.002828.06464.053.00 - 56.002222.08686.057.00 - 60.001313.09999.061.00+11.0100100.0合計(jì)100100.0直方圖:組距4,小于等于30vcneua
42、erFMean =4.06Std. Dev. =1.221 N =100組距5,上限為小于等于頻數(shù)百分比累計(jì)頻數(shù)累積百分比有效=45.001212.012.012.046.00 - 50.003737.049.049.051.00 - 55.003434.083.083.056.00 - 60.001616.099.099.061.00+11.0100.0100.0合計(jì)100100.0直方圖:組距5,小于等于分布特征:左偏鐘型。2I OMean =2.57Std. Dev. =0.935N =1003.8下面是北方某城市1 2月份各天氣溫的記錄數(shù)據(jù):-32-4-7-11-1789-614-18
43、-15-9-6-105-4-96-8-12-16-19-15-22-25-24-19-8-6-15-11-12-19-25-24-18-17-14-22-13-9-60-15-4-9-32-4-4-16-175-6-5指出上面的數(shù)據(jù)屬于什么類型。 數(shù)值型數(shù)據(jù)(2)對上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M。1、確定組數(shù):. lg(n) . lg 60. 1.778151K 1 以11 1 6.90989 ,取 k=7lg(2) lg2 0.301032、確定組距:組距=(最大值-最小值)+組數(shù)=(14- (-25) ) +7=5.57 ,取53、分組頻數(shù)表溫度頻數(shù)頻率%累計(jì)頻數(shù)累計(jì)頻率%-25 - -2161
44、0.0610.0-20 - -16813.31423.3-15 - -11915.02338.3-10 - -61220.03558.3-5 - -11220.04778.30 - 446.75185.05 - 9813.35998.310+11.760100.0合計(jì)60100.0繪制直方圖,說明該城市氣溫分布的特點(diǎn)。頻數(shù)3.11對于下面的數(shù)據(jù)繪制散點(diǎn)圖。x234187y252520301618解:3.12甲乙兩個(gè)班各有40名學(xué)生,期末統(tǒng)計(jì)學(xué)考試成績的分布如下:考試成績?nèi)藬?shù)甲班乙班優(yōu)36良615中189及格98不及格42要求:根據(jù)上面的數(shù)據(jù),畫出兩個(gè)班考試成績的對比條形圖和環(huán)形圖??诳趦?yōu)良中及
45、不及格(2)比較兩個(gè)班考試成績分布的特點(diǎn)。甲班成績中的人數(shù)較多,高分和低分人數(shù)比乙班多,乙班學(xué)習(xí)成績較甲班好, 高分較多,而低分較少。一*一人數(shù)甲班T-人數(shù)乙班畫出雷達(dá)圖,比較兩個(gè)班考試成績的分布是否相似。分布不相似。3.14 已知1995 - 2004年我國的國內(nèi)生產(chǎn)總值數(shù)據(jù)如下(按當(dāng)年價(jià)格計(jì)算):單位:億元年份國內(nèi)生產(chǎn)總值第一產(chǎn)業(yè)第二產(chǎn)業(yè)第二產(chǎn)業(yè)199558478.1119932853817947199667884 . 613844.23361320428199774462 . 614211 . 23722323029199878345 . 214552 . 438619251741999
46、82067 . 514471 . 964055827038200089468 . 114628 . 24493529905200197314 . 815411 . 848750331532002105172.316117 . 352980360752003117390 . 216928 . 161274391882004136875 . 920768 . 077238743721要求:用Excel繪制國內(nèi)生產(chǎn)總值的線圖。國內(nèi)生產(chǎn)總值國內(nèi)生產(chǎn)總值16000014000012000010000080000600004000020000400230022MO210020002909180917091
47、60915091(2)繪制第一、二、三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值的線圖。(3)根據(jù)2004年的國內(nèi)生產(chǎn)總值及其構(gòu)成數(shù)據(jù)繪制餅圖。國內(nèi)生產(chǎn)總值20768.07,43721,32%15%口第一產(chǎn)業(yè)口第二產(chǎn)業(yè)第三產(chǎn)業(yè)72387, 53%第四章 統(tǒng)計(jì)數(shù)據(jù)的概括性描述1 一家汽車零售店的10名銷售人員5月份銷售的汽車數(shù)量(單位:臺)排序后如下:24710101012121415要求:(1)計(jì)算汽車銷售量的眾數(shù)、中位數(shù)和平均數(shù)。(2)根據(jù)定義公式計(jì)算四分位數(shù)。(3)計(jì)算銷售量的標(biāo)準(zhǔn)差。(4)說明汽車銷售量分布的特征。解:汽車銷售數(shù)量StatisticsNValid10Missing0Mean9.60Median10
48、.00Mode10Std. Deviation4.169Percentiles256.255010.007512.50HistogramMean =9.6Std. Dev. =4.169N =104 . 2 隨機(jī)抽取25個(gè)網(wǎng)絡(luò)用戶,得到他們的年齡數(shù)據(jù)如下:單位:周歲19152925242321382218302019191623272234244120311723要求;(1)計(jì)算眾數(shù)、中位數(shù):1、排序形成單變量分值的頻數(shù)分布和累計(jì)頻數(shù)分布:網(wǎng)絡(luò)用戶的年齡FrequencyPercentCumulativeFrequencyCumulative PercentValid1514.014.0161
49、4.028.01714.0312.01814.0416.019312.0728.02028.0936.02114.01040.02228.01248.023312.01560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02288.03414.02392.03814.02496.04114.025100.0Total25100.0從頻數(shù)看出,眾數(shù) Mo有兩個(gè):19、23;從累計(jì)頻數(shù)看,中位數(shù) Me=23 。(2)根據(jù)定義公式計(jì)算四分位數(shù)。Q1 位置=25/4=6.25,因此 Q1=19 , Q3 位置=3
50、X25/4=18.75 ,因此 Q3=27 ,或者,由于25和27都只有一個(gè),因此 Q3也可等于25+0.75 X2=26.5 。(3)計(jì)算平均數(shù)和標(biāo)準(zhǔn)差;Mean=24.00 ; Std. Deviation=6.652(4)計(jì)算偏態(tài)系數(shù)和峰態(tài)系數(shù):Skewness=1.080 ; Kurtosis=0.773(5)對網(wǎng)民年齡的分布特征進(jìn)行綜合分析:分布,均值=24、標(biāo)準(zhǔn)差=6.652、呈右偏分布。如需看清楚分布形態(tài),需要進(jìn)行分組。為分組情況下的直方圖:網(wǎng)絡(luò)用戶的年齡為分組情況下的概率密度曲線:3.02.5nu 2.01.51.01516171819202122232425272930313
51、43841網(wǎng)絡(luò)用戶的年齡分組:1、確定組數(shù):K 1 皿 1 1g 25ig(2) 1g 21.398什1 5.64 ,取 k=60.301032、確定組距:組距=(最大值-最小值)+組數(shù)=(41-15 ) +6=4.3 ,取53、分組頻數(shù)表網(wǎng)絡(luò)用戶的年齡 (Binned)FrequencyPercentCumulative Frequency Cumulative PercentValid=1514.014.016 - 20832.0936.021 - 25936.01872.026 - 30312.02184.031 - 3528.02392.036 - 4014.02496.041 +14
52、.025100.0Total25100.0分組后的均值與方差:Mean23.3000Std. Deviation7.02377Variance49.333Skewness1.163Kurtosis1.302分組后的直方圖:02 =10.0015.0020.0025.0030.0035.0040.0045.00I 50.00組中值0 8 6 4 vcneuaerFMean =23.30Std. Dev. =7.024 N =254. 3某銀行為縮短顧客到銀行辦理業(yè)務(wù)等待的時(shí)間。準(zhǔn)備采用兩種排隊(duì)方式進(jìn)行試驗(yàn):種是所有頤客都進(jìn)入一個(gè)等待隊(duì)列:另一種是顧客在三千業(yè)務(wù)窗口處列隊(duì)3排等待。為比較哪種排隊(duì)方
53、式使顧客等待的時(shí)間更短.兩種排隊(duì)方式各隨機(jī)抽取9名顧客。得到第一種排隊(duì)方式的平均等待時(shí)間為7. 2分鐘,標(biāo)準(zhǔn)差為1 . 97分鐘。第二種排隊(duì)方式的等待時(shí)間(單位:分鐘)如下:5 . 56 . 66. 76. 87 . 17. 37. 4 7. 87. 8要求:(1)畫出第二種排隊(duì)方式等待時(shí)間的莖葉圖。第二種排隊(duì)方式的等待時(shí)間(單位:分鐘)Stem-and-Leaf PlotFrequency Stem & Leaf3.001.00 Extremes (=5.5)6 . 678 TOC o 1-5 h z 3.007 .1342.007 .88Stem width:1.00Each leaf:1
54、 case(s)(2)計(jì)算第二種排隊(duì)時(shí)間的平均數(shù)和標(biāo)準(zhǔn)差。Mean7Std. Deviation0.714143Variance0.51(3)比較兩種排隊(duì)方式等待時(shí)間的離散程度。第二種排隊(duì)方式的離散程度小。(4)如果讓你選擇一種排隊(duì)方式,你會(huì)選擇哪一種?試說明理由。選擇第二種,均值小,離散程度小。4.4某百貨公司6月份各天的銷售額數(shù)據(jù)如下:單位:萬元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:(1)計(jì)算該百貨公司日銷售額的平均數(shù)和中位數(shù)。(2)按定義公式
55、計(jì)算四分位數(shù)。(3)計(jì)算日銷售額的標(biāo)準(zhǔn)差。解:Statistics百貨公司每天的銷售額(萬元)NValid30Missing0Mean274.1000Median272.5000Std. Deviation21.17472Percentiles25260.250050272.500075291.25004. 5 甲乙兩個(gè)企業(yè)生產(chǎn)三種產(chǎn)品的單位成本和總成本資料如下:產(chǎn)品名稱單位成本(元)總成本(元)甲企業(yè)乙企業(yè)A152 1003 255B203 0001 500C301 5001 500要求:比較兩個(gè)企業(yè)的總平均成本,哪個(gè)高,并分析其原因。產(chǎn)品名稱單位成本(元)甲企業(yè)乙企業(yè)總成本(元)產(chǎn)品數(shù)總成
56、本(元)產(chǎn)品數(shù)A1521001403255217B203000150150075C30150050150050平均成本(元)19.4117647118.28947368調(diào)和平均數(shù)計(jì)算,得到甲的平均成本為19.41 ;乙的平均成本為18.29。甲的中間成本的產(chǎn)品多,乙的低成本的產(chǎn)品多。4. 6 在某地區(qū)抽取120家企業(yè),按利潤額進(jìn)行分組,結(jié)果如下:按利潤額分組(萬元)企業(yè)數(shù)(個(gè))20030019300400304005004250060018600以上11合計(jì)120要求:(1)計(jì)算120家企業(yè)利潤額的平均數(shù)和標(biāo)準(zhǔn)差。(2)計(jì)算分布的偏態(tài)系數(shù)和峰態(tài)系數(shù)。解:Statistics企業(yè)利潤組中值Mi
57、(萬元)NValid120Missing0Mean426.6667Std. Deviation116.48445Skewness0.208Std. Error of Skewness0.221Kurtosis-0.625Std. Error of Kurtosis0.438HistogramMean =426.67Std. Dev. =116.484 N =120Cases weighted by 企業(yè)個(gè)數(shù)4.7 為研究少年兒童的成長發(fā)育狀況,某研究所的一位調(diào)查人員在某城市抽取100名717歲的少年兒童作為樣本,另一位調(diào)查人員則抽取了1 000名717歲的少年兒童作為樣本。請回答下面的問題,并
58、解釋其原因。(1)兩位調(diào)查人員所得到的樣本的平均身高是否相同?如果不同,哪組樣本的平均身高較大?(2)兩位調(diào)查人員所得到的樣本的標(biāo)準(zhǔn)差是否相同?如果不同,哪組樣本的標(biāo)準(zhǔn)差較大?(3)兩位調(diào)查人員得到這l 100名少年兒童身高的最高者或最低者的機(jī)會(huì)是否相同?如果不同,哪位調(diào)查研究人員的機(jī)會(huì)較大?解:(1)不一定相同,無法判斷哪一個(gè)更高,但可以判斷,樣本量大的更接近于總體平均身高。(2)不一定相同,樣本量少的標(biāo)準(zhǔn)差大的可能性大。(3)機(jī)會(huì)不相同,樣本量大的得到最高者和最低者的身高的機(jī)會(huì)大。4. 8 一項(xiàng)關(guān)于大學(xué)生體重狀況的研究發(fā)現(xiàn).男生的平均體重為60kg ,標(biāo)準(zhǔn)差為5kg ;女生的平均體重為 50kg ,標(biāo)準(zhǔn)差為5kg。請回答下面的問題:(1)是男生的體重差異大還是女生的體重差異大?為什么?女生,因?yàn)闃?biāo)準(zhǔn)差一樣,而均值男生大,所以,離散系數(shù)是男生的小,離散程度是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度數(shù)據(jù)中心服務(wù)器租賃合同
- 2024醫(yī)院病房清潔服務(wù)合同
- 2024年展覽保險(xiǎn)服務(wù)協(xié)議
- 2024年度0kv線路工程建設(shè)的合作開發(fā)合同
- 2024年度婚禮主持委托合同
- 2024年定制版太陽能系統(tǒng)維護(hù)合同
- 2024年度太陽能熱水系統(tǒng)安裝合同
- 2024年度城市供水供電供氣合同
- 2024年三人股東責(zé)任承擔(dān)協(xié)議
- 04版建筑工程合同
- QC七大手法與新QC七大手法
- 照明路燈工程 投標(biāo)文件(技術(shù)方案)
- 數(shù)控車削編程試卷及答案
- 大學(xué)思政課價(jià)值觀課件
- 2024年教師普通話培訓(xùn)心得體會(huì)范文3篇
- 車寨礦井及選煤廠1.5Mt-a新建工程環(huán)評
- 2024年T8聯(lián)考高三第二次學(xué)業(yè)質(zhì)量語文試題答案講評課件
- 【川教版】一年級上冊 《生命 生態(tài) 安全》第一課 我和我的布娃娃 課件
- 設(shè)備管理的標(biāo)準(zhǔn)化與規(guī)范化
- 公司組織架構(gòu)圖
- 藥品非處方藥市場調(diào)研報(bào)告
評論
0/150
提交評論