版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、社會(huì)統(tǒng)計(jì)學(xué)期末復(fù)習(xí)題與答案 整理社會(huì)統(tǒng)計(jì)學(xué)期末復(fù)習(xí)訓(xùn)練一、單項(xiàng)選擇題(2O=2X 10)1. 為了解IT行業(yè)從業(yè)者收入水平,某研究機(jī)構(gòu) 從全市IT行業(yè)從業(yè)者隨機(jī)抽取800人作為樣本 進(jìn)行調(diào)查,其中44%回答他們的月收入在6000 元以上,30%回答他們每月用于娛樂(lè)消費(fèi)在1000 元以上。此處800人是.樣本2. 某地區(qū)政府想了解全市 332.1萬(wàn)戶家庭年均 收入水平,從中抽取3000戶家庭進(jìn)行調(diào)查,以 推斷所有家庭的年均收入水平。這項(xiàng)研究的總體 是332.1戶家庭的年均收入3. 學(xué)校后勤集團(tuán)想了解學(xué)校 22000學(xué)生的每月 生活費(fèi)用,從中抽取2200名學(xué)生進(jìn)行調(diào)查,以 推斷所有學(xué)生的每月生活費(fèi)
2、用水平。這項(xiàng)研究的 總體是22000名學(xué)生的每月生活費(fèi)用4. 為了解地區(qū)的消費(fèi),從該地區(qū)隨機(jī)抽取5000戶進(jìn)行調(diào)查,其中30%回答他們的月消費(fèi)在5000 元以上,40%回答他們每月用于通訊、網(wǎng)絡(luò)的費(fèi) 用在300元以上。此處5000戶是 樣本5 從變 量分類(lèi)看,下列變量屬于定序變量的是產(chǎn)品等級(jí)6. 下列變量屬于數(shù)值型變量的是工資收入7. 從含有N個(gè)元素的總體中,抽取n個(gè)元素作為 樣本,同時(shí)保證總體中每個(gè)元素都有相同的機(jī)會(huì) 入選樣本,這樣的抽樣方式稱為.簡(jiǎn)單隨機(jī)抽樣 8某班級(jí)有60名男生,40名女生,為了了解 學(xué)生購(gòu)書(shū)支出,從男生中抽取 12名學(xué)生,從女 生中抽取8名學(xué)生進(jìn)行調(diào)查。這種調(diào)查方法屬于
3、 分層抽樣9. 先將總體按某標(biāo)志分為不同的類(lèi)別或?qū)哟危?然 后在各個(gè)類(lèi)別中采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣 的方式抽取子樣本,這樣的抽樣方式稱為分層抽 樣10. 某班級(jí)有100名學(xué)生,為了了解學(xué)生消費(fèi)水平,將所有學(xué)生按照學(xué)習(xí)成績(jī)排序后, 在前十名 學(xué)生中隨機(jī)抽出成績(jī)?yōu)榈?名的學(xué)生,后面依次 選出第 13、23、33、43、53、63、73、83、93 九名同學(xué)進(jìn)行調(diào)查。這種調(diào)查方法屬于系統(tǒng)抽樣11. 在頻數(shù)分布表中,某一小組中數(shù)據(jù)個(gè)數(shù)占總 數(shù)據(jù)個(gè)數(shù)的比例稱為頻率12. 在頻數(shù)分布表中,將各個(gè)有序類(lèi)別或組的百 分比逐級(jí)累加起來(lái)稱為 累積頻率13. 在頻數(shù)分布表中,頻率是指各組頻數(shù)與總頻數(shù)之比14. 在
4、頻數(shù)分布表中,比率是指不同小組的頻數(shù) 之比15. 如果用一個(gè)圖形描述比較兩個(gè)或多個(gè)樣本或 總體的結(jié)構(gòu)性問(wèn)題時(shí),適合選用環(huán)形圖16. 某地區(qū)2001-2010年人口總量(單位:萬(wàn)人) 分別為 98, 102, 103, 106, 108, 109, 110, 111, 114, 115,下列哪種圖形最適合描述這些 數(shù)據(jù)線圖17. 當(dāng)我們用圖形描述甲乙兩地區(qū)的人口年齡結(jié) 構(gòu)時(shí),適合選用哪種圖形 環(huán)形圖18在某市隨機(jī)抽取10家企業(yè),7月份利潤(rùn)額(單位:萬(wàn)元)分另I為72.0、63.1、20.0、23.0、 54.7、54.3、23.9、25.0、26.9、29.0,那么這 10家企業(yè)7月份利潤(rùn)額均值
5、為39.1919 .某班級(jí)10名同學(xué)期末統(tǒng)計(jì)課考試分?jǐn)?shù)分別為 76、 93、 95、 80、 92、 83、 88、 90、 92、 72, 那么該班考試成績(jī)的中位數(shù)是 8920.某企業(yè)職工的月收入水平分為五組: 1)1500 元及以下;2) 1500-2000 元;3) 2000-2500 元;4) 2500-3000 元;5) 3000 元及以上,則 3000 元及以上這一組的組中值為 3250元21 為了解某行業(yè)12月份利潤(rùn)狀況,隨機(jī)抽取5家企業(yè),12月份利潤(rùn)額(單位:萬(wàn)元)分別為65、23、54、45、39,那么這5家企業(yè)12月份 利潤(rùn)額均值為45.222. 某專(zhuān)業(yè)共8名同學(xué),他們的統(tǒng)
6、計(jì)課成績(jī)分別 為 86、77、97、94、82、90、83、92,那么該 班考試成績(jī)的中位數(shù)是 8823. 某班級(jí)學(xué)生平均每天上網(wǎng)時(shí)間可以分為以下六組:1)1小時(shí)及以下;2) 1-2小時(shí);3)2-3小時(shí);4) 3-4小時(shí);5) 4-5小時(shí);6) 5小時(shí)及以上,則5小時(shí)及以上這一組的組中值近似為5.5小時(shí)24. 對(duì)于左偏分布,平均數(shù)、中位數(shù)和眾數(shù)之間 的關(guān)系是眾數(shù) 中位數(shù)平均數(shù)25. 對(duì)于右偏分布,平均數(shù)、中位數(shù)和眾數(shù)之間 的關(guān)系是平均數(shù)中位數(shù)眾數(shù)26離散系數(shù)的主要目的是比較多組數(shù)據(jù)的離散 程度27 兩組數(shù)據(jù)的平均數(shù)不相等,但是標(biāo)準(zhǔn)差相等。 那么平均數(shù)大的,離散程度小28. 已知某單位平均月收入
7、為 3500元,離散系 數(shù)為0.2,那么他們?cè)率杖氲臉?biāo)準(zhǔn)差為 70029. 班學(xué)生的平均體重均為 55千克,二班學(xué) 生的平均體重為52千克,兩個(gè)班級(jí)學(xué)生體重的 標(biāo)準(zhǔn)差均為5千克。那么二班學(xué)生體重的離散 程度大30. 已知某單位平均月收入標(biāo)準(zhǔn)差為 700元,離 散系數(shù)為0.2,那么他們?cè)率杖氲木禐?350031. 正態(tài)分布中, 值越小,則 離散趨勢(shì)越小32. 已知某單位職工平均每月工資為 3000元, 標(biāo)準(zhǔn)差為500元。如果職工的月收入是正態(tài)分 布,可以判斷月收入在2500元一3500元之間的 職工人數(shù)大約占總體的68%33 .如果一組數(shù)據(jù)中某一個(gè)數(shù)值的標(biāo)準(zhǔn)分值為-1.5,這表明該數(shù)值 比平均
8、數(shù)低1.5個(gè)標(biāo)準(zhǔn)差34. 某班級(jí)學(xué)生期末英語(yǔ)考試平均成績(jī)?yōu)?75分, 標(biāo)準(zhǔn)差為10分。如果已知這個(gè)班學(xué)生的考試分 數(shù)服從正態(tài)分布,可以判斷成績(jī)?cè)?5-85之間的 學(xué)生大約占全班學(xué)生的68%35. 經(jīng)驗(yàn)法則表明,當(dāng)一組數(shù)據(jù)正太分布時(shí),在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)大約有95%的數(shù)據(jù)36. 期中考試中,某班級(jí)學(xué)生統(tǒng)計(jì)學(xué)平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為4分。如果學(xué)生的成績(jī)是正太 分布,可以判斷成績(jī)?cè)?72分-88分之間的學(xué)生大約占總體的95%37如果一組數(shù)據(jù)中某個(gè)數(shù)值的標(biāo)準(zhǔn)分值為 1.8, 這表明該數(shù)值比平均數(shù)高出1.8個(gè)標(biāo)準(zhǔn)差38. 某班級(jí)學(xué)生期末統(tǒng)計(jì)學(xué)考試平均成績(jī)?yōu)?2 分,標(biāo)準(zhǔn)差為5分。如果已知這
9、個(gè)班學(xué)生的考試 分?jǐn)?shù)服從正態(tài)分布,可以判斷成績(jī)?cè)?7-87之間 的學(xué)生大約占全班學(xué)生的68%39. 經(jīng)驗(yàn)法則表明,當(dāng)一組數(shù)據(jù)正態(tài)分布時(shí),在平均數(shù)加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)大約有68%的數(shù)據(jù)40. 用樣本統(tǒng)計(jì)量的值直接作為總體參數(shù)的估計(jì) 值,這種方法稱為點(diǎn)估計(jì)41. 用樣本統(tǒng)計(jì)量的值構(gòu)造一個(gè)置信區(qū)間,作為 總體參數(shù)的估計(jì),這種方法稱為區(qū)間估計(jì)42. 某單位對(duì)該廠第一加工車(chē)間殘品率的估計(jì)高 達(dá)10%而該車(chē)間主任認(rèn)為該比例()偏高 如果要檢驗(yàn)該說(shuō)法是否正確,則假設(shè)形式應(yīng)該是H0 :> 0.1 ; H1 :<0.143. 某單位對(duì)該廠第一加工車(chē)間殘品率估計(jì)高達(dá)13%而該車(chē)間主任認(rèn)為該比例()
10、偏高。如果要檢驗(yàn)該說(shuō)法是否正確,則假設(shè)形式應(yīng)該為H0:> 0.13 ; H1:<0.1344. 在假設(shè)檢驗(yàn)中,不拒絕虛無(wú)假設(shè)意味著 沒(méi)有 證據(jù)證明虛無(wú)假設(shè)是錯(cuò)誤的45. 在假設(shè)檢驗(yàn)中,虛無(wú)假設(shè)和備擇假設(shè)有且只 有一個(gè)成立46 在假設(shè)檢驗(yàn)中,如果所計(jì)算出的P值越大,那么檢驗(yàn)的結(jié)果越不顯著47 .在假設(shè)檢驗(yàn)中,如果所計(jì)算出的P值越小,那么檢驗(yàn)的結(jié)果 越顯著48 .根據(jù)一個(gè)具體的樣本求出的總體均值 90%勺 置信區(qū)間以90%勺概率包含總體均值49 根據(jù)一個(gè)樣本均值求出的90%勺置信區(qū)間表 明總體均值有90%勺概率會(huì)落入該區(qū)間內(nèi)50. 根據(jù)一個(gè)具體的樣本求出的總體均值 95%勺 置信區(qū)間以
11、95%勺概率包含總體均值51. 用于說(shuō)明回歸方程中擬合優(yōu)度的統(tǒng)計(jì)量主要 是判定系數(shù)52. 兩個(gè)定類(lèi)變量之間的相關(guān)分析可以使用系 數(shù)53. 判斷下列哪一個(gè)不可能是相關(guān)系數(shù) 1.254 判斷下列哪一個(gè)不可能是相關(guān)系數(shù) 1.3255 .如果收入與支出之間的線性相關(guān)系數(shù)為0.92,那么二者之間存在著高度相關(guān)56. 如果物價(jià)與銷(xiāo)售量之間的線性相關(guān)系數(shù)為 -0.87,而且二者之間具有統(tǒng)計(jì)顯著性,那么二 者之間存在著高度相關(guān)57. 某項(xiàng)研究中欲分析受教育年限每增長(zhǎng)一年,收入如何變化,下列哪種方法最合適回歸58. 在回歸方程中,若回歸系數(shù)等于 0,這表明 自變量x對(duì)因變量y的影響是不顯著的59對(duì)消費(fèi)的回歸分析
12、中,學(xué)歷、年齡、戶口、 性別、收入都是因變量,其中收入的回歸系數(shù)為 0.8,這表明 消費(fèi)每增加1元,收入增加0.8元60. 在因變量的總離差平方和中,如果回歸和所 占的比例越大,則兩變量之間 相關(guān)程度越高61. 回歸平方和(SSR反映y的總變差中由于 x與y之間的線性關(guān)系引起的y的變化部分62對(duì)于線性回歸,在因變量的總離差平方和中, 如果殘差平方和所占比例越大,那么兩個(gè)變量之 間相關(guān)程度越小63對(duì)于線性回歸,在因變量的總離差平方和中, 如果回歸平方和所占比例越大,那么兩個(gè)變量之 間相關(guān)程度越大64. 在因變量的總離差平方和中,如果回歸平方 和所占的比例越小,則自變量和因變量之間 相關(guān) 程度越低
13、65. 方差分析的目的是 研究各分類(lèi)自變量對(duì)數(shù)值 型因變量的影響是否顯著66. 下面哪一項(xiàng)不是方差分析中的假定各總體的 方差等于067. 下列哪種情況不適合用方差分析 年齡對(duì)收入 的影響68. 從兩個(gè)總體中各選取了 6個(gè)觀察值,得到組 間平方和為234,組內(nèi)平方和為484,則組間方 差和組內(nèi)方差分別為234, 48.469. 從兩個(gè)總體中共選取了 8個(gè)觀察值,得到組 間平方和為432,組內(nèi)平方和為426,則組間均 方和組內(nèi)均方分別為432, 7170. 在方差分析中,某一水平下樣本數(shù)據(jù)之 間的誤差稱為組內(nèi)誤差10311、名詞解釋1 離散變量與連續(xù)變量P10(1)離散變量 如果一個(gè)變量的變量值是
14、間斷的,可以列舉的,這種變量稱為離散變量。人兄弟姐妹數(shù)、結(jié)婚次數(shù)、工廠生產(chǎn)產(chǎn)品的數(shù)量等,其變量值的取值是0,1, 2, 3。離散變量的取值是有限個(gè)值,而且 其取值都是以整數(shù)位斷開(kāi)的,是有最小計(jì)量單位 的。例如,某人的兄弟姐妹數(shù),只能是1個(gè)、2個(gè)、3個(gè)等,而不能是1.3個(gè)、2.5個(gè)等。(2)連續(xù)變量如果一個(gè)變量的變量值是連續(xù)不斷的,即可以取無(wú)數(shù)多個(gè)數(shù)值,這種變量 稱為連續(xù)變量。 例如,年齡、溫度、燈泡的壽命等, 它們的取值是連續(xù)不斷的。連續(xù)變量可以取無(wú)數(shù) 多個(gè)值,其取值是連續(xù)不斷,不可以列舉的,而且,它們沒(méi)有最小計(jì)量單位。例如,年齡可以 是1歲整,也可以是1.2歲、1.45歲、2.544歲2 總
15、體與樣本P11總體是構(gòu)成它的所有個(gè)體的集合,個(gè)體則是構(gòu)成總體的最基本的單位。樣本就 是從總體中按照一定方式抽取的一部分個(gè)體的集合。例如,要從某省所有育齡婦女中抽取1000人進(jìn)行調(diào)查進(jìn)行調(diào) 查,那么,該省所有育齡婦女就是研究總體,其 中每一位育齡婦女就是個(gè)體,而抽取出的1000名育齡婦女就構(gòu)成為了該總體的一個(gè)樣本。3 抽樣單位與抽樣框P11抽樣單位就是一次直接的抽樣所使用的基本單位。抽樣單位有時(shí)與構(gòu)成總體的 個(gè)體是相同的,有時(shí)是不同的。調(diào)查,當(dāng)直接抽取育齡婦女時(shí),兩者是相同的;當(dāng)我們從 總體中一次直接抽取戶時(shí),以抽中的戶中的育齡 婦女作為樣本時(shí),抽樣單位(戶)與個(gè)體(育齡 婦女)就不相同了。抽樣
16、框是指一次直接抽樣時(shí)樣本中所有抽樣單位的名單。 例女口,從 某校中抽取200名學(xué)生進(jìn)行就業(yè)觀的調(diào)查,那么 這所學(xué)校的所有學(xué)生的名單就是這次抽樣的抽 樣框。但是,當(dāng)我們先抽取班級(jí),以抽中班級(jí)中 的所有學(xué)生作為樣本時(shí),這所學(xué)校所有班級(jí)的名 單就是這次抽樣的抽樣框。4 普查與抽樣調(diào)查P12(1)普查普查是一種專(zhuān)門(mén)的調(diào)查,它是為了某種特定的目的而對(duì)總體中所有的個(gè)體 進(jìn)行的一次全面調(diào)查。 例如,我們歷年進(jìn)行的人口普查、 工業(yè)普查、農(nóng)業(yè)普查、第三產(chǎn)業(yè)普查、經(jīng)濟(jì)普查、 統(tǒng)計(jì)基本單位普查等。(2)抽樣調(diào)查抽樣調(diào)查是從總體中選取部分個(gè)體組成樣本進(jìn)行調(diào)查的一種方式,其目的 在于根據(jù)樣本的調(diào)查結(jié)果推斷總體特征。根據(jù)
17、抽取樣本的方法不同,抽樣調(diào)查 可以分為:概率抽樣和非概率抽樣。P125 普查普查是一種專(zhuān)門(mén)的調(diào)查,它是為了某種特定的目的而對(duì)總體中所有的個(gè) 體進(jìn)行的一次全面調(diào)查。例如,我們歷年進(jìn)行的人口普查、工業(yè)普查、農(nóng)業(yè)普 查、第三產(chǎn)業(yè)普查、經(jīng)濟(jì)普查、統(tǒng)計(jì)基本單位普查等。6 概率抽樣P13概率抽樣就是按照隨機(jī)原則進(jìn)行的抽樣,總體中每個(gè)個(gè)體都有一定的、非零 的概率入選樣本,并且入選樣本的概率都是已知的或可以計(jì)算的。包括:簡(jiǎn)單 隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、多階段抽樣。7 眾數(shù)P68i、眾數(shù)眾數(shù)是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多的數(shù)值,用 Mo表示。例如,一個(gè)城市有多 種產(chǎn)業(yè),但如果以旅游業(yè)為最多,那么旅游業(yè)就
18、是眾數(shù),這個(gè)城市也被稱為旅 游城市。8 中位數(shù) P732、中位數(shù)中位數(shù)是中心趨勢(shì)的一種測(cè)量,是將一組數(shù)據(jù)排序后,處于中間位置的變量 值,用Me表示。中位數(shù)處于中間位置,前后每部分均包括 50%的數(shù)據(jù),而且 前面部分小于中位數(shù)、后面部分大于中位數(shù)。 例如,在職工收入水平差異比較大的單位, 要了解職工收入的一般水平,用職工收入分布的中位數(shù)作為收入水平的代表值要比用算術(shù)平均數(shù)更恰當(dāng), 因?yàn)樗懦藰O端數(shù)據(jù)的影響。9 均值 P784、均值均值是集中趨勢(shì)最主要的測(cè)量值,它是將全部數(shù)據(jù)進(jìn)行加總?cè)缓蟪詳?shù)據(jù)總個(gè)數(shù),也稱為算數(shù)平均數(shù)。均值包含一組數(shù)據(jù)中所有數(shù)值,它是先將所有數(shù)值進(jìn) 行加總,然后進(jìn)行平均,在均值
19、中所有數(shù)值都有所體現(xiàn)。因而,我們說(shuō)均值是集 中趨勢(shì)最主要的測(cè)量值10 方差與標(biāo)準(zhǔn)差P956、方差方差是各數(shù)值與均值離差平方的平均數(shù),它是數(shù)值型數(shù)據(jù)離散趨勢(shì)最主要的 測(cè)量值。與平均差不同的是,方差采用平方的方式避免避免正、 負(fù)抵消帶來(lái)的問(wèn) 題,但是采用平方的方式給方差的解釋帶來(lái)一定的困難。7、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差是方差的平方根,用于測(cè)量數(shù)值型數(shù)據(jù)離散趨勢(shì)。標(biāo)準(zhǔn)差克服了方差 面臨的夸大離散程度、不容易解釋的問(wèn)題。與方差相比,標(biāo)準(zhǔn)差是有量綱的,它 與變量值的單位相同,容易解釋。在實(shí)際中,標(biāo)準(zhǔn)差使用更為普遍。11. 離散系數(shù)P1008、離散系數(shù)離散系數(shù)是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與該組數(shù)據(jù)均值之比,也稱為變異系數(shù)。離散
20、系數(shù)是測(cè)量數(shù)據(jù)離散程 度的相對(duì)指標(biāo),通常用 Vs適用于數(shù)值型數(shù)據(jù)離散程度的測(cè)量。12 .正態(tài)分布P1031、正態(tài)分布連續(xù)性隨機(jī)變量中重要的分布是鐘型概率分布,就是正態(tài)分布(n ormaldistribution ),也稱為常態(tài)分布,是一種連續(xù)型隨機(jī)變量的概率分布 。學(xué)生 的身高、體重、成績(jī)等都是正態(tài)分布常見(jiàn)的例子, 很高、很矮的都比較少,多數(shù)處于正常身高;很 胖、很瘦的也較少,多數(shù)是正常體重;成績(jī)很高 和很低的是少數(shù),多數(shù)同學(xué)屬于中等成績(jī)。13參數(shù)與統(tǒng)計(jì)量4、參數(shù)與統(tǒng)計(jì)量P127, P128參數(shù)是研究者想要了解的總體的某種特征值。通常情況下,我們關(guān)心的總體的參數(shù)主 要有總體平均數(shù)(卩)、標(biāo)準(zhǔn)差
21、(b)、比例(n)等。統(tǒng)計(jì)量是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一個(gè)量。 樣本統(tǒng)計(jì)量主要有樣本平均數(shù)(X)、樣本 標(biāo)準(zhǔn)差(S)、樣本比例(P)等。與參數(shù)不同,統(tǒng)計(jì)量是根據(jù)樣本數(shù)據(jù)計(jì)算岀來(lái)的、有關(guān)樣本的特征值, 因而統(tǒng)計(jì)量是知道的、可以計(jì)算的,是估計(jì)總體參數(shù)的依據(jù)。14 抽樣分布P1295、抽樣分布抽樣分布是指樣本統(tǒng)計(jì)量的概率分布,它是在重復(fù)選取容量為n的樣本時(shí),由每個(gè)樣本計(jì)算出來(lái)的統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布。例如樣本均值的分布、樣本比例分布等。15. 中心極限定理P1301、中心極限定理中心極限定理具體內(nèi)容為:不論總體分布是 否服從正態(tài)分布,從均值為、方差為b2的總體中,抽取容量為n的隨機(jī)樣本,當(dāng)n充分大時(shí)
22、 (通常要求n30),樣本均值X的抽樣分布近似 服從均值為卩、方差為b 2/n的正態(tài)分布。16. 區(qū)間估計(jì)P134區(qū)間估計(jì)是在估計(jì)總體參數(shù)時(shí)給出的不是一個(gè)數(shù)值,而是一個(gè)區(qū)間,是根 據(jù)統(tǒng)計(jì)量的抽樣分布的特點(diǎn)進(jìn)行估計(jì),同時(shí)給出總體參數(shù)落入這一區(qū)間的可能性大小。也就是要在給定值的前提下,去尋找兩個(gè)統(tǒng)計(jì)量 '1和'2,使其滿足/? ?/? ?上述不等式。從而知道 落在區(qū)間(1, 2)內(nèi)的概率為1,故也稱( 2)為 的17.區(qū)間估計(jì)。P135置信水平就是將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù) 真值的次數(shù)所占的比例。P14018假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是首先對(duì)總體參數(shù)建立一個(gè)假設(shè),然
23、后根據(jù)樣本信息區(qū)檢驗(yàn)這一 假設(shè)是否正確。假設(shè)檢驗(yàn)和參數(shù)估計(jì)都是建立在抽樣分布的基礎(chǔ)上。例如,某品牌燈泡的壽命X服從正態(tài)分布(場(chǎng)125),廠方說(shuō)它的平均工作壽命是 1800小時(shí)。隨機(jī)測(cè)試16次,得到的平 均工作溫度是1750度。樣本結(jié)果與廠方所說(shuō)的是否有顯著差異?廠方的說(shuō)法是否可以接受?這就是假設(shè) 檢驗(yàn)要解決的問(wèn)題。19. 虛無(wú)假設(shè)與替換假設(shè)P140P141將需要通過(guò)樣本信息來(lái)推斷其正確與否的命題稱為虛無(wú)假設(shè),也成為原假 設(shè)或者零假設(shè),通常用Ho表示。如果虛無(wú)假設(shè)不成立,我們就拒絕虛無(wú)假設(shè), 需要在另個(gè)一假設(shè)中進(jìn)行選擇,這就是替換假設(shè),替換假設(shè)通常用H 1表示。上面例子中,虛無(wú)假設(shè)為:H
24、6; :卩= 800替換假設(shè)為:H1:戸1800a20.二維表二維表P152二維表就是行列交叉的表格,將兩個(gè)變量一個(gè)分行排放,一個(gè)分列排放,行列交叉處就是同屬于兩個(gè)變量的不同類(lèi)的數(shù)據(jù),也稱為列聯(lián)表。例如,對(duì)某單位職工學(xué)歷進(jìn)行分析,隨機(jī)抽取 262名進(jìn)行調(diào)查,性別、學(xué)歷二維表如下所示:對(duì)某項(xiàng)政策態(tài)度的調(diào)查結(jié)果男女合計(jì)初中及以下243256高中354075專(zhuān)科342155本科及以上542276合.誤差減少比例P1581、誤差減少比例在預(yù)測(cè)變量丫的值時(shí),知道變量X的值時(shí)所減少的誤差(E1 E2)與總誤 差已的比值稱為誤差減少比例(proportional reduction
25、 of error ),簡(jiǎn)稱PRE。 取值范圍為01, PRE值越大,說(shuō)明用變量X去預(yù)測(cè)變量丫是能夠減少的誤差 所占的比例越大,即變量X與變量丫之間的相關(guān)性越大。E1 E2公式為:PRE= E1例如,PRE=0.7,說(shuō)明以變量X預(yù)測(cè)變量丫時(shí)能減少70%的誤差,說(shuō)明二者之間關(guān)系較強(qiáng)。22. 散點(diǎn)圖P165散點(diǎn)圖散點(diǎn)圖是在坐標(biāo)系中,用X軸表示自變量x,用丫軸表示因變量y,而變量 組(x,y)則用坐標(biāo)系中的點(diǎn)表示,不同的變量組在坐標(biāo)系中形成不同的散點(diǎn), 用坐標(biāo)系及其坐標(biāo)系中的散點(diǎn)形成的二維圖就是散點(diǎn)圖。散點(diǎn)圖是描述變量關(guān)系的一種直觀方法, 從散點(diǎn)圖中直觀的看出兩個(gè)變量之 間是否存在相關(guān)關(guān)系、是正線性
26、相關(guān)還是負(fù)線性相關(guān),也可以大致看出變量之 間關(guān)系強(qiáng)度如何,但是對(duì)于具體關(guān)系強(qiáng)度則需要相關(guān)系數(shù)來(lái)判斷。23. 相關(guān)系數(shù)P170相關(guān)系數(shù)就是對(duì)變量之間相關(guān)關(guān)系程度和方向的度量。當(dāng)研究?jī)蓚€(gè)變量之間的 相關(guān)關(guān)系時(shí)我們稱之為簡(jiǎn)單相關(guān)系數(shù)??傮w相關(guān)系數(shù)用P表示,樣本相關(guān)系數(shù) 般用r表示。24. 最小二乘法P180對(duì)于變量x和y的觀察值,有多條直線可以描述,其中距離各觀測(cè)值最近的 一條直線對(duì)x與y之間的關(guān)系的描述與實(shí)際的誤差最小。最小二乘法是使因變、 ? ?量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求參數(shù)0合?的方法,即使得:2 ? ? 2yi ?ny ? ?iXi最小25. 獨(dú)立樣本與配對(duì)樣本P207,
27、P203獨(dú)立樣本獨(dú)立樣本(independent sample) 是指我們得到的樣本總體之間是相互獨(dú)立的。比如我們要研究一個(gè)地區(qū)百姓的生活水平,要同時(shí)考察家庭的子女?dāng)?shù)X,父母的教育水平 y,這就可以看做是獨(dú)立樣本。兩個(gè)樣本容量 n1和n2都小于30,或其中一個(gè)小于30的兩獨(dú)立樣本為獨(dú)立小樣 本。當(dāng)總體標(biāo)準(zhǔn)差 1和 2未知時(shí),獨(dú)立小樣本均值之差的檢驗(yàn)采用 t檢驗(yàn)。配對(duì)樣本配對(duì)樣本(matched sample)就是一個(gè)樣本中的數(shù)據(jù)與另一個(gè)樣本 中的數(shù)據(jù)相對(duì)應(yīng)的兩個(gè)樣本。配對(duì)樣本可以消除由于樣本指定的不公平 造成的差異。在選擇配對(duì)樣本時(shí),可以將兩種同質(zhì)對(duì)象分別接受兩種不 同的處理。26. 組內(nèi)均方
28、P218組內(nèi)誤差的自由度為全部觀察值個(gè)數(shù)減去因素水平個(gè)數(shù),即 n k,其中n為全部觀察值個(gè)數(shù),k為因素水平的個(gè)數(shù)。SSE的均方記作MSE , 稱為組內(nèi)均方。其計(jì)算公式為:MSE=組內(nèi)平方和自由度SSEn k三、簡(jiǎn)答題1.舉例簡(jiǎn)要說(shuō)明社會(huì)研究過(guò)程。P4系統(tǒng)、完整的社會(huì)研究通常遵循著比較固定的過(guò)程,一般包括五個(gè)主要過(guò) 程:提出問(wèn)題、形成假設(shè)、收集數(shù)據(jù)、分析數(shù)據(jù)、檢驗(yàn)假設(shè)。1、提出問(wèn)題:是社會(huì)研究的第一步,研究者應(yīng)首先明確要做什么,或者說(shuō)進(jìn)行研究的目的是 什么。2、形成假設(shè):研究問(wèn)題往往是無(wú)法直接檢驗(yàn)的,而是要把研究問(wèn)題形 成假設(shè)才可以進(jìn)行檢驗(yàn)。也就是對(duì)兩個(gè)變量間關(guān)系進(jìn)行嘗試性回答。3、收集數(shù)據(jù):是
29、社會(huì)研究的關(guān)鍵步驟。4、分析數(shù)據(jù):對(duì)收集的原始數(shù)據(jù)進(jìn)行系統(tǒng)的審核、整理、歸類(lèi)、統(tǒng)計(jì)和分析。5、檢驗(yàn)假設(shè):完成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析后,我們要開(kāi)始進(jìn)行最后一步一一根據(jù)對(duì)數(shù)據(jù)的分析來(lái)檢驗(yàn)我們之前的假設(shè)和理 論。2. 按測(cè)度水平,變量可分為哪幾類(lèi)?并舉例說(shuō)明。P7變量分類(lèi)(按測(cè)度水平):(1)定類(lèi)變量當(dāng)變量值的含義僅表示個(gè)體的不同類(lèi)別,而不能說(shuō)明個(gè)體的大小、程度等 其它特征時(shí),這種變量稱為定類(lèi)變量。定類(lèi)變量是最低層次的變量。在社會(huì)調(diào) 查中,定類(lèi)變量有很多,如性別、婚姻狀態(tài)、民族、地區(qū)、職業(yè).等。性別可以分為男、女兩類(lèi),我們可以用 1表示男性,用2表示女性。民族可以分為漢 族和少數(shù)民族,我們可以用1表示漢族
30、,用2表示少數(shù)民族。(2)定序變量當(dāng)變量值的含義不僅表示個(gè)體的不同類(lèi)別,還可以區(qū)分個(gè)體之間大小、程 度等序次差異時(shí),這種變量稱為定序變量。社會(huì)調(diào)查中,受教育程度是定序變 量,可以分為文盲、小學(xué)、初中、高中、大專(zhuān)及以上等;人們對(duì)某種制度的態(tài) 度可以分為非常同意、同意、中立、不同意、非常不同意等。我們也可以用不同的數(shù)值1、2、3等表示不同的類(lèi)別,但是這時(shí)候 1、2、3等是包含大小的比 較意義的,例如,用“1”表示文盲,用“ 2”表示小學(xué),用“ 3”表示初中,用“ 4”表示咼中,用“ 5”表示大專(zhuān)及以上。此處,數(shù)字 1、2等不僅僅表示文化 程度的分類(lèi),還表示文化程度的高低,1還代表最低的文化程度,2
31、表示的文化 程度要高于1,5表示最高的文化程度。(3) 定距變量當(dāng)變量值不僅可以將個(gè)體區(qū)分為不同類(lèi)型并進(jìn)行排序,而且可以確定不同 類(lèi)別之間的數(shù)量差別和間隔差距時(shí),這樣的變量稱為定距變量。定距變量具有 測(cè)量單位,這些測(cè)量單位具有不變的相等區(qū)間的標(biāo)準(zhǔn),使個(gè)體之間的比較更具 客觀性。智商、溫度等都是定距變量。定距變量的變量值是用數(shù)值表示的,同一度量單位之間我們可以準(zhǔn)確的計(jì)算出個(gè)體之間的差值。例如,地區(qū)甲的溫度 是0°,地區(qū)乙的溫度是8°,則甲的溫度比乙的溫度低 8°,而在定類(lèi)和定序 變量中則不能這樣。在定距變量中,0的選取只是為了方便或習(xí)慣,0只表示- 個(gè)數(shù)值,而不表示
32、該現(xiàn)象不存在。如地區(qū)乙的溫度 =0°,并不是說(shuō)地區(qū)乙沒(méi)有 溫度;一個(gè)人的智商=0,并不是說(shuō)這個(gè)人沒(méi)有智商。(4) 定比變量除了上述三種變量的全部特征外,還可以計(jì)算兩個(gè)變量值之間的比值時(shí), 這樣的變量稱為定比變量。定比變量是最高層次的變量。在社會(huì)調(diào)查中,很多 情況下我們使用的都是定比變量,例如身高、年齡、收入、一個(gè)地區(qū)的人口數(shù)、 某產(chǎn)品的生產(chǎn)量等。 定比變量的變量值也是用數(shù)值表示, 但是與定距變量相比, 兩者的唯一區(qū)別是,定比變量有絕對(duì)零點(diǎn),即定比變量中的“0”是有實(shí)際意義的數(shù)值。例如,一個(gè)人的身高是0米,則表示這個(gè)人不存在;一個(gè)人的收入是 0 元,貝U表示這個(gè)人沒(méi)有收入。同樣,由于定
33、比變量中有絕對(duì)零點(diǎn),除可以進(jìn)行“=”或“工”、“”或“V”比較外,它還可以進(jìn)行“ + ”、“一”、“X”、“十”運(yùn)算。例如,職工甲每月收入是 7500元,職工乙每月收入是2500元, 我們可以說(shuō)職工甲比職工乙每月多收入 5000元,也可以說(shuō)職工甲每月的收入是 職工乙的3倍。3 判斷以下隨機(jī)變量是定性變量還是定量 變量,如果是定量變量,確定是離散變量還是連續(xù)變量。(1) 網(wǎng)絡(luò)供應(yīng)商的姓名(2) 每月的網(wǎng)絡(luò)服務(wù)費(fèi)定性變量定量變量連續(xù)變量(3)每月上網(wǎng)時(shí)間 連續(xù)變量(4)上網(wǎng)的主要目的定量變量定性變量(5)上周收到的電子郵件數(shù)量疋量變量離散變量(6)每月用于網(wǎng)上購(gòu)物的金額疋量變量連續(xù)變量(7)上月網(wǎng)
34、上購(gòu)物的次數(shù)定量變量離散變量(8)使用的電腦的品牌定性變量(9)上網(wǎng)是否玩游戲定性變量(10 )電腦是否帶有光盤(pán)刻錄機(jī)定性變量4.判斷以下隨機(jī)變量是定性變量還是定量 變量,如果是定量變量,確定是離散變量還 是連續(xù)變量。(1) 考研輔導(dǎo)班參加者的姓名定性變量(2) 家庭月消費(fèi)定量變量連續(xù)變量(3) 溫度定量變量 連續(xù)變量(4) 上個(gè)月外出吃飯的次數(shù)定量變量 離散變量(5) 產(chǎn)品等級(jí)定性變量5 舉例說(shuō)明什么是自變量和因變量,二者之間是什么關(guān)系?P10變量分類(lèi)(按變量間關(guān)系) 自變量與因變量?jī)蓚€(gè)變量之間,如果一個(gè)變量的變化能引起其他變量變化則稱之為自變量, 而將由于其他變量的變化而導(dǎo)致自身發(fā)生變化的
35、變量稱為因變量。自變量與因變量之間的關(guān)系既有時(shí)間上的先后關(guān)系,即現(xiàn)因后果,同時(shí)還 有因果關(guān)系,即因變量的變化是以自變量的變化為前提。例如我們常說(shuō)的“小樹(shù)長(zhǎng)高,我也長(zhǎng)高”,但是不能說(shuō)“我長(zhǎng)高”是因變量,“小樹(shù)長(zhǎng)高”是自變量,兩者只是有時(shí)間上的先后關(guān)系, 而沒(méi)有必然聯(lián)系。自變量與因變量之間還必須是例如,受教育程度增加,收入增加,這兩者就是因果關(guān)系,受教育程度是自變量,收入是因變量。6舉例說(shuō)明什么是離散變量和連續(xù)變量。P10(1) 離散變量如果一個(gè)變量的變量值是間斷的,可以列舉的,這種變量稱為離散變 量。例如,某人兄弟姐妹數(shù)、結(jié)婚次數(shù)、工廠生產(chǎn)產(chǎn)品的數(shù)量等,其變量值的取值是0, 1,2,3。離散變量
36、的取值是有限個(gè)值,而且其取值都是以整數(shù)位斷開(kāi)的,是有最小計(jì)量單位的。例如,某人的兄弟姐 妹數(shù),只能是1個(gè)、2個(gè)、3個(gè)等,而不能是1.3個(gè)、2.5個(gè)等。(2) 連續(xù)變量如果一個(gè)變量的變量值是連續(xù)不斷的,即可以取無(wú)數(shù)多個(gè)數(shù)值,這種變量 稱為連續(xù)變量。例如,年齡、溫度、燈泡的壽命等,它們的取值是連續(xù)不斷的。連續(xù)變量可以取無(wú)數(shù) 多個(gè)值,其取值是連續(xù)不斷,不可以一一列舉的,而且,它們沒(méi)有最小計(jì)量單位。例如,年齡可以是1歲整,也可以是1.2歲、1.45歲、2.544歲等。7 概率抽樣方法主要包括哪幾種?答:概率抽樣主要的方式有:簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、多階段抽樣等。8調(diào)查方法主要包括哪
37、幾種?簡(jiǎn)要說(shuō)明各 種方法的優(yōu)缺點(diǎn)。P16(1)問(wèn)卷法問(wèn)卷法是調(diào)查者根據(jù)一定的目的和要求,采用事先設(shè)計(jì)好的問(wèn)卷,向被調(diào) 查者了解情況,征詢意見(jiàn)的一種方法。問(wèn)卷法廣泛應(yīng)用于社會(huì)學(xué)、人口學(xué)、教 育學(xué)、管理學(xué)、心理學(xué)等領(lǐng)域中。(2)訪談法訪談法是指由調(diào)查員直接對(duì)被調(diào)查員進(jìn)行訪問(wèn)和交談,并記錄調(diào)查結(jié)果的方法。訪談法是以口頭語(yǔ)言為中介、調(diào)查者與被調(diào)查者面對(duì)面的交談和互動(dòng)的 過(guò)程。(3)觀察法觀察法是指研究者深入到所要研究對(duì)象的生活背景中,在實(shí)際參與研究對(duì)象的日常生活的過(guò)程中直接記錄研究對(duì)象的有關(guān)資料的方法。(4)典型組討論典型組討論是由812個(gè)具有某些共同特征或經(jīng)歷的人,在一個(gè)經(jīng)過(guò)專(zhuān)門(mén) 培訓(xùn)主持人的引導(dǎo)下
38、、圍繞著某一專(zhuān)門(mén)話題進(jìn)行互動(dòng)小組討論的一種定性調(diào)查 方式。目前有地方使用的電話典型組、網(wǎng)絡(luò)典型組、視頻典型組都是典型組討論的方式之一。9 數(shù)據(jù)分析中的歸納法和演繹法分別是什么? P19數(shù)據(jù)分析法(1)歸納法與演繹法歸納法與演繹法是社會(huì)研究的兩種基本推理方式。歸納法是從特殊到一般, 也就是從一組具體的觀察結(jié)果推導(dǎo)出一般性的規(guī)律或法則;演繹法則與歸納法 正好相反,是從一般到特殊,也就是研究者從想要檢驗(yàn)的一般性理論開(kāi)始,然 后去觀察、收集資料,通過(guò)這些資料來(lái)檢驗(yàn)這個(gè)理論。10. SPSS主要有哪些功能?P25統(tǒng)計(jì)分析功能和數(shù)據(jù)管理功能。11 在SPSS中如何定義變量屬性?P30變量屬性 SPSS中變
39、量有三種基本類(lèi)型:數(shù)值型、字符型、日期型。(1)數(shù)值型變量數(shù)值型變量是SPSS最常用的變量類(lèi)型。數(shù)值型變量包括標(biāo)準(zhǔn)數(shù)值型、逗 號(hào)數(shù)值型、圓點(diǎn)數(shù)值型、科學(xué)計(jì)數(shù)法型、美元數(shù)值型、自定義型。(2)字符型變量字符型變量也是SPSS中比較常用的數(shù)據(jù)類(lèi)型,默認(rèn)長(zhǎng)度為 &例如姓名、 地點(diǎn)等都可以定義為字符型變量,字符型變量不能參與運(yùn)算。(3)日期型變量日期型變量可以用來(lái)表示日期,也可以表示時(shí)間,例如調(diào)查時(shí)間、出生日 期等都可以定義為日期型變量。12. 等距分組和不等距分組有什么區(qū)別?請(qǐng)舉例說(shuō)明。P46在分組時(shí),如果 分組組距相等,就是等距分組,如:學(xué)生平均每天上網(wǎng)時(shí) 間:組距設(shè)3,分成3-6,6-9
40、,9-12,12-15共4個(gè)小組。如果分組組距不相等, 就是不等距分組。如:人口分析,分嬰幼兒組(0-6),少兒組(7-17),中青年 組(18-59),老人組(60-130),組距不相等。13. 統(tǒng)計(jì)表主要由哪幾部分構(gòu)成?答:統(tǒng)計(jì)表主要有標(biāo)題、標(biāo)目、線條、數(shù)字四部分構(gòu)成,有些統(tǒng)計(jì)表還有備 注。14. 條形圖和直方圖有什么區(qū)別?P63(1)條形圖:用寬度相同的條形的高度或者長(zhǎng)短來(lái)表示數(shù)據(jù)多少的圖形。條形圖既可以橫置也可以縱置,縱置時(shí)也可以稱為柱形圖 條形圖的繪制在繪制條形圖時(shí),如果將類(lèi)別放在縱軸,即條形圖橫置,稱為條形圖;如果 將類(lèi)別放在橫軸,即縱置,稱為柱形圖。繪制條形圖是既可以繪制成二維平
41、面圖, 也可以繪制成三維立體圖。直方圖的定義直方圖:就是用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形。在平面直角坐標(biāo)系中,我們用橫軸表示數(shù)據(jù)分組,用縱軸表示頻數(shù)或頻率,各個(gè) 組的頻數(shù)與頻率形成一個(gè)小矩形,就是直方圖。15. 簡(jiǎn)述眾數(shù)、中位數(shù)和平均數(shù)作為測(cè)量中 心趨勢(shì)的指標(biāo)所適用的數(shù)據(jù)類(lèi)型。P82,P83眾數(shù)只與變量值出現(xiàn)的次數(shù)有關(guān),適用于定序數(shù)據(jù)、定類(lèi)數(shù)據(jù)和數(shù)值型數(shù)據(jù) 中心趨勢(shì)的測(cè)量。但主要適用于定類(lèi) 數(shù)據(jù)中心趨勢(shì)的測(cè)量,中位數(shù)只與變量值的排序有關(guān),因而它適用于定序 數(shù)據(jù)和數(shù)值型數(shù)據(jù)中心趨 勢(shì)的測(cè)量。但主要適用于定序 數(shù)據(jù)中心趨勢(shì)的測(cè)量,平均數(shù)是將所有數(shù)據(jù)加總后除以數(shù)據(jù)總個(gè)數(shù)得出的。主要適用于數(shù)值型
42、數(shù)據(jù)中心趨勢(shì)的測(cè)量。數(shù)值型數(shù)據(jù)也可以用眾數(shù)和中位數(shù)測(cè)量中心趨勢(shì), 但均值最佳。16. 簡(jiǎn)述定類(lèi)變量、定序變量和數(shù)值型變量集中 趨勢(shì)測(cè)量的方法。與第二題一樣P83的表格數(shù)據(jù)類(lèi)型定類(lèi)數(shù)據(jù)定序數(shù)據(jù)數(shù)值型數(shù)據(jù)適用的測(cè)眾數(shù)中位數(shù)均值量值分位數(shù)中位數(shù)眾數(shù)分位數(shù)眾數(shù)17.簡(jiǎn)述相關(guān)系數(shù)的取值與意義。P174相關(guān)系數(shù)相關(guān)系數(shù)就是對(duì)變量之間相關(guān)關(guān)系程度和方向的度量。 當(dāng)研究?jī)蓚€(gè)變量之間 的相關(guān)關(guān)系時(shí)我們稱之為簡(jiǎn)單相關(guān)系數(shù)??傮w相關(guān)系數(shù)用p表示,樣本相關(guān)系 數(shù)-般用r表示。1、符號(hào):如果為正號(hào),則表示正相 關(guān),如果為負(fù)號(hào),貝I表示負(fù)相關(guān)。通俗點(diǎn)說(shuō),正 相關(guān)就是變量會(huì)與參照數(shù)同方向變動(dòng),負(fù)相關(guān)就 是變量與參照數(shù)反向變
43、動(dòng);2、取值為0,這是極端,表示不相關(guān);3、取值 為1,表示完全正相關(guān),而且呈同向變動(dòng)的幅度 是一樣的;4、如果為-1,表示完全負(fù)相關(guān),以 同樣的幅度反向變動(dòng);5、取值范圍:-1,1.相關(guān) 系數(shù)的絕對(duì)值越大,相關(guān)程度越強(qiáng),相關(guān)系數(shù)的絕對(duì)值越小,相關(guān)程度越弱。18.P177什么是回歸分析?其作用是什么?4、回歸分析回歸分析是通過(guò)一定的數(shù)學(xué)表達(dá)式將變量間的關(guān)系進(jìn)行描述,確定一個(gè)變量或幾個(gè)變量的變化對(duì)另一個(gè)特定變量的影響,是進(jìn)行估計(jì)或預(yù)測(cè)的一種方法, 側(cè)重于考察變量之間的數(shù)量伴隨關(guān)系?;貧w分析的作用是從一組數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式,對(duì)變量間這些關(guān)系式進(jìn)行統(tǒng)計(jì)檢驗(yàn)。并從影響某一個(gè) 變量的多
44、個(gè)變 量中找出 影響顯著的變量利用所求出的關(guān)系式,根據(jù)一個(gè) 變量或 多個(gè)變量取值估計(jì)或預(yù)測(cè)另一個(gè)特定變量的 取值。19.什么是簡(jiǎn)單一元線性回歸分析?其作 用是什么?P仃8一元線性回歸就是對(duì)具有線性相關(guān)關(guān)系的兩 個(gè)變量之間(其中一個(gè)為自變量)數(shù)量變化的一 般關(guān)系進(jìn)行預(yù)測(cè),確定相應(yīng)的數(shù)學(xué)關(guān)系式,以便 進(jìn)行估計(jì)或預(yù)測(cè)。通常將描述因變量y如何依賴 自變量x和誤差項(xiàng)e的方程稱為回歸模型。一元 線性回歸模型表達(dá)式為:y 0 ix20. 一元線性回歸模型中有哪些基本假定P179一元回歸模型的三個(gè)基本假定(1) 誤差項(xiàng) 是一個(gè)期望值為0的隨機(jī)變量,即E( )=0。在一個(gè)回歸模型 中,0和1都是常數(shù),因而,對(duì)于
45、一個(gè)特定的x值,y的期望值為E(y)= 0 1X。2(2) 對(duì)于所有的x值,的方差 都是相同的。(3) 誤差項(xiàng) 是一個(gè)服從正態(tài)分布的隨機(jī)變量, 而且互相獨(dú)立,即N( 0,21 .如何對(duì)配對(duì)樣本進(jìn)行t檢驗(yàn)P203(1)配對(duì)樣本T檢驗(yàn)方法配對(duì)樣本檢驗(yàn)主要是判斷不同的處理或試驗(yàn)結(jié)果是否有差異。配對(duì)樣本T檢驗(yàn)(Paired Sample T test )用于檢驗(yàn)兩個(gè)相 關(guān)的樣本(配對(duì)樣本)是否來(lái)自具有相同均 值的總體,因此針對(duì)配對(duì)樣本我們可以首先 計(jì)算出兩個(gè)樣本每個(gè)對(duì)應(yīng)變量間的差值,然后再檢驗(yàn)其差值的均值是否為零,若均值接 近于零(即在給定的置信區(qū)間內(nèi)),說(shuō)明兩 個(gè)樣本均值在給定的置信水平上沒(méi)有差異;
46、 若均值在給定置信區(qū)間以外,說(shuō)明兩個(gè)樣本 均值在給定的置信水平上有差異。(2)利用SPSS進(jìn)行配對(duì)樣本T檢驗(yàn)在 SPSS 主菜單選中 Analyze >Compare Means>Paired Sample T Test,出現(xiàn)圖 11 4所示窗口。 “Paired Variables ”框中的變量作為分析變量,總是 成對(duì)出現(xiàn),指定要檢驗(yàn)的兩個(gè)變量到 “ Paired Variables "輸入欄里的 “ VariableT' 和 “ Variable2 ” 中,在 “ Current Selections ” 欄中就會(huì)顯示被選中的成對(duì)變量,在“Optio ns ”
47、選項(xiàng)中可以進(jìn)行置信水平和缺失值的設(shè)置,同單樣本T檢驗(yàn)。22 .簡(jiǎn)要舉例說(shuō)明在分析雙變量的關(guān)系時(shí),t檢驗(yàn)和卡方檢驗(yàn)的主要區(qū)別。P207T檢驗(yàn)(T Test )是最常見(jiàn)的一種假設(shè)檢驗(yàn)類(lèi)型,主要驗(yàn)證總體均值間是否存在 顯著性差異。T檢驗(yàn)屬于參數(shù)假設(shè)檢驗(yàn),所以它適用的范圍是數(shù)值型的數(shù)據(jù), 在 網(wǎng)站分析中可以是訪問(wèn)數(shù)、獨(dú)立訪客數(shù)、停留時(shí)間等,電子商務(wù)的訂單數(shù)、銷(xiāo) 售額等。T檢驗(yàn)還需要符合一個(gè)條件 一一總體符合正態(tài)分布。卡方檢驗(yàn)(chi-square test ),也就是檢驗(yàn),用來(lái)驗(yàn)證兩個(gè)總體間某個(gè)比 率之間是否存在顯著性差異。卡方檢驗(yàn)屬于非參數(shù)假設(shè)檢驗(yàn),適用于布爾型或 二項(xiàng)分布數(shù)據(jù),基于兩個(gè)概率間的比較
48、,早期用于生產(chǎn)企業(yè)的產(chǎn)品合格率等, 在網(wǎng)站分析中可以用于轉(zhuǎn)化率、Bou nee Rate等所有比率度量的比較分析,23.簡(jiǎn)要說(shuō)明卡方的擬合優(yōu)度檢驗(yàn)和獨(dú)立性檢驗(yàn)的含義。P仃82 、擬合優(yōu)度檢驗(yàn)(1) 擬合優(yōu)度檢驗(yàn)從總體的不同類(lèi)別中抽取元素構(gòu)成樣本,樣本包含總體中各個(gè)類(lèi)別的元素,對(duì)不同類(lèi) 別的目標(biāo)量之間是否存在顯著性差異進(jìn)行的檢驗(yàn)稱為擬合優(yōu)度檢驗(yàn)。擬合優(yōu)度檢驗(yàn)是2檢驗(yàn)中重要的一部分,可以同時(shí)對(duì)多個(gè)總 體進(jìn)行比較。在2檢驗(yàn)中,如果2統(tǒng)計(jì)量小 于給定的2,那么就不能拒絕原假設(shè),如果 大于則拒絕。即2檢驗(yàn)的拒絕域是2 > 2(k 1),其中k 1是自由度。自由度是可以 自由變動(dòng)的變量個(gè)數(shù),在列聯(lián)表
49、中,自由度 =(R 1) * (C 1)。獨(dú)立性檢驗(yàn)(1) 獨(dú)立性檢驗(yàn):2檢驗(yàn)還可用于判斷兩 個(gè)分類(lèi)變量之間是否存在聯(lián)系,例如,對(duì)宿 舍管理改革的態(tài)度是否與專(zhuān)業(yè)有關(guān)、對(duì)性行 為的態(tài)度是否與學(xué)歷有關(guān)等。如果兩個(gè)分類(lèi) 變量之間沒(méi)有關(guān)系,則稱為獨(dú)立,我們用2判斷它們之間是否關(guān)聯(lián),這時(shí)稱為獨(dú)立性檢 驗(yàn)。3532四、計(jì)算題(每題15分,共30分)12-16題 題型一樣,公式自己抄1.某校社會(huì)學(xué)專(zhuān)業(yè)同學(xué)統(tǒng)計(jì)課成績(jī)?nèi)缦卤?所示。社會(huì)學(xué)專(zhuān)業(yè)同學(xué)統(tǒng)計(jì)課成績(jī)表學(xué)號(hào)成績(jī)學(xué)號(hào)成績(jī)學(xué)號(hào)成績(jī)101023761010377510105270101024911010387010105388101025871010397610
50、105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1) 對(duì)考試成績(jī)按由低到高進(jìn)行排序,求 出眾數(shù)、中位
51、數(shù)和平均數(shù)。(2) 對(duì)考試成績(jī)進(jìn)行適當(dāng)分組,編制頻數(shù) 分布表,并計(jì)算累計(jì)頻數(shù)和累計(jì)頻率。解答:(1)對(duì)考試成績(jī)按由低到高進(jìn)行排序如 下:62, 66,68,70,70,75,76,76,76,76,76,77, 78,79,80,80,80,81,82,82,83,83,85, 86,86,87,87,88,88,90,90,90,91,91, 92, 93, 93, 94, 95, 95, 96, 97其中,眾數(shù)為76,中位數(shù)為83,平均數(shù)為83.1(2) 對(duì)考試成績(jī)進(jìn)行適當(dāng)分組,編制頻數(shù)分布 表如下:按成績(jī)分 組(分)頻數(shù)累計(jì)頻數(shù)累計(jì)頻率6070337%7080111433%8090152
52、969%901001342100%2.某行業(yè)管理局所屬40個(gè)企業(yè)2011年產(chǎn)品 銷(xiāo)售額數(shù)據(jù)如下所示。40個(gè)企業(yè)2011年產(chǎn)品銷(xiāo)售額企業(yè) 編號(hào)銷(xiāo)售 額企業(yè) 編號(hào)銷(xiāo)售 額企業(yè) 編號(hào)銷(xiāo)售 額企業(yè) 編號(hào)銷(xiāo)售 額115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1) 對(duì)2011年
53、銷(xiāo)售額按由低到高進(jìn)行排 序,求出眾數(shù)、中位數(shù)和平均數(shù)。(2) 如果按照規(guī)定,銷(xiāo)售額在 125萬(wàn)元以 上的為先進(jìn)企業(yè),115萬(wàn)-125萬(wàn)之間的為良好企 業(yè),105萬(wàn)-115萬(wàn)之間的為一般企業(yè),105萬(wàn)以 下的為落后企業(yè),請(qǐng)按先進(jìn)企業(yè)、良好企業(yè)、一 般企業(yè)、落后企業(yè)進(jìn)行分組,編制頻數(shù)分布表,并計(jì)算累積頻數(shù)和累積頻率。解答:(1)對(duì)2011年銷(xiāo)售額按由低到高進(jìn) 行排序如下:87, 88,91,95,97,100,103,103,104,105,105,107,108,108,110,112,113,115,115,115,116,117,117,118,119,119,120,123,124,125,126,127,129,135,136,137,138,142,146,152得到眾數(shù)攵為115 ;中位數(shù)為115>5 ;平均數(shù)為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度文化產(chǎn)品出口代理協(xié)議模板3篇
- 2025年度征收補(bǔ)償與安置補(bǔ)償協(xié)議執(zhí)行監(jiān)督辦法4篇
- 2024年04月湖南國(guó)家開(kāi)發(fā)銀行湖南分行暑期實(shí)習(xí)生招考筆試歷年參考題庫(kù)附帶答案詳解
- 個(gè)人汽車(chē)租借協(xié)議2024年標(biāo)準(zhǔn)格式樣張版B版
- 2025年度文化創(chuàng)意產(chǎn)業(yè)園區(qū)場(chǎng)地租賃管理協(xié)議4篇
- 個(gè)人與公司買(mǎi)賣(mài)合同范本完整版
- 2025年度文化產(chǎn)業(yè)園區(qū)場(chǎng)地合作開(kāi)發(fā)合同協(xié)議書(shū)4篇
- 2024版室外房屋墻面裝修合同書(shū)版B版
- 2025年度化妝品全球包銷(xiāo)代理合同范本4篇
- 2024裝飾裝修合同的法律適用
- 礦山安全生產(chǎn)法律法規(guī)
- 標(biāo)點(diǎn)符號(hào)的研究報(bào)告
- 小學(xué)數(shù)學(xué)《比的認(rèn)識(shí)單元復(fù)習(xí)課》教學(xué)設(shè)計(jì)(課例)
- 詞性轉(zhuǎn)換清單-2024屆高考英語(yǔ)外研版(2019)必修第一二三冊(cè)
- GB/T 44670-2024殯儀館職工安全防護(hù)通用要求
- 安徽省合肥市2023-2024學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)試題(含答案)
- 合同債務(wù)人變更協(xié)議書(shū)模板
- 2024年高中生物新教材同步選擇性必修第三冊(cè)學(xué)習(xí)筆記第4章 本章知識(shí)網(wǎng)絡(luò)
- 西班牙可再生能源行業(yè)市場(chǎng)前景及投資研究報(bào)告-培訓(xùn)課件外文版2024.6光伏儲(chǔ)能風(fēng)電
- 2024-2029年中國(guó)制漿系統(tǒng)行業(yè)市場(chǎng)現(xiàn)狀分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- (正式版)SHT 3225-2024 石油化工安全儀表系統(tǒng)安全完整性等級(jí)設(shè)計(jì)規(guī)范
評(píng)論
0/150
提交評(píng)論