版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、統(tǒng)計(jì)學(xué)原理與SPSS軟件應(yīng)用專題講座 楊 端 和 2015年10月 定性分析和定量分析 定性分析:用文字語言進(jìn)行相關(guān)描述。它是主要憑分析者的直覺、經(jīng)驗(yàn),憑分析對(duì)象過去和現(xiàn)在的延續(xù)狀況及最新的信息資料,對(duì)分析對(duì)象的性質(zhì)、特點(diǎn)、發(fā)展變化規(guī)律作出判斷的一種方法。 定量分析:用數(shù)學(xué)語言進(jìn)行描述。它是依據(jù)統(tǒng)計(jì)數(shù)據(jù),建立數(shù)學(xué)模型,并用數(shù)學(xué)模型計(jì)算出分析對(duì)象的各項(xiàng)指標(biāo)及其數(shù)值的一種方法。 相比而言,定量分析方法更加精確,但需要較高的數(shù)學(xué),統(tǒng)計(jì)學(xué)知識(shí)。 定量分析就是通過比較對(duì)照來分析問題和說明問題的。正是通過對(duì)各種指標(biāo)的比較或不同時(shí)期同一指標(biāo)的對(duì)照才反映出數(shù)量的多少、質(zhì)量的優(yōu)劣、效率的高低、發(fā)展速度的快慢等,
2、才能作出判斷、得出可靠的結(jié)論。 我們文科出身的語言教師一般數(shù)學(xué)基礎(chǔ)都相對(duì)薄弱,對(duì)于數(shù)據(jù)與統(tǒng)計(jì)都比較生疏,還由于統(tǒng)計(jì)學(xué)理論本身復(fù)雜難懂,以語言研究為目的,專門探討怎樣用統(tǒng)計(jì)學(xué)原理來處理評(píng)估語言數(shù)據(jù)的專著也很少。因而,統(tǒng)計(jì)學(xué)這門重要的 應(yīng)用學(xué)科在我們的語言教學(xué),科研中并沒有得到廣泛,充分應(yīng)用。 現(xiàn)在有了像SPSS這樣強(qiáng)有力的統(tǒng)計(jì)研究與數(shù)據(jù)分析工具,我們廣大語言教師只要經(jīng)過一段時(shí)間的學(xué)習(xí),就可掌握這一研究工具,在我們的語言教學(xué),科研中熟練掌握,使用它來對(duì)科研項(xiàng)目,學(xué)術(shù)論文的大量數(shù)據(jù)進(jìn)行定量分析,得出令人信服的結(jié)論就不再是不可企及的夢(mèng)想。統(tǒng)計(jì)學(xué)(statistics)的基本概念統(tǒng)計(jì)學(xué)是高等數(shù)學(xué)的一個(gè)分
3、支,是利用量化數(shù)據(jù)作出客觀判斷的科學(xué),是進(jìn)行任何科學(xué)研究必不可少的一個(gè)重要工具。描述統(tǒng)計(jì)學(xué)與推導(dǎo)統(tǒng)計(jì)學(xué)描述統(tǒng)計(jì)學(xué)(Descriptive Statistics):用不同的方式來描述所獲得的數(shù)據(jù),例如分?jǐn)?shù)的高低,內(nèi)部差異的大小等。 推導(dǎo)統(tǒng)計(jì)學(xué)(Inferential Statistics):從某一部分群體的特征推導(dǎo)出整體的特征,例如從某一個(gè)學(xué)校學(xué)生的英語水平推導(dǎo)出這個(gè)地區(qū)所有學(xué)生的水平。總體和樣本總體(population),具有相同性質(zhì)的研究對(duì)象的總和。例如可以說海明威老人與?!八邢薅▌?dòng)詞的總體”,等。總體還可再分為有限總體與無限總體有限總體(Finite Population): 老人與海
4、中“所有限定動(dòng)詞”是有限的,可數(shù)的,這就是有限總體的例子。無限總體(Infinite Population):有些總體從理論上講可能是無限的,例如英語句子的長度可以是無限的: This is the cat that ran after the mouse that came out from the house that the old man built .樣本(Sample): 從某一總體中取出的代表總體特征的一個(gè)部分。參數(shù)及統(tǒng)計(jì)值參數(shù)(Parameter):代表總體的一般特點(diǎn)的數(shù)據(jù)就稱為參數(shù)。例如,一篇英語文本共有60,5320個(gè)詞,這個(gè)數(shù)字就是這篇文本的長度參數(shù)。統(tǒng)計(jì)值(Statis
5、tical value):從總體中獲得的樣本的特點(diǎn)。例如,從剛才提到的那篇 6萬多詞的文本中隨機(jī)抽出1,200個(gè)詞,統(tǒng)計(jì)出這些詞的平均長度是3.8個(gè)字母,這個(gè)數(shù)字就是樣本的統(tǒng)計(jì)值。統(tǒng)計(jì)學(xué)研究的主要內(nèi)容之一就是變量。獨(dú)立變量(Independent Variable):變更一個(gè)或一組條件,然后觀察這種變更對(duì)我們感興趣的另外一些特點(diǎn)的影響,這些我們能夠變更的變量就稱為獨(dú)立變量。應(yīng)變量(Dependent Variable):受這種變更影響的變量就是應(yīng)變量。 語言教學(xué)方法,句子的復(fù)雜程度,社會(huì)階層等都是獨(dú)立變量;而語言考試成績,受試者正確復(fù)述句子的數(shù)量,發(fā)卷舌r音的人在美國某一 社會(huì)階層中所占的比例
6、則都是應(yīng)變量。連續(xù)變量及離散變量連續(xù)變量(Continuous Variable):可在特定范圍內(nèi)任取一個(gè)值,相鄰兩值可取無數(shù)數(shù)值。例如。發(fā)一個(gè)英語元音所用的時(shí)間就是一個(gè)連續(xù)變量。離散變量(Discrete Variable):只能取某些值的變量。例如,任何一個(gè)英語詞只能是由1,2,3,4.個(gè)字母組成,語言研究受試者只能是20,500,或1,000人等。離散變量只能按整數(shù)計(jì)算,不能有小數(shù)。 當(dāng)然,詞的平均長度或受試者的平均人數(shù)是連續(xù)變量,可以取3.15或55.4這樣的值。定性變量(Qualitative Variable):這種變量就是要為某些量“定性”。說明“是”還是“不是”,而不說明是“多
7、” 還是“少”。例如,一個(gè)詞在一個(gè)特定的句子中只能屬于某一詞類,我們只能說“這是個(gè)形容詞”,或“這不是個(gè)形容詞”,不能說“這個(gè)詞或多或少是形容詞”。序列變量(Ranking Variable):與定性變量恰恰相反,序列變量可劃分為等級(jí)或程度。漢語發(fā)音的正確程度可用等級(jí)來表達(dá)。可以說, 學(xué)生A的發(fā)音比學(xué)生B正確,而學(xué)生B又比學(xué)生C正確。掌握一門語言的熟練程度也是一種序列變量。 在序列變量中,等級(jí)與程度的差異是連續(xù),漸次變化的,中間沒有明確的間隔。說學(xué)生A的發(fā)音比學(xué)生B的好,而學(xué)生B的又比學(xué)生C的更正確,但學(xué)生A與學(xué)生B的發(fā)音差異是否與學(xué)生B與學(xué)生C的差異完全一樣就很難說了。比例變量(Ratio
8、Variable):以零為起點(diǎn)來計(jì)算比例。例如,某人發(fā)一個(gè)漢語韻母的時(shí)間是12秒,而另一個(gè)人只用了06秒,所以,這個(gè)人的發(fā)音時(shí)間就比那個(gè)人長了一倍??梢钥闯?,時(shí)間就是一個(gè)比例變量。描述統(tǒng)計(jì)學(xué)(Descriptive Statistics)簡 介摘自語言統(tǒng)計(jì)學(xué): 用不同的方式來描述所獲得的數(shù)據(jù),就是描述統(tǒng)計(jì)學(xué),包括集中趨勢(shì)與差異性計(jì)算,主要內(nèi)容有平均值,中數(shù),眾數(shù),全距,方差及標(biāo)準(zhǔn)差的計(jì)算。集中趨勢(shì)(Central Tendency)與差異性(Discrepancy)計(jì)算 測(cè)量數(shù)據(jù)的排列狀態(tài)就是研究它們的集中趨勢(shì),包括計(jì)算平均數(shù),中數(shù)及眾數(shù)。 平均數(shù)(mean): 中數(shù)(median):把一組數(shù)
9、據(jù)由高到低排列,中間的那個(gè)數(shù)就是中數(shù)。它上面和下面都有同樣多的數(shù)。但如果這一組數(shù)是偶數(shù),就要將中間的這兩個(gè)數(shù)相加,再取它們的平均數(shù),這個(gè)平均數(shù)就是這組偶數(shù)的中數(shù)。 眾數(shù)(mode):眾數(shù)就是一組數(shù)據(jù)中出現(xiàn)頻數(shù)最高的那個(gè)數(shù)。 差異性計(jì)算包括計(jì)算全距,方差和標(biāo)準(zhǔn)差: 1全距(Range):全距就是一組數(shù)據(jù)的最大數(shù)與最小數(shù)之差。 兩組分?jǐn)?shù):A組:42 46 49 50 58 66 68 70 75 78 80 85B組:31 38 45 49 51 52 55 68 71 75 85 90A組的全距:85 42 = 43B組的全距:90 31 = 592方差(Variance,V)和標(biāo)準(zhǔn)差(Stan
10、dard Deviation,SD,S.td) 計(jì)算一組數(shù)據(jù)之間內(nèi)部差異最常用的方法就是計(jì)算方差和標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差是密切相關(guān)的兩個(gè)概念,方差就是標(biāo)準(zhǔn)差的平方,標(biāo)準(zhǔn)差就是方差的平方根。 3 計(jì)算標(biāo)準(zhǔn)差的公式: 這兩組簡單數(shù)據(jù)的平均分都是 50,而標(biāo)準(zhǔn)差卻相差很大: 1組:48 49 50 51 52 標(biāo)準(zhǔn)差= 1.58 2組:20 30 50 60 90 標(biāo)準(zhǔn)差= 27.39 可見,第2組的內(nèi)部差異要比第1組大得多。用計(jì)算機(jī)來處理這些數(shù)據(jù)非常簡單。稍后我們就用SPSS軟件來演示,計(jì)算這幾項(xiàng)常用的描述統(tǒng)計(jì)學(xué)數(shù)據(jù)。 下面用兩位學(xué)者為我的書寫的書評(píng)來簡要介紹這個(gè)世界知名統(tǒng)計(jì)軟件。 SPSS軟件簡要
11、介紹: 摘自書評(píng):語言研究應(yīng)用SPSS軟件實(shí)例大全評(píng)介 -(刊載于外語類核心期刊外語電化教學(xué)2005年第3期,作者:孟凡勝,胡加圣) 書評(píng)前言: 美國芝加哥專業(yè)軟件公司設(shè)計(jì)開發(fā)的社會(huì)科學(xué)統(tǒng)計(jì)軟件SPSS(Statistical Package for Social Sciences)是一個(gè)功能完善,不斷升級(jí)換代的統(tǒng)計(jì)數(shù)據(jù)分析軟件,有“世界優(yōu)秀統(tǒng)計(jì)工具”的盛名。 自從其8.0版本改為Windows制式以來,數(shù)據(jù)輸入,保存,操作方式都變得及為簡便,即便是初學(xué)者也可以很快上手,輸出的圖表更加規(guī)范豪華,更易于修改,縮放,打印。因而早已超越國界,為世界各國的研究人員所喜愛。 自九十年代中期以來,SPSS
12、的10.0版本及后來的新版本在我國得到廣泛的傳播,成為眾多研究人員必不可少的研究工具。雖然稱為“社會(huì)科學(xué)統(tǒng)計(jì)軟件”,但實(shí)際上在自然科學(xué)領(lǐng)域使用得更加廣泛,這當(dāng)然是由于自然科學(xué)工作者對(duì)統(tǒng)計(jì)學(xué)原理有更深地理解。 而在我們語言研究、教學(xué)領(lǐng)域,對(duì)這一軟件的使用并不普遍,這可能應(yīng)歸結(jié)為很多文科出身的語言工作者對(duì)統(tǒng)計(jì)學(xué)數(shù)據(jù),計(jì)算機(jī)應(yīng)用有天生的恐懼,同時(shí)也是由于還沒有一本專門為廣大語言工作者,語言教師撰寫,以語言研究為目的,全面論述這一軟件綜合應(yīng)用的參考書。 云南師范大學(xué)楊端和教授撰寫的專著語言研究應(yīng)用SPSS軟件實(shí)例大全(中國社會(huì)科學(xué)出版社2004年4月出版,ISBN7-5004-4300-5,71098
13、0毫米,1/16開本,287頁,319千字,定價(jià)32.00元)是第一本這樣的專著,填補(bǔ)了這一領(lǐng)域的空白。 該書用解析眾多語言研究實(shí)例的方法,將統(tǒng)計(jì)學(xué)基本的闡釋與軟件運(yùn)行步驟說明有機(jī)地結(jié)合起來,深入淺出,全面論述這一優(yōu)秀統(tǒng)計(jì)工具的11.0版本在語言研究,語言教學(xué)各分枝領(lǐng)域各個(gè)層面的全方位應(yīng)用。 值得一提的是作者在演示這一軟件的運(yùn)行過程時(shí),已將所有的英語統(tǒng)計(jì)學(xué)術(shù)語,板塊名稱,說明與命令語句都譯成了漢語,使得不懂英語的語言工作者也能應(yīng)用,熟練掌握這一強(qiáng)有力的研究工具,并將其得心應(yīng)手地應(yīng)用于自己的科研實(shí)踐中。 因此,該書對(duì)于語言文字,中外文學(xué),語言學(xué)及應(yīng)用語言學(xué)專業(yè)研究人員、教師、碩士、博士研究生具有
14、較高參考價(jià)值,也可作為語言研究方法論,語言測(cè)試與統(tǒng)計(jì)學(xué),及語言教學(xué)評(píng)估等研究生課程的教科書或參考書。 新加坡國家大學(xué)中文系最先看到了該書的價(jià)值,已將它定為該系研究生漢語計(jì)量分析課程的主要教材,臺(tái)灣,香港的幾所主要大學(xué)的圖書館收藏了該書。 國內(nèi)數(shù)十所大學(xué)也將該書列為語言專業(yè)研究生參考書或教材。書中的很多實(shí)例,本身就是現(xiàn)成的研究項(xiàng)目或?qū)n},相信廣大語言工作者定會(huì)從中得到借鑒與啟示。(書評(píng)結(jié)束語): 政治經(jīng)濟(jì)學(xué)的一個(gè)基本觀點(diǎn)就是生產(chǎn)工具的使用水平反映出社會(huì)生產(chǎn)力發(fā)展的水平。在語言研究中使用什么樣的研究工具,研究手段,就體現(xiàn)了語言研究的發(fā)展水平。 因此,我們新世紀(jì)的語言研究要走向現(xiàn)代化,首先就應(yīng)該實(shí)現(xiàn)
15、研究工具,研究手段的現(xiàn)代化,走應(yīng)用計(jì)算機(jī)軟件全方位處理語言數(shù)據(jù)之路。 所以說,該書對(duì)于提高我國的語言研究量化分析水平,對(duì)于普及計(jì)算機(jī)在語言研究信息處理方面的應(yīng)用所作的貢獻(xiàn)是顯而易見的。筆者相信,該書會(huì)成為廣大語言研究人員、語言教師、語言專業(yè)研究生一本常用的參考書。 作者在前言中講述寫作這本書的動(dòng)機(jī)時(shí)充滿企盼地說,“作者執(zhí)著的追求就是要幫助我們的語言工作者拿起SPSS這一強(qiáng)有力的研究工具”。我們相信,作者的企盼一定為成為現(xiàn)實(shí)。其實(shí)這也是我們撰寫這一書評(píng)的初衷。SPSS軟件界面及數(shù)據(jù)錄入模式簡介1變量視窗(variable view) 在變量視窗建立變量,轉(zhuǎn)換。2數(shù)據(jù)視窗(data view) 數(shù)
16、據(jù)錄入:在數(shù)據(jù)視窗錄入數(shù)據(jù),每個(gè)空格錄入一 個(gè)數(shù)。 數(shù)據(jù)集的保存與調(diào)出數(shù)據(jù)集命名:中文,英語都可以。保存:可保存在任何一個(gè)盤上。調(diào)出:點(diǎn)擊即可調(diào)出應(yīng)用。描述統(tǒng)計(jì)學(xué)數(shù)據(jù)示例從Analyze下拉菜單選擇Descriptive Statstics 分板塊,點(diǎn)擊Frequencies欄,將文件bar-1 中的a,b,c,四個(gè)變量都從左側(cè)源變量欄選入右側(cè)variables (計(jì)算變量)欄內(nèi)。然后點(diǎn)擊坐下側(cè)displaying frequency tables.點(diǎn)擊主對(duì)話框下方Statistics(統(tǒng)計(jì)值)按鈕,進(jìn)入Frequencies: Statistics(頻數(shù):統(tǒng)計(jì)值)子對(duì)話框。 左下側(cè)的Disp
17、ersion(離散趨勢(shì))欄,全選。右上側(cè)的Central Tendency(集中趨勢(shì))欄,也是全選。 有下方的Distribution(分布特征)欄不選了。 點(diǎn)擊Continue 按鈕,返回主對(duì)話框。點(diǎn)擊主對(duì)話框下部Charts按鈕,進(jìn)入Frequencies:Chart(頻數(shù):制圖)子對(duì)話框。選擇histogram(直方圖),點(diǎn)擊with nornal curve.添加正態(tài)分布曲線。點(diǎn)擊Continue 按鈕,再次返回主對(duì)話框。 點(diǎn)擊主對(duì)話框 OK.常用統(tǒng)計(jì)圖制作誤差條圖(Error Bar):口語評(píng)估標(biāo)準(zhǔn)實(shí)驗(yàn):未參照細(xì)則與參照細(xì)則對(duì)比。文件名:error bar從graph 到 error
18、 bar 項(xiàng),進(jìn)入后選 Clustered,選擇 Summaries for groups of cases 點(diǎn)擊Define后,將“口語成績”選入右邊Variables 欄內(nèi);將“學(xué)生編號(hào)” 選入 Category Axis欄內(nèi); 將“評(píng)估標(biāo)準(zhǔn)” 選入Define clusters by.欄內(nèi) 點(diǎn)擊Title 按鈕,輸入:口語評(píng)估標(biāo)準(zhǔn)實(shí)驗(yàn)誤差條圖 字樣。點(diǎn)擊Continue返回主對(duì)話框。點(diǎn)擊 OK(見書2122) 從該圖可見,參照評(píng)估細(xì)則后,各位老師對(duì)同一學(xué)生評(píng)估的差異迅速縮小,也就是說,信度有較大的提高。證明實(shí)施細(xì)則對(duì)于保證口語考試信度具有舉足輕重的作用。餅圖(Pie)的制作從Graphs
19、進(jìn)入 Pie。調(diào)入文件pie:英國詩人華茲華斯詩歌修辭格百分比將所列修辭格直接錄入作為變量名,看變量視窗。返回?cái)?shù)據(jù)視窗,錄入百分比轉(zhuǎn)換的小數(shù)。選擇summary of separate variables點(diǎn)擊Define, 移入所有七個(gè)變量。立體餅圖1.打開“立體餅圖”文件。還是從 Graphs 下拉菜單選擇“interranctive”選項(xiàng)。選擇 pie, 點(diǎn)擊進(jìn)入,選擇simple 項(xiàng),點(diǎn)擊進(jìn)入。選擇3-D 項(xiàng)。將修辭格拖入上slice 欄,將百分比拖入下slice 欄。點(diǎn)擊頂部選項(xiàng)pie,進(jìn)入后選擇category,percent 這兩項(xiàng)。返回。點(diǎn)擊OK按鈕即可。這個(gè)圖還可旋轉(zhuǎn),改變角度
20、。 控制圖(Control)繪制文件名:control從Graphs 到 control 項(xiàng),進(jìn)入Control chart 預(yù)定義框。選擇 Individuals,Moving range(數(shù)據(jù)與移動(dòng)范圍)選項(xiàng)。選擇左下角Cases are units(以個(gè)案為單位) 選項(xiàng)。點(diǎn)擊右上角 Define 按鈕,進(jìn)入Individuals and Moving Range(數(shù)據(jù)與移動(dòng)范圍)主對(duì)話框。將左邊源變量欄中的case變量選入右上方 Process Measurement(過程測(cè)量)條欄內(nèi)。將group 選入Subgroups Labeled by(分組限 定)條欄內(nèi)。在該框中部的Charts(制圖)圍欄內(nèi)選擇 Individuals and moving range 項(xiàng),現(xiàn)在點(diǎn)擊該框 OK 按鈕。系統(tǒng)繪制出一張平均分控
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧解決方案:智能城市管理
- 消防應(yīng)急避險(xiǎn)
- 3.2.3離子反應(yīng) 課件 高一上學(xué)期化學(xué)蘇教版(2019)必修第一冊(cè)
- 糖尿病個(gè)人教育與護(hù)理
- 傳統(tǒng)毛筆課件教學(xué)課件
- 日常生活食品安全
- 生產(chǎn)安全事故案例培訓(xùn)教材
- 布谷鳥節(jié)奏游戲教案反思
- 弧度制說課稿
- 海水的運(yùn)動(dòng)說課稿
- 醫(yī)院人才梯隊(duì)建設(shè)情況匯報(bào)
- 動(dòng)火作業(yè)票填寫模板
- 學(xué)校三年發(fā)展規(guī)劃落實(shí)情況評(píng)估報(bào)告(通用3篇)
- 術(shù)后譫妄演示課件
- 人教版二年級(jí)數(shù)學(xué)上冊(cè)第六單元《表內(nèi)乘法(二)》單元分析(學(xué)校集體備課)
- 常用孔軸卡簧規(guī)格尺寸
- 課件:幼兒園中小學(xué)防拐騙安全教育主題班會(huì)必備
- DB12-T 1145-2022牛糞臥床墊料生物安全管理規(guī)范
- 風(fēng)管系統(tǒng)安裝檢驗(yàn)批質(zhì)量驗(yàn)收記錄(Ⅰ)(送、排風(fēng)、防排煙、除塵系統(tǒng))1
- 水泵試運(yùn)行記錄表
- 最新高警示藥品目錄
評(píng)論
0/150
提交評(píng)論