SPSS信度和效度檢驗全套文檔_第1頁
SPSS信度和效度檢驗全套文檔_第2頁
SPSS信度和效度檢驗全套文檔_第3頁
SPSS信度和效度檢驗全套文檔_第4頁
SPSS信度和效度檢驗全套文檔_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

關(guān)于調(diào)查問卷的信度和效度檢驗(一)信度1、信度的含義測驗的信度又稱測驗的可靠性,是指同一個測驗對同一組被試施測兩次或多次,所得結(jié)果一致形程度。一個好的測驗必須是穩(wěn)定可靠的,多次使用所獲得的結(jié)果是前后一致的。例如,用直尺測量長度,其結(jié)果是穩(wěn)定可靠的。用橡皮筋測長度則是不可靠的,前后測量結(jié)果缺乏一致性。在測量理論中,信度被ST2定義為:某次測驗分數(shù)的真變異數(shù)與總變異數(shù)(即實測分數(shù))之比:R=S-2X式中Rxx表示測量的信度,ST2代表真分數(shù)的變異數(shù)(方差),Sx2表示實得分數(shù)的變異數(shù)(方差)。從上式可看出,(1)信度是指實測值和真值相差的程度,實測值是指對某物實際進行測量時所獲得值,也稱實測分數(shù)(X)。真值是指被測事物的真實規(guī)模取值,也稱真分數(shù)(T)。由于各種原因,實得分數(shù)常不等于真分數(shù),兩者之差稱為測量誤差或誤差分數(shù)(E)。從理論上看,實得分數(shù)由真分數(shù)和誤差分數(shù)兩部分組成即:X=T+ERxx就是對一組測驗數(shù)據(jù)的實測分數(shù)與真分數(shù)相差程度的最好估計。(2)信度又是指相同的測驗對相同的被試再次測量時引起的同樣反應(yīng)的程度。如果兩次測驗中,受測者所得分數(shù)或所處等級前后一致,則說明測驗結(jié)果的信度較高。反之,兩次測驗結(jié)果一致性低,說明測驗結(jié)果的信度低。信度是任何一種測量的必要條件(但不是唯一條件),只有測量值接近或等于真值,用同一工具多次測量同一特性獲得相同或相近的結(jié)果,才能認為這個測量結(jié)果是可靠的。信度對于教育測量尤其重要,只有信度高的教育測驗才能成為教育工作者有用的工具,才能為教育工作者提供可靠的信息,為教育預測和決策提供客觀依據(jù)。2、信度的估計方法測驗的信度是用信度系數(shù)的大小來表示的,根據(jù)測量理論,信度系數(shù)但是在實際測量中,一般只能獲得實得分數(shù)(X)及實得變異數(shù)(Sx2),而真分數(shù)(T)及真變異數(shù)(ST2)是不知道的,因此,依據(jù)上述公式還無法機算信度系數(shù)。在統(tǒng)計上,主要采用相關(guān)分析的方法即機算兩列變量的相關(guān)系數(shù),用相關(guān)系數(shù)的大小來表示信度的高低。主要用以下方法來求得信度:(1)再測法:用同一測驗對同一被試,前后施測兩次,根據(jù)兩次測驗分數(shù)計算相關(guān)系數(shù),即是再測信度。該信度反映了測驗的穩(wěn)定性程度,故又稱穩(wěn)定性系數(shù),是用皮爾遜積差相關(guān)公式計算的:R=XX式中X1.X2為同一被試的兩次測驗得分,M1.M2為兩次測驗的平均分數(shù),S1.S2是兩次測驗的標準差,N是被試人數(shù)。用再測法估計信度,可以得到有關(guān)測驗結(jié)果是否隨時間而變化及變化程度的資料,可以作為預測被測者將來行為表現(xiàn)的依據(jù)。但也存在明顯的局限性:前后兩次測驗結(jié)果易受到練習和記憶的影響,前后兩次施測的時間間隔影響穩(wěn)定性系數(shù),特別是對學績測驗的影響較大。如果時間間隔太長,被測者的身心因受環(huán)境影響將發(fā)生大的變化,從而對第二次施測結(jié)果產(chǎn)生較大影響,使穩(wěn)定性系數(shù)降低。如果間隔太短,則被試第一次完成測驗時練習和記憶會對第二次測驗產(chǎn)生較大影響,使第二次測驗性質(zhì)發(fā)生變化。另外,有些測驗不宜用再測法估計信度,如測量創(chuàng)造力測驗,被試一旦掌握了解決問題的辦法、原則,重測時,他將很容易作出反應(yīng),這樣測驗的性質(zhì)就發(fā)生了改變。因此,只有在沒有復本可用,測驗不易受重復使用影響,現(xiàn)實條件又允許重復施測的情況下才使用重測法估計信度。用重測法估計信度,間隔時間長短沒有嚴格的規(guī)定,一般說,間隔時間越長,穩(wěn)定性系數(shù)越低,最適

宜的時距應(yīng)根據(jù)測驗目的、性質(zhì)及被試特點而定,最好不超過六個月。對兒童的時距應(yīng)該短些,對成年人的時距可適當長些,因為個體早期的身心特征變化較大,而成年人的身心特征則相對穩(wěn)定。(2)復本法.根據(jù)同一測驗目的編制的許多平行德等值測驗,可測定被試的同一特征,這些等值的測驗叫做復本。對一組受測者間隔一定時間或同時施測兩個復本,根據(jù)兩次測驗結(jié)果求得相關(guān)系數(shù),即得等值性系數(shù),又稱復本信度。對一組受測者間隔一定時間后施測兩個復本所求得的穩(wěn)定性系數(shù)又稱等值穩(wěn)定性系數(shù)。因為用這種方法求得的信度不僅受復本質(zhì)量的影響,而且受時間練習等因素的影響,因此,等值穩(wěn)定性系數(shù)更全面地反映了測驗的信度。計算等值穩(wěn)定性系數(shù)是對兩個復本測驗結(jié)果計算斯皮爾曼積差相關(guān)系數(shù)(具體公式見前)。(3)分半法.當測驗沒有復本(復本的編制是很復雜的)而且測驗只適合施測一次的情況下,可用分半法估計信度,即將測驗題目分成對等的兩半,根據(jù)每人在這兩半測驗中的得分,計算其相關(guān)系數(shù),這個系數(shù)又稱內(nèi)部一致性系數(shù)。要求得分半信度,首先要將測驗分成對等的兩半。絕大多數(shù)測驗是由許多題目排列組成的,但是若將測驗簡單地分成前后兩部分,常常是不對等的,對等的兩部分起碼有兩個要求:一是測驗的兩部分在難度、區(qū)分度及測驗目標上基本是相同的。一是被測者以同等的態(tài)度來對待兩部隊測驗,即在完成兩部分測驗過程中,練習,疲勞,情緒等因素對被試產(chǎn)生了同等的影響。因此,將一個測驗分成兩部分時,常用的是奇偶分半法,即將奇數(shù)題分為一部分,將偶數(shù)題分為一部分。特別是測驗題目是按由易到難排列時,這種分法可以將測驗分為大致相等的兩半,但是,對于速度型的測驗不適合用奇偶分半法。用分半法求出的測驗的信度系數(shù)并不能反映整個測驗的信度。這是因為信度受測驗的長度的影響,測驗越長,信度越高,將測驗分成兩半求得的信度系數(shù),低估了整個測驗的信度,因此,需對測驗系數(shù)加以校正,校正公式是斯皮爾曼―布朗校正,校正公式是斯皮爾曼―布朗(Spearman—Brown)公式:R2Rhhxx1+RhhRxx是整個測驗的信度估計系數(shù),Rhh是兩個分半測驗的相關(guān)系數(shù)。上述公式的前提假設(shè)是兩個半測驗分數(shù)的變異性相等,但是若測驗資料不符合這個假定,可用下列公式求得信度:弗朗那根(Flanagan)公式:R=2?(1- )xx Sx2Sa2和Sb2分別代表兩個分測驗分數(shù)的變異數(shù),Sx2代表整個測驗的變異數(shù)。c,Sd2盧倫(Rulon)公式:Rxx=1--Sx2Sd2代表兩個半測驗分數(shù)之差的變異數(shù),Sx2代表總測驗變異數(shù)。對于由客觀性題目組成的測驗(即答對一題得一分,答錯得0分),則可用庫得一理查遜(Kuder一kZ(pq)Richardson)公式估計測驗的內(nèi)部一致性:Rkk=(-一-)(1- )k-1 Sx2k為測驗的總題目數(shù),p為某一個題目的答對率或通過該題目的人數(shù)比例,q為未通過該題目的人數(shù)比例,p=1-q,Sx2為測驗總分的方差。對于由客觀性題目和主觀性題目組成的測驗 ,有些題目是多重計分的情況下,則要用克倫巴赫kZSi2(Cronbach)公式計算a系數(shù)來估計測驗的內(nèi)部一致性:a=(--)(1- )k-1 Sx2k為測驗題目總分,Si2是某一題目得分的方差,Sx2是整個測驗分數(shù)的方差。上面這些公式不適用于速度性測驗,因為只有每個人做完所有的題目,題目的方差才是準確的。3、提高測驗信度的方法:影響測驗信度的誤差歸納起來主要有:(1)抽樣誤差:簡單說,這是在抽樣過程中由于被試間的差異所造成的誤差。被試間的差異可以用全距和方差大小來表示。全距是指某一心理量最大值與最小值之差。全距大說明被試間差異大,全距小說明被試間差異小。被試間在某一心理量上參差不齊,差別懸殊,則該心理量的方差大。反之,方差小。對于方差小的樣本,被試間在某一心理特征上相差較小,則前后兩次測驗結(jié)果的一致性較低,即降低了信度。因為被試之間的差別越小其同質(zhì)性越高,被試的分數(shù)只要發(fā)生小的變化,其名次就可能改變,從而降低信度。(2)隨機誤差:由于各種偶然因素的影響而產(chǎn)生的誤差,表現(xiàn)為用同一方法多次測量同一對象時結(jié)果上不一致。隨機誤差是由許多因素造成的,如量標的質(zhì)量,測量的程序,被試的身心狀態(tài),測量的環(huán)境等。根據(jù)影響測驗信度的因素,可從以下幾方面來提高測驗的信度:一是從測驗本身考慮,如測驗的長度、難度、區(qū)分度、速度、程序、環(huán)境條件與計分方法等。一是從被試自身考慮,如被試在被測心理特征上的差異大小,參加測驗的動機水平,對測驗的態(tài)度和積極性等。在此主要介紹如下幾種提高測驗信度的方法:(1)適當延長測驗的長度:測驗的長度主要指量表所包含的題目多少。對一個測驗來說,測驗的題目越少,得分越容易受偶然因素的影響,故測驗的信度越低。反之如果測驗題目較多,即測驗長度延長,擴大了被試得分范圍,可在一定程度上排除偶然因素的影響,從而提高測驗信度。但是測驗信度的增加并不是等比例提高信度系數(shù)。當信度系數(shù)較小時,延長測驗長度信度系數(shù)增加較大。當信度系數(shù)已經(jīng)較大時,延長測驗長度對信度系數(shù)的影響就較小了。而且,在延長測驗長度時,還需考慮其他因素的影響,如被試在回答問題時是否疲倦或產(chǎn)生厭煩情緒,是否節(jié)省時間、物力和財力,測題是否附合測驗目的等。(2)測驗的難度要適中:難度即測驗的難易程度,當測驗難度太大時,被試得分普遍太低,呈負偏態(tài)分布。當測驗難度太小時,被試得分普遍較高,呈正偏態(tài)分布。太難太易的測驗都使被試得分差異減小,使實得分數(shù)方差減小,從而降低測驗信度。參見公式:(3)測驗的內(nèi)容盡量同質(zhì):性質(zhì)相同的測驗內(nèi)容,對被試也要求相同的能力、知識和技能。而內(nèi)容不同質(zhì)的測驗,則要求被試不同的能力、知識和技能。因而為了提高測驗信度,測驗內(nèi)容應(yīng)盡量同質(zhì)。(4)測驗的時間要充分:對某一測驗而言,應(yīng)保證絕大多數(shù)被試在規(guī)定時間內(nèi)完成測驗。否則,如果被試不能從容回答所有問題,就不能反映被試的真實水平。(5)測驗的程序要統(tǒng)一:包括測驗的題目統(tǒng)一,指導語、回答問題的方式、分收試卷的方法、測驗時間等都要統(tǒng)一。(6)評分要客觀:評分是否客觀對測驗信度有直接的影響。對于客觀性題目,評分標準明確,評分容易做到客觀。但對于主觀性題目,受評分者影響較大,不易做到客觀。為了盡可能客觀評分,應(yīng)制定明確而易掌握的評分標準,盡量做到一卷多評,或一人只評一題等。(二)效度1、效度的含義效度(Validity)是指測量的有效程度或測量的正確性,即一個測驗能夠測量出所要測量特性的程度。例如,用直尺測量長度是有效的,而用來測量溫度則是無效的。對效度的定義可作如下理解:(1)任何一種測驗只是對一定目的來說才是有效的。(2)測驗的效度是對測量結(jié)果而言的,即一種測量工具只有經(jīng)過實際測量,才能根據(jù)測量結(jié)果判斷它的效度。(3)測驗的效度是相對的而非絕對的。測驗是根據(jù)行為樣本,對所要測量的心理特性作間接推斷,只能達到某種程度的準確性,而沒有全有、全無的差別。在測量理論中,效度被定義為:在一系列測量中,與測量目的有關(guān)的真變異數(shù)(即有效變異)與總變…、,cSy2異數(shù)之比:rxy2=——Sx2rxy表示測量的效度系數(shù),Sv2代表有效變異數(shù),Sx2代表總變異數(shù)。根據(jù)上述公式,可看出效度與信度的關(guān)系:???Sx2=Sv2+SI2+SE2ST2=Sv2+SI2cSy2 ST2—SI2SI2rxy2= = = Sx2 Sx2Sy2;.rxy2WrxxSI2表示系統(tǒng)誤差方差,它穩(wěn)定地與有效方差結(jié)合在一起,對信度沒有影響,而影響效度。從以上證明看出,測驗的效度受測驗的信度所制約,而且效度系數(shù)不會大于信度系數(shù)。效度高的測驗,信度必定高。但信度高的測驗,效度則未必高。效度在教育測量中有重要的意義。對一個測驗來說,效度比信度更為重要,測驗首先要保證能如實地測量出所要測量的東西,否則,這種測量將是沒有意義的。在教育測量中,效度問題尤其重要,首先,教育測量的對象大多是精神現(xiàn)象,只能對被測者的外部表現(xiàn)進行測量,以間接了解其心理活動特點或知識技能水平。其次,學生的心理活動特征與其外部表現(xiàn)之間,僅有相關(guān)關(guān)系而沒有嚴格的函數(shù)關(guān)系,外部行為有時并不能準確地反映某種心理狀態(tài)。再次,教育測量對象是有主觀能動性的人,人是能夠有意識地調(diào)節(jié)自己的外部行為,掩蓋自己的內(nèi)心活動,這就更增加了教育測量的難度。2、效度的類型與估計⑴內(nèi)容效度(ContentValidity):是指測驗目的代表所欲測量的內(nèi)容和引起預期反應(yīng)所達到的程度。例如,以考查學習成績?yōu)槟康牡臏y驗來說,"所欲測量的內(nèi)容"是指教案大綱所規(guī)定的全部教材。"起預期反應(yīng)"是指學生學習這些教材所產(chǎn)生的行為變化,如對教材的記憶、理解和應(yīng)用。在編制測驗時,內(nèi)容效度是一個相當復雜的問題,例如教師編制學績測驗,其目的是了解學生在某一學科或?qū)n}上對知識掌握情況,若條件允許,應(yīng)該對大綱規(guī)定的所有內(nèi)容進行全面考試,這顯然是行不通的,只能從這一范圍總體內(nèi)容中選取有代表性題目(樣本),組成測驗,根據(jù)測驗分數(shù)推論學生對該范圍總體知識的掌握。若測驗題目較好地代表了這個知識范圍,則推論是有效的,即測驗的內(nèi)容效度高。若選題有偏差,則推論是無效的,即測驗的內(nèi)容效度低。從另一方面看,測驗題目所引起的被試反應(yīng)(是一個樣本),若能代表其對本學科或?qū)n}的全部行為反應(yīng),也說明該測驗是有效的。反之,則是無效的。因此,一個測驗要有較高的內(nèi)容效度應(yīng)具備如下兩個條件:1.要有定義好的內(nèi)容范圍。2.測驗題目取樣應(yīng)有代表性(對所界定的內(nèi)容范圍而言)。估計內(nèi)容效度的方法:A、由專家進行邏輯分析:即請有關(guān)專家對測驗題目與原來的內(nèi)容范圍是否符合進行分析,作出判斷,看測驗題目是否較好地代表了原來的內(nèi)容。B、統(tǒng)計分析:克倫巴赫(Cronbach)認為內(nèi)容效度可以進行數(shù)量估計,方法是從同一教案內(nèi)容總體中抽取兩套測題,分別對同一組被試進行測驗,兩種測驗的相關(guān)系數(shù)可用來估計內(nèi)容效度。若相關(guān)系數(shù)大,則內(nèi)容效度高。若相關(guān)系數(shù)小,則兩個測驗中至少有一個內(nèi)容效度低。另外,有經(jīng)驗的任課教師對本學科測驗的內(nèi)容效度有較好的判斷。當然,若能與有關(guān)專家配合會更好些。(2)結(jié)構(gòu)效度(ConstructValidity):又稱構(gòu)想效度,是測驗對某一理論概念或心理特質(zhì)量的程度。即某測驗對所要測量的結(jié)構(gòu)或心理特質(zhì)實際測量的程度。心理測驗都是建立在心理學理論基礎(chǔ)的,例如比納一西蒙智力量表的制訂,心理學家比納(Binet)首先詳細研究了智力的結(jié)構(gòu),他認為智力行為是一種連鎖性的過程,包括判斷、推理、解決問題等。他根據(jù)這一理論編制的智力測驗,確實測量出被試的判斷、推理和解決問題能力,可以認為他所編制的測驗具有結(jié)構(gòu)效度。一般說,學科測驗主要看內(nèi)容效度,心理測驗主要看結(jié)構(gòu)效度。判斷內(nèi)容效度更容易一些,有教案大綱作依據(jù)。判斷結(jié)構(gòu)效度更難一些,因為理論結(jié)構(gòu)和心理特質(zhì)不易把握。因此,要制訂有構(gòu)想效度的測驗,首先要建立理論結(jié)構(gòu),例如智力測驗,先要確定關(guān)于智力的一套理論,如智力的概念、結(jié)構(gòu)、與環(huán)境的關(guān)系、與年齡的關(guān)系、與性別的關(guān)系等,在理論的基礎(chǔ)上提出若干假設(shè)并編制測題。確定結(jié)構(gòu)效度的方法:A、對測驗題目進行分析:主要是分析測驗的內(nèi)容,被試對題目所作的反應(yīng),測驗題目的同質(zhì)性以及分測驗之間的關(guān)系來判斷測驗的構(gòu)想效度。B、計算與同類權(quán)威測驗的相關(guān):某一個新測驗如果與同類的大家公認有效的已有測驗之間,在測驗結(jié)果上相關(guān)很高,說明這兩個測驗測的是相同特質(zhì),即新測驗也有較高的結(jié)構(gòu)效度,如后編的智力測驗常與斯坦福一比納智力量表進行比較。C、因素分析:通過因素分析找到影響測驗分數(shù)的共同因素,在測驗分數(shù)的總變異中來自有關(guān)因素的比例,可以作為構(gòu)想效度的指標。⑶預測效度(PredictiveValidity):又稱實證效度,是指一個測驗對個體將來的行為或獲得的成就進行預測時的準確性。一個測驗預測得越準確,預測效度越高。被預測的行為或成績是檢驗預測效度的標準,簡稱效標(Criterion),即衡量測驗有效性的參照標準。效標是估計預測效度的主要依據(jù),應(yīng)具備如下一些條件1)有效性:即效標測量本身必須有效。(2)可靠性:效標測量要具有較高的信度。(3)客觀性:在效標測量時要防止受評定者主觀印象和成見的影響,要防止效標污染,即由于主試知道某個人原來的測驗成績,因而影響了在效標測量中對這個人的評定分數(shù)。(4)效標測量應(yīng)該簡單省時,花費少,經(jīng)濟實用。一般常用學業(yè)成就,等級評定,臨床診斷,實際的工作表現(xiàn)作為效標。例如,一個智力測驗其預測效度既可用被試的學業(yè)成就作效標,也可用熟悉的班主任對其進行等級評定作效標。估計預測效度的主要方法是:A、相關(guān)法:即求某測驗分數(shù)與效標測量間的相關(guān),所得結(jié)果即效標系數(shù)。當測驗分數(shù)與效標測量分數(shù)都是連續(xù)變量時,用積差相關(guān)公式求相關(guān)系數(shù)(具體公式見統(tǒng)計教材)。當測驗分數(shù)是連續(xù)變量,而效標測量分數(shù)是二分變量時,可用二列相關(guān)公式計算效度系數(shù)(具體公式見統(tǒng)計教材)。B、區(qū)分法:即看原先測驗的分數(shù)是否可以區(qū)分由效標測量所化分的團體。例如,某工廠通過測驗錄用了一批工人,過一段時間后,根據(jù)工作成績將其分為稱職和不稱職兩種,然后回過頭來檢查他們的測驗分數(shù),運用t檢驗看看兩組在測驗上的平均分數(shù)是否有顯著差異。若有顯著差異,說明測驗是有效的。若差異不顯著,說明測驗是無效的。C、功利率:為了測定測驗的功效,人們還可對使用測驗所化掉的費用與得到的利益進行比較,看其利弊大小,這種效度指標叫功利率。U=B(Ns)-C(Nu)-SU代表功利率,B表示錄用一個合格的工人所產(chǎn)生的平均利潤,C表示錄用一個不合格的工人所造成的損失,Ns和Nu分別代表所錄用的人中成功和不成功的人數(shù),S代表整個選人程序的費用。計算功利率說明,如果一個測驗簡單易做,適合于團體施測,即使效度低些,也會有人采用。反之,如果測驗復雜,只能個別施測,費時費力,那么只有效度極高,給人帶來極大好處時,人們才會使用它。提高測驗效度對教育測驗非常關(guān)鍵,效度系數(shù)多大合適?要根據(jù)測驗的具體情況而定:(1)智力測驗分數(shù)與熟悉教師對學生智力等級評定之間的效度系數(shù)一般在0.30—0.50之間。教師評定常受許多其他因素的影響。(2)某一科目的標準測驗成績與任課教師對學生名次排列之間的相關(guān)系數(shù)應(yīng)達到0.60—0.70。(3)兩種不同的智力測驗或兩種標準測驗之間的相關(guān)系數(shù)應(yīng)達到0.60—0.80效度系數(shù)可解釋為效標分數(shù)中的變異有百分之幾來源于測驗的變異。例如效度系數(shù)為0.50,則說明效標分數(shù)中有0.502=25%的變異來自原測驗分數(shù)的變異。若效度系數(shù)為0.71,則效標分數(shù)中有50%的變異來自原測驗分數(shù)。3、提高測驗效度的方法:(2)控制系統(tǒng)誤差:系統(tǒng)誤差是影響測驗效度的主要因素。它主要包括儀器不準,題目和指導語有暗示性,答案按排不當(被試可以猜測)等,控制這些因素可以降低系統(tǒng)誤差,提高效度。(2)精心編制測題和測驗量表:首先測題內(nèi)容要適合測驗目的,如知識性測題就不能全面反映被試的智力水平,它主要測量其知識水平。其次,測題要清楚明了,用語要讓被試理解,排列由易到難。第三,測題的難度和曲分度要合適。(3)嚴格按照測驗程序進行測量,防止測量誤差:要嚴格按照測驗手冊進行測量,不能作過多的解釋,按標準評分,兩次測驗間隔要適當。

(4)樣本容量要適當:當樣本容量增大時,樣本對總體的代表性提高,樣本大,被試的內(nèi)部差異增大,擴大了真分數(shù)的方差,使效度提高。樣本容量一般不應(yīng)低于30。另外,抽樣方法也很重要,一般用隨機抽樣,當群體很大時,可分層抽樣,樣本容量擴大時,其代表性才隨之增大。(5)正確處理好信度與效度的關(guān)系:信度是效度的必要條件,但信度高的測驗,效度不一定高。而效度高的測驗,信度卻比較高。但是,既要有高效度,又要有高信度是不容易做到的?!白畲罂煽慷?信度)要求測驗工程之間有高度的組間相關(guān);最大預測有效度卻要求低度的組間相關(guān)。最大可靠度(信度)要求工程等同的難度;最大預測有效度卻要求工程的難度有所區(qū)別。中等程度的組間相關(guān)(0.10—0.60),通??僧a(chǎn)生良好的效度(0.30—0.80),并且產(chǎn)生滿意的信度(0.90)?!?郝德員:《教育與心理統(tǒng)計》,教育科學出版社,1962年版.P429)(6)適當增加測驗的長度:增加測驗的長度可提高測驗的信度,也可以提高效度,但增加測驗的長度對信度的影響大于對效度的影響。如果增加測驗長度到原來的n倍,則新測驗的效度系數(shù)Rnxy計算公:Rnxy=:Rnxy=Rxy-1-Rxx:n+Rxx式中Rxy、Rxx分別是原測驗的效度系數(shù)和信度系數(shù)。2.3.3信度和效度檢驗(1)信度檢驗采用Cronbacha系數(shù)、個別工程信度、潛在變量的組合信度(CompositeReliability,CR)進行信度檢驗,其中運用SPSS15.0中的“Analyze-Scale-ReliabilityAnalysis”命令,并選擇“Statistics”中的“Scaleifitemdeleted”,來計算Cronbacha系數(shù),利用LISREL8.70進行驗證性因子分析來計算個別工程信度和組合信度,驗證性因子分析的運算結(jié)果(詳見附錄3)經(jīng)整理如表2.6所示:從表2.6中關(guān)于Cronbacha系數(shù)的三欄中可以看出:C1、B4對應(yīng)的“校正得項總計相關(guān)性”(CorrectedItem-TotalCorrelation)偏低(相對于該部分量表中的其他指標對應(yīng)值而言),且刪除C1、B4有利于分別提升該部分量表的總體信度,故應(yīng)將C1、B4兩個指標刪除。同時“個別工程信度”一欄中C1、C2、B3、B4、P1這5個指標的因子負荷均小于0.50,根據(jù)社會科學研究特點,這5個指標也應(yīng)刪除,且刪除后有利于提高整個因素的一致性;而另外35個指標的因子負荷均大于0.5,滿足信度要求。除此之外,誠信環(huán)境、企業(yè)素質(zhì)、投標誠信、履約誠信、社會誠信各個量表以及整體的Cronbacha系數(shù)分別為0.750、0.845、0.817、0.862、0.830、0.939,屬于很可信的區(qū)間范圍;且對應(yīng)的組合信度分別為0.75、0.85、0.83、0.86、0.83、0.96,均大于0.5,滿足信度要求。(2)效度檢驗在信度檢驗刪除5個指標基礎(chǔ)上,首先,對有效樣本數(shù)據(jù)進行KMO抽樣適當性檢驗和Bartlett球形檢驗,檢驗結(jié)果顯示KMO值為0.5,Bartlett球形檢驗的x2值為250.278(自由度為105),達到顯著水平(p=0.000<0.001)。一般認為,當KMO值大于0.5時,即可進行因子分析,而本次KMO的檢驗值為0.5,說明本調(diào)查問卷的樣本數(shù)據(jù)基本適合進行因子分析。其次,采用主成分分析法,進行Varimax方差正交旋轉(zhuǎn),最終提取特征值大于1的因子4個,7個共同因子累計解釋的變異量為60.74%,且正交旋轉(zhuǎn)后得到的因子負荷矩陣如表2.7所示:

表2.6第三輪問卷信度檢驗編號校正的項總計相關(guān)性對應(yīng)指標刪除后的Cronbacha系數(shù)部分量表Cronbacha系數(shù)整體量表Cronbacha系數(shù)個別工程信度組合信度誠信環(huán)境C10.3650.7520.7500.9390.310.750.96C20.4080.7350.33C30.4980.7120.63C40.6280.6740.80C50.5750.6900.77C60.4790.7170.59企業(yè)素質(zhì)E10.5040.8340.8450.590.85E20.5390.8310.57E30.5840.8270.62E40.6080.8240.60E50.4980.8350.55E60.5650.8280.64E70.5260.8320.62E80.5610.8290.64E90.5670.8280.62E100.4700.8370.56投標誠信B10.5540.7940.8170.630.83B20.5790.7910.66B30.4320.8100.44B40.4090.8210.42B50.4990.8010.53B60.6160.7850.71B70.6560.7800.76B80.5980.7870.71履約誠信P10.4350.8620.8620.460.86P20.5160.8540.56P30.5630.8500.57P40.5580.8500.64P50.6340.8440.71P60.6340.8440.69P70.6090.8460.63P80.5580.8500.61P90.6170.8450.69P100.6190.8450.67社會誠信S10.5480.8130.8300.650.83S20.6090.8010.74S30.5860.8050.66S40.6610.7890.69S50.6150.7990.62S60.5840.8060.62

表2.7旋轉(zhuǎn)后因子負荷矩陣共同因子1234567施工安全0.6820.0950.2830.1100.1180.0530.188合同工期0.6720.192-0.0660.1600.1940.0990.097工程質(zhì)量保證0.6720.2510.3070.1650.0180.0000.009保修義務(wù)履行情況0.6490.1950.1270.1090.1090.2790.025設(shè)備到位情況0.5640.1130.0650.0070.1920.1100.402工程索賠0.5220.3370.0130.1610.1700.238-0.097工人工資支付0.4840.3650.2330.1610.0230.2700.060締約過失行為0.2070.7390.1640.1580.1610.1540.016中標放棄0.1640.7150.1070.2230.1760.132-0.006參與串標圍標0.2280.6770.2320.143-0.0160.2000.042低于成本價投標0.1000.5940.0030.0250.1810.0670.268轉(zhuǎn)包違法分包0.4210.5510.2040.049-0.0280.1830.082資質(zhì)真實性0.2240.4640.3330.2960.0370.1130.143政府誠信水平0.1220.1550.7840.1380.1380.0320.118誠信法律環(huán)境0.0770.2870.7360.1650.1570.064-0.066誠信文化環(huán)境0.1020.0350.681-0.0680.1820.1750.047征信體系建設(shè)水平0.1640.0940.6630.182-0.0630.163-0.002職工素質(zhì)0.3790.1000.3890.1810.275-0.0980.304工程業(yè)績0.0620.2130.0100.6810.100-0.0030.263建設(shè)單位評價0.3170.0600.2400.6470.1370.239-0.066守法誠信評價0.2250.3540.3200.522-0.0430.3360.078資質(zhì)等級0.0180.1530.0490.5010.343-0.0460.363監(jiān)理單位評價0.3860.0090.1280.4460.3510.351-0.014工程部情況0.2850.3460.1700.419-0.057-0.0330.360資格審查材料真實性0.3630.2260.3410.3940.1130.0900.115管理素質(zhì)0.2790.2620.3580.3900.070-0.0370.384總資產(chǎn)收益率0.1330.1310.1000.1010.7670.0990.117資產(chǎn)負債率0.1820.1920.2490.0660.7020.1660.071企業(yè)凈資產(chǎn)0.177-0.0040.0450.1190.6620.0610.392銀行信用等級0.1180.2380.2890.4090.4250.184-0.012法院評價0.1060.2270.0660.1170.0860.8050.067納稅評價0.1050.2240.1910.1840.1420.7360.057勞動保障評價0.3540.1240.150-0.0990.1370.7100.193機械設(shè)備0.0860.035-0.0190.0960.4300.0540.754技術(shù)創(chuàng)新0.0950.1200.0660.1780.0510.2120.737根據(jù)因子分析中對因子負荷的要求,由于“職工素質(zhì)”、“資格審查材料真實性”、“管理素質(zhì)”、三個指標的因子負荷均小于0.4,故這三個指標應(yīng)刪除;而第7個因素只包含

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論