分析化學中的數據處理_第1頁
分析化學中的數據處理_第2頁
分析化學中的數據處理_第3頁
分析化學中的數據處理_第4頁
分析化學中的數據處理_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

分析化學中的數據處理第一頁,共48頁。設樣本容量為n,則其平均值為當測量次數無限多時,所得平均值即為總體平均值μ:

(2-1)若沒有系統誤差,則總體平均值μ就是真實值在分析化學中,廣泛采用標準偏差來衡量數據的分散(離散)程度第一頁第二頁,共48頁。①總體標準偏差當測量次數為無限多次時,各測量值對總體平均值μ的偏離,用總體標準偏差σ表示:(2-2)②樣本標準偏差當測量值不多,總體平均值又不知道時,用樣本的標準偏差s來衡量該組數據的分散程度。第二頁第三頁,共48頁。當測量次數非常多時,測量次數n與自由度(n-1)的區(qū)別就很小了,此時即

同時s③平均值的標準偏差(P58)單次測定值的標準差S反映的是單次測定值之間的離散性平均值的標準差反映的是若干組平行測定,各平均值之間的離散性第三頁第四頁,共48頁。若對某試樣作若干批測定,每批又作n個平行測定則(2-4)由此可見:①平均值的精密度比單次測定的精密度更好,;平均值的標準偏差與測定次數的平方根成反比.②增加測定次數,可使平均值的標準偏差減小。作關系圖如P59圖3-5所示。第四頁第五頁,共48頁。

開始時,隨減少很快,n>5變化較慢,而當n>10時,變化很小,進一步增加測定次數,徒勞無益,對提高分析結果可靠性并無更多好處。實際中,一般的分析作3~5次平行測定即可,而標樣、物理常數、原子量的測定則次數較多第五頁第六頁,共48頁。隨機誤差是由一些偶然因素造成的誤差,其大小、方向都不固定,難以預計,不能測量也無法消除。它的出現似乎很不規(guī)律,但實質上,它的出現和分布服從統計規(guī)律§2.2隨機誤差的正態(tài)分布(P53)第六頁第七頁,共48頁。它在概率統計中占有特別重要的地位,因為許多隨機變量都服從或近似服從正態(tài)分布,分析測定中的隨機誤差也是這樣的,P55圖3-3即為正態(tài)分布曲線,它的數學表達式為:

(2-5)式中y-為概率密度x-為測量值1.正態(tài)分布(高斯GAUSS分布)第七頁第八頁,共48頁。μ-為總體平均值,即無限次測定數據的平均值,相應于曲線最高點的橫坐標值,在沒有系統誤差時,它即為真值,它反映無限個測量數據分布的集中趨勢σ-總體標準偏差,是μ到曲線兩拐點之一的距離,它表征數據的分散程度,σ小,數據集中,曲線瘦高;σ大,數據分散,曲線矮胖。X-μ表示隨機誤差,若以X-μ為橫坐標,則曲線最高點橫坐標為0,即為隨機誤差的正態(tài)分布曲線第八頁第九頁,共48頁。由圖可看到隨機誤差有以下規(guī)律性:1)偏差大小相等、符號相反的測定值出現的概率大致相等2)偏差小的測定值比偏差較大的測定值出現的概率大,偏差很大的測定值出現的概率極小,趨近于03)大多數測定值集中在μ的附近,所以μ為最可信賴值或最佳值第九頁第十頁,共48頁。正態(tài)分布曲線隨μ、σ值不同而不同,應用起來不方便,為此,采用變量轉換的方法,將其化為同一分布-標準正態(tài)分布即令代入(2-5)式得又所以第十頁第十一頁,共48頁。即將式(2-5)轉化為只有變量u的方程

(2-6)因此曲線的形狀與σ大小無關,即不同σ曲線皆合為一條標準正態(tài)分布曲線見P56圖3-4第十一頁第十二頁,共48頁。第十二頁第十三頁,共48頁。正態(tài)分布曲線與橫坐標-∞到+∞之間所夾的面積代表全部數據出現概率的總和,顯然應當是100%,即為1P=(2-7)隨機誤差或測量值在某一區(qū)間出現的概率可取不同u值對式(2-7)進行定積分,求得面積(即為概率),并制得標準正態(tài)分布概率積分表。表的形式有很多種,為了區(qū)別,在表上方一般繪圖說明表中所列值是什么區(qū)間的概率,表中列出的面積與圖中陰影部分相對應(P57表3-2),表示隨機誤差在此區(qū)間的概率,若是求區(qū)間的概率,利用正態(tài)分布的對稱性,必須乘以22.隨機誤差的區(qū)間概率第十三頁第十四頁,共48頁。隨機誤差出現的區(qū)間測量值出現的區(qū)間概率P2×0.3413=68.3%2×0.4773=95.5%2×0.4953=99.1%2×0.4987=99.7%第十四頁第十五頁,共48頁。從計算結果可知,95%以上的測量值都會落在范圍內,隨機誤差x-μ超過的大誤差(或測量值)出現的概率<0.3%,一般化學分析是作幾次測定,所以可以認為實際上是不可能出現的,如一旦出現,可認為其不是由于隨機因素引起的,應棄去。例:P57例7、例8、例9第十五頁第十六頁,共48頁。

對無限次測量而言,總體平均值μ衡量數據的集中趨勢,總體標準差σ反映了數據的離散程度,但是,分析化學中常常只作有限次測定。下面將討論如何通過有限次測定結果對μ和σ進行估計,從而合理地推斷總體的特性

§2.3少量數據的統計處理第十六頁第十七頁,共48頁。正態(tài)分布是無限次測量數據的分布規(guī)律,而實際測定只能是有限次,其分布規(guī)律不可能完全相同。英國的統計學家兼化學家戈塞特(W.S.GOSSET)提出了t分布規(guī)律

(2-8)(書P60公式3-29有誤)

平均值的標準偏差一.有限次測量時的隨機誤差第十七頁第十八頁,共48頁。μ-總體平均值,無系統誤差時就是真值,t分布曲線如圖2-2(P60圖3-6)所示,縱坐標仍為概率密度,橫坐標為t,t分布曲線與正態(tài)分布曲線相似,只是①t分布曲線隨自由度f(f=n-1)而改變,當時,,t分布曲線即正態(tài)分布曲線。第十八頁第十九頁,共48頁。②與正態(tài)分布曲線一樣,t分布曲線下面一定范圍內的面積,即是該范圍內測定值出現的概率,但應注意,對于正態(tài)分布曲線,只要u值一定,相應的概率也就一定;但對于t分布曲線,當t一定時,由于f不同,相應曲線所包括的面積,即概率也就不同。為此引入置信度的概念,置信度P-人們對所作判斷的把握程度,其實質為某事件出現的概率,在此表示某一t值時,平均值落在()區(qū)間內的概率。落在此范圍之外的概率為(1-P)稱為顯著性水平,用α表示。第十九頁第二十頁,共48頁。③不同概率P與f值所對應的t值,表示為tα,f。如t0.05,10

代表置信度95%,自由度為10時的t值。t值表見書P61表3-3,概率P都是指雙邊值,即雖然表中所列的t值均為正值,實際上每個t值對應的概率p是指直線t=-t表和t=t表之間所夾曲線下的面積,例如:當f=3,p=0.95時,t0.05,3

=3.18,是指在自由度f=3的那條t分布曲線下,直線t=-3.18與直線t=3.18之間所夾的面積為0.95。第二十頁第二十一頁,共48頁。④理論上當f=∞時,各置信度對應的t值才與u值一致,但實際當f=20時,t與u已很接近。第二十一頁第二十二頁,共48頁。

多次重復測定得到一系列測定值,在報告分析結果時,要反映出數據的集中趨勢和分散性,一般采用下列三項值,①-是總體μ的最佳估計值,反映數據的集中趨勢。②S-是σ的估計值,反映數據的離散程度。③測定次數n-用于求自由度f,反映數據的可靠程度二.一般分析結果的統計表示法第二十二頁第二十三頁,共48頁。例測某鐵礦樣中Fe的含量,得:37.45%,37.30%,37.20%,37.50%,37.25%,報告分析結果解:=37.34%di(i=1,2…..5)分別為:+0.11,-0.04,-0.14,+0.16,-0.09(%)所以分析結果報告如下:=37.34%,s=0.13%,n=5第二十三頁第二十四頁,共48頁。注意:1)S結果保留幾位,要根據值而定,如=0.9987,則s可為0.0015,也可寫為0.002,最多與可疑位“7”相齊。2)如無%,則s不帶%,如=20.36%,s可寫為0.04%,此時才用“%”第二十四頁第二十五頁,共48頁。

在一定置信度上,根據(樣本)估計μ(總體平均值)可能存在的區(qū)間,只有當,,顯然做不到,少數測量得到的總帶有一定的不確定性,所以只能在一定置信度上,根據對μ可能存在的區(qū)間作出估計由t分布(2-8)式(2-9)這表示在一定置信度下,以平均值為中心,包括總體平均值μ范圍,就叫平均值的置信區(qū)間(P61)。三.平均值的置信區(qū)間(P61)第二十五頁第二十六頁,共48頁。例1:已知=35.21%,S=0.06%,n=4,求P=0.95,0.99時,平均值的置信區(qū)間解:P=0.95,t0.05,3

=3.18

理解為:在區(qū)間中包括總體平均值μ的把握(概率)有95%。P=0.99t0.01,3

=5.84μ參P62例10第二十六頁第二十七頁,共48頁。置信度越高,t曲線下面積越大,置信區(qū)間就越大,即所估計的區(qū)間包括真值的可能性也就越大。P=100%,則意味著區(qū)間無限大,肯定會包括真值,這樣的區(qū)間毫無意義;置信度定得太低則不能保證判斷的可靠性。分析中通常將P定在95%或90%第二十七頁第二十八頁,共48頁。(一)顯著性檢驗在分析工作中常遇到這樣的情況,某人對標樣進行分析,得到的平均值()與標準值(

μ

)不一致;或采用兩種不同的分析方法分析同一試樣,得到的兩組測定數據的平均值不一致;或兩個不同分析人員對同一試樣進行分析時,兩組數據的平均值不一致。如這種差異是由隨機誤差引起,則是不可避免的(正常的),可以認為差異不顯著;如這種差異是由系統誤差引起,則認為它們之間存在“顯著性”差異四測定數據的評價第二十八頁第二十九頁,共48頁。1.平均值()與標準值(μ)的顯著性檢驗-t檢驗為檢查某一新分析方法或某操作過程是否存在系統誤差,可用標樣或基準物質作幾次測定,然后用t檢驗法檢驗與μ

之間是否存在顯著性差異將、μ代入(2-8)式得

(2-10)第二十九頁第三十頁,共48頁。步驟:1)計算2)選定P(一般取95%),查表3),處于以μ為中心的95%概率區(qū)間之外,這種數據出現的機會是極少的,則與μ存在顯著性差異,說明有系統誤差存在;,則無顯著性差異,與μ的差異是由隨機誤差引起的第三十頁第三十一頁,共48頁。例(P63例11)采用某種新方法測定基準明礬中Al2O3的含量,得:=10.79%,S=0.04%,n=9,已知明礬中ω(Al2O3

)的理論值為10.77%,問該新方法是否有系統誤差?解:=1.5

t0.05,8

=2.314,所以

與μ無顯著性差異第三十一頁第三十二頁,共48頁。2.兩組平均值的顯著性檢驗-F檢驗+t檢驗不同分析人員、或同一分析人員采用不同方法分析同一試樣所得兩組數據平均值往往是不一致的,要判斷這兩組數據之間是否存在系統誤差(顯著性差異),通常按如下步驟進行:設兩組數據為:第三十二頁第三十三頁,共48頁。(1)F檢驗-檢驗兩組數據的精密度s1、s2

有無顯著差異(s1,s2是否來自同一總體)a.S2

-方差(2-11)因(方差較大,標準偏差較大)作分子,所以>1b.然后查F表(P64表3-4)c.若,說明s1與s2差異不顯著,進而用t檢驗法檢驗兩組數據之間是否存在系統誤差,即是否有顯著性差異。若,說明s1與s2差異顯著。第三十三頁第三十四頁,共48頁。2)t檢驗-檢驗兩組數據平均值有無顯著性差異(是否來自同一總體)a

其中S稱為合并標準偏差S=總自由度f=n1+n2-2為了簡化起見,有時不計算合并標準偏差S,若S1=S2,則S=S1=S2;若S1≠S2,則S=S小第三十四頁第三十五頁,共48頁。b.然后在選定的P下,根據f=n1+n2-2,查t表(t

.f),若t計算>t表

.則說明兩組平均值有顯著差異(可認為μ1≠μ2,而兩組數據不屬于同一總體)例:P65例12,例13第三十五頁第三十六頁,共48頁。(二)異常值(離群值)的取舍在一組平行測定數據中,有時會出現個別離群值(異常值、可疑值)。首先,要仔細回顧和檢查產生離群值的實驗過程,如系過失所引起(溶液濺失,加錯試劑等),此數據應棄去。否則,就要根據隨機誤差與分布規(guī)律決定取舍,若把有一定偏離仍屬隨機誤差范疇的數據舍去,表面上得到了精密度較好的結果,但這是不科學的、不嚴肅的。確定了離群值的取舍后,才能計算該組數據的、s以及進行其他有關數理統計處理。用統計學方法處理離群值的方法有好幾種,下面著重介紹Q檢驗法和格魯不斯(Grubbs)法第三十六頁第三十七頁,共48頁。1.Q檢驗法步驟:1)

(取正值)2)根據測定次數n和置信度P查Q值表(P68表3-6),若Q計算≥Q表,該值應棄去,否則應予保留。3)Q檢驗適于測定次數n≤10第三十七頁第三十八頁,共48頁。2.格魯布斯(Grubbs)法1).將測定值從小到大排列x1,x2,x3…….Xn2)計算統計量T,若x1為可疑值,;若xn為可疑值,對于一定的p和n(數據個數),查(P67表3-5),若則該可疑數據應棄去。如可疑值有兩個,則棄去一個(如x1)后,檢驗另一個異常值(如xn)時,測定次數應少算一次(n-1),、S要重新算。第三十八頁第三十九頁,共48頁。由于Grubbs法將正態(tài)分布中的兩個最重要的樣本參數及s引入進來,所以準確性可靠性較好,缺點是要計算及s,手續(xù)稍麻煩。例:P67例163.4法1)求出除異常值外其余數據和(平均偏差)2)如,則舍去。優(yōu)點:不用查表。缺點:可靠性較低

第三十九頁第四十頁,共48頁。在實際工作中,對分析結果的準確度的要求是各不相同的。例如:原子量的測定允許誤差小于10-4—10-5;在地球化學研究中,勘探測定巖石和土壤中的重金屬,50%的準確度即可滿足要求。另外,待測組分的含量較高,一般要求分析準確度較高(誤差較小),對于低含量組分,允許有較大的誤差?!?.5提高分析結果準確度的方法一.選擇合適的分析方法(根據被測物含量、共存元素的干擾情況)第四十頁第四十一頁,共48頁。各種分析方法的靈敏度和準確度是不同的,重量法與滴定法的準確度較高(Er≤0.2%),但靈敏度低,適合于常量(>1%)組分的測定;儀器分析法靈敏度高,但準確度較差,適合于微量(<1%)組分的測定;

第四十一頁第四十二頁,共48頁。例如:ω(Fe)=40.00%分析方法

ErE結果滴定法0.2%0.08%39.92%-40.08%光度法5%2%38%-42%(準確度太差)ω

(Fe)=0.02%時用光度法測定,E為0.001%,結果為0.019%~0.021%,可滿足分析要求。而用重量法與滴定法測不出來(靈敏度達不到)。第四十二頁第四十三頁,共48頁。用光譜法測純硅(Si)中的硼(B),得結果為2×10-6%,其Er允許

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論