1、離群值按產生原因分為兩類:
a)第一類離群值是總體固有變異性的極端表現,這類離群值與樣本中其餘觀測值屬於同一總體;
b)第二類離群值是由於試驗條件和試驗方法的偶然偏離所產生的結果,或產生於觀測、記錄、計(ji)算(suan)中(zhong)的(de)失(shi)誤(wu),這(zhe)類(lei)離(li)群(qun)值(zhi)與(yu)樣(yang)本(ben)中(zhong)其(qi)餘(yu)觀(guan)測(ce)值(zhi)不(bu)屬(shu)於(yu)同(tong)一(yi)總(zong)體(ti)。對(dui)離(li)群(qun)值(zhi)的(de)判(pan)定(ding)通(tong)常(chang)可(ke)根(gen)據(ju)技(ji)術(shu)上(shang)或(huo)物(wu)理(li)上(shang)的(de)理(li)由(you)直(zhi)接(jie)進(jin)行(xing),例(li)如(ru)當(dang)試(shi)驗(yan)者(zhe)已(yi)經(jing)知(zhi)道(dao)試(shi)驗(yan)偏(pian)離(li)了(le)規(gui)定(ding)的(de)試(shi)驗(yan)方(fang)法(fa),或(huo)測(ce)試(shi)儀(yi)器(qi)發(fa)生(sheng)問(wen)題(ti)等(deng)。當(dang)上(shang)述(shu)理(li)由(you)不(bu)明(ming)確(que)時(shi),可(ke)用(yong)本(ben)標(biao)準(zhun)規(gui)定(ding)的(de)方(fang)法(fa)。
2、離群值的三種情形:
本標準在下述不同情形下判斷樣本中的離群值:
a)上側情形:根據實際情況或以往經驗,離群值都為高端值;
b)下側情形:根據實際情況或以往經驗,離群值都為低端值;
c)雙側情形:根據實際情況或以往經驗,離群值可為高端值,也可為低端值。
3、檢出離群值個數的上限
應規定在樣本中檢出離群值個數的上限(與樣本量相比應較小),當檢出離群值個數超過了這個上限時,對此樣本應作慎重的研究和處理。
4、單個離群值情形
a)依實際情況或以往經驗選定,選定適宜的離群值檢驗規則(格拉布斯檢驗、狄克遜檢驗等);
b)確定適當的顯著性水平;
c)根據顯著性水平及樣本量,確定檢驗的臨界值;d)由觀測值計算相應統計量的值,根據所得值與臨界值的比較結果作出判斷。
5、判定多個離群值的檢驗規則
在允許檢出離群值的個數大於1的情況下,重複使用檢驗規則進行檢驗。若沒有檢出離群值,則整個檢驗停止;若ruo檢jian出chu離li群qun值zhi,當dang檢jian出chu的de離li群qun值zhi總zong數shu超chao過guo上shang限xian時shi,檢jian驗yan停ting止zhi,對dui此ci樣yang本ben應ying慎shen重zhong處chu理li,否fou則ze,采cai用yong相xiang同tong的de檢jian出chu水shui平ping和he相xiang同tong的de規gui則ze,對dui除chu去qu已yi檢jian出chu的de離li群qun值zhi後hou餘yu下xia的de觀guan測ce值zhi繼ji續xu檢jian驗yan。
1、處理方式
處理離群值的方式有:
a)保留離群值並用於後續數據處理;
b)在找到實際原因時修正離群值,否則予以保留;
c)剔除離群值,不追加觀測值;
d)剔除離群值,並追加新的觀測值或用適宜的插補值代替。
格魯布斯檢驗方法:
在(zai)定(ding)量(liang)分(fen)析(xi)實(shi)驗(yan)中(zhong),實(shi)驗(yan)結(jie)束(shu)後(hou),必(bi)須(xu)對(dui)分(fen)析(xi)數(shu)據(ju)進(jin)行(xing)處(chu)理(li),在(zai)一(yi)組(zu)分(fen)析(xi)數(shu)據(ju)中(zhong),往(wang)往(wang)有(you)個(ge)別(bie)數(shu)據(ju)與(yu)其(qi)它(ta)數(shu)據(ju)相(xiang)差(cha)較(jiao)大(da),這(zhe)種(zhong)個(ge)別(bie)數(shu)據(ju)稱(cheng)為(wei)可(ke)疑(yi)值(zhi)。
對可疑值的處理,應首先回顧和檢查生產可疑值的實驗過程,有無可覺察到的技術上的異常原因。
當原因不明時,必須按一定的數理統計方法進行處理,決定是保留還是舍棄。
格魯布斯檢驗法效果比較好的方法。格魯布斯檢驗法的優點是在判斷可疑值取舍的過程中,將正態分布中的兩個最重要的參數—平均值和標準偏差引進來,故方法的準確性較高。方法計算的過程是這樣的:
1.實驗得出一組數據X1;X2;X3;X4……Xn,懷疑其中某個數據可疑(X可疑)
2.計算X1;X2;X3;X4……Xn 的平均數(X平均)標準偏差(S)
3.計算格魯布斯G計算=(X平均-X可疑)/S,取絕對值
4.查表求格魯布斯G查表
5.若G計算≥G查表,則可疑數據舍去,反之保留
2、處理規則
對(dui)檢(jian)出(chu)的(de)離(li)群(qun)值(zhi),應(ying)盡(jin)可(ke)能(neng)尋(xun)找(zhao)其(qi)技(ji)術(shu)上(shang)和(he)物(wu)理(li)上(shang)的(de)原(yuan)因(yin),作(zuo)為(wei)處(chu)理(li)離(li)群(qun)值(zhi)的(de)依(yi)據(ju)。應(ying)根(gen)據(ju)實(shi)際(ji)問(wen)題(ti)的(de)性(xing)質(zhi),權(quan)衡(heng)尋(xun)找(zhao)和(he)判(pan)定(ding)產(chan)生(sheng)離(li)群(qun)值(zhi)的(de)原(yuan)因(yin)所(suo)需(xu)代(dai)價(jia)、正確判定離群值的得益及錯誤剔除正常觀測值的風險,以確定實施下述三個規則之一:
a)若在技術上或物理上找到了產生離群值的原因,則應剔除或修正;若未找到產生它的物理上和技術上的原因,則不得剔除或進行修正。
b)若在技術上或物理上找到產生離群值的原因,則應剔除或修正;否則,保留歧離值,剔除或修正統計離群值;在重複使用同一檢驗規則檢驗多個離群值的情形,每次檢出離群值後,都要再檢驗它是否為統計離群值。
若某次檢出的離群值為統計離群值,則此離群值及在它前麵檢出的離群值(含歧離值)都應被剔除或修正。
c)檢出的離群值(含歧離值)都應被剔除或進行修正。
3、備案
被剔除或修正的觀測值及其理由應予記錄,以備查詢。
手機版








