概率論第八章假設檢驗.ppt
《概率論第八章假設檢驗.ppt》由會員分享,可在線閱讀,更多相關《概率論第八章假設檢驗.ppt(114頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第八章假設檢驗,8.1假設檢驗的基本思想8.2正態(tài)總體未知參數(shù)的假設檢驗8.3單側假設檢驗,上一章介紹了對總體中未知參數(shù)的估計方法。本章將討論統(tǒng)計推斷的另一個重要方面——統(tǒng)計假設檢驗。出于某種需要,對未知的或不完全明確的總體給出某些假設,用以說明總體可能具備的某種性質,這種假設稱為統(tǒng)計假設。如正態(tài)分布的假設,總體均值的假設等。這個假設是否成立,還需要考察,這一過程稱為假設檢驗,并最終作出判斷,是接受假設還是拒絕假設。本章主要介紹假設檢驗的基本思想和常用的檢驗方法,重點解決正態(tài)總體參數(shù)的假設檢驗。,1假設檢驗的基本思想,一、假設檢驗問題的提出,二、假設檢驗的基本思想,三、假設檢驗中兩類錯誤,統(tǒng)計推斷的另一個重要問題是假設檢驗問題。在總體的分布函數(shù)未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質,提出某些關于總體的假設。例如,提出總體服從泊松分布的假設,又如,對于正態(tài)總體提出數(shù)學期望?0的假設等。,這里,先結合例子來說明假設檢驗的基本思想和做法。,假設檢驗就是根據(jù)樣本對所提出的假設作出判斷:是接受,還是拒絕。,例1已知某煉鐵廠的鐵水含碳量X在某種工藝條件下服從正態(tài)分布N(4.55,0.1082)?,F(xiàn)改變了工藝條件,測了五爐鐵水,其含碳量分別為:4.28,4.40,4.42,4.35,4.37根據(jù)以往的經(jīng)驗,總體的方差?2=0.1082一般不會改變。試問工藝條件改變后,鐵水含碳量的均值有無改變?,,顯然,這里需要解決的問題是,如何根據(jù)樣本判斷現(xiàn)在冶煉的鐵水的含碳量是服從?≠4.55的正態(tài)分布呢?還是與過去一樣仍然服從?=4.55的正態(tài)分布呢?若是前者,可以認為新工藝對鐵水的含碳量有顯著的影響;若是后者,則認為新工藝對鐵水的含碳量沒有顯著影響。通常,選擇其中之一作為假設后,再利用樣本檢驗假設的真?zhèn)巍?,,例2某自動車床生產(chǎn)了一批鐵釘,現(xiàn)從該批鐵釘中隨機抽取了11根,測得長度(單位:mm)數(shù)據(jù)為:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。試問鐵釘?shù)拈L度X是否服從正態(tài)分布?,而在本例中,我們關心的問題是總體X是否服從正態(tài)分布。如同例1那樣,選擇“是”或“否”作為假設,然后利用樣本對假設的真?zhèn)巫鞒雠袛唷?以上兩例都是實際問題中常見的假設檢驗問題。我們把問題中涉及到的假設稱為原假設或稱待檢假設,一般用H0表示。而把與原假設對立的斷言稱為備擇假設,記為H1。如例1,若原假設為H0:?=?0=4.55,則備擇假設為H1:?≠4.55。若例2的原假設為H0:X服從正態(tài)分布,則備擇假設為H1:X不服從正態(tài)分布。,當然,在兩個假設中用哪一個作為原假設,哪一個作為備擇假設,視具體問題的題設和要求而定。在許多問題中,當總體分布的類型已知時,只對其中一個或幾個未知參數(shù)作出假設,這類問題通常稱之為參數(shù)假設檢驗,如例1。而在有些問題中,當總體的分布完全不知或不確切知道,就需要對總體分布作出某種假設,這種問題稱為分布假設檢驗,如例2。,接下來我們要做的事是:給出一個合理的法則,根據(jù)這一法則,利用巳知樣本做出判斷是接受假設H0,還是拒絕假設H0。,二、假設檢驗的基本思想,假設檢驗的一般提法是:在給定備擇假設H1下,利用樣本對原假設H0作出判斷,若拒絕原假設H0,那就意味著接受備擇假設H1,否則,就接受原假設H0。換句話說,假設檢驗就是要在原假設H0和備擇假設H1中作出拒絕哪一個和接受哪一個的判斷。究竟如何作出判斷呢?對一個統(tǒng)計假設進行檢驗的依據(jù)是所謂小概率原理,即,概率很小的事件在一次試驗中是幾乎不可能發(fā)生!,例如,在100件產(chǎn)品中,有一件次品,隨機地從中取出一個產(chǎn)品是次品的事件就是小概率事件。因為此事件發(fā)生的概率?=0.01很小,因此,從中任意抽一件產(chǎn)品恰好是次品的事件可認為幾乎不可能發(fā)生的,如果確實出現(xiàn)了次品,我們就有理由懷疑這“100件產(chǎn)品中只有一件次品”的真實性。那么?取值多少才算是小概率呢?這就要視實際問題的需要而定,一般?取0.1,0.05,0.01等。,以例1為例:首先建立假設:,H0:?=?0=4.55,H1:?≠4.55。,其次,從總體中作一隨機抽樣得到一樣本觀察值(x1,x2,…,xn)。,注意到是的無偏估計量。因此,若H0正確,則,與?0的偏差一般不應太大,即,不應太大,若過分大,我們有理由懷疑H0的正確性而拒絕H0。由于,因此,考察,的大小等價于考察,的大小,哪么如何判斷,是否偏大呢?,具體設想是,對給定的小正數(shù)?,由于事件,是概率為?的小概率事件,即,因此,當用樣本值代入統(tǒng)計量,具體計算得到其觀察值,統(tǒng)計量稱為檢驗統(tǒng)計量。,當檢驗統(tǒng)計量取某個區(qū)域C中的值時,就拒絕H0,則稱C為H0的拒絕域,拒絕域的邊界點稱為臨界值。如例1中拒絕域為,臨界值為和,若,即說明在一次抽樣中,小概率事件居然發(fā)生了。,因此依據(jù)小概率原理,有理由拒絕H0,接受H1;,,則沒有理由拒絕H0,只能接受H0。,若,將上述檢驗思想歸納起來,可得參數(shù)的假設檢驗的一般步驟:,(1)根據(jù)所討論的實際問題建立原假設H0及備擇假設H1;,(2)選擇合適的檢驗統(tǒng)計量Z,并明確其分布;,(3)對預先給定的小概率?>0,由P{|Z|≥z?/2}=?確定臨界值z?/2;,(4)由樣本值具體計算統(tǒng)計量Z的觀察值z,并作出判斷,若|z|≥z?/2,則拒絕H0,接受H1;若|z|<z?/2,則接受H0。,現(xiàn)在,我們來解決例1提出的問題:,(1)假設H0:?=?0=4.55,H1:?≠4.55;,(2)選擇檢驗用統(tǒng)計量,(3)對于給定小正數(shù),如?=0.05,查標準正態(tài)分表得到臨界值z?/2=z0.025=1.96;,因為|z|=3.9>1.96,所以拒絕H0,接受H1,即認為新工藝改變了鐵水的平均含碳量。,(4)具體計算:這里n=5,,,故Z的觀察值,三、假設檢驗中兩類錯誤,第Ⅰ類錯誤,當原假設H0為真時,卻作出拒絕H0的判斷,通常稱之為棄真錯誤,由于樣本的隨機性,犯這類錯誤的可能性是不可避免的。若將犯這一類錯誤的概率記為?,則有P{拒絕H0|H0為真}=?。,第Ⅱ類錯誤,當原假設H0不成立時,卻作出接受H0的決定,這類錯誤稱之為取偽錯誤,這類錯誤同樣是不可避免的。若將犯這類錯誤的概率記為?,則有P{接受H0|H0為假}=?。,自然,我們希望一個假設檢驗所作的判斷犯這兩類錯誤的概率都很小。事實上,在樣本容量n固定的情況下,這一點是辦不到的。因為當?減小時,?就增大;反之,當?減小時,就?增大。,那么,如何處理這一問題呢?事實上,在處理實際問題中,一般地,對原假設H0,我們都是經(jīng)過充分考慮的情況下建立的,或者認為犯棄真錯誤會造成嚴重的后果。,例如,原假設是前人工作的結晶,具有穩(wěn)定性,從經(jīng)驗看,沒有條件發(fā)生變化,是不會輕易被否定的,如果因犯第Ⅰ類錯誤而被否定,往往會造成很大的損失。因此,在H0與H1之間,我們主觀上往往傾向于保護H0,即H0確實成立時,作出拒絕H0的概率應是一個很小的正數(shù),也就是將犯棄真錯誤的概率限制在事先給定的范圍內(nèi),這類假設檢驗通常稱為顯著性假設檢驗,小正數(shù)?稱為檢驗水平或稱顯著性水平。,8.2正態(tài)總體下未知參數(shù)的假設檢驗,一、單個正態(tài)總體情形,1.均值?的檢驗,原假設H0:?=?0,備擇假設H1:?≠?0。,(a)?2已知,由上節(jié)的討論可知,在H0成立的條件下,選用檢驗統(tǒng)計量,對給定的檢驗水平?,查正態(tài)分布表得臨界值z?/2,再由樣本值具體計算統(tǒng)計量Z的觀察值z并與z?/2比較,若|z|≥z?/2,則拒絕H0,接受H1;若|z|<z?/2,則接受H0。這種檢驗法常稱為Z檢驗法。,一、單個正態(tài)總體情形,例1設某車床生產(chǎn)的鈕扣的直徑X服從正態(tài)分布,根據(jù)以往的經(jīng)驗,當車床工作正常時,生產(chǎn)的鈕扣的平均直徑?0=26mm,方差?2=2.62。某天開機一段時間后,為檢驗車床工作是否正常,隨機地從剛生產(chǎn)的鈕扣中抽檢了100粒,測得均值為26.56。假定方差沒有什么變化。試分別在?1=0.05,?2=0.01下,檢驗該車床工作是否正常?,由?1=0.05及?2=0.01,查正態(tài)分布表,得臨界值z?1/2=z0.025=1.96,z?2/2=z0.005=2.58。而,解:原假設H0:?=?0,備擇假設H1:?≠?0。,因此,|z|=2.15>1.96,但|z|=2.15<2.58,故在檢驗水平?1=0.05下,應當拒絕H0,接受H1,即認為該天車床工作不正常;而在檢驗水平?2=0.01下,應當接受H0,即認為該天車床工作是正常的。,上例說明:1)對于同一個問題,同一個樣本,由于檢驗水平不一樣,可能得出完全相反的結論。因此,在實際應用中,如何合理地選擇檢驗水平是非常重要的。,(b)?2未知,由于?2未知,因此,不能用Z作為檢驗統(tǒng)計量,但注意到樣本方差,是?2的無偏估計量,因此,我們自然會想到用s2代替?2,而在第六章的定理3也已經(jīng)證明,在H0成立的條件下,統(tǒng)計量,于是,對給定的顯著性水平?>0,查t分布表可得臨界值t?/2,使P{|t|≥t?/2}=?成立。再由樣本值具體計算統(tǒng)計量T的觀察值t,并與t?/2比較,若|t|≥t?/2,則拒絕H0,接受H1;若|t|<t?/2,則接受H0。這種檢驗法也稱為t檢驗法。,例2某廠利用某種鋼生產(chǎn)鋼筋,根據(jù)長期資料的分析,知道這種鋼筋強度X服從正態(tài)分布,今隨機抽取六根鋼筋進行強度試驗,測得強度X(單位:kg/mm2)為48.5,49.0,53.5,56.0,52.5,49.5。試問:能否據(jù)此認為這種鋼筋的平均強度為52.0kg/mm2(?=0.05)?,解設X~N(?,?2),,依題意建立假設H0:?=?0,H1:?≠?0。,這里?2未知,故在H0成立的條件下應選取檢驗統(tǒng)計量,由已知?=0.05,查t分布表得臨界值t?/2=t0.025(6-1)=2.571。,又由樣本值算得,因為,|t|≈0.41<2.571,故接受H0,即可以認為這種鋼筋的平均強度為52.0kg/mm2。,2.方差的檢驗,設總體X~N(?,?2),均未知,(X1,X2,…,Xn)來自總體X的樣本,要求進行的檢驗(設顯著性水平為?>0)為,原假設H0:=,備擇假設H1:≠。,是的無偏估計量,因此由第六章的定理3知當H0為真時,統(tǒng)計量,因此對給定檢驗水平?>0,由?2分布表求得臨界值(n–1)及(n–1)使,再由樣本值(x1,x2,…,xn)具體計算統(tǒng)計量?2的觀察值,判斷:,這種檢驗法稱為?2檢驗法。,例4某種電子元件的壽命(單位:h)X~N(?,?2),其中?,?2未知?,F(xiàn)檢測了16只電子元件,其壽命如下:159,280,101,212,224,279,179,264,222,362,168,250,149,260,485,170。試問元件壽命的方差?2是否等于1002(?=0.05)?,解依題意,假設H0:?2=1002,H1:?2≠1002,選取檢驗統(tǒng)計量,因此對給定檢驗水平?=0.05,由?2分布表求得臨界值,又據(jù)樣本值算得:,因為6.262<12.81<27.488,所以,應接受H0,即可以認為電子元件壽命的方差?2與1002無顯著差異。,例5某廠生產(chǎn)的某種型號的電池,其壽命長期以來服從方差?2=5000(小時2)的正態(tài)分布,現(xiàn)有一批這種電池,從它的生產(chǎn)情況來看,壽命的波動性有所改變,現(xiàn)隨機抽取26只電池,測出其壽命的樣本方差s2=9200(小時2)。問根據(jù)這一數(shù)據(jù)能否推斷這批電池的壽命波動性較以往有顯著改變(取?=0.02)?,所以拒絕H0,由此可以推斷這批電池的壽命波動性較以往有顯著改變。,在實際應用中,常常遇到兩正態(tài)總體參數(shù)的比較問題,如兩個車間生產(chǎn)的燈泡壽命是否相同;兩批電子元件的電阻是否有差別;兩臺機床加工零件的精度是否有差異等等。一般都可歸納為兩正態(tài)總體參數(shù)的假設檢驗。,因此,對給定顯著性水平?>0,可查t分布表求得臨界值t?/2(n1+n2–2)。再由樣本值具體計算統(tǒng)計量T的觀察值t,并與t?/2(n1+n2–2)比較,若|t|≥t?/2(n1+n2–2),則拒絕H0,接受H1;若|t|- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 概率論 第八 假設檢驗
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.3dchina-expo.com/p-3248860.html