金融統(tǒng)計03-假設檢驗與方差分析.ppt
《金融統(tǒng)計03-假設檢驗與方差分析.ppt》由會員分享,可在線閱讀,更多相關《金融統(tǒng)計03-假設檢驗與方差分析.ppt(36頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第3章假設檢驗與方差分析,第1節(jié)假設檢驗第2節(jié)方差分析第3節(jié)方差分析應用:恩格爾系數(shù)的城鄉(xiāng)比較,第1節(jié)假設檢驗,主要內(nèi)容假設檢驗的概念假設檢驗的標準假設檢驗的步驟,假設檢驗的概念及形式,假設檢驗對總體的某個參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷假設是否成立假設檢驗的形式假設分為原假設(H0)和備擇假設(H1)兩種原假設(Nullhypothesis):初始假定為真的假設備擇假設(Alternativehypothesis):與原假設的內(nèi)容相反,當原假設被拒絕時,被認為是真的假設應用中,原假設一般是舊的、他人的觀點或理論,備擇假設一般是新的、自己的觀點或理論,而統(tǒng)計分析的目的往往就是以新的數(shù)據(jù)來拒絕原假設,支持自己的觀點所以,習慣上,能拒絕原假設的檢驗,稱為顯著的、有統(tǒng)計意義的(Significant),否則為不顯著,原假設(H0)和備擇假設(H1)例,某汽車使用改進型發(fā)動機后聲稱油耗不超過百公里6升,對此進行檢驗檢驗假設的設定:設u為百公里平均油耗,則單邊檢驗(只檢驗小于或大于檢驗值中的一種情況)工廠對收到的一批長度為2cm的零件抽檢,檢驗長度是否合格?檢驗假設的設定:設u為平均長度,則雙邊檢驗(同時檢驗小于、大于檢驗值的兩種情況,常用),假設檢驗的標準:顯著水平,顯著水平的定義假設檢驗中的第一類錯誤(typeIerror):拒絕正確的原假設(H0)顯著水平指犯第一類錯誤的最大概率,通常設定為5%或1%顯著水平的理解形象的說,顯著水平為1%是指,拒絕100次原假設,只有1次是拒絕錯了(即只有1次原假設確實正確)因為原假設往往是公認的觀點、成熟的理論,甚至已經(jīng)反復檢驗證明是正確的,所以為了加強拒絕的說服力,應設定一個嚴格的拒絕標準,即要將顯著水平設的很小顯著水平越小,原假設值的允許變動范圍就越大,備擇假設成立的范圍就越小,備擇假設成立的概率就越小。如果能成立,則結論就很有說服力,不同顯著水平的比較(單邊檢驗),假設國家標準規(guī)定冰箱使用年限必須10年或以上對某品牌抽樣檢驗時,如果顯著水平設為40%,則樣本均值9年或以下即可認定為不合格。顯著水平設為5%,則樣本均值4年或以下才可認定為不合格,相當于把原假設放寬到H0>4,更有說服力,,原假設H0=10即假設某品牌合格,4,,,,,,,,,,,某品牌冰箱總體的特征,顯著水平5%,,,,概率,,顯著水平40%,,9,10,冰箱使用年限,圖中4為5%的臨界值9為40%的臨界值,顯著水平的運用:t統(tǒng)計量,t統(tǒng)計量的定義假定總體服從正態(tài)分布,則抽取的樣本的平均值可用下列公式換算成t分布的值(簡稱t值),該值可用來判斷樣本平均值相對于總體平均值的誤差程度t統(tǒng)計量公式的理解公式中總體均值μ0在假設檢驗時,等于原假設H0的值上述t值公式就是將樣本均值換算成一個標準化的t值,這與將正態(tài)變量換算成標準正態(tài)變量一樣,所以t分布的中心為0顯然,t值的絕對值越大,樣本均值離原假設H0的值越遠,樣本越不支持原假設,顯著水平的運用:t檢驗,顯著水平在t檢驗中的運用過程如下:假定原假設成立,比如將樣本統(tǒng)計量的值按前述公式換算成t值,其中μ0等于原假設的,比如10從t分布表查出某一顯著水平(比如5%)的臨界值t0.05比較換算的t值與臨界值t0.05。如果|t值|>t0.05,則拒絕原假設,反之,接受原假設,t檢驗示意圖(雙邊檢驗,顯著水平設為5%),將樣本均值換算成標準化的t值,如果|t值|>臨界值,表明樣本均值離原假設的總體均值很遠,樣本來自于這個總體的可能性很小,于是原假設(H0)成立的概率也很小,所以拒絕H0,,0,t臨界值(約為-2),2.5%,t值,拒絕域,,,,,,,,,,,,單邊檢驗示意圖,,顯著水平,,,,,概率,,拒絕域,,,t臨界值(約為2),,2.5%,,95%,假設檢驗的實用標準:P值,根據(jù)樣本值計算的顯著水平又稱為P值比如:5%顯著水平下的臨界值為4,而實際的樣本均值為3,小于臨界值,則P值也小于5%(比如4%等)統(tǒng)計軟件作檢驗時,通常會根據(jù)樣本值計算相應的P值,所以一般直接使用P值作為假設檢驗的標準,非常方便判斷原理如下如果P值≤1%,則檢驗值在1%水平顯著,拒絕H0如果1%5%,則檢驗值不顯著,接受H0,P值與t統(tǒng)計量,主要區(qū)別P值不依賴于樣本變量的分布形式,適用于任何假設檢驗,而t統(tǒng)計量依賴于樣本變量的分布,適用范圍有限P值可直接與顯著水平比較,判斷簡單,而t統(tǒng)計量需查表、換算,判斷復雜在應用統(tǒng)計的假設檢驗中,更多使用P值作為檢驗標準主要聯(lián)系一般情況下,P值和t值有如下對應關系:P值≤5%時,|t值|≥2所以實用中(比如回歸分析中),要獲得有統(tǒng)計意義的結論(即在5%顯著水平拒絕原假設(H0)),可作下列任一種判斷:看P值時,應≤5%看|t值|時,應≥2,假設檢驗的步驟,(1)選擇要檢驗的統(tǒng)計量(比如樣本均值)(2)確定原假設(H0)和備擇假設(H1)(3)確定檢驗的顯著水平(一般為5%)(4)查表確定與顯著水平相對應的t分布的臨界值(5)將要檢驗的統(tǒng)計量換算成標準化的t值(6)根據(jù)要檢驗的統(tǒng)計量的|t值|大于還是小于臨界值,決定是否拒絕原假設(H0)如果使用統(tǒng)計軟件,則只要(1)、(2)、(3)步,然后看輸出的P值是否小于顯著水平?jīng)Q定是否拒絕原假設,假設檢驗例,將旅客對機場的評價分為10級,7級以上為高服務質(zhì)量。隨機抽取12名旅客對某機場的評級,分別為7、8、10、8、6、9、6、7、7、8、9、8。檢驗該機場是否為高服務質(zhì)量?,假設檢驗例(續(xù)),(1)確定檢驗樣本均值(2)確定原假設和備擇假設(3)確定顯著水平為5%(4)查表得t分布的臨界值(5)將樣本均值換算成標準化的t值(6)要檢驗的統(tǒng)計量的|t值|>臨界值,所以拒絕原假設(H0):結論是:7.75確實大于7,該機場是高服務質(zhì)量,第2節(jié)方差分析,主要點內(nèi)容方差分析的概念組間平方和與組內(nèi)平方和的概念如何判斷方差分析的結果,什么是方差分析?,方差分析(ANOVA)的定義在相同方差假定下,檢驗多組正態(tài)樣本的均值是否相等的一種統(tǒng)計分析方法方差分析的基本概念因子:實驗中會改變狀態(tài)的因素因子的水平:因子的狀態(tài)方差分析的應用例兩種抗生素對某種疾病的療效是否相同?某軟件的升級版是否比原版運行速度更快?三個工廠生產(chǎn)的零件是否強度相同?(單因子:工廠;三個工廠?該因子有三個水平),單因素方差分析的統(tǒng)計模型,模型的假定:因子A有r個水平,在第i水平下對要檢驗的指標作m次相互獨立的觀察,獲得關于總體i的一個樣本假定總體i服從均值為,方差為的正態(tài)分布模型要檢驗的問題:模型檢驗的結論:檢驗結果為F分布的值及其P值。一般將顯著水平設為0.05,則當P≤0.05時,拒絕H0,即r個水平不全相同;當P>0.05時,接受H0,即r個水平全部相同。,單因素方差分析原理(1),假定:因子A有r個水平,在第i水平下對要檢驗的指標作m次相互獨立的觀察,獲得關于總體i的一個樣本。則共有個觀察值總離差平方和為,總離差的兩個來源:組間平方和與組內(nèi)平方和組間平方和,即每個水平的均值與總均值的離差的平方和組內(nèi)平方和,即每個水平內(nèi),各觀察值之間的離差的平方和,視為隨機取樣的誤差總方差和兩個來源的關系,單因素方差分析原理(2),如何判斷各個水平下的均值是否相等?對組間平方和SA與組內(nèi)平方和Se分別作自由度調(diào)整將調(diào)整后的組間平方和SA與組內(nèi)平方和Se相除,該比值服從F分布F值>1,表示組間的差距>組內(nèi)的隨機差距,各組數(shù)據(jù)可能有質(zhì)的區(qū)別,均值相等的可能性較小根據(jù)F分布值的P值大小即可判斷均值是否相等:P值≤0.05,檢驗結果顯著,拒絕H0,即不全相等;P值>0.05為接受H0全相等,單因素方差分析原理(3),使用EViews軟件作單因素方差分析例(1),某銀行規(guī)定VIP客戶的月均賬戶余額要達到100萬元,并以此作為比較各分行業(yè)績的一項指標。現(xiàn)從三個分行(A1、A2、A3)中,分別隨機抽取4個VIP客戶賬戶,用單因素方差分析判斷三個分行此項業(yè)績指標是否相同。,例續(xù)1:EViews數(shù)據(jù)表,定義三個分行變量,分別輸入4個賬戶余額,得數(shù)據(jù)表,例續(xù)2:三個分行賬戶余額的均值,求隨機變量的均值等基本統(tǒng)計量:菜單View?DescriptiveStats?CommonSample,例續(xù)3:作方差分析選菜單View?TestofEquality,,例續(xù)4:檢驗結論,顯然方差分析的F分布值的P值=0.0001<0.05,拒絕H0,即三個分行VIP賬戶余額不全相同。,使用EViews軟件作單因素方差分析的詳細結果,Sourceofvariation:離差來源Between:組間平方和Within:組內(nèi)平方和Total:總平方和,,df:自由度,,方差分析例:工資(1),從美國勞工部的統(tǒng)計中,選出兩個職業(yè)男、女周工資數(shù)據(jù),分別分析兩個職業(yè)的男女工資差異,方差分析例:工資(2),各變量的基本統(tǒng)計量表兩種職業(yè)的男平均工資均大于女平均工資財務管理男平均工資高出較大,方差分析例:工資(3),財務管理職業(yè)男女工資差別方差分析的檢驗假設H0:財務管理職業(yè)男女平均工資相等H1:財務管理職業(yè)男女平均工資不相等方差分析的檢驗結果F值22.84,p值0.001F值22.84,男女組間差距是各自組內(nèi)差距的20倍以上。p值0.001,遠遠小于5%的顯著水平(即非常顯著),故拒絕H0,男女平均工資不相等,或者說男女平均工資差異大于抽樣誤差,方差分析例:工資(4),計算機程序員職業(yè)男女工資差別方差分析的檢驗假設H0:計算機程序員職業(yè)男女平均工資相等H1:計算機程序員職業(yè)男女平均工資不相等方差分析的檢驗結果F值0.99,p值0.35F值0.99,男女組間差距比各自組內(nèi)差距還小。p值0.35,遠遠大于5%的顯著水平(非常不顯著),不能拒絕H0,所以男女平均工資相等,差距來自抽樣誤差,第3節(jié)方差分析應用:恩格爾系數(shù)的城鄉(xiāng)比較,主要內(nèi)容恩格爾系數(shù)的概念對我國近年城鄉(xiāng)恩格爾系數(shù)的方差分析,有關居民消費結構的恩格爾系數(shù),恩格爾系數(shù)(EngelsCoefficient)反映如下規(guī)律收入越少,食品支出占總消費支出的比率越高,恩格爾系數(shù)越大隨著國民經(jīng)濟的增長,恩格爾系數(shù)呈下降趨勢國際標準根據(jù)聯(lián)合國糧農(nóng)組織提出的標準,恩格爾系數(shù)在59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為富裕,低于30%為最富裕。,我國近年恩格爾系數(shù)(表),聯(lián)合國糧農(nóng)組織的標準,我國城鎮(zhèn)居民的系數(shù)在30-40%之間,為富裕水平;農(nóng)村居民的系數(shù)在40-50%,為小康水平近年農(nóng)村居民的恩格爾系數(shù)下降較為明顯,我國近年恩格爾系數(shù)(圖),總體趨勢是下降,但有波動。主要原因是農(nóng)產(chǎn)品價格波動農(nóng)村居民恩格爾系數(shù)“悖論”:農(nóng)產(chǎn)品價格上升?收入增加?食品消費支出增加?恩格爾系數(shù)不變,城鄉(xiāng)恩格爾系數(shù)的方差分析(均值),,分析假設:H0:城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的均值相等H1:城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的均值不相等分析結論:F分布的值在0.05水平顯著(P值0.05)?接受H0的假設?城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的方差相等,恩格爾系數(shù)的標準差:城鎮(zhèn)為6.77;農(nóng)村為6.05,所以表面看農(nóng)村系數(shù)下降較快,實質(zhì)上,城鄉(xiāng)系數(shù)變化幅度是相當?shù)?- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 金融 統(tǒng)計 03 假設檢驗 方差分析
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.3dchina-expo.com/p-3278842.html