研《非參數(shù)假設(shè)檢驗》.ppt
《研《非參數(shù)假設(shè)檢驗》.ppt》由會員分享,可在線閱讀,更多相關(guān)《研《非參數(shù)假設(shè)檢驗》.ppt(82頁珍藏版)》請在裝配圖網(wǎng)上搜索。
常用的統(tǒng)計分析,Means過程,單一樣本均值的T檢驗,兩獨立樣本均值差的T檢驗,兩配對樣本均值的T檢驗,SPSS的非參數(shù)檢驗與參數(shù)檢驗,SPSS的相關(guān)分析與回歸分析,SPSS的主成分分析與因子分析,,,,,,,,SPSS的方差分析,,SPSS的聚類分析與判別分析,,特點:對樣本進行分組計算均值和標(biāo)準(zhǔn)差。如:,Means過程,比較不同性別同學(xué)數(shù)學(xué)成績的平均值和方差。,數(shù)學(xué)成績表,SPSS的實現(xiàn)過程:Analyze菜單CompareMeans項中選擇Means命令。,,非參數(shù)假設(shè)檢驗,追求,一個總體分布的非參數(shù)假設(shè)檢驗,(2)兩個總體的分布未知,它們是否相同;,非參數(shù)假設(shè)檢驗需要處理的問題:,(1)猜出總體的分布(假設(shè)),用另一組樣本檢驗。,兩個總體分布的非參數(shù)假設(shè)檢驗,內(nèi)容,,多個總體分布的非參數(shù)假設(shè)檢驗,配對樣本非參數(shù)檢驗,SPSS的非參數(shù)檢驗,,,一個總體:單樣本總體分布的檢驗,兩個總體,多個總體,,,獨立樣本非參數(shù)檢驗,配對樣本非參數(shù)檢驗,獨立樣本非參數(shù)檢驗,一個總體分布的檢驗,,檢驗總體的卡方分布,檢驗總體的二項分布,,,單樣本變量值的隨機性檢驗(游程檢驗),單樣本的Kolmogorov—Smirnov檢驗,,,檢驗總體的正態(tài)分布,,P-P正態(tài)概率分布圖(GraphsP-P),,Q-Q正態(tài)概率單位分布圖(GraphsQ-Q),,,,檢驗總體的正態(tài)分布的圖示法,是根據(jù)變量的累計比例對所指定的理論分布累計比例繪制的圖形。,是根據(jù)變量分布的分位數(shù)對所指定的理論分布分位數(shù)繪制的圖形。,半正態(tài)分布(Half-normal),伽瑪分布(Gamma),指數(shù)分布(Exponential),TestDistribution提供13種概率分布:,,,,,,,,,,,,,,貝塔分布(Beta),卡方分布(Chi-square),拉普拉斯分布(Laplace),邏輯斯諦分布(Logistic),對數(shù)正態(tài)分布(Lognormal),正態(tài)分布(Normal),帕累托分布(Pareto),T分布(StudentT),威布爾分布(Weibull),均勻分布(Uniform),Blom’s方法:使用公式:,Tukey方法:使用公式:,Rankit方法:使用公式:,VanderWaerden方法:使用公式:,n:個案的數(shù)目r:從1到n的秩次,式中:,選擇比率估測的公式,每次只能選擇一項。,若與某個概率分布的統(tǒng)計圖一致,即被檢驗的數(shù)據(jù)符合所指定的分布,則代表個案的點簇在一條直線上。,總體分布的卡方檢驗的原理:如果從一個隨機變量X中隨機抽取若干個觀察樣本,這些觀察樣本落在X的K個互不相交的子集中的觀察頻數(shù)服從一個多項分布,該多項分布當(dāng)K趨于無窮時,就近似服從X的總體分布。,因此,假設(shè)樣本來自的總體服從某個期望分布或理論分布,同時獲得樣本數(shù)據(jù)各子集的實際觀察頻數(shù),則可依據(jù)下面統(tǒng)計量作出推斷:,例題,檢驗總體的卡方分布,例題:某地一周內(nèi)每日患憂郁癥的人數(shù)如表所示,請檢驗一周內(nèi)每日人們憂郁的數(shù)是否滿足1:1:2:2:1:1:1。,SPSS實現(xiàn)過程,1.定義變量;,2.變量加權(quán);,3.進入Analyze菜單,用于選擇計算非參數(shù)檢驗統(tǒng)計量對應(yīng)的P值的方法。SPSS提供了3種計算P值的方法:Asymptoticonly:漸進性的顯著性檢驗,適合于樣本服從漸進分布或較大樣本。MonteCarlo:不依賴漸進性方法估測精確顯著性,這種方法在數(shù)據(jù)不滿足漸進性分布,而且樣本數(shù)據(jù)過大以致不能計算精確顯著性時特別有效。Exact:精確計算法,即準(zhǔn)確計算觀測結(jié)果的統(tǒng)計概率。計算量較大,適用于小樣本。,練習(xí):賽馬比賽時,任一馬的起點位置是起跑線上所指定的標(biāo)桿位置。現(xiàn)有8匹馬的比賽,位置1是內(nèi)側(cè)最靠近欄桿的跑道,位置8是外側(cè)離欄桿最遠(yuǎn)的跑道,下表是某賽馬在一個月內(nèi)某特定圓形跑道上的紀(jì)錄,并且按照起點的標(biāo)桿位置分類。試檢驗起點標(biāo)桿位置對賽馬結(jié)果的影響。,馬在8個圓形跑道的起點標(biāo)桿位置上獲勝的紀(jì)錄,均勻分布檢驗,二項分布檢驗的基本思想:根據(jù)搜集到的樣本數(shù)據(jù),推斷總體分布是否服從某個指定的二項分布。,SPSS中的二項分布檢驗,在樣本小于等于30時,按照計算二項分布概率的公式進行計算;樣本數(shù)大于30時,計算的是Z統(tǒng)計量,認(rèn)為在零假設(shè)下,Z統(tǒng)計量服從正態(tài)分布。,其零假設(shè):樣本來自的總體與所指定的某個二項分布不存在顯著的差異。,K:觀察變量取值的樣本個數(shù),當(dāng)K小于n/2時,取加號;p為檢驗概率。,練習(xí),檢驗總體的二項分布,練習(xí):某地某一時期內(nèi)出生35名嬰兒,其中女孩兒19名(Sex=0),男孩兒16名(Sex=1)。問,該地區(qū)出生嬰兒的性別比例與通常的男女性別比例(總體概率約為0.5)是否不同?數(shù)據(jù)如下表所示:,續(xù),,35名嬰兒的性別,操作,單樣本變量值的隨機性檢驗(游程檢驗),依時間或其他順序排列的有序數(shù)列中,具有相同的事件或符號的連續(xù)部分稱為一個游程。調(diào)用Runs過程可進行游程檢驗,即用于檢驗序列中事件發(fā)生過程的隨機性分析。,單樣本變量值的隨機性檢驗是對某變量的取值出現(xiàn)是否隨機進行檢驗,也稱游程檢驗。,例題,例題:某村發(fā)生一種地方病,其住戶沿一條河排列,調(diào)查時對發(fā)病的住戶標(biāo)記為“1”,對非發(fā)病的住戶標(biāo)記為“0”,共20戶,其取值如下表所示:,續(xù),,35家住戶的發(fā)病情況,操作,單樣本的Kolmogorov—Smirnov檢驗,,單樣本K—S檢驗是一種擬合優(yōu)度的非參數(shù)檢驗,是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)性隨機變量的分布形態(tài)。進行Kolmogorov-SmirnovZ檢驗,是將一個變量的實際頻數(shù)分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)進行比較。,SPSS實現(xiàn)K—S檢驗的過程如下:,(1)根據(jù)樣本數(shù)據(jù)和用戶的指定構(gòu)造出理論分布,查分布表得到相應(yīng)的理論累計概率分布函數(shù)。,(2)利用樣本數(shù)據(jù)計算各樣本數(shù)據(jù)點的累積概率,得到檢驗累計概率分布函數(shù)。(3)計算和在相應(yīng)的變量值點X上的差,得到差值序列。單樣本K—S檢驗主要對差值序列進行研究。,例題,練習(xí),例題:某地144個周歲兒童身的高數(shù)據(jù)如下表,問該地區(qū)周歲兒童身高頻數(shù)是否成正態(tài)分布?,,SPSS操作,,練習(xí):某報刊亭為研究每天報刊的銷售量,為以后每天報刊進量提供依據(jù),統(tǒng)計其在140天的銷售中,某日報的日銷售量的頻數(shù)資料如下表,問該資料的頻數(shù)是否服從正態(tài)分布?,操作,兩個總體獨立樣本的非參數(shù)檢驗,檢驗兩個總體的分布是否相同:,方差相同,分布函數(shù)形式相同,兩個總體的分布若相同,參數(shù)相同,,,均值相同,(2)兩個總體的分布未知,它們是否相同;,Wald-wolfowitzRuns游程檢驗,檢驗分布是否相同的方法,Mann-WhitneyU秩和檢驗,Kolmogorov—Smirnov檢驗,MosesExtremeReactions極端反應(yīng)檢驗,,,,,SPSS實現(xiàn)過程,,零假設(shè):樣本來自的兩獨立總體分布無顯著差異,K-S檢驗實現(xiàn)的方法:將兩組樣本數(shù)據(jù)混合并升序排列,分別計算兩組樣本秩的累計頻率和每個點上的累積頻率,然后將兩個累計頻率相減,得到差值序列數(shù)據(jù)。,K-S檢驗將關(guān)注差值序列,并計算K-S的Z統(tǒng)計量,依據(jù)正態(tài)分布表給出相應(yīng)的相伴概率值。,(1)Kolmogorov—Smirnov檢驗,兩組樣本是可以各自獨立顛倒順序的,(2)Mann-WhitneyU秩和檢驗法,檢驗這兩組樣本是否來自同一個總體(或兩組樣本的總體分布是否相同)。,問題:,有兩個總體的樣本為:,與,可能,。,。,Mann-WhitneyU檢驗的統(tǒng)計量是:,式中,對給定,查值表,得,若,,則總體分布相同。,,,兩樣本W(wǎng)ald-wolfowitz游程檢驗中,計算游程的方法與觀察值的秩有關(guān)。首先,將兩組樣本混合并升序排列。在數(shù)據(jù)排序時,兩組樣本的每個觀察值對應(yīng)的樣本組標(biāo)志值序列也隨之重新排列,然后對標(biāo)志值序列求游程。,如果計算出的游程數(shù)相對比較小,則說明樣本來自的兩總體分布形態(tài)存在較大差距。,SPSS將自動計算游程數(shù)得到Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應(yīng)的相伴概率值。,(3)Wald-wolfowitz游程檢驗,如果跨度或截頭跨度很小,說明兩個樣本數(shù)據(jù)無法充分混合,認(rèn)為實驗樣本存在極端反應(yīng)。,,兩獨立樣本的極端反應(yīng)檢驗,將一個樣本作為控制樣本,另一個樣本作為實驗樣本。以控制樣本做對照,檢驗實驗樣本是否存在極端反應(yīng)。,首先,將兩組樣本混合并升序排列;然后計算控制樣本最低秩和最高秩之間的觀察值個數(shù),即:Span(跨度)。,為控制極端值對分析結(jié)果的影響,可先去掉樣本兩個最極端的觀察值后,再求跨度,這個跨度稱為截頭跨度。,零假設(shè):樣本來自的兩獨立總體分布沒有顯著差異。,(4)Moses極端反應(yīng)檢驗,兩組獨立樣本的總體分布是否相同的檢驗,點擊進入Analyze菜單的NonparametricTests子菜單,選擇2IndependentSample命令。,MosesExtremeReactions(極端檢驗):檢驗兩個獨立樣本觀察值的散布范圍是否有差異存在,以檢驗兩個樣本是否來自具有同一分布的總體。,Mann-WhitneyU:檢驗兩個獨立樣本所屬的總體均值是否相同。,Kolmogorov-SmirnovZ(K—S):推測兩個樣本是否來自具有相同分布的總體。,Wald-Wolfowitzruns(游程檢驗):考察兩個獨立樣本是否來自具有相同分布的總體。,,,,,練習(xí),,練習(xí):研究兩個不同廠家生產(chǎn)的燈泡使用壽命是否存在顯著性差異,隨機抽取兩個廠家生產(chǎn)的燈泡,試驗得到的使用壽命數(shù)據(jù)如下表:,,SPSS操作,兩個總體配對樣本的非參數(shù)檢驗,McNemar檢驗,Sign符號檢驗法(正負(fù)號檢驗法),Wilcoxon秩和檢驗,,,,,(1)Wilcoxon秩和檢驗法,設(shè)有兩個總體的樣本為:,把兩組樣本放在一起,按樣本觀察值,較多地集中在左段。,w太大,說明樣本較多地集中在右段。,。,兩組樣本是可以各自獨立顛倒順序的,。,可能,與,w太小,說明樣本,(秩)加總起來,記為w。如果兩個總體的分布相同,則樣本應(yīng)當(dāng)是均勻混合的,即w不能太小,也不能太大。,的序號,為秩。把樣本個數(shù)少的這組樣本,那么每個觀察值就有一個序號,稱,的大小重新排序,,不妨設(shè),續(xù),顯著性水平,,則接受,由于,∴w應(yīng)在某兩個數(shù)字之間:,,可以由威爾可可遜表,依據(jù),是由,所決定的。對于給定的,查出,。,若,,或,,則拒絕,反之,若,。,,McNemar變化顯著性檢驗,以研究對象自身為對照,檢驗其兩組樣本“前后”變化是否顯著。該檢驗要求待檢驗的兩組樣本的觀察值是二值數(shù)據(jù)。即該法適用于相關(guān)的二分變量數(shù)據(jù)。,零假設(shè):樣本來自的兩配對總體分布無顯著差異,McNemar變化顯著性檢驗基本方法:二項分布檢驗。,例題,,McNemar檢驗,例題:分析學(xué)生接受某種方法進行訓(xùn)練的效果,收集到10個學(xué)生在訓(xùn)練前、訓(xùn)練后的成績?nèi)缦卤硭?,問?xùn)練前后學(xué)生的成績是否存在顯著性差異?,SPSS實現(xiàn)過程,,,不能各自獨立地顛倒順序。,樣本,發(fā)生的概率為,(1)符號檢驗法(正負(fù)號檢驗法)的前提:,(2)復(fù)習(xí)二項分布:,或,在,次重復(fù)努力試驗中,,事件,,,在,次試驗中出現(xiàn)的次數(shù)為,,,則如果隨機變量,的分布如下:,則稱,服從參數(shù)為,的二項分布,,記為,且二項分布的均值為,,,方差為,。,若隨機變量X~分布,則統(tǒng)計量,且,,定理一:,~,定理二:,函數(shù)的均值,定理三:,當(dāng)充分大時,近似地服從均值、,的正態(tài)分布,即,標(biāo)準(zhǔn)差為,,,,,(3)符號檢驗法的思路:,若兩個總體的分布相同,即,,則,令:,則,設(shè),∴,式中,用容量相同的兩個配對樣本來檢驗,即,所以問題轉(zhuǎn)化為:,求從小到大的累積概率:,(4)正負(fù)號個數(shù)檢驗法的處理,①小樣本情況下:,對,對,求從大到小的累積概率:,即,若,則接受,是拒絕的最高界限。,是拒絕的最低界限。,小樣本情況下,,大樣本情況下,S統(tǒng)計量,(0—1分布參數(shù)的假設(shè)檢驗),(0—1)分布,,一個總體,兩個總體——大樣本,,小樣本,大樣本,假設(shè)檢驗,某類個體占總體數(shù)量的比例問題,如高收入的比重問題等,類似于拋硬幣。,一個0~1分布總體的小樣本比例值的參數(shù)檢驗,是總體中某類個體的比例。由0~1分布知:,令X是比例的隨機變量,則X~分布,,E(X)=,,續(xù),足夠大了,用正態(tài)分布來近似它。,若隨機變量X~分布,則統(tǒng)計量,且,,定理一:,~,定理二:,函數(shù)的均值,定理三:,當(dāng)充分大時,近似地服從均值、,的正態(tài)分布,即,標(biāo)準(zhǔn)差為,按照經(jīng)驗,只要,,同時,,,就可,以認(rèn)為,例題,例1某公司要招聘若干名工程師。出了10道選擇題,每題有4個備選答案,其中只有一個是正確的即正確的比率只有四分之一。問:應(yīng)當(dāng)答對幾道題,才能考慮錄取?(注意:這是一個總體),又∵統(tǒng)計量,。,的分布是二項分布,解:,于是應(yīng)有:,計算結(jié)果如下表。,00.05631.00000.056310.18770.94370.24420.28160.75600.525630.25030.44740.775940.14600.22410.921950.05840.07810.980360.01620.01970.996570.00310.00350.999680.00040.00041.000090.00000.00001.0000100.00000.00001.0000,累積概率表,正確的次數(shù)r,向下累計概率,,,,,,,向上累計概率,由于=5000.15=75>25,已經(jīng)足夠大,故由中心極限定理,近似地服從均值為、,例一個賣襯衣的郵購店從過去的經(jīng)驗中得知有15%的購買者說襯衣的大小不合身,要求退貨?,F(xiàn)這家郵購店改進了郵購定單的設(shè)計,結(jié)果在以后售出的500件襯衣中,有60件要求退貨。問:在5%的a水平上,改進后的退貨比例(母體比例)與原來的退貨比例有無顯著差異?,的正態(tài)分布。,于是,取顯著性水平,,方差為,解:,:,對于顯著性水平,假設(shè):,(即,式中用,(即,),),絕還是接受,。,所謂“大樣本”,就是要,檢驗統(tǒng)計量為:,代替,,,得出拒,是否大于,判斷,,,同時,②大樣本情況下,正負(fù)號個數(shù)檢驗法的處理,,用兩套問卷測量20個管理人員的素質(zhì),滿分都是200分。測量結(jié)果如下表所示,問:兩套問卷有無顯著差異(本質(zhì)是兩套問卷的結(jié)果的分布是否相同)?,請分別用小樣本和大樣本來檢驗兩套問卷有無顯著差異。,練習(xí),,與可從“符號檢,在顯著性水平之下,依據(jù),S=min(,),③處理正負(fù)號個數(shù)檢驗法的S統(tǒng)計量方法,,選統(tǒng)計量:,記,,,若,則拒絕假設(shè),認(rèn)為,則接受假設(shè),若,,認(rèn)為,。,這一檢驗法的重要的前提與前兩個方法相同,,驗表”中查出,:,與就越接近。S越小,,的差別就越大,與,即按照問題本來的屬性,天然地配對。,不能各自獨立地顛倒順序。,或,樣本,注意:,S越大,,例如,練習(xí)用兩種激勵方法,分別對同樣工種的兩個班組(每個班組7個人)進行激勵,測得激勵后業(yè)績增長(%),數(shù)據(jù)如下。問:兩種激勵方法的效果有無顯著差異(兩種激勵方法的總體分布是否相同)?,表兩種激勵方法分別實施于不同組工人的效果,激勵法A,激勵法B,,多獨立樣本的K—W檢驗,多獨立樣本的Median檢驗,多個總體獨立樣本的非參數(shù)檢驗,,,,多獨立樣本的K—T檢驗,,SPSS實現(xiàn)的過程中,將多組樣本數(shù)據(jù)混合并升序排列,求出混合樣本數(shù)據(jù)的中位數(shù),并假設(shè)是共同的中位數(shù)。,如果多組獨立樣本的中位數(shù)無顯著差異,則說明多組獨立樣本有共同的中位數(shù)。如果每組中大于該中位數(shù)的中位數(shù)大致等于每組中小于該中位數(shù)的樣本數(shù),則可以認(rèn)為該多個獨立總體的中位數(shù)沒有顯著差異。,多獨立樣本的中位數(shù)檢驗,,通過對多組數(shù)據(jù)的分析,推斷多個獨立總體分布是否存在顯著差異。,零假設(shè):樣本來自的多個獨立總體的中位數(shù)無顯著差異。,多獨立樣本的K—W檢驗,零假設(shè):樣本來自的多個獨立總體的分布無顯著差異。,SPSS的實現(xiàn),將多組樣本數(shù)據(jù)混合并升序排列,求出求出每個觀察值的秩,然后對多組樣本的值分別求平均值。如果各組樣本的平均秩大致相等,則認(rèn)為多個獨立總體的分布無顯著差異。,n第i組樣本的觀察值個數(shù);R平均秩。,例題,例題:隨機抽取3個班級學(xué)生的21個成績樣本,問3個班級學(xué)生總體成績是否存在顯著差異?,,SPSS操作,,多個總體配對樣本的非參數(shù)檢驗,多配對樣本的Friendman檢驗,多配對樣本的Kendall檢驗,多配對樣本的CochranQ檢驗,,,,多配對樣本的Friendman檢驗,要求:數(shù)據(jù)是定距的。,實現(xiàn)原理:以樣本為單位,將各個樣本數(shù)據(jù)按照升序排列,求各個樣本數(shù)據(jù)在各自行中的秩,然后計算個樣本的秩總和及平均秩。,如果多個配對樣本的分布存在顯著性差異,則數(shù)值普遍偏大組的秩和必然偏大,各組的秩之間就會存在顯著差異。如果個樣本的平均秩大致相當(dāng),則可以認(rèn)為個組的總體分布沒有顯著差異。,例題,,例題:為了試驗?zāi)撤N減肥藥物的性能,測量11個人在服用該藥以前以及服用該藥1個月后、2個月后、3個月后的體重。問:在這4個時期,11個人的體重有無發(fā)生顯著的變化?,SPSS操作,多配對樣本的Kendall檢驗,主要用于分析評判者的判別標(biāo)準(zhǔn)是否一致公平。它將每個評判對象的分?jǐn)?shù)都看作是來自多個配對總體的樣本。一個評判對象對不同評判對象的分?jǐn)?shù)構(gòu)成一個樣本,其零假設(shè):樣本來自的多個配對總體的分布無顯著差異,即評判者的評判標(biāo)準(zhǔn)不一致。Kendall協(xié)同系數(shù)W的公式:,例題,R:第i個被評判者的秩和;,n:被評判者人數(shù);m:評判人數(shù)。,,例題:某文藝晚會有5個節(jié)目,共有5個評委參與打分。問這5個評委的判別標(biāo)準(zhǔn)是否一致,數(shù)據(jù)如下表。注意:不是檢驗這5個節(jié)目之間實際是否存在顯著的差異。,SPSS操作,式中:K為樣本數(shù);n為樣本容量;,多配對樣本的CochranQ檢驗,該檢驗處理的數(shù)據(jù)是二值的(0和1)。其零假設(shè):樣本來自的多配對總體分布無顯著差異。,例題,為第j列取值為1的個數(shù);為第i行取值為1的個數(shù)。,,例題:消費者協(xié)會調(diào)查了顧客對3種品牌電視機的滿意程度,共有10個顧客參與了滿意度的調(diào)查,數(shù)據(jù)如下表所示:,SPSS操作,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 非參數(shù)假設(shè)檢驗 參數(shù) 假設(shè)檢驗
鏈接地址:http://www.3dchina-expo.com/p-3490340.html