分類變量資料的統(tǒng)計(jì)分析 ppt課件
《分類變量資料的統(tǒng)計(jì)分析 ppt課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《分類變量資料的統(tǒng)計(jì)分析 ppt課件(37頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
>計(jì)數(shù)資料的統(tǒng)計(jì)分析統(tǒng)計(jì)資料的類型數(shù)值變量 : 計(jì)量資料分類變量 : 計(jì)數(shù)資料 有序分類 : 變量之間有程度的差別 , 且排列有序 . (等級(jí)變量 )無(wú)序分類 : 二項(xiàng)分類多項(xiàng)分類變量的轉(zhuǎn)換 : 定量 定性連續(xù)型計(jì)量資料離散型計(jì)量資料第十章 分類變量資料的統(tǒng)計(jì)分析第一節(jié) 統(tǒng)計(jì)描述一 .描述指標(biāo) (相對(duì)數(shù) )1. 率 (rate) :單位 : %,‰,萬(wàn)分率 ,10萬(wàn)分率2. 構(gòu)成比 (constituent ratio) 單位 : % 特點(diǎn) :3. 相對(duì)比 (relative ratio)常用率比 ? 例 10-1某研究者 2000年對(duì)某校的初中生進(jìn)行了近視患病情況調(diào)查 ,試計(jì)算各年級(jí)近視患病率和構(gòu)成比及三年級(jí)和一年級(jí)患病率的相對(duì)比 .年級(jí) 檢查人數(shù) 患病人數(shù) 患病率 構(gòu)成比 相對(duì)比一 年級(jí) 442 67 二年級(jí) 428 68三年級(jí) 405 74 合計(jì) 1275 209 16.39 100.015.16 32.0615.89 32.53 18.27 35.41 1.2二 . 應(yīng)用相對(duì)數(shù)時(shí)注意事項(xiàng)1. 分母 不宜太小2. 率和構(gòu)成比的區(qū)別3. 樣本含量不等的 幾個(gè)率的平均值 不等于 幾個(gè)率的算數(shù)平均值4. 對(duì)率或構(gòu)成比進(jìn)行比較時(shí) ,應(yīng)注意 資料的可比性5. 率的標(biāo)準(zhǔn)化6. 兩樣本率進(jìn)行比較時(shí)應(yīng)進(jìn)行 假設(shè)檢驗(yàn)三 .率的標(biāo)準(zhǔn)化1.基本思想 : 為消除內(nèi)部構(gòu)成不同對(duì)指標(biāo)的影響, 采用統(tǒng)一的內(nèi)部構(gòu)成計(jì)算標(biāo)準(zhǔn)化率 ,使得出的標(biāo)準(zhǔn)化率具有可比性 .2.計(jì)算方法 : 直接法 : 已知各年齡組的實(shí)際發(fā)病率 ,用標(biāo)準(zhǔn)人口數(shù)或標(biāo)準(zhǔn)人口構(gòu)成進(jìn)行計(jì)算間接法 : 標(biāo)準(zhǔn)化死亡比 (SMR), 實(shí)際死亡數(shù)與預(yù)期死亡數(shù)的比3. 率的標(biāo)準(zhǔn)化應(yīng)注意的問(wèn)題第三節(jié) 率的標(biāo)準(zhǔn)化法 (standardization)西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 治愈數(shù) 治愈率 (%) 病例數(shù) 治愈數(shù) 治愈率 (%) 普通型 60 36 60 20 13 65重型 20 8 40 60 27 45 爆發(fā)型 20 4 20 20 5 25合計(jì) 100 48 48 100 45 45例 : 某病兩種療法治愈率的比較西醫(yī)標(biāo)準(zhǔn)化治愈率 P'= 88÷200 = 44%中西醫(yī)標(biāo)準(zhǔn)化治愈率 P'= 98÷200 = 49%例 : 某病兩種療法治愈率的比較西醫(yī)組 中西醫(yī)結(jié)合組 病型 病例數(shù) 原治愈率 (%) 預(yù)期治愈數(shù) 原治愈率 (%) 預(yù)期治愈數(shù) 普通型 80 60 48 65 52重型 80 40 32 45 36 爆發(fā)型 40 20 8 25 10合計(jì) 200 88 98率的標(biāo)準(zhǔn)化1.基本思想 : 為消除 內(nèi)部構(gòu)成不同 對(duì)指標(biāo)的影響 , 采用 統(tǒng)一的內(nèi)部構(gòu)成 計(jì)算標(biāo)準(zhǔn)化率 ,使得出的標(biāo)準(zhǔn)化率具有可比性 .2.計(jì)算方法 : 直接法 : 已知各年齡組的實(shí)際發(fā)病率 ,用標(biāo)準(zhǔn)人口數(shù)或標(biāo)準(zhǔn)人口構(gòu)成進(jìn)行計(jì)算間接法 : 標(biāo)準(zhǔn)化死亡比 (SMR), 實(shí)際死亡數(shù)與預(yù)期死亡數(shù)的比 3. 率的標(biāo)準(zhǔn)化應(yīng)注意的問(wèn)題? 由于內(nèi)部構(gòu)成不同 ,影響到要比較的總率 ,需要標(biāo)準(zhǔn)化處理?? 標(biāo)準(zhǔn)化率只用于比較,已經(jīng)不代表實(shí)際的水平。? 各分組率有交叉 ,不能用標(biāo)準(zhǔn)化率比較? 抽樣得到的標(biāo)準(zhǔn)化率的比較 ,也應(yīng)該進(jìn)行假設(shè)檢驗(yàn) .第二節(jié) 計(jì)數(shù)資料統(tǒng)計(jì)推斷一 . 率的抽樣誤差和標(biāo)準(zhǔn)誤樣本率和總體率或樣本率之間存在的差異 ,稱抽樣誤差 .率的抽樣誤差用率的標(biāo)準(zhǔn)誤表示 .(?p or Sp).( p =陽(yáng)性率 , 1- p=陰性率 )二 . 總體率的區(qū)間估計(jì)2. 查表法 : 當(dāng) n ≤50, 樣本率 p 接近與 0或 1時(shí) ,該資料服從二項(xiàng)分布 ,用查表法估計(jì)樣本含量p ? u?× Sp1. 正態(tài)近似法 :np 和 n(1-p)>5條件 : n 足夠大 ,樣本率 p 或 1-p均不太小時(shí) , 即例 10-5為了解某地乙肝表面抗原攜帶情況 ,某研究者在該地人群中隨機(jī)檢測(cè)了該地 200人 ,乙肝表面抗原陽(yáng)性 7人 ,乙肝表面抗原攜帶率為 3.5%, 試計(jì)算標(biāo)準(zhǔn)誤并估計(jì) 95% 和 99% 可信區(qū)間 .95% 可信區(qū)間 : 3.5% ? 1.96 Sp99% 可信區(qū)間 : 3.5% ? 2.58 Spn=200 X=7, P=3.5% 三 . 兩個(gè)率比較的 u 檢驗(yàn)當(dāng) np和 n(1-p) ≧ 5 時(shí) 樣本率的分布近似正態(tài)分布 — u 檢驗(yàn)(一 ) 檢驗(yàn)步驟 : 1. 建立假設(shè) , 確定檢驗(yàn)水準(zhǔn) αH0: H1:α =0.052. 選擇檢驗(yàn)方法 , 計(jì)算 u 值3. 確定 P 值 , 判斷結(jié)果(二 )資料類型1. 樣本率與總體率的比較 (例 10-6)計(jì)算公式 :2. 兩個(gè)樣本率的比較 (例 10-7)計(jì)算公式 :第三節(jié) X2 檢驗(yàn) (chi-square test)基本思想檢驗(yàn)實(shí)際頻數(shù)與理論頻數(shù)的吻合程度 ,實(shí)際頻數(shù)與理論頻數(shù)越相近 , X2 值越小 ; 反之 ,實(shí)際數(shù)與理論數(shù)相差越大 , X2值越大 .計(jì)算公式 :理論頻數(shù)的計(jì)算 : TRC= nRnC / ndf=(行數(shù) -1)(列數(shù) -1)例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問(wèn)兩種藥物的有效率是否有差別 ?處理 有效 無(wú)效 合計(jì) 有效率(%)A 藥 68 6 74 91.89B 藥 52 11 63 82.54合計(jì) 120 17 137 87.59例 10-8 某醫(yī)生用 A,B兩種藥物治療急性下呼吸道感染 .A藥治療 74例 ,有效 68例 ;B藥治療 63例 ,有效 52例 .問(wèn)兩種藥物的有效率是否有差別 ?處理 有效 無(wú)效 合計(jì) 有效率(%)A 藥 68 (64.82) 6 (9.18) 74 91.89B 藥 52 (55.18) 11(7.82) 63 82.54合計(jì) 120 17 137 87.59二 . Χ2 檢驗(yàn)的基本步驟?建立檢驗(yàn)假設(shè) ,確定檢驗(yàn)水準(zhǔn)H0: ?1= ?2H1: ?1 ? ?2?=0.052. 計(jì)算 Χ2 值資料類型不同 ,計(jì)算公式不同3. 確定 P 值 , 判斷結(jié)果根據(jù)查 Χ2 界值表 , 確定 P值三 . 四格表資料的 Χ2 檢驗(yàn)1. 四格表資料的 Χ2 檢驗(yàn)的 專用公式df =(R-1)(C-1)=1?四格表資料的 Χ2 檢驗(yàn)的校正-- Yates 連續(xù)校正校正公式 :校正的目的 :英國(guó)統(tǒng)計(jì)學(xué)家 (Yates)認(rèn)為 ?2分布是一種連續(xù)性分布 ,而四格表中的資料屬離散性分布 ,得到的 ?2統(tǒng)計(jì)量的抽樣分布也是離散的 .因此 ,為改善 ?2統(tǒng)計(jì)量分布的連續(xù)性 ,建議進(jìn)行校正 .連續(xù)性校正應(yīng)遵循的條件 :1. T ? 5, 且 N ? 40時(shí) , 用非校正的公式2. 1? T 40:當(dāng) b+c<40 時(shí) , 用校正公式 . (McNemar 檢驗(yàn) )4. 行 ×列表資料的 ?2檢驗(yàn) (R ×C 表資料 )基本公式 : A — 每個(gè)格子的實(shí)際頻數(shù) nR – A所對(duì)應(yīng)的行合計(jì)nC – A所對(duì)應(yīng)的列合計(jì)例 10-12. 某研究者欲比較甲、乙、丙三家醫(yī)院住院患者院內(nèi)感染情況,隨機(jī)抽查同一時(shí)期住院患者感染情況,結(jié)果如下:試比較三家醫(yī)院院內(nèi)感染率有無(wú)差別。表 10-12 三家醫(yī)院住院患者的院內(nèi)感染率比較醫(yī)院 感染 未感染 合計(jì)合計(jì) 77 509 586甲 43 188 231乙 19 170 189丙 15 151 166H0:三家醫(yī)院院內(nèi)感染率相同H1:三家醫(yī)院院內(nèi)感染率不相同或不全相同α= 0.05 df=(行數(shù) -1)(列數(shù) -1)= (3- 1)(2- 1) =2查 X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按 α = 0.05,拒絕 H0,接受 H1,差別有統(tǒng)計(jì)學(xué)意義,即可認(rèn)為三家醫(yī)院住院病人的院內(nèi)感染率有差別。然而,三者之間誰(shuí)和誰(shuí)有差別,還不知道。應(yīng)該進(jìn)一步進(jìn)行兩兩比較兩兩比較,可采用 X2分割行 ?列表資料 ?2檢驗(yàn)應(yīng)注意事項(xiàng)1. 行 ?列表資料 ?2檢驗(yàn)公式的應(yīng)用條件 :不能有 1/5以上 的格子的 理論數(shù) <5,或者 ,不能有 1個(gè)格子 的 理論數(shù) <12. 如果資料不能滿足上述條件 ,則可以通過(guò)(1) 在可能的情況下再增加樣本量 ;(2)專業(yè)上允許的情況下 ,合并相鄰的行或列;(3) 刪去理論數(shù)太小的行和列3. 假設(shè)檢驗(yàn)結(jié)果有差別 ,只能認(rèn)為總的率或構(gòu)成比有差別4. 單向有序變量(等級(jí)資料)的行 × 列表,不能用 X2檢驗(yàn)比較組間效應(yīng),如果作 X2,只能說(shuō)明個(gè)處理組間的效應(yīng)在構(gòu)成比上有無(wú)差別。表 10-12 中藥和西藥對(duì)某病的療效比較藥物 治愈 好轉(zhuǎn) 無(wú)效 合計(jì)合計(jì) 163 102 70 335中藥 78 42 32 152西藥 85 60 38 183小結(jié)計(jì)數(shù)資料的統(tǒng)計(jì)描述指標(biāo) : 率、構(gòu)成比、相對(duì)比計(jì)數(shù)資料的統(tǒng)計(jì)推斷總體參數(shù)估計(jì): P±uαSp率的假設(shè)檢驗(yàn): 樣本率與總體率的比較 -- u檢驗(yàn)兩個(gè)大樣本率的比較 -- u檢驗(yàn)兩個(gè)樣本率的比較 -- χ2檢驗(yàn)配 對(duì)設(shè)計(jì)資 料的兩個(gè)率比 較 -- χ2檢驗(yàn)多個(gè) 樣 本率的比 較 -- R×C表的 χ2檢驗(yàn)假 設(shè)檢驗(yàn) 的基本步 驟 完全相同統(tǒng)計(jì)資料處理的基本思路資料的整理 : 統(tǒng)計(jì)圖,統(tǒng)計(jì)表統(tǒng)計(jì)資料的描述 (描述指標(biāo))統(tǒng)計(jì)學(xué)推斷總體參數(shù)的估計(jì)(可信區(qū)間)假設(shè)檢驗(yàn) 統(tǒng)計(jì)資料類型的判斷例 1. 某研究者欲比較甲乙兩藥治療高血壓的效果 ,進(jìn)行了隨機(jī)對(duì)照試驗(yàn) .甲乙藥組各選擇了 50名病人 ,甲藥組血壓平均下降了 10.67mmHg,標(biāo)準(zhǔn)差是 3.27mmHg, 乙藥組平均下降了 13.20mmHg,標(biāo)準(zhǔn)差是 4.33mmHg. 問(wèn)兩藥降壓效果是否不同 ?例 2. 為調(diào)查 2型糖尿病發(fā)病易感因素 ,某研究者進(jìn)行了一項(xiàng)以醫(yī)院為基礎(chǔ)的病例對(duì)照研究 .結(jié)果發(fā)現(xiàn) ,在 200名糖尿病病例中 , 100人有糖尿病遺傳家族史 ;而 200名對(duì)照者中只有 50人有糖尿病家族史 .問(wèn)糖尿病家族史是否在兩組中分布不同 ?例 3. 為比較 A,B,C,D四種藥物治療小細(xì)胞肺癌的效果 ,將 160人隨機(jī)分配進(jìn)入四個(gè)治療組 .每組 40人 .治療結(jié)果見(jiàn)下表 ,試比較四種藥物治療效果有無(wú)差別 ?處理組 有效 無(wú)效 合計(jì) . A 藥 15 25 40B 藥 10 30 40C 藥 13 27 40D 藥 8 32 40合計(jì) 46 114 160 .例 4. 用 A、 B兩種不同的方法對(duì) 58例系統(tǒng)紅斑狼瘡患者血清中的抗體進(jìn)行測(cè)定,資料見(jiàn)下表,問(wèn)兩種檢測(cè)結(jié)果有無(wú)差別 ?A 法 + -B 法 合計(jì)+ 11 12 23- 2 33 35合計(jì) 13 45 58 .例 5. 為研究鉛作業(yè)與工人尿鉛含量的關(guān)系 ,隨機(jī)抽查了 3種作業(yè)工人的尿鉛結(jié)果,見(jiàn)下表 .問(wèn) 3種作業(yè)工人的尿鉛含量是否不同 ?鉛 作業(yè)組 調(diào)離鉛作業(yè)組 非鉛作業(yè)組 .0.01 0.11 0.090.16 0.23 0.020.24 0.18 0.050.18 0.14 0.020.28 0.20 0.010.14 0.12 0.10- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 分類 變量 資料 統(tǒng)計(jì)分析 ppt 課件
鏈接地址:http://www.3dchina-expo.com/p-278841.html