《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc
《《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc(36頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
教學(xué)提要 (一)《醫(yī)用統(tǒng)計(jì)學(xué)》基本概念 1、變異:宇宙中的事物, 千差萬(wàn)別, 各不相同。即使是性質(zhì)相同的事物, 就同一觀察指標(biāo)來(lái)看, 各觀察指標(biāo)(亦稱(chēng)個(gè)體)之間, 也各有差異, 稱(chēng)為變異。同質(zhì)觀察單位之間的個(gè)體變異, 是生物的重要特征, 是偶然性的表現(xiàn)。 2、變量:由于生物的變異特性, 使得觀察單位某種指標(biāo)的數(shù)值互相不等, 所以個(gè)體值稱(chēng)為變量值或觀察值。 3、總體:即根據(jù)研究目的確定的同質(zhì)的研究對(duì)象的全體。更確切地說(shuō), 是性質(zhì)相同的所有觀察單位的某種變量值的集合。 4、樣本: 即從總體中抽取一部分作為觀察單位進(jìn)行觀察,這部分觀察單位稱(chēng)為樣本。為了使樣本對(duì)總體有較好的代表性,抽樣必須遵循隨機(jī)化的原則,即總體中每一觀察單位均有相同的機(jī)會(huì)被抽取到樣本中去。 5、計(jì)量資料(數(shù)值變量資料): 對(duì)每個(gè)觀察單位用定量方法測(cè)定某項(xiàng)指標(biāo)量的大小, 所得的資料稱(chēng)為計(jì)量資料, 一般有度量衡等單位。 6、計(jì)數(shù)資料(分類(lèi)變量資料): 將觀察單位按某種屬性或類(lèi)別分組, 所得各組的觀察單位數(shù), 稱(chēng)為計(jì)數(shù)資料??煞譃槎?xiàng)式或多項(xiàng)式分類(lèi)變量。 7、等級(jí)資料:將觀察單位按某種屬性的不同程度分組, 所得各組的觀察單位數(shù), 稱(chēng)為等級(jí)資料。這類(lèi)資料與計(jì)數(shù)資料不同的是:屬性的分組有程度的差別, 各組按大小順序排列; 與計(jì)量資料不同的是:每個(gè)觀察單位未確切定量, 因而稱(chēng)為半定量資料。 8、抽樣誤差:由于總體中各觀察單位間存在個(gè)體差異, 抽樣研究中抽取的樣本, 只包含總體的一部分, 因而樣本指標(biāo)不一定等于相應(yīng)的總體指標(biāo), 這種樣本統(tǒng)計(jì)量與總體參數(shù)間的差別稱(chēng)為抽樣誤差。 (二)統(tǒng)計(jì)工作的基本步驟 1、設(shè)計(jì): 這是關(guān)鍵的一步。要求科學(xué)、周密、簡(jiǎn)明。 2、搜集資料: 要求完整、準(zhǔn)確、及時(shí)。 醫(yī)學(xué)統(tǒng)計(jì)資料的來(lái)源主要有三個(gè)方面:(1) 統(tǒng)計(jì)報(bào)表; (2) 日常醫(yī)療工作的原始記錄和報(bào)告卡片; (3) 專(zhuān)題調(diào)查 3、整理資料: 核查資料; 按性質(zhì)或數(shù)量分組, 擬定整理表。 4、分析資料: 包括指標(biāo)的計(jì)算、統(tǒng)計(jì)圖表的繪制, 用統(tǒng)計(jì)方法如參數(shù)估計(jì)、假設(shè)檢驗(yàn)等對(duì)資料作統(tǒng)計(jì)分析。 (三) 計(jì)量資料的分析 1、平均數(shù): 用以描述同質(zhì)計(jì)量資料頻數(shù)分布的集中趨勢(shì), 反映一組變量值的平均水平, 是一組變量值的代表值。 (1) 算術(shù)均數(shù): 簡(jiǎn)稱(chēng)均數(shù)。用于描述對(duì)稱(chēng)分布(特別是呈正態(tài)分布)的變量值的平均水平。 直接法: `x=Sx/n 加權(quán)法: `x=Sx/S=Sx/n 要點(diǎn): 頻數(shù)表的制作 (2) 幾何均數(shù): 用G表示。用于描述變量值呈等比數(shù)列, 或呈對(duì)數(shù)正態(tài)分布或近似對(duì)數(shù)正態(tài)分布資料。 直接法: G=`x1x2 x3 xn , G=lg-1( Slgx/n ) 加權(quán)法: G=lg-1 ( Slgx/S ) (3) 中位數(shù)和百分位數(shù): 中位數(shù)是一組從小到大順序排列的變量值, 位于中間位置的數(shù)值,亦稱(chēng)為位置平均數(shù), 代號(hào)為M。多用于描述偏態(tài)分布資料, 或分布不明資料, 或一端或兩端無(wú)確定數(shù)值的開(kāi)口資料的集中趨勢(shì)。百分位數(shù)代號(hào)為PX, 是一種位置指標(biāo)。 小樣本資料中位數(shù)計(jì)算方法: 當(dāng)n為奇數(shù)時(shí) M=X(n+1/2) 當(dāng)n為偶數(shù)時(shí) M=[ X(n/2)+X(n/2+1) ] 大樣本資料中位數(shù)和百分位數(shù)計(jì)算方法: PX =L+I ( nx% - SL ) 2、變異指標(biāo) (1) 全距: R, 亦稱(chēng)極差。即一組變量值中最大值與最小值之差。 (2) 標(biāo)準(zhǔn)差: 是最常用來(lái)衡量變量值間離散程度的變異指標(biāo)??傮w標(biāo)準(zhǔn)差代號(hào)s,樣本標(biāo)準(zhǔn)差代號(hào)s。 運(yùn)用:” 用來(lái)描述正態(tài)分布資料的變異程度。當(dāng)資料呈正態(tài)或近似正態(tài)資料時(shí)往往將均數(shù)與標(biāo)準(zhǔn)差同時(shí)寫(xiě)出: `X S, 表示均數(shù)的代表性。 (3) 變異系數(shù): 又稱(chēng)離散系數(shù)。代號(hào)為CV。CV= 運(yùn)用: 比較均數(shù)相差懸殊的幾組資料的變異程度; 比較度量衡單位不同的幾組資料的變異程度。 3、正態(tài)分布及其應(yīng)用 (1) 正態(tài)分布: 是醫(yī)學(xué)和生物學(xué)中最常見(jiàn)的總體頻數(shù)分布, 以均數(shù)為中心, 對(duì)稱(chēng),兩側(cè)逐漸下降, 兩端永遠(yuǎn)不與橫軸相交。正態(tài)分布用N(m, s2)表示, 為了應(yīng)用方便, 常對(duì)變量X作u=( X - m )/ s變換, 使m=0, s=1, 則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布( 或呈U分布), 用N(0, 1)表示。 特征: 均數(shù)處最高; 以均數(shù)為中心, 左右對(duì)稱(chēng); 有兩個(gè)參數(shù): m和s; 態(tài)曲線下的面積分布有一定規(guī)律: 變量值范圍 正態(tài)曲線下面積(變量值出現(xiàn)的概率) m 1.0 s 68.27% m 1.96 s 95.00% m 2.58 s 99.00% (2) 正態(tài)分布的應(yīng)用: 常用于估計(jì)頻數(shù)分布情況; 制定正常值范圍。 正常值: 指正常人的各種生理常數(shù)。當(dāng)資料呈正態(tài)分布時(shí), 最常用X 1.96S估計(jì)95%正常值范圍, 其含義是指絕大多數(shù)正常的變量值都在這個(gè)范圍內(nèi), 絕大多數(shù)是包括正常的80%、90%、95%和99%, 最常用95%。 4、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤 (1) 標(biāo)準(zhǔn)誤的概念 即樣本均數(shù)的標(biāo)準(zhǔn)差, 是說(shuō)明均數(shù)抽樣誤差大小的指標(biāo)。標(biāo)準(zhǔn)誤愈小, 表示抽樣誤差愈小, 樣本統(tǒng)計(jì)量對(duì)總體參數(shù)的估計(jì)愈可靠。 (2) 標(biāo)準(zhǔn)誤的計(jì)算 sx=s/`n(總體標(biāo)準(zhǔn)誤) sx=s/`n(樣本標(biāo)準(zhǔn)誤) (3) 標(biāo)準(zhǔn)誤的應(yīng)用 表示樣本均數(shù)的散布情形; 估計(jì)總體均數(shù)的可信區(qū)間; 進(jìn)行假設(shè)檢驗(yàn) 5、t分布和總體均數(shù)的估計(jì) (1) t分布的概念 對(duì)正態(tài)變量`X采用u=( `X - m )/ sx變換, 將N(m, sx2)變換為標(biāo)準(zhǔn)正態(tài)分布, 即U分布, 而實(shí)際中sx往往用sx來(lái)估計(jì), 這時(shí)對(duì)正態(tài)變量`X采用的不是U變換而是t變換, 即 t = ( `X - m )/ sx 其結(jié)果也不是U分布而是t分布。 (2) t分布的特征 與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征: a.二者都是單峰分布, 以0為中心, 左右對(duì)稱(chēng); b. t分布的峰部較矮而尾部翹得較高, 說(shuō)明遠(yuǎn)側(cè)的t值的個(gè)數(shù)相對(duì)較多, 即尾部面積 (概率P) 較大。自由度u越小這種情況越明顯, u逐漸增大時(shí), t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布; 當(dāng)u=時(shí), t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。 (3)t界值 t界值表, 橫標(biāo)目為自由度u, 縱標(biāo)目為概率P, 表中數(shù)字表示自由度為u, P為a(檢驗(yàn)水準(zhǔn))時(shí), t的界值, 常記為ta,u。理論上 單側(cè): P( t - ta,u)= a, 或P(t ta,u)= a 雙側(cè): P( t - ta,u)+P(t ta,u)= a; P( - ta,u < t < ta,u)= 1 - a (4)總體均數(shù)的估計(jì) 包括點(diǎn)值估計(jì)和區(qū)間估計(jì)。 a.區(qū)間估計(jì)的涵義: 意思是從總體中作隨機(jī)抽樣, 每個(gè)樣本可以算得一個(gè)可信區(qū)間, 如95%可信區(qū)間, 意味著做100個(gè)可信區(qū)間, 平均有95個(gè)可信區(qū)間包括總體均數(shù)(估計(jì)正確), 只有5個(gè)可信區(qū)間不包括總體均數(shù)(估計(jì)錯(cuò)誤)。 b.區(qū)間估計(jì)的方法: `X -- ta,u sx < m <`X + ta,u sx ; s已知 `X - Ua,sx < m <`X + Ua,sx ; s未知但n足夠大 `X - Ua,sx < m <`X + Ua, sx ; 6、假設(shè)檢驗(yàn) (1) 概念 所謂假設(shè)檢驗(yàn), 就是根據(jù)研究目的, 對(duì)樣本所屬總體特征提出一個(gè)假設(shè), 然后用適當(dāng)方法根據(jù)樣本提供的信息, 推斷該假設(shè)應(yīng)當(dāng)拒絕或不拒絕, 以使研究者了解在假設(shè)的條件下, 差異由抽樣誤差引起的可能性大小, 便于比較分析。 (2) 一般步驟 a.建立假設(shè): H0: 無(wú)效假設(shè)。即假設(shè)樣本指標(biāo)與總體指標(biāo), 或樣本與樣本指標(biāo)是相等的, 它們的差別是由抽樣誤差引起的。H1: 備擇假設(shè)。是與H0相對(duì)立的假設(shè)。 b.確定檢驗(yàn)水準(zhǔn): 亦稱(chēng)顯著性水準(zhǔn), 代號(hào)為a, 是一個(gè)接受或拒絕H0的概率標(biāo)準(zhǔn)。常取a = 0.05或a = 0.01 c.選定檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量: t檢驗(yàn), U檢驗(yàn), c2檢驗(yàn)等。 d.確定P值:P值是指在由H0所規(guī)定的總體中作隨機(jī)抽樣, 獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計(jì)量的概率。 e.做出統(tǒng)計(jì)推斷: 當(dāng)P a時(shí), 統(tǒng)計(jì)推斷結(jié)論為按所取檢驗(yàn)水準(zhǔn)拒絕H0, 接受H1, 差別有顯著性意義。 (3) 計(jì)量資料的假設(shè)檢驗(yàn) a.樣本均數(shù)與總體均數(shù)的比較: H0: m = m0 t = ( `X - m )/ sx u = n -1 b.配對(duì)資料的t檢驗(yàn): 即差值均數(shù)與總體均數(shù)0比較的t檢驗(yàn)。 配對(duì)資料: 對(duì)同對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理;對(duì)同一受 試對(duì)象分別給予兩種處理; 同一受試對(duì)象處理前后的 比較。 H0: md = 0 t = `d / sd c.兩樣本均數(shù)的t檢驗(yàn): H0: m1 = m2 t = ( `X1 - `X2)/ sx1-x2 u = n1 + n2 -2 d. 兩大樣本均數(shù)的U檢驗(yàn): H0: m1 = m2 U = ( `X1 - `X2)/ sx12+sx22 e.多個(gè)樣本比較F分析:F=MS組間/MS組內(nèi) (4) t、F檢驗(yàn)的應(yīng)用條件: a. 要求資料呈正態(tài)分步; b. 要求總體方差相等c.獨(dú)立樣本 (5) U檢驗(yàn)的應(yīng)用條件: 樣本例數(shù)較大或總體標(biāo)準(zhǔn)差已知 (6) 第一類(lèi)錯(cuò)誤與第二類(lèi)錯(cuò)誤 第一類(lèi)錯(cuò)誤: 拒絕實(shí)際上是成立的H0, 概率為a。 第二類(lèi)錯(cuò)誤: 不拒絕實(shí)際上是不成立的H0, 概率為b, 1 - b稱(chēng)為檢驗(yàn)效能或把握度。 (7) 假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問(wèn)題 a. 要有嚴(yán)密的抽樣研究設(shè)計(jì); b. 選用的假設(shè)檢驗(yàn)方法應(yīng)符合其應(yīng)用條件; c. 正確理解差別有無(wú)顯著性的條件意義; d. 結(jié)論不能絕對(duì)化; e. 報(bào)告結(jié)論時(shí)注意應(yīng)列出檢驗(yàn)統(tǒng)計(jì)量值, 注明采用的是單側(cè)或雙側(cè)檢驗(yàn), 寫(xiě)出P值確切范圍。 ( 四 )計(jì)數(shù)資料的分析 1、常用相對(duì)數(shù): 分析計(jì)數(shù)資料的指標(biāo)。 ( 1 ) 率: 表示某種現(xiàn)象發(fā)生的頻度或強(qiáng)度。 率= 某現(xiàn)象實(shí)際發(fā)生例數(shù)/可能發(fā)生該現(xiàn)象的總例數(shù) 比例基數(shù)( 習(xí)慣上以計(jì)算的率保留1 - 2位整數(shù)) ( 2 ) 構(gòu)成比: 說(shuō)明事物內(nèi)部各組成部分所占的比重或分布。 構(gòu)成比= 某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù) 100% ( 3 ) 相對(duì)比: 兩個(gè)有關(guān)指標(biāo)之比, 用以表示兩個(gè)指標(biāo)之間的對(duì)比關(guān)系。 2、應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的問(wèn)題 (1) 計(jì)算相對(duì)數(shù)的分母不宜太小; (2) 分析時(shí)不能以構(gòu)成比代替率; (3) 對(duì)觀察單位數(shù)不等的幾個(gè)率, 不能直接相加就其平均率; (4) 資料的對(duì)比應(yīng)注意可比性: a.觀察對(duì)象同質(zhì); b.內(nèi)部構(gòu)成相同。 (5) 對(duì)樣本率( 或構(gòu)成比 )的比較應(yīng)遵循隨機(jī)抽樣, 要作假設(shè)檢驗(yàn)。 3、標(biāo)準(zhǔn)化法 (1) 概念: 即采用一個(gè)共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn), 使兩個(gè)樣本或多個(gè)樣本的不同內(nèi)部構(gòu)成調(diào)整為共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn), 以消除因內(nèi)部構(gòu)成不同對(duì)樣本率的影響。標(biāo)準(zhǔn)化后的率叫標(biāo)準(zhǔn)化率。 (2) 計(jì)算方法: 直接法、間接法。 (3) 注意事項(xiàng): a. 選定標(biāo)準(zhǔn)不同, 算得的標(biāo)準(zhǔn)化率也不同, 因此不能代表實(shí)際水平; b. 各組間若出現(xiàn)明顯交叉, 不宜用標(biāo)準(zhǔn)化法; c. 兩樣本標(biāo)化率的比較應(yīng)作假設(shè)檢驗(yàn)。 4、常用相對(duì)數(shù)指標(biāo) (1) 出生率=某年活產(chǎn)數(shù)/同年平均人口數(shù) 1000% (2) 死亡率=某年死亡總數(shù)/同年平均人口數(shù) 1000% (3) 發(fā)病率=某人群某時(shí)期內(nèi)新病例數(shù)/某人群同期平均人口數(shù) K (4) 某病患病率=觀察時(shí)點(diǎn)某病例數(shù)/同時(shí)點(diǎn)檢查人數(shù) K (5) 某病感染率=受檢者感染某病原體人數(shù)/受檢人數(shù) K (6) 治愈率= 治愈病人數(shù)/接受治療人數(shù) 100% (7) 某病病死率=某期間因某病死亡人數(shù)/同期該病患者 100% (8) 生存率=n年末存活的病例數(shù)/隨訪滿n年的病例數(shù) 100% 5、率的抽樣誤差和率的標(biāo)準(zhǔn)誤 (1) 概念: 由抽樣造成的樣本率與總體率的差別叫率的抽樣誤差。衡量率的抽樣誤差大小, 衡量樣本率的穩(wěn)定性的指標(biāo), 即率的標(biāo)準(zhǔn)誤。 (2) 率的標(biāo)準(zhǔn)誤的計(jì)算 sP =p( 1 - p )/n SP =P( 1 - P )/n (3) 總體率的區(qū)間估計(jì) a. 查表法: n較小, 特別是p接近0或1時(shí) b.正態(tài)近似法: n足夠大, 樣本率p和(1 - p)均不太小, 如np與n( 1 - p )均大于5時(shí) ( p - ua SP , p + ua SP ) 6、計(jì)數(shù)資料的假設(shè)檢驗(yàn)----U檢驗(yàn) (1) 條件: n足夠大, 樣本率p和(1 - p)均不太小, 如np與n( 1 - p )均大于5時(shí), 樣本率的分布呈正態(tài)分布。 (2) 樣本率與總體率的比較 H0: p = p0 u = p - p/ sP (3) 兩樣本率比較的u檢驗(yàn) H0: p1 = p0 u = p1 - p2/ SP1 - P2 7、計(jì)數(shù)資料的假設(shè)檢驗(yàn)-----c2檢驗(yàn) (1) 用途 常用于檢驗(yàn)兩個(gè)樣本率(或構(gòu)成比)之間的差異顯著性, 也可用于檢驗(yàn)多個(gè)樣本率之間的差異顯著性, 還可用于檢驗(yàn)配對(duì)計(jì)數(shù)資料的差異顯著性。 (2) 基本思想 c2 = S( A - T)2/T T = nRnC/n c2反映了實(shí)際頻數(shù)與理論頻數(shù)的吻合程度。 c2的大小取決于A - T的差值, 還取決于自由度u。 u = ( 行數(shù)- 1 )( 列數(shù)- 1 ) (3) 四格表資料的c2檢驗(yàn)( 兩樣本率比較 ) 統(tǒng)計(jì)量的計(jì)算可用專(zhuān)用公式或基本公式 a. 基本條件: n > 40, T > 1 b. 校正條件: n > 40, 5 > T > 1 (4) 行 列表的c2檢驗(yàn)( 多個(gè)樣本率或構(gòu)成比的比較) a. c2值的計(jì)算: c2 = n( A2/nRnC - 1 ) b. 注意事項(xiàng): c2檢驗(yàn)要求理論頻數(shù)不宜太小, 一般認(rèn)為不宜有1/5以上格子理論數(shù)小于5, 或有一個(gè)理論數(shù)小于1, 處理辦法有: 增大一般含量, 最好; 刪去理論頻數(shù)太小的行或列; 合并性質(zhì)相近的行或列。等級(jí)資料宜用秩和檢驗(yàn)。當(dāng)結(jié)論為拒絕檢驗(yàn)假設(shè), 只能認(rèn)為各總體率( 或總體構(gòu)成比 )之間總的來(lái)說(shuō)有差別, 但不能說(shuō)明它們彼此之間都有差別。 (5) 配對(duì)計(jì)數(shù)資料的c2檢驗(yàn) a. H0 : b = c b. c2 =( b - c )2/ b + c c. b + c < 40, 需校正, c2 =( b - c - 1)2/b + c d. u = 1 (五) 統(tǒng)計(jì)表與統(tǒng)計(jì)圖 1、統(tǒng)計(jì)表 (1) 基本結(jié)構(gòu)與要求: 由標(biāo)題、標(biāo)目、線條、數(shù)字等組成 a. 標(biāo)題: 要求中心內(nèi)容突出, 必要時(shí)注明資料的時(shí)間、地點(diǎn)。 b. 標(biāo)目: 橫標(biāo)目: 在表的左側(cè), 是表的主語(yǔ)位置。 縱標(biāo)目: 在表的上方, 是表的謂語(yǔ)位置。 c. 線條: 分頂線、底線、縱標(biāo)目下面與合計(jì)上面的橫線,斜線、豎線省略。 d. 數(shù)字: 一律用阿拉伯?dāng)?shù)字。 e. 備注: 列于表的下面, 對(duì)表中標(biāo)有 ( * )的數(shù)字加以描述。 (2) 種類(lèi) a. 簡(jiǎn)單表: 被研究的事物只按一個(gè)特征或指標(biāo)分組。 b. 復(fù)合表: 被研究的事物按兩個(gè)或兩個(gè)以上相關(guān)聯(lián)的特征或指標(biāo)分組。 2、統(tǒng)計(jì)圖 (1) 基本要求: a. 依據(jù)資料的性質(zhì)選擇適當(dāng)?shù)膱D形; b. 要有標(biāo)題, 扼要說(shuō)明資料的內(nèi)容, 必要時(shí)注明時(shí)間、地點(diǎn); c. 以縱軸和橫軸為坐標(biāo)的圖形, 橫軸尺度自左而右, 縱軸尺度自下而上, 數(shù) 量一律由小到大, 并需等距標(biāo)明??v橫坐標(biāo)長(zhǎng)度的比例一般為5: 7。 d. 比較不同事物時(shí), 用不同的線條或顏色表示, 要附圖例說(shuō)明。 3、常用統(tǒng)計(jì)圖 (1) 直條圖: 用相同寬度條形的長(zhǎng)短.來(lái)表示資料數(shù)值大小比例關(guān)系, 適用于按性質(zhì)分組, 各個(gè)獨(dú)立的、無(wú)連續(xù)關(guān)系的統(tǒng)計(jì)圖。 (2) 百分條圖: 適用于表達(dá)構(gòu)成比的資料。 (3) 線圖: 用線條的上升和下降來(lái)表示某事物( 或某現(xiàn)象 )因時(shí)間或條件而變化的趨勢(shì)。 適用于連續(xù)性的變量資料。 (4) 直方圖: 用于表示連續(xù)變量的頻數(shù)分布。常以橫軸表示被觀察現(xiàn)象, 縱軸表示頻數(shù)或 頻率, 以各矩形( 寬度為組距 )的面積代表各組段的頻數(shù)。 (六) 調(diào)查設(shè)計(jì) 1、調(diào)查方法 (1) 普查( 全面調(diào)查 ): 將組成總體的所有觀察單位全部加一調(diào)查。 (2) 抽樣調(diào)查: 從總體中隨機(jī)抽取一定數(shù)量的觀察單位組成樣本, 然后用樣本信息來(lái)推斷 總體特征。 (3) 典型調(diào)查( 案例調(diào)查 ): 即在對(duì)事物作全面分析的基礎(chǔ)上, 有目的地選定典型的人、典 型的單位進(jìn)行調(diào)查。 2、調(diào)查項(xiàng)目和調(diào)查表 (1) 分析項(xiàng)目: 直接用于計(jì)算調(diào)處指標(biāo), 以及分析時(shí)排除混雜因素影響所必須得分內(nèi)容。 (2) 備查項(xiàng)目: 便于核查、補(bǔ)填和更正而設(shè)置的, 通常不直接用于分析。 (3) 調(diào)查表的格式: 分為一覽表和單一表。 (4) 隨機(jī)抽樣的方法: a. 單純隨機(jī)抽樣; b. 系統(tǒng)抽樣; c. 整群抽樣; d. 分層抽樣; 根據(jù)抽樣誤差的大小, 分層抽樣 < 系統(tǒng)抽樣 < 單純隨機(jī)抽樣 < 整群抽樣 第十章 線性相關(guān)與回歸 (Linear Correlation & Regression ) 線性相關(guān)與回歸 第一節(jié) 線性相關(guān) 第二節(jié) 線性回歸 第三節(jié) 線性相關(guān)與回歸的區(qū)別和聯(lián)系 第三節(jié) 等級(jí)相關(guān) 線性相關(guān)(linear correlation) 一、線性相關(guān)的基本概念 二、線性相關(guān)系數(shù) 三、相關(guān)系數(shù)的顯著性檢驗(yàn) 四、進(jìn)行線性相關(guān)分析的注意事項(xiàng) 一、線性相關(guān)的基本概念 為直觀地判斷兩個(gè)變量之間的關(guān)系,可在直角坐標(biāo)系中把每對(duì)(Xi,Yi)值所代表的點(diǎn)繪出來(lái),形成散點(diǎn)圖。 若一個(gè)變量X由小到大(或由大到?。?,另一變量Y亦相應(yīng)地由小到大或由大到小,則兩個(gè) 變量的散點(diǎn)圖呈直線趨勢(shì),我們稱(chēng)這種現(xiàn)象為共變,也就是這兩個(gè)變量之間有“相關(guān)關(guān)系”。 男青年身高與前臂長(zhǎng)散點(diǎn)呈直線趨勢(shì),即男青年身材高,前臂亦長(zhǎng),說(shuō)明身高與前臂長(zhǎng)之間存在線性相關(guān)關(guān)系我們把這種關(guān)系稱(chēng)為直線相關(guān)。 線性相關(guān)用于雙變量正態(tài)資料。它的性質(zhì)可由散點(diǎn)圖直觀地說(shuō)明。散點(diǎn)圖中點(diǎn)的分布即線性相關(guān)的性質(zhì)和相關(guān)之間的密切程度,可分為以下幾種情況: 1.正相關(guān) 2.負(fù)相關(guān) 3.無(wú)相關(guān) 線性相關(guān)系數(shù) 在分析兩個(gè)變量X與Y之間關(guān)系時(shí),常常要了解X與Y之間 有無(wú)相關(guān)關(guān)系,相關(guān)是否密切,是呈正相關(guān)還是負(fù)相關(guān)。相關(guān)系數(shù)就是說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計(jì)量。 皮爾森(Pearson)相關(guān)系數(shù)的計(jì)算公式為: 相關(guān)系數(shù)r沒(méi)有測(cè)量單位,其數(shù)值為-1≤≤+1 相關(guān)系數(shù)的計(jì)算方法 計(jì)算時(shí)分別可用下面公式帶入相關(guān)系數(shù)r的計(jì)算公式中 例10.1 從男青年總體中隨機(jī)抽取11名男青年組成樣本,分別測(cè)量每個(gè)男青年的身高和前臂長(zhǎng),身高和前臂長(zhǎng)均以cm為單位,測(cè)量結(jié)果如下表所示,試計(jì)算身高與前 臂長(zhǎng)之間的相關(guān)系數(shù)。 編號(hào) 身高(cm) 前臂長(zhǎng)(cm) XY X2 Y2 (X) (Y) 1 170 47 7990 28900 2209 2 173 42 7266 29929 1764 3 160 44 7040 25600 1936 4 155 41 6355 24025 1681 5 173 47 8131 29929 2209 6 188 50 9400 35344 2500 7 178 47 8366 31684 2209 8 183 46 8418 33489 2116 9 180 49 8820 32400 2401 10 165 43 7095 27225 1849 11 166 44 3174 28561 2116 合計(jì) 1891 500 86185 326081 22810 相關(guān)系數(shù)的顯著性檢驗(yàn) 與前面講的其它統(tǒng)計(jì)量一樣,根據(jù)樣本資料計(jì)算出來(lái)的相關(guān)系數(shù)同樣存在抽樣誤差。即假設(shè)在一個(gè)X與Y無(wú)關(guān)總體中作隨機(jī)抽樣,由于抽樣誤差的影響,所得的樣本相關(guān)系數(shù)也常常不等于零。 因此要判斷兩個(gè)變量X與Y是否真的存在相關(guān)關(guān)系,仍需根據(jù)作總體相關(guān)系數(shù)ρ是否為零的假設(shè)檢驗(yàn)。 常用的檢驗(yàn)方法有兩種: 1.按自由度直接查附表11的界值表,得到P 值。 2.用假設(shè)檢驗(yàn)法,計(jì)算統(tǒng)計(jì)量 進(jìn)行線性相關(guān)分析的注意事項(xiàng) ⒈ 線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系是雙向的,分析兩個(gè)變量之間到底有無(wú)相關(guān)關(guān)系可首先繪制散點(diǎn)圖,散點(diǎn)圖呈現(xiàn)出直線趨勢(shì)時(shí),再作分析。 ⒉ 相關(guān)系數(shù)的計(jì)算只適用于兩個(gè)變量都服從正態(tài)分布的情形,如果資料不服從正態(tài)分布,應(yīng)先通過(guò)變量變換,使之正態(tài)化,再根據(jù)變換值計(jì)算相關(guān)系數(shù)。 ⒊ 依據(jù)公式計(jì)算出的相關(guān)系數(shù)僅是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)的一個(gè)估計(jì)值,與總體相關(guān)系數(shù)之間存在著抽樣誤差,要判斷兩個(gè)事物之間有無(wú)相關(guān)及相關(guān)的密切程度,必須作假設(shè)檢驗(yàn)。 ⒋ 相關(guān)分析是用相關(guān)系數(shù)來(lái)描述兩個(gè)變量間相互關(guān)系的密切程度和方向,而兩個(gè)事物之間的關(guān)系既可能是依存因果關(guān)系,也可能僅是相互伴隨的數(shù)量關(guān)系。決不可因?yàn)閮墒挛镩g的相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義,就認(rèn)為兩者之間存在著因果關(guān)系,要證明兩事物間確實(shí)存在因果關(guān)系,必須憑借專(zhuān)業(yè)知識(shí)加以闡明。 相關(guān)是分析兩個(gè)正態(tài)變量X與Y之間的互相關(guān)系。在相關(guān)分析中,分不清X(qián)與Y何者為自變量,何者為因變量?,F(xiàn)在假設(shè)兩個(gè)變量X 、Y 中,當(dāng)一個(gè)變量X 改變時(shí),另一個(gè)變量 Y 也相應(yīng)地改變,當(dāng)這樣的兩個(gè)變量之間存在著直線關(guān)系時(shí),不僅可以用相關(guān)系數(shù) r 表示變量Y與X線性關(guān)系的密切程度,也可以用一個(gè)直線方程來(lái)表示 Y 與 X 的線性關(guān)系。 根據(jù)大量實(shí)測(cè)數(shù)據(jù),尋找出其規(guī)律性,尋求一個(gè)直線方程來(lái)描述兩個(gè)變量間依存變化的近似的線性數(shù)量關(guān)系,即線性回歸關(guān)系,這樣得出的直線方程叫做線性回歸方程。 進(jìn)行線性回歸分析的注意事項(xiàng) ⒈ 只有將兩個(gè)內(nèi)在有聯(lián)系的變量放在一起進(jìn)行回歸分析才是有意義的。 ⒉ 作回歸分析時(shí),如果兩個(gè)有內(nèi)在聯(lián)系的變量之間存在的是一種依存因果的關(guān)系,那么應(yīng)該以“因”的變量為X ,以“果”的變量為Y 。如果變量之間并無(wú)因果關(guān)系,則應(yīng)以易于測(cè)定、較為穩(wěn)定或變異較小者為X 。 ⒊ 在回歸分析中,因變量是隨機(jī)變量,自變量既可以是隨機(jī)變量(II型回歸模型,兩個(gè)變量應(yīng)該都服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時(shí),與每個(gè)X 取值相對(duì)應(yīng)的變量Y必須服從正態(tài)分布),如果數(shù)據(jù)不符合要求,在進(jìn)行回歸分析前,必須先進(jìn)行變量的變換。 ⒋ 回歸方程建立后必須作假設(shè)檢驗(yàn),只有經(jīng)假設(shè)檢驗(yàn)拒絕了無(wú)效假設(shè),回歸方程才有意義。 ⒌ 使用回歸方程計(jì)算估計(jì)值時(shí),不可把估計(jì)的范圍擴(kuò)大到建立方程時(shí)的自變量的取值范圍之外。 第三節(jié) 線性相關(guān)和回歸的區(qū)別與聯(lián)系 ⒈ 相關(guān)系數(shù)的計(jì)算只適用于兩個(gè)變量都服從正態(tài)分布的情形,而在回歸分析中,因變量是隨機(jī)變量,自變量既可以是隨機(jī)變量(II型回歸模型,兩個(gè)變量都應(yīng)該服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時(shí),與每個(gè)X 取值相對(duì)應(yīng)的變量Y必須服從正態(tài)分布)。 ⒉ 線性相關(guān)表示兩個(gè)變量之間的相互關(guān)系是雙向的,回歸則反映兩個(gè)變量之間的依存關(guān)系,是單向的。 ⒊ 如果對(duì)同一資料進(jìn)行相關(guān)與回歸分析,則得到的相關(guān)系數(shù)r與回歸方程中的b正負(fù)號(hào)是相同的。 ⒋ 在相關(guān)分析中,求出r后要進(jìn)行假設(shè)檢驗(yàn),同樣,在回歸分析中,對(duì)b也要進(jìn)行假設(shè)檢驗(yàn)。實(shí)際上,通過(guò)數(shù)學(xué)推導(dǎo),對(duì)同一樣本可以得出r與b互化的公式,同一樣本的這兩種假設(shè)檢驗(yàn)也是等價(jià)的。因此,由于r的假設(shè)檢驗(yàn)可以直接查表,較為簡(jiǎn)單,所以可以用其代替對(duì)b的假設(shè)檢驗(yàn)。 第四節(jié) 等級(jí)相關(guān) 如果觀測(cè)值是等級(jí)資料,則可以用等級(jí)相關(guān)來(lái)表達(dá)兩事物之間的關(guān)系。 等級(jí)相關(guān)是分析X、Y 兩變量等級(jí)間是否相關(guān)的一種非參數(shù)方法。 常用的等級(jí)相關(guān)方法是Spearman等級(jí)相關(guān)。 與線性相關(guān)系數(shù)r 一樣,等級(jí)相關(guān)系數(shù) rs的數(shù)值亦在 -1與 +1之間,數(shù)值為正表示正相關(guān),數(shù)值為負(fù)表示負(fù)相關(guān)。 思考題與參考答案 《數(shù)值變量資料的統(tǒng)計(jì)描述 統(tǒng)計(jì)表與圖》思考題 1.描述單變量資料的統(tǒng)計(jì)描述指標(biāo)分哪兩類(lèi),分別包括哪些指標(biāo)? 2.試述平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)的含意與用途。 3.什么是醫(yī)學(xué)參考值?如何制定95%的參考值范圍? 4.繪制統(tǒng)計(jì)表及統(tǒng)計(jì)圖的原則與要求是什么? 5.常見(jiàn)的統(tǒng)計(jì)圖有哪幾種?它們的適用條件是什么? 《數(shù)值變量資料的統(tǒng)計(jì)推斷》思考題 1.標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤有何區(qū)別和聯(lián)系。 2.t檢驗(yàn)和u檢驗(yàn)的公式有哪些類(lèi)型,在應(yīng)用上有哪些異同? 3.在統(tǒng)計(jì)推斷過(guò)程中,如何區(qū)別單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)。 4.可信區(qū)間和參考值范圍有何不同? 5.假設(shè)檢驗(yàn)和總體均數(shù)區(qū)間估計(jì)有何不同? 6.什么是一類(lèi)錯(cuò)誤與二類(lèi)錯(cuò)誤,有何關(guān)系? 7.方差分析的基本思想是什么? 8.描述t檢驗(yàn)與F檢驗(yàn)的適用條件。 《分類(lèi)變量資料的統(tǒng)計(jì)描述與統(tǒng)計(jì)推斷》思考題 1.常用的相對(duì)數(shù)指標(biāo)有哪些?它們?cè)谟?jì)算和意義上有哪些不同? 2.率的標(biāo)準(zhǔn)化的意義和基本思想是什么? 3.試述率的標(biāo)準(zhǔn)誤的意義和用途。 4.試述檢驗(yàn)的用途和各種檢驗(yàn)的適用條件。 5.列舉RC表檢驗(yàn)的注意事項(xiàng)。 6. 為什么不能以構(gòu)成比代替率?請(qǐng)聯(lián)系實(shí)際加以說(shuō)明。 7. 應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意哪些問(wèn)題? 《數(shù)值變量資料的統(tǒng)計(jì)描述 統(tǒng)計(jì)表與圖》思考題 1、描述單變量資料的統(tǒng)計(jì)描述指標(biāo)分哪兩類(lèi),分別包括哪些指標(biāo)? 答:?jiǎn)巫兞抠Y料的統(tǒng)計(jì)描述指標(biāo)分: (1)集中趨勢(shì)指標(biāo):包括算術(shù)平均數(shù)(簡(jiǎn)稱(chēng)均數(shù))、幾何均數(shù)、中位數(shù)與百分位數(shù)、眾數(shù)、調(diào)和均數(shù); (2)離散趨勢(shì)指標(biāo):包括全距、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。 2、試述平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)的含意與用途。 答:1、平均數(shù) (1)含意:平均數(shù)是一類(lèi)用于描述數(shù)值變量資料集中趨勢(shì)(或平均水平)的指標(biāo),包括算術(shù)平均數(shù)(適用條件是資料呈正態(tài)分布或近似正態(tài)分布或?qū)ΨQ(chēng)分布)、幾何平均數(shù)(適用于觀察值非對(duì)稱(chēng)分布、其差距較大時(shí),倍數(shù)關(guān)系或近似倍數(shù)關(guān)系)、中位數(shù)(適用于偏態(tài)分布、開(kāi)口、分布不確定)、眾數(shù)、調(diào)和均數(shù)。 (2)用途:描述數(shù)值變量資料集中趨勢(shì),進(jìn)行事物之間的分析比較。 2 、 標(biāo)準(zhǔn)差 (1)含意:指將方差開(kāi)平方,取平方根的正值。反映資料的離散程度。 (2)用途:①反映一組觀察值的離散程度,標(biāo)準(zhǔn)差小,離散程度小,均數(shù)的代表性好;②用于計(jì)算變異系數(shù);③計(jì)算標(biāo)準(zhǔn)誤;④結(jié)合均值與正態(tài)分布的規(guī)律估計(jì)醫(yī)學(xué)參考值的范圍。 3、變異系數(shù) (1)含意:是將標(biāo)準(zhǔn)差轉(zhuǎn)化為算術(shù)均數(shù)的倍數(shù),以百分?jǐn)?shù)的形式表示。 (2)用途:用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。 3、什么是醫(yī)學(xué)參考值?如何制定95%的參考值范圍? 答: 醫(yī)學(xué)參考值是指絕大多數(shù)正常人的各種生理、生化數(shù)據(jù),組織或排泄物中各種成分的含量范圍。 制定95%的參考范圍:從正常人總體中抽樣;控制測(cè)量誤差;判定是否需要分組確定參考范圍;決定取單側(cè)還是雙側(cè);選定合適的百分界限;對(duì)資料的分布進(jìn)行正態(tài)性檢驗(yàn);根據(jù)資料的分布類(lèi)型選定適當(dāng)?shù)姆椒ㄟM(jìn)行參考范圍的估計(jì)。 4、繪制統(tǒng)計(jì)表及統(tǒng)計(jì)圖的原則與要求是什么? 答:繪制統(tǒng)計(jì)表的原則:(1)重點(diǎn)突出,簡(jiǎn)單明了; (2)主謂分明,層次清楚; (3)數(shù)據(jù)準(zhǔn)確,便于分析。 基本要求:(1)標(biāo)題:簡(jiǎn)明扼要說(shuō)明表的中心內(nèi)容,必要時(shí)注明研究事物現(xiàn)象發(fā)生的時(shí)間、地點(diǎn)等。標(biāo)題一般寫(xiě)在表的正上方。 (2)標(biāo)目:橫標(biāo)目和縱標(biāo)目。橫標(biāo)目列在表的左側(cè),表明被研究事物的主要特征;縱標(biāo)目列在表的右上端,說(shuō)明橫標(biāo)目?jī)?nèi)容的各項(xiàng)統(tǒng)計(jì)指標(biāo)。標(biāo)目的排列應(yīng)有一定的次序。 (3)線條:一般包括頂線、縱標(biāo)目下線、合計(jì)上線、底線。 (4)數(shù)字:表內(nèi)數(shù)字一律用阿拉伯?dāng)?shù)字,同一指標(biāo)的小數(shù)位數(shù)保留、單位、精度一致,上下位次對(duì)齊,表內(nèi)不留空格。數(shù)據(jù)暫缺或未記錄可用“…”,數(shù)據(jù)不可能得到用“—”,數(shù)據(jù)為“0”時(shí)則填0。 (5)備注:一般不列入表內(nèi),必要時(shí)可用“*”,解釋在表的下面。 繪制統(tǒng)計(jì)圖的原則:用幾何圖形的位置、大小、長(zhǎng)短、面積等特征來(lái)表現(xiàn)數(shù)據(jù)信息,將數(shù)據(jù)形象化。與統(tǒng)計(jì)表相比,更直觀。但只是粗略表達(dá),只能做統(tǒng)計(jì)表的補(bǔ)充。 基本要求:(1)標(biāo)題:概括圖的內(nèi)容,應(yīng)簡(jiǎn)明確切,一般置于圖域的下方。一篇文獻(xiàn)中有多幅統(tǒng)計(jì)圖時(shí),標(biāo)題前應(yīng)表注序號(hào)。 (2)圖域:長(zhǎng)寬比例一般為7:5或5:7。 (3)標(biāo)目:一般在縱軸左側(cè)和橫軸下方 (4)刻度:常用算術(shù)尺度和對(duì)數(shù)尺度,刻度值一般標(biāo)注與縱軸外側(cè)和橫軸上側(cè)。 (5)圖例:圖例一般放在橫標(biāo)目下方,若空間較多可放在圖域中。 5、常見(jiàn)的統(tǒng)計(jì)圖有哪幾種?它們的適用條件是什么? 答:常用統(tǒng)計(jì)圖有:按圖示形式有條圖、直方圖、百分條圖、圓圖、散點(diǎn)圖、線圖、統(tǒng)計(jì)地圖以及在探索性分析時(shí)用的莖葉圖、殘差圖、箱式圖,判別分析的類(lèi)別分布圖,聚類(lèi)分析的譜系圖等。 使用條件:(1)條圖:適于彼此相互獨(dú)立的現(xiàn)象間相同指標(biāo)的比較。 (2)圓圖:用于表示全體各部分的構(gòu)成情況,百分比的情況。 (3)線圖:適用于連續(xù)性變量或某一現(xiàn)象隨另一現(xiàn)象變遷的情況。 (4)半對(duì)數(shù)線圖:用語(yǔ)表示事物現(xiàn)象發(fā)展變化的速度(相對(duì)比),常用語(yǔ)兩個(gè)或多個(gè)事物現(xiàn)象在發(fā)展速度上的對(duì)比。 (5)直方圖:適用于某連續(xù)性資料的分布。 (6)散點(diǎn)圖:適用于雙變量統(tǒng)計(jì)分析。 (7)統(tǒng)計(jì)地圖:用與顯示不同地域事物數(shù)量的分布情況。 《數(shù)值變量資料的統(tǒng)計(jì)推斷》思考題 1、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤有何區(qū)別和聯(lián)系。 答:區(qū)別:①標(biāo)準(zhǔn)差是表示個(gè)體之間的變異度,其值越大,說(shuō)明變異程度越大。 標(biāo)準(zhǔn)差同時(shí)是表示觀察值與樣本均值之間的離散程度,標(biāo)準(zhǔn)差越大,說(shuō)明離散程度越大,從而也說(shuō)明均數(shù)反映平均水平代表性欠佳。 ②標(biāo)準(zhǔn)誤即樣本均數(shù)的標(biāo)準(zhǔn)差。表示樣本均數(shù)之間的變異度以及樣本均數(shù)與總體均數(shù)之間的離散度。標(biāo)準(zhǔn)誤越大,均數(shù)的抽樣誤差就越大,說(shuō)明樣本均數(shù)與總體均數(shù)的差異越大。 聯(lián)系: 即當(dāng)樣本例數(shù)n一定時(shí),標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比;當(dāng)標(biāo)準(zhǔn)差一定時(shí),標(biāo)準(zhǔn)誤與樣本含量n的平方根成反比。 2、t檢驗(yàn)和u檢驗(yàn)的公式有哪些類(lèi)型,在應(yīng)用上有哪些異同? 答:t檢驗(yàn)和u檢驗(yàn)的公式類(lèi)型如下: ⑴ 樣本均數(shù)與總體均數(shù)的比較: 已知總體均數(shù)一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。 樣本與總體均數(shù)比較的目的是推斷樣本所代表的未知的總體均數(shù)與0是否相同。用統(tǒng)計(jì)量t的計(jì)算公式: ⑵配對(duì)資料的比較:用檢驗(yàn)統(tǒng)計(jì)量t值公式: ⑶兩個(gè)樣本均數(shù)的比較: ①兩個(gè)大樣本均數(shù)的比較:當(dāng)兩個(gè)樣本量較大(均>50)時(shí),自由度足夠大,可用u檢驗(yàn)。公式為: ②兩個(gè)小樣本均數(shù)的比較:推斷μ1是否等于μ2,作與比較的t檢驗(yàn),公式為: 在應(yīng)用上的異同:t檢驗(yàn)和μ檢驗(yàn)通常用于兩均數(shù)的比較。 μ檢驗(yàn)用于已知總體標(biāo)準(zhǔn)差情況下的樣本均數(shù)與總體均數(shù)比較與大樣本資料的兩均數(shù)比較,要求資料服從對(duì)稱(chēng)或正態(tài)分布; t檢驗(yàn)常用于樣本例數(shù)n較小、總體標(biāo)準(zhǔn)差未知時(shí)樣本與總體均數(shù)的比較,配對(duì)設(shè)計(jì)資料的比較與兩個(gè)樣本均數(shù)的比較。 兩樣本均數(shù)比較時(shí)還要求所對(duì)應(yīng)總體方差齊同,資料服從正態(tài)分布。 3、在統(tǒng)計(jì)推斷過(guò)程中,如何區(qū)別單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)。 答:應(yīng)事先根據(jù)專(zhuān)業(yè)知識(shí)和問(wèn)題的要求,在實(shí)驗(yàn)設(shè)計(jì)時(shí)做出規(guī)定,而不能在計(jì)算出檢驗(yàn)統(tǒng)計(jì)量后才確定。對(duì)同一份資料,單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更易得到差別有顯著性的結(jié)論。因此,在報(bào)告討論時(shí),應(yīng)列出檢驗(yàn)方法、檢驗(yàn)統(tǒng)計(jì)量的值、檢驗(yàn)水準(zhǔn)和P值的確切范圍,還要著名采用的是單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn),然后結(jié)合專(zhuān)業(yè)做出結(jié)論。 4、可信區(qū)間和參考值范圍有何不同? 答:可信區(qū)間反映區(qū)間包含總體均數(shù)的概率大小,即1-α大小,越趨近1越好;反映區(qū)間的長(zhǎng)度,長(zhǎng)度越小越好,即1-α一定,n越大精度越高。 參考值范圍是正常人指標(biāo)測(cè)定值的波動(dòng)范圍,參考值范圍在診斷方面可用于劃分正?;虍惓?。 5、假設(shè)檢驗(yàn)和總體均數(shù)區(qū)間估計(jì)有何不同? 答:總體均數(shù)區(qū)間估計(jì)是從總體中做隨機(jī)抽樣,每個(gè)樣本可以算得一個(gè)可信區(qū)間,如95%可信區(qū)間,意味著做100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括總體均數(shù)(估計(jì)正確),只有5個(gè)可信區(qū)間不包括總體均數(shù)(估計(jì)錯(cuò)誤)。 假設(shè)檢驗(yàn),就是根據(jù)研究目的,對(duì)樣本所屬總體特征提出一個(gè)假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本提供的信息,推斷假設(shè)應(yīng)當(dāng)拒絕或不拒絕,使研究者了解在假設(shè)的條件下,差異由抽樣誤差引起的可能性大小。 6、什么是一類(lèi)錯(cuò)誤與而二類(lèi)錯(cuò)誤,有何關(guān)系? 答:一類(lèi)錯(cuò)誤是統(tǒng)計(jì)學(xué)中將拒絕了實(shí)際正確的無(wú)效假設(shè)Ho,即“棄真”,放棄本來(lái)成立的Ho所犯的錯(cuò)誤,概率α表示, 常取α=0.05。 二類(lèi)錯(cuò)誤是將接受了實(shí)際上錯(cuò)誤的無(wú)效假設(shè)Ho,概率用β表示,在統(tǒng)計(jì)學(xué)中將1-β稱(chēng)為檢驗(yàn)效能,即“取偽”接受本來(lái)不成立的Ho所犯的錯(cuò)。 關(guān)系:一類(lèi)誤差認(rèn)為規(guī)定,二類(lèi)誤差大小隨一類(lèi)誤差增大而減?。辉龃髽颖玖?,可以同時(shí)減小兩類(lèi)誤差。 客觀實(shí)際 拒絕H0 不拒絕H0 H0成立 第一類(lèi)錯(cuò)誤(α) 判斷正確(1-α) H0 不成立 判斷正確(1-β) 第一類(lèi)錯(cuò)誤(β) 7、方差分析的基本思想是什么? 答:將總變異分解成兩個(gè)或多個(gè)變異,其中有一個(gè)是由隨機(jī)誤差引起的,而其他變異是由各自因素引起的。然后,比較各因素變異與誤差引起的變異,評(píng)價(jià)由某種因素引起的變異是否具有統(tǒng)計(jì)學(xué)意義。 總變異=組內(nèi)變異+組間變異 總變異:隨機(jī)測(cè)量誤差+個(gè)體變異+處理因素作用 組內(nèi)變異:隨機(jī)測(cè)量誤差+個(gè)體之間變異 組間變異:隨機(jī)測(cè)量誤差+個(gè)體之間變異+處理因素作用 F=組間變異均方/組內(nèi)變異均方 8、描述t檢驗(yàn)與F檢驗(yàn)的使用條件。 答:t檢驗(yàn)的使用條件:常用于樣本例數(shù)n較小、總體標(biāo)準(zhǔn)差未知是樣本與總體的比較,配對(duì)設(shè)計(jì)資料的比較和兩個(gè)樣本均數(shù)的比較。要求所對(duì)應(yīng)的總體方差齊同,資料服從正態(tài)分布。 F檢驗(yàn)的使用條件:各樣本來(lái)自正態(tài)分布的總體,且為相互獨(dú)立的隨機(jī)樣本,各個(gè)樣本所來(lái)自的總體相等。 《分類(lèi)變量資料的統(tǒng)計(jì)描述與統(tǒng)計(jì)推斷》 1、常用的相對(duì)數(shù)指標(biāo)有哪些?它們的意義和計(jì)算上有和不同? (1)比例(構(gòu)成比) 意義:用以說(shuō)明事物內(nèi)部各組成部分所占的比重或分布情況。 計(jì)算:構(gòu)成比=事物內(nèi)部某一組成部分的觀察單位數(shù)/事物各組成部分觀察單位總數(shù)(或100﹪) (2)率 意義:用以說(shuō)明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 計(jì)算:一定時(shí)間內(nèi)某現(xiàn)象發(fā)生率=一定時(shí)間內(nèi)某現(xiàn)象實(shí)際發(fā)生的觀察單位數(shù)/該時(shí)間段開(kāi)始時(shí)的觀察單位總數(shù) (3)比 意義:兩個(gè)有聯(lián)系的指標(biāo)之比。 計(jì)算:比=甲指標(biāo)計(jì)數(shù)/乙指標(biāo)計(jì)數(shù)(或100﹪) 3、試述率的標(biāo)準(zhǔn)誤的意義和用途。 意義:由于抽樣而引起的樣本率與總體率之間或樣本率之間的差異稱(chēng)為率的抽樣誤差,其大小用率的標(biāo)準(zhǔn)誤來(lái)表示。 用途:率的標(biāo)準(zhǔn)誤反映抽樣誤差的大小,標(biāo)準(zhǔn)誤越小,說(shuō)明率的抽樣誤差越小,用樣本推論總體時(shí),可信程度越高。 4、試述c2檢驗(yàn)的用途和c2檢驗(yàn)各種適用條件。 c2檢驗(yàn)的應(yīng)用: 1)兩個(gè)或兩個(gè)以上樣本率之間差異有無(wú)顯著性; 2)兩個(gè)或兩個(gè)以上樣本構(gòu)成比之間差異有無(wú)顯著性; 3)兩分類(lèi)變量間有無(wú)相關(guān)關(guān)系; 4)頻數(shù)分布的擬合優(yōu)度檢驗(yàn); 5)實(shí)際頻數(shù)與理論頻數(shù)的吻合程度檢驗(yàn)。 c2檢驗(yàn)的應(yīng)用條件: 1)n>=40,T>=5 卡方檢驗(yàn) 2)n>=40,1- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
5 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué) 醫(yī)學(xué) 統(tǒng)計(jì)學(xué) 復(fù)習(xí)資料 習(xí)題 答案
鏈接地址:http://www.3dchina-expo.com/p-13146551.html