《醫(yī)學(xué)統(tǒng)計學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc
《《醫(yī)學(xué)統(tǒng)計學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc》由會員分享,可在線閱讀,更多相關(guān)《《醫(yī)學(xué)統(tǒng)計學(xué)》復(fù)習(xí)資料與習(xí)題答案.doc(36頁珍藏版)》請在裝配圖網(wǎng)上搜索。
教學(xué)提要 (一)《醫(yī)用統(tǒng)計學(xué)》基本概念 1、變異:宇宙中的事物, 千差萬別, 各不相同。即使是性質(zhì)相同的事物, 就同一觀察指標來看, 各觀察指標(亦稱個體)之間, 也各有差異, 稱為變異。同質(zhì)觀察單位之間的個體變異, 是生物的重要特征, 是偶然性的表現(xiàn)。 2、變量:由于生物的變異特性, 使得觀察單位某種指標的數(shù)值互相不等, 所以個體值稱為變量值或觀察值。 3、總體:即根據(jù)研究目的確定的同質(zhì)的研究對象的全體。更確切地說, 是性質(zhì)相同的所有觀察單位的某種變量值的集合。 4、樣本: 即從總體中抽取一部分作為觀察單位進行觀察,這部分觀察單位稱為樣本。為了使樣本對總體有較好的代表性,抽樣必須遵循隨機化的原則,即總體中每一觀察單位均有相同的機會被抽取到樣本中去。 5、計量資料(數(shù)值變量資料): 對每個觀察單位用定量方法測定某項指標量的大小, 所得的資料稱為計量資料, 一般有度量衡等單位。 6、計數(shù)資料(分類變量資料): 將觀察單位按某種屬性或類別分組, 所得各組的觀察單位數(shù), 稱為計數(shù)資料??煞譃槎検交蚨囗検椒诸愖兞?。 7、等級資料:將觀察單位按某種屬性的不同程度分組, 所得各組的觀察單位數(shù), 稱為等級資料。這類資料與計數(shù)資料不同的是:屬性的分組有程度的差別, 各組按大小順序排列; 與計量資料不同的是:每個觀察單位未確切定量, 因而稱為半定量資料。 8、抽樣誤差:由于總體中各觀察單位間存在個體差異, 抽樣研究中抽取的樣本, 只包含總體的一部分, 因而樣本指標不一定等于相應(yīng)的總體指標, 這種樣本統(tǒng)計量與總體參數(shù)間的差別稱為抽樣誤差。 (二)統(tǒng)計工作的基本步驟 1、設(shè)計: 這是關(guān)鍵的一步。要求科學(xué)、周密、簡明。 2、搜集資料: 要求完整、準確、及時。 醫(yī)學(xué)統(tǒng)計資料的來源主要有三個方面:(1) 統(tǒng)計報表; (2) 日常醫(yī)療工作的原始記錄和報告卡片; (3) 專題調(diào)查 3、整理資料: 核查資料; 按性質(zhì)或數(shù)量分組, 擬定整理表。 4、分析資料: 包括指標的計算、統(tǒng)計圖表的繪制, 用統(tǒng)計方法如參數(shù)估計、假設(shè)檢驗等對資料作統(tǒng)計分析。 (三) 計量資料的分析 1、平均數(shù): 用以描述同質(zhì)計量資料頻數(shù)分布的集中趨勢, 反映一組變量值的平均水平, 是一組變量值的代表值。 (1) 算術(shù)均數(shù): 簡稱均數(shù)。用于描述對稱分布(特別是呈正態(tài)分布)的變量值的平均水平。 直接法: `x=Sx/n 加權(quán)法: `x=Sx/S=Sx/n 要點: 頻數(shù)表的制作 (2) 幾何均數(shù): 用G表示。用于描述變量值呈等比數(shù)列, 或呈對數(shù)正態(tài)分布或近似對數(shù)正態(tài)分布資料。 直接法: G=`x1x2 x3 xn , G=lg-1( Slgx/n ) 加權(quán)法: G=lg-1 ( Slgx/S ) (3) 中位數(shù)和百分位數(shù): 中位數(shù)是一組從小到大順序排列的變量值, 位于中間位置的數(shù)值,亦稱為位置平均數(shù), 代號為M。多用于描述偏態(tài)分布資料, 或分布不明資料, 或一端或兩端無確定數(shù)值的開口資料的集中趨勢。百分位數(shù)代號為PX, 是一種位置指標。 小樣本資料中位數(shù)計算方法: 當(dāng)n為奇數(shù)時 M=X(n+1/2) 當(dāng)n為偶數(shù)時 M=[ X(n/2)+X(n/2+1) ] 大樣本資料中位數(shù)和百分位數(shù)計算方法: PX =L+I ( nx% - SL ) 2、變異指標 (1) 全距: R, 亦稱極差。即一組變量值中最大值與最小值之差。 (2) 標準差: 是最常用來衡量變量值間離散程度的變異指標??傮w標準差代號s,樣本標準差代號s。 運用:” 用來描述正態(tài)分布資料的變異程度。當(dāng)資料呈正態(tài)或近似正態(tài)資料時往往將均數(shù)與標準差同時寫出: `X S, 表示均數(shù)的代表性。 (3) 變異系數(shù): 又稱離散系數(shù)。代號為CV。CV= 運用: 比較均數(shù)相差懸殊的幾組資料的變異程度; 比較度量衡單位不同的幾組資料的變異程度。 3、正態(tài)分布及其應(yīng)用 (1) 正態(tài)分布: 是醫(yī)學(xué)和生物學(xué)中最常見的總體頻數(shù)分布, 以均數(shù)為中心, 對稱,兩側(cè)逐漸下降, 兩端永遠不與橫軸相交。正態(tài)分布用N(m, s2)表示, 為了應(yīng)用方便, 常對變量X作u=( X - m )/ s變換, 使m=0, s=1, 則正態(tài)分布轉(zhuǎn)換為標準正態(tài)分布( 或呈U分布), 用N(0, 1)表示。 特征: 均數(shù)處最高; 以均數(shù)為中心, 左右對稱; 有兩個參數(shù): m和s; 態(tài)曲線下的面積分布有一定規(guī)律: 變量值范圍 正態(tài)曲線下面積(變量值出現(xiàn)的概率) m 1.0 s 68.27% m 1.96 s 95.00% m 2.58 s 99.00% (2) 正態(tài)分布的應(yīng)用: 常用于估計頻數(shù)分布情況; 制定正常值范圍。 正常值: 指正常人的各種生理常數(shù)。當(dāng)資料呈正態(tài)分布時, 最常用X 1.96S估計95%正常值范圍, 其含義是指絕大多數(shù)正常的變量值都在這個范圍內(nèi), 絕大多數(shù)是包括正常的80%、90%、95%和99%, 最常用95%。 4、均數(shù)的抽樣誤差和標準誤 (1) 標準誤的概念 即樣本均數(shù)的標準差, 是說明均數(shù)抽樣誤差大小的指標。標準誤愈小, 表示抽樣誤差愈小, 樣本統(tǒng)計量對總體參數(shù)的估計愈可靠。 (2) 標準誤的計算 sx=s/`n(總體標準誤) sx=s/`n(樣本標準誤) (3) 標準誤的應(yīng)用 表示樣本均數(shù)的散布情形; 估計總體均數(shù)的可信區(qū)間; 進行假設(shè)檢驗 5、t分布和總體均數(shù)的估計 (1) t分布的概念 對正態(tài)變量`X采用u=( `X - m )/ sx變換, 將N(m, sx2)變換為標準正態(tài)分布, 即U分布, 而實際中sx往往用sx來估計, 這時對正態(tài)變量`X采用的不是U變換而是t變換, 即 t = ( `X - m )/ sx 其結(jié)果也不是U分布而是t分布。 (2) t分布的特征 與標準正態(tài)分布相比有以下特征: a.二者都是單峰分布, 以0為中心, 左右對稱; b. t分布的峰部較矮而尾部翹得較高, 說明遠側(cè)的t值的個數(shù)相對較多, 即尾部面積 (概率P) 較大。自由度u越小這種情況越明顯, u逐漸增大時, t分布逐漸逼近標準正態(tài)分布; 當(dāng)u=時, t分布就完全成為標準正態(tài)分布了。 (3)t界值 t界值表, 橫標目為自由度u, 縱標目為概率P, 表中數(shù)字表示自由度為u, P為a(檢驗水準)時, t的界值, 常記為ta,u。理論上 單側(cè): P( t - ta,u)= a, 或P(t ta,u)= a 雙側(cè): P( t - ta,u)+P(t ta,u)= a; P( - ta,u < t < ta,u)= 1 - a (4)總體均數(shù)的估計 包括點值估計和區(qū)間估計。 a.區(qū)間估計的涵義: 意思是從總體中作隨機抽樣, 每個樣本可以算得一個可信區(qū)間, 如95%可信區(qū)間, 意味著做100個可信區(qū)間, 平均有95個可信區(qū)間包括總體均數(shù)(估計正確), 只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。 b.區(qū)間估計的方法: `X -- ta,u sx < m <`X + ta,u sx ; s已知 `X - Ua,sx < m <`X + Ua,sx ; s未知但n足夠大 `X - Ua,sx < m <`X + Ua, sx ; 6、假設(shè)檢驗 (1) 概念 所謂假設(shè)檢驗, 就是根據(jù)研究目的, 對樣本所屬總體特征提出一個假設(shè), 然后用適當(dāng)方法根據(jù)樣本提供的信息, 推斷該假設(shè)應(yīng)當(dāng)拒絕或不拒絕, 以使研究者了解在假設(shè)的條件下, 差異由抽樣誤差引起的可能性大小, 便于比較分析。 (2) 一般步驟 a.建立假設(shè): H0: 無效假設(shè)。即假設(shè)樣本指標與總體指標, 或樣本與樣本指標是相等的, 它們的差別是由抽樣誤差引起的。H1: 備擇假設(shè)。是與H0相對立的假設(shè)。 b.確定檢驗水準: 亦稱顯著性水準, 代號為a, 是一個接受或拒絕H0的概率標準。常取a = 0.05或a = 0.01 c.選定檢驗方法和計算統(tǒng)計量: t檢驗, U檢驗, c2檢驗等。 d.確定P值:P值是指在由H0所規(guī)定的總體中作隨機抽樣, 獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率。 e.做出統(tǒng)計推斷: 當(dāng)P a時, 統(tǒng)計推斷結(jié)論為按所取檢驗水準拒絕H0, 接受H1, 差別有顯著性意義。 (3) 計量資料的假設(shè)檢驗 a.樣本均數(shù)與總體均數(shù)的比較: H0: m = m0 t = ( `X - m )/ sx u = n -1 b.配對資料的t檢驗: 即差值均數(shù)與總體均數(shù)0比較的t檢驗。 配對資料: 對同對的兩個受試對象分別給予兩種處理;對同一受 試對象分別給予兩種處理; 同一受試對象處理前后的 比較。 H0: md = 0 t = `d / sd c.兩樣本均數(shù)的t檢驗: H0: m1 = m2 t = ( `X1 - `X2)/ sx1-x2 u = n1 + n2 -2 d. 兩大樣本均數(shù)的U檢驗: H0: m1 = m2 U = ( `X1 - `X2)/ sx12+sx22 e.多個樣本比較F分析:F=MS組間/MS組內(nèi) (4) t、F檢驗的應(yīng)用條件: a. 要求資料呈正態(tài)分步; b. 要求總體方差相等c.獨立樣本 (5) U檢驗的應(yīng)用條件: 樣本例數(shù)較大或總體標準差已知 (6) 第一類錯誤與第二類錯誤 第一類錯誤: 拒絕實際上是成立的H0, 概率為a。 第二類錯誤: 不拒絕實際上是不成立的H0, 概率為b, 1 - b稱為檢驗效能或把握度。 (7) 假設(shè)檢驗時應(yīng)注意的問題 a. 要有嚴密的抽樣研究設(shè)計; b. 選用的假設(shè)檢驗方法應(yīng)符合其應(yīng)用條件; c. 正確理解差別有無顯著性的條件意義; d. 結(jié)論不能絕對化; e. 報告結(jié)論時注意應(yīng)列出檢驗統(tǒng)計量值, 注明采用的是單側(cè)或雙側(cè)檢驗, 寫出P值確切范圍。 ( 四 )計數(shù)資料的分析 1、常用相對數(shù): 分析計數(shù)資料的指標。 ( 1 ) 率: 表示某種現(xiàn)象發(fā)生的頻度或強度。 率= 某現(xiàn)象實際發(fā)生例數(shù)/可能發(fā)生該現(xiàn)象的總例數(shù) 比例基數(shù)( 習(xí)慣上以計算的率保留1 - 2位整數(shù)) ( 2 ) 構(gòu)成比: 說明事物內(nèi)部各組成部分所占的比重或分布。 構(gòu)成比= 某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù) 100% ( 3 ) 相對比: 兩個有關(guān)指標之比, 用以表示兩個指標之間的對比關(guān)系。 2、應(yīng)用相對數(shù)時應(yīng)注意的問題 (1) 計算相對數(shù)的分母不宜太小; (2) 分析時不能以構(gòu)成比代替率; (3) 對觀察單位數(shù)不等的幾個率, 不能直接相加就其平均率; (4) 資料的對比應(yīng)注意可比性: a.觀察對象同質(zhì); b.內(nèi)部構(gòu)成相同。 (5) 對樣本率( 或構(gòu)成比 )的比較應(yīng)遵循隨機抽樣, 要作假設(shè)檢驗。 3、標準化法 (1) 概念: 即采用一個共同的內(nèi)部構(gòu)成標準, 使兩個樣本或多個樣本的不同內(nèi)部構(gòu)成調(diào)整為共同的內(nèi)部構(gòu)成標準, 以消除因內(nèi)部構(gòu)成不同對樣本率的影響。標準化后的率叫標準化率。 (2) 計算方法: 直接法、間接法。 (3) 注意事項: a. 選定標準不同, 算得的標準化率也不同, 因此不能代表實際水平; b. 各組間若出現(xiàn)明顯交叉, 不宜用標準化法; c. 兩樣本標化率的比較應(yīng)作假設(shè)檢驗。 4、常用相對數(shù)指標 (1) 出生率=某年活產(chǎn)數(shù)/同年平均人口數(shù) 1000% (2) 死亡率=某年死亡總數(shù)/同年平均人口數(shù) 1000% (3) 發(fā)病率=某人群某時期內(nèi)新病例數(shù)/某人群同期平均人口數(shù) K (4) 某病患病率=觀察時點某病例數(shù)/同時點檢查人數(shù) K (5) 某病感染率=受檢者感染某病原體人數(shù)/受檢人數(shù) K (6) 治愈率= 治愈病人數(shù)/接受治療人數(shù) 100% (7) 某病病死率=某期間因某病死亡人數(shù)/同期該病患者 100% (8) 生存率=n年末存活的病例數(shù)/隨訪滿n年的病例數(shù) 100% 5、率的抽樣誤差和率的標準誤 (1) 概念: 由抽樣造成的樣本率與總體率的差別叫率的抽樣誤差。衡量率的抽樣誤差大小, 衡量樣本率的穩(wěn)定性的指標, 即率的標準誤。 (2) 率的標準誤的計算 sP =p( 1 - p )/n SP =P( 1 - P )/n (3) 總體率的區(qū)間估計 a. 查表法: n較小, 特別是p接近0或1時 b.正態(tài)近似法: n足夠大, 樣本率p和(1 - p)均不太小, 如np與n( 1 - p )均大于5時 ( p - ua SP , p + ua SP ) 6、計數(shù)資料的假設(shè)檢驗----U檢驗 (1) 條件: n足夠大, 樣本率p和(1 - p)均不太小, 如np與n( 1 - p )均大于5時, 樣本率的分布呈正態(tài)分布。 (2) 樣本率與總體率的比較 H0: p = p0 u = p - p/ sP (3) 兩樣本率比較的u檢驗 H0: p1 = p0 u = p1 - p2/ SP1 - P2 7、計數(shù)資料的假設(shè)檢驗-----c2檢驗 (1) 用途 常用于檢驗兩個樣本率(或構(gòu)成比)之間的差異顯著性, 也可用于檢驗多個樣本率之間的差異顯著性, 還可用于檢驗配對計數(shù)資料的差異顯著性。 (2) 基本思想 c2 = S( A - T)2/T T = nRnC/n c2反映了實際頻數(shù)與理論頻數(shù)的吻合程度。 c2的大小取決于A - T的差值, 還取決于自由度u。 u = ( 行數(shù)- 1 )( 列數(shù)- 1 ) (3) 四格表資料的c2檢驗( 兩樣本率比較 ) 統(tǒng)計量的計算可用專用公式或基本公式 a. 基本條件: n > 40, T > 1 b. 校正條件: n > 40, 5 > T > 1 (4) 行 列表的c2檢驗( 多個樣本率或構(gòu)成比的比較) a. c2值的計算: c2 = n( A2/nRnC - 1 ) b. 注意事項: c2檢驗要求理論頻數(shù)不宜太小, 一般認為不宜有1/5以上格子理論數(shù)小于5, 或有一個理論數(shù)小于1, 處理辦法有: 增大一般含量, 最好; 刪去理論頻數(shù)太小的行或列; 合并性質(zhì)相近的行或列。等級資料宜用秩和檢驗。當(dāng)結(jié)論為拒絕檢驗假設(shè), 只能認為各總體率( 或總體構(gòu)成比 )之間總的來說有差別, 但不能說明它們彼此之間都有差別。 (5) 配對計數(shù)資料的c2檢驗 a. H0 : b = c b. c2 =( b - c )2/ b + c c. b + c < 40, 需校正, c2 =( b - c - 1)2/b + c d. u = 1 (五) 統(tǒng)計表與統(tǒng)計圖 1、統(tǒng)計表 (1) 基本結(jié)構(gòu)與要求: 由標題、標目、線條、數(shù)字等組成 a. 標題: 要求中心內(nèi)容突出, 必要時注明資料的時間、地點。 b. 標目: 橫標目: 在表的左側(cè), 是表的主語位置。 縱標目: 在表的上方, 是表的謂語位置。 c. 線條: 分頂線、底線、縱標目下面與合計上面的橫線,斜線、豎線省略。 d. 數(shù)字: 一律用阿拉伯?dāng)?shù)字。 e. 備注: 列于表的下面, 對表中標有 ( * )的數(shù)字加以描述。 (2) 種類 a. 簡單表: 被研究的事物只按一個特征或指標分組。 b. 復(fù)合表: 被研究的事物按兩個或兩個以上相關(guān)聯(lián)的特征或指標分組。 2、統(tǒng)計圖 (1) 基本要求: a. 依據(jù)資料的性質(zhì)選擇適當(dāng)?shù)膱D形; b. 要有標題, 扼要說明資料的內(nèi)容, 必要時注明時間、地點; c. 以縱軸和橫軸為坐標的圖形, 橫軸尺度自左而右, 縱軸尺度自下而上, 數(shù) 量一律由小到大, 并需等距標明。縱橫坐標長度的比例一般為5: 7。 d. 比較不同事物時, 用不同的線條或顏色表示, 要附圖例說明。 3、常用統(tǒng)計圖 (1) 直條圖: 用相同寬度條形的長短.來表示資料數(shù)值大小比例關(guān)系, 適用于按性質(zhì)分組, 各個獨立的、無連續(xù)關(guān)系的統(tǒng)計圖。 (2) 百分條圖: 適用于表達構(gòu)成比的資料。 (3) 線圖: 用線條的上升和下降來表示某事物( 或某現(xiàn)象 )因時間或條件而變化的趨勢。 適用于連續(xù)性的變量資料。 (4) 直方圖: 用于表示連續(xù)變量的頻數(shù)分布。常以橫軸表示被觀察現(xiàn)象, 縱軸表示頻數(shù)或 頻率, 以各矩形( 寬度為組距 )的面積代表各組段的頻數(shù)。 (六) 調(diào)查設(shè)計 1、調(diào)查方法 (1) 普查( 全面調(diào)查 ): 將組成總體的所有觀察單位全部加一調(diào)查。 (2) 抽樣調(diào)查: 從總體中隨機抽取一定數(shù)量的觀察單位組成樣本, 然后用樣本信息來推斷 總體特征。 (3) 典型調(diào)查( 案例調(diào)查 ): 即在對事物作全面分析的基礎(chǔ)上, 有目的地選定典型的人、典 型的單位進行調(diào)查。 2、調(diào)查項目和調(diào)查表 (1) 分析項目: 直接用于計算調(diào)處指標, 以及分析時排除混雜因素影響所必須得分內(nèi)容。 (2) 備查項目: 便于核查、補填和更正而設(shè)置的, 通常不直接用于分析。 (3) 調(diào)查表的格式: 分為一覽表和單一表。 (4) 隨機抽樣的方法: a. 單純隨機抽樣; b. 系統(tǒng)抽樣; c. 整群抽樣; d. 分層抽樣; 根據(jù)抽樣誤差的大小, 分層抽樣 < 系統(tǒng)抽樣 < 單純隨機抽樣 < 整群抽樣 第十章 線性相關(guān)與回歸 (Linear Correlation & Regression ) 線性相關(guān)與回歸 第一節(jié) 線性相關(guān) 第二節(jié) 線性回歸 第三節(jié) 線性相關(guān)與回歸的區(qū)別和聯(lián)系 第三節(jié) 等級相關(guān) 線性相關(guān)(linear correlation) 一、線性相關(guān)的基本概念 二、線性相關(guān)系數(shù) 三、相關(guān)系數(shù)的顯著性檢驗 四、進行線性相關(guān)分析的注意事項 一、線性相關(guān)的基本概念 為直觀地判斷兩個變量之間的關(guān)系,可在直角坐標系中把每對(Xi,Yi)值所代表的點繪出來,形成散點圖。 若一個變量X由小到大(或由大到小),另一變量Y亦相應(yīng)地由小到大或由大到小,則兩個 變量的散點圖呈直線趨勢,我們稱這種現(xiàn)象為共變,也就是這兩個變量之間有“相關(guān)關(guān)系”。 男青年身高與前臂長散點呈直線趨勢,即男青年身材高,前臂亦長,說明身高與前臂長之間存在線性相關(guān)關(guān)系我們把這種關(guān)系稱為直線相關(guān)。 線性相關(guān)用于雙變量正態(tài)資料。它的性質(zhì)可由散點圖直觀地說明。散點圖中點的分布即線性相關(guān)的性質(zhì)和相關(guān)之間的密切程度,可分為以下幾種情況: 1.正相關(guān) 2.負相關(guān) 3.無相關(guān) 線性相關(guān)系數(shù) 在分析兩個變量X與Y之間關(guān)系時,常常要了解X與Y之間 有無相關(guān)關(guān)系,相關(guān)是否密切,是呈正相關(guān)還是負相關(guān)。相關(guān)系數(shù)就是說明具有直線關(guān)系的兩個變量間相關(guān)密切程度和相關(guān)方向的統(tǒng)計量。 皮爾森(Pearson)相關(guān)系數(shù)的計算公式為: 相關(guān)系數(shù)r沒有測量單位,其數(shù)值為-1≤≤+1 相關(guān)系數(shù)的計算方法 計算時分別可用下面公式帶入相關(guān)系數(shù)r的計算公式中 例10.1 從男青年總體中隨機抽取11名男青年組成樣本,分別測量每個男青年的身高和前臂長,身高和前臂長均以cm為單位,測量結(jié)果如下表所示,試計算身高與前 臂長之間的相關(guān)系數(shù)。 編號 身高(cm) 前臂長(cm) XY X2 Y2 (X) (Y) 1 170 47 7990 28900 2209 2 173 42 7266 29929 1764 3 160 44 7040 25600 1936 4 155 41 6355 24025 1681 5 173 47 8131 29929 2209 6 188 50 9400 35344 2500 7 178 47 8366 31684 2209 8 183 46 8418 33489 2116 9 180 49 8820 32400 2401 10 165 43 7095 27225 1849 11 166 44 3174 28561 2116 合計 1891 500 86185 326081 22810 相關(guān)系數(shù)的顯著性檢驗 與前面講的其它統(tǒng)計量一樣,根據(jù)樣本資料計算出來的相關(guān)系數(shù)同樣存在抽樣誤差。即假設(shè)在一個X與Y無關(guān)總體中作隨機抽樣,由于抽樣誤差的影響,所得的樣本相關(guān)系數(shù)也常常不等于零。 因此要判斷兩個變量X與Y是否真的存在相關(guān)關(guān)系,仍需根據(jù)作總體相關(guān)系數(shù)ρ是否為零的假設(shè)檢驗。 常用的檢驗方法有兩種: 1.按自由度直接查附表11的界值表,得到P 值。 2.用假設(shè)檢驗法,計算統(tǒng)計量 進行線性相關(guān)分析的注意事項 ⒈ 線性相關(guān)表示兩個變量之間的相互關(guān)系是雙向的,分析兩個變量之間到底有無相關(guān)關(guān)系可首先繪制散點圖,散點圖呈現(xiàn)出直線趨勢時,再作分析。 ⒉ 相關(guān)系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的情形,如果資料不服從正態(tài)分布,應(yīng)先通過變量變換,使之正態(tài)化,再根據(jù)變換值計算相關(guān)系數(shù)。 ⒊ 依據(jù)公式計算出的相關(guān)系數(shù)僅是樣本相關(guān)系數(shù),它是總體相關(guān)系數(shù)的一個估計值,與總體相關(guān)系數(shù)之間存在著抽樣誤差,要判斷兩個事物之間有無相關(guān)及相關(guān)的密切程度,必須作假設(shè)檢驗。 ⒋ 相關(guān)分析是用相關(guān)系數(shù)來描述兩個變量間相互關(guān)系的密切程度和方向,而兩個事物之間的關(guān)系既可能是依存因果關(guān)系,也可能僅是相互伴隨的數(shù)量關(guān)系。決不可因為兩事物間的相關(guān)系數(shù)有統(tǒng)計學(xué)意義,就認為兩者之間存在著因果關(guān)系,要證明兩事物間確實存在因果關(guān)系,必須憑借專業(yè)知識加以闡明。 相關(guān)是分析兩個正態(tài)變量X與Y之間的互相關(guān)系。在相關(guān)分析中,分不清X與Y何者為自變量,何者為因變量?,F(xiàn)在假設(shè)兩個變量X 、Y 中,當(dāng)一個變量X 改變時,另一個變量 Y 也相應(yīng)地改變,當(dāng)這樣的兩個變量之間存在著直線關(guān)系時,不僅可以用相關(guān)系數(shù) r 表示變量Y與X線性關(guān)系的密切程度,也可以用一個直線方程來表示 Y 與 X 的線性關(guān)系。 根據(jù)大量實測數(shù)據(jù),尋找出其規(guī)律性,尋求一個直線方程來描述兩個變量間依存變化的近似的線性數(shù)量關(guān)系,即線性回歸關(guān)系,這樣得出的直線方程叫做線性回歸方程。 進行線性回歸分析的注意事項 ⒈ 只有將兩個內(nèi)在有聯(lián)系的變量放在一起進行回歸分析才是有意義的。 ⒉ 作回歸分析時,如果兩個有內(nèi)在聯(lián)系的變量之間存在的是一種依存因果的關(guān)系,那么應(yīng)該以“因”的變量為X ,以“果”的變量為Y 。如果變量之間并無因果關(guān)系,則應(yīng)以易于測定、較為穩(wěn)定或變異較小者為X 。 ⒊ 在回歸分析中,因變量是隨機變量,自變量既可以是隨機變量(II型回歸模型,兩個變量應(yīng)該都服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時,與每個X 取值相對應(yīng)的變量Y必須服從正態(tài)分布),如果數(shù)據(jù)不符合要求,在進行回歸分析前,必須先進行變量的變換。 ⒋ 回歸方程建立后必須作假設(shè)檢驗,只有經(jīng)假設(shè)檢驗拒絕了無效假設(shè),回歸方程才有意義。 ⒌ 使用回歸方程計算估計值時,不可把估計的范圍擴大到建立方程時的自變量的取值范圍之外。 第三節(jié) 線性相關(guān)和回歸的區(qū)別與聯(lián)系 ⒈ 相關(guān)系數(shù)的計算只適用于兩個變量都服從正態(tài)分布的情形,而在回歸分析中,因變量是隨機變量,自變量既可以是隨機變量(II型回歸模型,兩個變量都應(yīng)該服從正態(tài)分布),也可以是給定的量(I型回歸模型,這時,與每個X 取值相對應(yīng)的變量Y必須服從正態(tài)分布)。 ⒉ 線性相關(guān)表示兩個變量之間的相互關(guān)系是雙向的,回歸則反映兩個變量之間的依存關(guān)系,是單向的。 ⒊ 如果對同一資料進行相關(guān)與回歸分析,則得到的相關(guān)系數(shù)r與回歸方程中的b正負號是相同的。 ⒋ 在相關(guān)分析中,求出r后要進行假設(shè)檢驗,同樣,在回歸分析中,對b也要進行假設(shè)檢驗。實際上,通過數(shù)學(xué)推導(dǎo),對同一樣本可以得出r與b互化的公式,同一樣本的這兩種假設(shè)檢驗也是等價的。因此,由于r的假設(shè)檢驗可以直接查表,較為簡單,所以可以用其代替對b的假設(shè)檢驗。 第四節(jié) 等級相關(guān) 如果觀測值是等級資料,則可以用等級相關(guān)來表達兩事物之間的關(guān)系。 等級相關(guān)是分析X、Y 兩變量等級間是否相關(guān)的一種非參數(shù)方法。 常用的等級相關(guān)方法是Spearman等級相關(guān)。 與線性相關(guān)系數(shù)r 一樣,等級相關(guān)系數(shù) rs的數(shù)值亦在 -1與 +1之間,數(shù)值為正表示正相關(guān),數(shù)值為負表示負相關(guān)。 思考題與參考答案 《數(shù)值變量資料的統(tǒng)計描述 統(tǒng)計表與圖》思考題 1.描述單變量資料的統(tǒng)計描述指標分哪兩類,分別包括哪些指標? 2.試述平均數(shù)、標準差、變異系數(shù)的含意與用途。 3.什么是醫(yī)學(xué)參考值?如何制定95%的參考值范圍? 4.繪制統(tǒng)計表及統(tǒng)計圖的原則與要求是什么? 5.常見的統(tǒng)計圖有哪幾種?它們的適用條件是什么? 《數(shù)值變量資料的統(tǒng)計推斷》思考題 1.標準差和標準誤有何區(qū)別和聯(lián)系。 2.t檢驗和u檢驗的公式有哪些類型,在應(yīng)用上有哪些異同? 3.在統(tǒng)計推斷過程中,如何區(qū)別單側(cè)檢驗和雙側(cè)檢驗。 4.可信區(qū)間和參考值范圍有何不同? 5.假設(shè)檢驗和總體均數(shù)區(qū)間估計有何不同? 6.什么是一類錯誤與二類錯誤,有何關(guān)系? 7.方差分析的基本思想是什么? 8.描述t檢驗與F檢驗的適用條件。 《分類變量資料的統(tǒng)計描述與統(tǒng)計推斷》思考題 1.常用的相對數(shù)指標有哪些?它們在計算和意義上有哪些不同? 2.率的標準化的意義和基本思想是什么? 3.試述率的標準誤的意義和用途。 4.試述檢驗的用途和各種檢驗的適用條件。 5.列舉RC表檢驗的注意事項。 6. 為什么不能以構(gòu)成比代替率?請聯(lián)系實際加以說明。 7. 應(yīng)用相對數(shù)時應(yīng)注意哪些問題? 《數(shù)值變量資料的統(tǒng)計描述 統(tǒng)計表與圖》思考題 1、描述單變量資料的統(tǒng)計描述指標分哪兩類,分別包括哪些指標? 答:單變量資料的統(tǒng)計描述指標分: (1)集中趨勢指標:包括算術(shù)平均數(shù)(簡稱均數(shù))、幾何均數(shù)、中位數(shù)與百分位數(shù)、眾數(shù)、調(diào)和均數(shù); (2)離散趨勢指標:包括全距、四分位數(shù)間距、方差、標準差、變異系數(shù)。 2、試述平均數(shù)、標準差、變異系數(shù)的含意與用途。 答:1、平均數(shù) (1)含意:平均數(shù)是一類用于描述數(shù)值變量資料集中趨勢(或平均水平)的指標,包括算術(shù)平均數(shù)(適用條件是資料呈正態(tài)分布或近似正態(tài)分布或?qū)ΨQ分布)、幾何平均數(shù)(適用于觀察值非對稱分布、其差距較大時,倍數(shù)關(guān)系或近似倍數(shù)關(guān)系)、中位數(shù)(適用于偏態(tài)分布、開口、分布不確定)、眾數(shù)、調(diào)和均數(shù)。 (2)用途:描述數(shù)值變量資料集中趨勢,進行事物之間的分析比較。 2 、 標準差 (1)含意:指將方差開平方,取平方根的正值。反映資料的離散程度。 (2)用途:①反映一組觀察值的離散程度,標準差小,離散程度小,均數(shù)的代表性好;②用于計算變異系數(shù);③計算標準誤;④結(jié)合均值與正態(tài)分布的規(guī)律估計醫(yī)學(xué)參考值的范圍。 3、變異系數(shù) (1)含意:是將標準差轉(zhuǎn)化為算術(shù)均數(shù)的倍數(shù),以百分數(shù)的形式表示。 (2)用途:用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。 3、什么是醫(yī)學(xué)參考值?如何制定95%的參考值范圍? 答: 醫(yī)學(xué)參考值是指絕大多數(shù)正常人的各種生理、生化數(shù)據(jù),組織或排泄物中各種成分的含量范圍。 制定95%的參考范圍:從正常人總體中抽樣;控制測量誤差;判定是否需要分組確定參考范圍;決定取單側(cè)還是雙側(cè);選定合適的百分界限;對資料的分布進行正態(tài)性檢驗;根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒ㄟM行參考范圍的估計。 4、繪制統(tǒng)計表及統(tǒng)計圖的原則與要求是什么? 答:繪制統(tǒng)計表的原則:(1)重點突出,簡單明了; (2)主謂分明,層次清楚; (3)數(shù)據(jù)準確,便于分析。 基本要求:(1)標題:簡明扼要說明表的中心內(nèi)容,必要時注明研究事物現(xiàn)象發(fā)生的時間、地點等。標題一般寫在表的正上方。 (2)標目:橫標目和縱標目。橫標目列在表的左側(cè),表明被研究事物的主要特征;縱標目列在表的右上端,說明橫標目內(nèi)容的各項統(tǒng)計指標。標目的排列應(yīng)有一定的次序。 (3)線條:一般包括頂線、縱標目下線、合計上線、底線。 (4)數(shù)字:表內(nèi)數(shù)字一律用阿拉伯?dāng)?shù)字,同一指標的小數(shù)位數(shù)保留、單位、精度一致,上下位次對齊,表內(nèi)不留空格。數(shù)據(jù)暫缺或未記錄可用“…”,數(shù)據(jù)不可能得到用“—”,數(shù)據(jù)為“0”時則填0。 (5)備注:一般不列入表內(nèi),必要時可用“*”,解釋在表的下面。 繪制統(tǒng)計圖的原則:用幾何圖形的位置、大小、長短、面積等特征來表現(xiàn)數(shù)據(jù)信息,將數(shù)據(jù)形象化。與統(tǒng)計表相比,更直觀。但只是粗略表達,只能做統(tǒng)計表的補充。 基本要求:(1)標題:概括圖的內(nèi)容,應(yīng)簡明確切,一般置于圖域的下方。一篇文獻中有多幅統(tǒng)計圖時,標題前應(yīng)表注序號。 (2)圖域:長寬比例一般為7:5或5:7。 (3)標目:一般在縱軸左側(cè)和橫軸下方 (4)刻度:常用算術(shù)尺度和對數(shù)尺度,刻度值一般標注與縱軸外側(cè)和橫軸上側(cè)。 (5)圖例:圖例一般放在橫標目下方,若空間較多可放在圖域中。 5、常見的統(tǒng)計圖有哪幾種?它們的適用條件是什么? 答:常用統(tǒng)計圖有:按圖示形式有條圖、直方圖、百分條圖、圓圖、散點圖、線圖、統(tǒng)計地圖以及在探索性分析時用的莖葉圖、殘差圖、箱式圖,判別分析的類別分布圖,聚類分析的譜系圖等。 使用條件:(1)條圖:適于彼此相互獨立的現(xiàn)象間相同指標的比較。 (2)圓圖:用于表示全體各部分的構(gòu)成情況,百分比的情況。 (3)線圖:適用于連續(xù)性變量或某一現(xiàn)象隨另一現(xiàn)象變遷的情況。 (4)半對數(shù)線圖:用語表示事物現(xiàn)象發(fā)展變化的速度(相對比),常用語兩個或多個事物現(xiàn)象在發(fā)展速度上的對比。 (5)直方圖:適用于某連續(xù)性資料的分布。 (6)散點圖:適用于雙變量統(tǒng)計分析。 (7)統(tǒng)計地圖:用與顯示不同地域事物數(shù)量的分布情況。 《數(shù)值變量資料的統(tǒng)計推斷》思考題 1、標準差和標準誤有何區(qū)別和聯(lián)系。 答:區(qū)別:①標準差是表示個體之間的變異度,其值越大,說明變異程度越大。 標準差同時是表示觀察值與樣本均值之間的離散程度,標準差越大,說明離散程度越大,從而也說明均數(shù)反映平均水平代表性欠佳。 ②標準誤即樣本均數(shù)的標準差。表示樣本均數(shù)之間的變異度以及樣本均數(shù)與總體均數(shù)之間的離散度。標準誤越大,均數(shù)的抽樣誤差就越大,說明樣本均數(shù)與總體均數(shù)的差異越大。 聯(lián)系: 即當(dāng)樣本例數(shù)n一定時,標準誤與標準差呈正比;當(dāng)標準差一定時,標準誤與樣本含量n的平方根成反比。 2、t檢驗和u檢驗的公式有哪些類型,在應(yīng)用上有哪些異同? 答:t檢驗和u檢驗的公式類型如下: ⑴ 樣本均數(shù)與總體均數(shù)的比較: 已知總體均數(shù)一般為理論值、標準值或經(jīng)大量觀察所得的穩(wěn)定值。 樣本與總體均數(shù)比較的目的是推斷樣本所代表的未知的總體均數(shù)與0是否相同。用統(tǒng)計量t的計算公式: ⑵配對資料的比較:用檢驗統(tǒng)計量t值公式: ⑶兩個樣本均數(shù)的比較: ①兩個大樣本均數(shù)的比較:當(dāng)兩個樣本量較大(均>50)時,自由度足夠大,可用u檢驗。公式為: ②兩個小樣本均數(shù)的比較:推斷μ1是否等于μ2,作與比較的t檢驗,公式為: 在應(yīng)用上的異同:t檢驗和μ檢驗通常用于兩均數(shù)的比較。 μ檢驗用于已知總體標準差情況下的樣本均數(shù)與總體均數(shù)比較與大樣本資料的兩均數(shù)比較,要求資料服從對稱或正態(tài)分布; t檢驗常用于樣本例數(shù)n較小、總體標準差未知時樣本與總體均數(shù)的比較,配對設(shè)計資料的比較與兩個樣本均數(shù)的比較。 兩樣本均數(shù)比較時還要求所對應(yīng)總體方差齊同,資料服從正態(tài)分布。 3、在統(tǒng)計推斷過程中,如何區(qū)別單側(cè)檢驗和雙側(cè)檢驗。 答:應(yīng)事先根據(jù)專業(yè)知識和問題的要求,在實驗設(shè)計時做出規(guī)定,而不能在計算出檢驗統(tǒng)計量后才確定。對同一份資料,單側(cè)檢驗比雙側(cè)檢驗更易得到差別有顯著性的結(jié)論。因此,在報告討論時,應(yīng)列出檢驗方法、檢驗統(tǒng)計量的值、檢驗水準和P值的確切范圍,還要著名采用的是單側(cè)檢驗還是雙側(cè)檢驗,然后結(jié)合專業(yè)做出結(jié)論。 4、可信區(qū)間和參考值范圍有何不同? 答:可信區(qū)間反映區(qū)間包含總體均數(shù)的概率大小,即1-α大小,越趨近1越好;反映區(qū)間的長度,長度越小越好,即1-α一定,n越大精度越高。 參考值范圍是正常人指標測定值的波動范圍,參考值范圍在診斷方面可用于劃分正常或異常。 5、假設(shè)檢驗和總體均數(shù)區(qū)間估計有何不同? 答:總體均數(shù)區(qū)間估計是從總體中做隨機抽樣,每個樣本可以算得一個可信區(qū)間,如95%可信區(qū)間,意味著做100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)(估計正確),只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。 假設(shè)檢驗,就是根據(jù)研究目的,對樣本所屬總體特征提出一個假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本提供的信息,推斷假設(shè)應(yīng)當(dāng)拒絕或不拒絕,使研究者了解在假設(shè)的條件下,差異由抽樣誤差引起的可能性大小。 6、什么是一類錯誤與而二類錯誤,有何關(guān)系? 答:一類錯誤是統(tǒng)計學(xué)中將拒絕了實際正確的無效假設(shè)Ho,即“棄真”,放棄本來成立的Ho所犯的錯誤,概率α表示, 常取α=0.05。 二類錯誤是將接受了實際上錯誤的無效假設(shè)Ho,概率用β表示,在統(tǒng)計學(xué)中將1-β稱為檢驗效能,即“取偽”接受本來不成立的Ho所犯的錯。 關(guān)系:一類誤差認為規(guī)定,二類誤差大小隨一類誤差增大而減??;增大樣本量,可以同時減小兩類誤差。 客觀實際 拒絕H0 不拒絕H0 H0成立 第一類錯誤(α) 判斷正確(1-α) H0 不成立 判斷正確(1-β) 第一類錯誤(β) 7、方差分析的基本思想是什么? 答:將總變異分解成兩個或多個變異,其中有一個是由隨機誤差引起的,而其他變異是由各自因素引起的。然后,比較各因素變異與誤差引起的變異,評價由某種因素引起的變異是否具有統(tǒng)計學(xué)意義。 總變異=組內(nèi)變異+組間變異 總變異:隨機測量誤差+個體變異+處理因素作用 組內(nèi)變異:隨機測量誤差+個體之間變異 組間變異:隨機測量誤差+個體之間變異+處理因素作用 F=組間變異均方/組內(nèi)變異均方 8、描述t檢驗與F檢驗的使用條件。 答:t檢驗的使用條件:常用于樣本例數(shù)n較小、總體標準差未知是樣本與總體的比較,配對設(shè)計資料的比較和兩個樣本均數(shù)的比較。要求所對應(yīng)的總體方差齊同,資料服從正態(tài)分布。 F檢驗的使用條件:各樣本來自正態(tài)分布的總體,且為相互獨立的隨機樣本,各個樣本所來自的總體相等。 《分類變量資料的統(tǒng)計描述與統(tǒng)計推斷》 1、常用的相對數(shù)指標有哪些?它們的意義和計算上有和不同? (1)比例(構(gòu)成比) 意義:用以說明事物內(nèi)部各組成部分所占的比重或分布情況。 計算:構(gòu)成比=事物內(nèi)部某一組成部分的觀察單位數(shù)/事物各組成部分觀察單位總數(shù)(或100﹪) (2)率 意義:用以說明某現(xiàn)象發(fā)生的頻率或強度。 計算:一定時間內(nèi)某現(xiàn)象發(fā)生率=一定時間內(nèi)某現(xiàn)象實際發(fā)生的觀察單位數(shù)/該時間段開始時的觀察單位總數(shù) (3)比 意義:兩個有聯(lián)系的指標之比。 計算:比=甲指標計數(shù)/乙指標計數(shù)(或100﹪) 3、試述率的標準誤的意義和用途。 意義:由于抽樣而引起的樣本率與總體率之間或樣本率之間的差異稱為率的抽樣誤差,其大小用率的標準誤來表示。 用途:率的標準誤反映抽樣誤差的大小,標準誤越小,說明率的抽樣誤差越小,用樣本推論總體時,可信程度越高。 4、試述c2檢驗的用途和c2檢驗各種適用條件。 c2檢驗的應(yīng)用: 1)兩個或兩個以上樣本率之間差異有無顯著性; 2)兩個或兩個以上樣本構(gòu)成比之間差異有無顯著性; 3)兩分類變量間有無相關(guān)關(guān)系; 4)頻數(shù)分布的擬合優(yōu)度檢驗; 5)實際頻數(shù)與理論頻數(shù)的吻合程度檢驗。 c2檢驗的應(yīng)用條件: 1)n>=40,T>=5 卡方檢驗 2)n>=40,1- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
5 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 醫(yī)學(xué)統(tǒng)計學(xué) 醫(yī)學(xué) 統(tǒng)計學(xué) 復(fù)習(xí)資料 習(xí)題 答案
鏈接地址:http://www.3dchina-expo.com/p-13146551.html