《祝曉明《醫(yī)學統(tǒng)計學》醫(yī)統(tǒng)-第三章正態(tài)分布與醫(yī)學參考值范圍》由會員分享,可在線閱讀,更多相關《祝曉明《醫(yī)學統(tǒng)計學》醫(yī)統(tǒng)-第三章正態(tài)分布與醫(yī)學參考值范圍(51頁珍藏版)》請在裝配圖網上搜索。
1、流行病與衛(wèi)生統(tǒng)計學教研室 祝曉明醫(yī) 學 統(tǒng) 計 學第三章 正態(tài)分布與醫(yī)學參考值范圍 第一節(jié) 正態(tài)分布 卡爾弗里德里希高斯 (C.F.Gauss,1777-1855)正態(tài)分布(normal distribution)又稱為高斯分布。首先由德國數(shù)學家和天文學家德莫阿弗爾提出,高斯雖然發(fā)現(xiàn)稍晚,但他迅速將正態(tài)分布應用于天文學,并對其性質作了進一步的研究,使正態(tài)分布的應用價值廣為人知。 例2-1 某地用隨機抽樣方法檢查了140名成年男子的紅細胞數(shù),檢測結果如表所示: 4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.184.92 4.27 4.77 4.88 5.00 4.73
2、 4.47 5.344.70 4.81 4.93 5.04 4.40 5.27 4.63 5.505.24 4.97 4.71 4.44 4.94 5.05 4.78 4.524.63 5.02 4.76 紅細胞數(shù) 頻 數(shù) 頻 率(%) 累積頻率(%) 3.80 2 1.4 1.44.00 6 4.3 5.74.20 11 7.9 13.64.40 25 17.9 31.54.60 32 22.9 54.44.80 27 19.3 73.75.00 17 12.1 85.85.20 13 9.3 95.15.40 4 2.9 98.05.60 2 1.4 99.45.80 6.00 1 0.7
3、 100.0合計 140 - 100.0 表2-2 某地140名正常男子紅細胞數(shù)的頻數(shù)表 0 0.2 0.4 0.6 0.8 1 1.2 3.8 4.2 4.6 5.0 5.4 5.8 )(Xf X 0 0.2 0.4 0.6 0.8 1 1.2 3.8 4.2 4.6 5 5.4 5.8 )(Xf X 0 0.2 0.4 0.6 0.8 1 1.2 3.6 4 4.4 4.8 5.2 5.6 6 f(X) X正態(tài)分布有兩個參數(shù): 和 , 分別表示均數(shù)和標準差。 圖3-1 某地成年男子紅細胞數(shù)的分布逐漸接近正態(tài)分布示意圖 X 第一節(jié) 正態(tài)分布(Normal Distribution) ii X
4、nfXf /)/()( 2 22 )(21)( XeXf 一、正態(tài)曲線 二、正態(tài)分布的特征則稱連續(xù)型隨機變量X服從正態(tài)分布,記為XX的取值范圍理論上沒有邊界 2( , )N 概率分布函數(shù) 2121( ) 2 XXF X e dx 2121( ) 2 Xf X e 概率密度函數(shù)如果隨機變量X的分布服從以下函數(shù) 正態(tài)分布的主要特征:1.單峰分布,以 為中心,左右完全對稱。 以X軸為漸近線,兩端與X軸永不相交。 X 2.在 處有最大值,其值為 ; X越遠離對稱軸,y越小。 正態(tài)曲線在 處有拐點,呈現(xiàn)為鐘型X ( ) 1 ( 2 )f X 3.正態(tài)分布由兩個參數(shù) 和 決定 是位置參數(shù),決定著正態(tài)曲線在
5、X軸上的位置 是形狀參數(shù),決定著正態(tài)曲線的分布形狀 -4 -3 -2 -1 0 1 2 3 4 5 6 71 2 3321 -5 -4 -3 -2 -1 0 1 2 3 4 5 1 2 3 321 圖3-3 三種不同均值的正態(tài)分布 圖3-4 三種不同標準差的正態(tài)分布 4.正態(tài)曲線下的面積分布有一定的規(guī)律 圖3-5 圖3-6問題:曲線下面積的含義? 如何計算? 正態(tài)曲線下某一區(qū)間的面積占總面積的百分數(shù)有何意義? 1.該區(qū)間的例數(shù)占總例數(shù)的百分數(shù)(頻數(shù)分布) 2.觀察值落在該區(qū)間的概率 3.從此總體隨機抽得該區(qū)間觀察值的概率 圖 正態(tài)曲線面積分布示意圖 三、標準正態(tài)分布 對任何參數(shù)的正態(tài)分布,都可
6、以通過一個簡單的變量變換 化成 和 的標準正態(tài)分布。Z變換也稱隨機變量的標準化變換。0 1 Xz 可以利用標準正態(tài)分布表求出與原始變量X 有關的概率值。 圖 標準正態(tài)分布及曲線下面積 概率分布函數(shù)概率密度函數(shù)正態(tài)分布標準正態(tài)分布 2121( ) 2 XXF X e dx 2121( ) 2 Xf X e 2212 zz e 2212 zzz e dz 如何根據(jù)概率分布函數(shù)去求陰影部分面積?Z轉換的目的? ( ) 1 ( )Z Z 問題:s=? =? 那當和已知時z=? 例3-1 若X ,試計算X 取值在區(qū)間 上的概率。 ),( 2N1.96 11 1.96 1.96Xz 22 1.96 1.9
7、6Xz 1.96 1.96 1.96 1.96 1 1.96 1.96 1 2 1.96 1 2 0.025 0.95P z 例3-2 已知某地140名正常成年男子紅細胞計數(shù)近似服從正態(tài)分布, =4.781012/L, =0.381012/L。該地正常成年男子紅細胞計數(shù)在4.01012/L以下者占該地正常成年男子總數(shù)的百分比;X S4.0 4.78 2.050.38X Xz S 查附表1 ,表明該地成年男子紅細胞計數(shù)低于 4102/L 者約占該地正常成年男子總數(shù)的2.02%( 2.05) 0.0202 1 1.89 2.05 1 0.0294 0.0202 0.9504 紅細胞計數(shù)在4.010
8、12/L5.51012/L者占該地正常成年男子總數(shù)的百分比4.00 4.78 5.50 4.78(4.00 5.50) ( )0.38 0.38XP X P = ( 2.05 1.89)P z 表明紅細胞計數(shù)在 4.01012/L 5.51012/L者約占該地正常成年男子總數(shù)的95.04%。 課后習題:P25 計算題2 第二節(jié) 醫(yī)學參考值范圍 一、基本概念 通常指“正常人”的解剖、生理、生化、免疫及組織代謝產物的含量等數(shù)據(jù)大多數(shù)個體值的波動范圍。 含義:從選擇的參照總體上獲得的所有個體觀察值,用統(tǒng)計方法建立百分位數(shù)界限,由此得到個體觀察值的波動區(qū)間。 最常用的是95%參考值范圍 主要目的:1.
9、基于臨床實踐。作為劃分正常人與異常人的界限。2.基于預防醫(yī)學實踐。例如制定兒童發(fā)育指標的等級標準。 確定95%參考值范圍示意圖 二、制定醫(yī)學參考值范圍的注意事項 1. 確定同質的參照總體一般選擇“正?!比耍饕桥懦藢ρ芯恐笜擞杏绊懙募膊』蛴嘘P因素的同質人群。例如在制定血清谷丙轉氨酶活性正常值時,選取正常人的條件為:肝、腎、心、腦、肌肉等無器質性疾患近期無特殊用藥史等檢測前未做劇烈運此外同時可能需要考慮性別、年齡、民族、地理位置等因素 2. 選擇足夠例數(shù)的參照樣本 通常情況下,確定參考值范圍需要大樣本,如果例數(shù)過少,確定的參考值范圍往往不夠準確。若接近正態(tài)分布,變異度不大,樣本含量可以少一些
10、若明顯偏態(tài),變異度大,樣本含量要多一些。 3. 控制檢測誤差為保證原始數(shù)據(jù)可靠,檢測過程中要嚴格控制隨機誤差,避免系統(tǒng)誤差和過失誤差。包括分析儀器的靈敏度、試劑的純度、操作技術及標準的掌握等,同時必須對測量條件做出統(tǒng)一的規(guī)定和說明,如臨床化驗參考值范圍的制定,應對收集樣本時的環(huán)境和生理條件(溫度、季節(jié)、體育活動強度、飲食、妊娠等),收集、轉運和儲藏樣品的方法及時間有明確的規(guī)定。人員 培訓 控制條件 重復測定 4. 選擇單、雙側界值 有些指標如白細胞數(shù)過高或過低均屬異常(a) ,故其參考值范圍需要分別確定下限和上限,稱作雙側。有些指標如24小時尿糖含量僅在過高(b)、肺活量僅在過低時為異常(c)
11、,只需確定其上限或下限,稱作單側參考值范圍。 (a)白細胞數(shù)參考值范圍 (b)24小時尿糖參考值范圍 (c)肺活量參考值范圍 5. 選擇適當?shù)陌俜謹?shù)范圍參考值的百分范圍應根據(jù)資料的性質和研究目的選擇,它與診斷閾值有確定的關系。百分范圍的不同將導致不同的假陽性率和假陰性率。 圖3-9 正常人和病人數(shù)據(jù)分布重疊問題:確診病人和初篩病人參考值范圍定大還是定?。?6.選擇計算參考值范圍的方法 正態(tài)分布法百分位數(shù)法 如何選擇? 三、醫(yī)學參考值范圍的計算方法百分位數(shù)法適合于任何分布類型的資料,在實際中最為常用。由于參考值范圍所涉及的常常是波動較大的兩端數(shù)據(jù),使用百分位數(shù)法必須要有較大的樣本含量,否則結果不
12、穩(wěn)定。正態(tài)分布法要求資料服從或近似服從正態(tài)分布,優(yōu)點是結果比較穩(wěn)定,在樣本含量不是很大的情況下仍然能夠進行處理;若偏態(tài)分布資料經變量變換能轉換為正態(tài)分布或近似正態(tài)分布,仍可用正態(tài)分布法。 Medical reference range 例3-3 已知某地140名正常成年男子紅細胞計數(shù)近似服從正態(tài)分布, =4.781012/L, =0.381012/L, 估計該地正常成年男子紅細胞計數(shù)95%參考值范圍。X S近似正態(tài)分布資料可按正態(tài)分布法處理,因紅細胞計數(shù)值過大或過小均為異常,故應估計雙側95%參考值范圍: 0.05 2 4.78 1.96 0.38 4.04,5.52X z S 即該地正常成年
13、男子紅細胞計數(shù)的95%參考值范圍為4.041012/L5.521012/L。 Medical reference range 例3-4 某年某地測得 100 名正常成年人的血鉛含量值(g/dl),試確定該地正常成年人血鉛含量的95%參考值范圍。根據(jù)經驗已知正常成年人的血鉛含量近似對數(shù)正態(tài)分布,因此首先對原始數(shù)據(jù)作對數(shù)變換,經正態(tài)性檢驗可知對數(shù)值服從正態(tài)分布(P0.50),故編制對數(shù)值頻數(shù)表,再利用正態(tài)分布法求95%參考值范圍。 Medical reference rangeG 對數(shù)組段 頻數(shù) 累計頻數(shù)0.6 4 40.7 2 60.8 5 110.9 9 201.0 12 321.1 15 4
14、71.2 18 651.3 14 791.4 12 911.5 5 961.6 3 99 1.71.8 1 100合計 100 4 4 5 5 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 910 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 1313 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 1718 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 2626 26 27 27 28 28 29
15、 30 30 31 31 32 32 32 33 35 41 44 50 51表3-2 某年某地100名正常成年人血鉛含量(g/dl)對數(shù)值頻數(shù)表 依據(jù)表3-2,設X為對數(shù)組段的組中值, , , ,則對數(shù)值的均數(shù)和 標準差為: 100n120fX 2 149.73fX 120 1.2100fXX n (g/dl) 2 2 2( ) 149.73 120 /1001 100 1fX fX nS n 0.2406S (g/dl ) Medical reference range 因為血鉛含量僅過大異常,故參考值范圍應為單側,求單側95%上限值: 即該地正常成年人血鉛含量95%參考值范圍為小于39.
16、3173g/dl 。1 1lg ( 1.64 ) lg (1.2 1.64 0.2406) 39.3173X S (g/dl)Medical reference range 例3-5 依據(jù)表2-4(P11)某地630名50歲60歲正常女性血清甘油三酯含量(mmol/L)的資料,估計其血清甘油三脂含量的單側95%參考值范圍,為該地5060歲女性高血脂診斷與治療提供參考依據(jù)。資料顯現(xiàn)出血清甘油三脂含量數(shù)值偏小的人數(shù)較多,呈正偏態(tài)分布,故選用百分位數(shù)法計算參考值范圍;依據(jù)專業(yè)知識,為該地5060歲女性高血脂診斷與治療提供參考依據(jù)應計算單側95%界值P 95。 Medical reference ra
17、nge 95 1.90 (630 95% 580) 28 0.30 2.098P (mmol/L) 即該地5060歲正常女性血清甘油三脂含量的單側95%參考值范圍為小于2.098 mmol/L。 甘油三脂 頻數(shù) 累積頻數(shù) 累積頻率(%)0.10 27 27 4.30.40 169 196 31.10.70 167 363 57.61.00 94 457 72.51.30 81 538 85.41.60 42 580 92.11.90 28 608 96.52.20 14 622 98.72.50 4 626 99.42.80 3 629 99.83.10 1 630 100.0合計 630 表
18、2-4 某地630名正常女性血清甘油三酯含量(mmol/L)的頻數(shù)表 許多統(tǒng)計方法都要求資料服從正態(tài)分布或者近似正態(tài)分布,在使用這些方法之前需對資料進行正態(tài)性判定。如有充足的專業(yè)知識和經驗得知某些醫(yī)學指標服從正態(tài)分布,或樣本含量足夠大時,可不必再作正態(tài)性判定。正態(tài)性判定的方法有兩類:一是圖示法,二是計算法,圖示法簡單易行但比較粗糙,計算法檢驗效率較高,可利用統(tǒng)計軟件獲得計算結果。Medical reference range 小 結 1. 正態(tài)分布是許多統(tǒng)計分析方法的理論基礎,是醫(yī)學研究應用中重要的一種連續(xù)型分布。 2. 正態(tài)分布受到兩個參數(shù)影響,總體均數(shù) 是位置參數(shù),決定著正態(tài)曲線在橫軸上的
19、位置;總體標準差 是形狀參數(shù),決定著正態(tài)曲線的分布形狀。不同的 與 對應不同的正態(tài)分布,記為X 。正態(tài)曲線下的面積即為概率,利用其面積分布規(guī)律 可估計頻數(shù)分布和確定醫(yī)學參考值范圍。 2( , )N 4. 醫(yī)學參考值范圍指同質總體中某醫(yī)學指標大多數(shù)個體值的波動范圍。計算參考值范圍常用的方法有正態(tài)近似法和百分位數(shù)法,當資料服從正態(tài)分布或轉換值服從正態(tài)分布,可用正態(tài)近似法;若資料不服從正態(tài)分布或未知分布類型,可用百分位數(shù)法。 3. =0、 =1的正態(tài)分布稱作標準正態(tài)分布,即 對服從 的任意隨機變量x,都可經 變換轉化成標準正態(tài)分布, (0,1)N ),( 2N z X zz THEEND! 課后習題:P27 計算題1-4P27計算題2 P271.正態(tài)分布及醫(yī)學參考值范圍的計算 返回1 返回2 P272.偏態(tài)分布醫(yī)學參考值范圍的計算 返回 滿1個月時體重/kg 滿2個月時體重/kg 滿3個月時體重/kg標準體重 5.1 6.16 6.98正常范圍 4.45.8 5.36.6 6.07.4月增加量 1.02.0 0.71.4 0.51.0營養(yǎng)不良 小于4.34 小于5.24 小于5.93肥胖癥 大于6.12 大于7.39 大于8.371-3個月男孩體重判斷