醫(yī)學(xué)統(tǒng)計(jì)學(xué)
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》由會(huì)員分享,可在線閱讀,更多相關(guān)《醫(yī)學(xué)統(tǒng)計(jì)學(xué)(68頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、2013.3.3 1 醫(yī)學(xué)統(tǒng)計(jì)學(xué) 主講人 陶育純 1 http:/ 2013.3.3 2 第一講 課程名稱: 醫(yī)學(xué) 統(tǒng)計(jì)學(xué) 主要教材: 衛(wèi)生 統(tǒng)計(jì)學(xué) 第 7版 方積乾 主編 人民衛(wèi)生出版社 年級(jí)、專業(yè): 2010級(jí)醫(yī)學(xué)試驗(yàn)班 授課時(shí)間: 2013年 3月 5日 授課時(shí)數(shù): 4h 2013.3.3 3 目錄 第一節(jié) 醫(yī)學(xué)中統(tǒng)計(jì)思維的進(jìn)化 第二節(jié) 統(tǒng)計(jì)學(xué)與公共衛(wèi)生互相推動(dòng) 第三節(jié) 統(tǒng)計(jì)學(xué)的若干概念 第四節(jié) 目標(biāo)與方法 第一章 緒論 2013.3.3 4 目錄 第一節(jié) 頻率分布表與頻率分布圖 第二節(jié) 描述平均水平的統(tǒng)計(jì)指標(biāo) 第三節(jié) 描述變異程度的統(tǒng)計(jì)指標(biāo) 第二章 定量變量的統(tǒng)計(jì)描述 2013.3.3
2、 5 第一章 緒論 統(tǒng)計(jì)學(xué) ( statistics) 是運(yùn)用概率論與數(shù)理統(tǒng)計(jì) 的原理和方法研究數(shù)字資料的搜集 、 整理 、 分析 與推斷 , 從而揭示事物內(nèi)在客觀規(guī)律的一門學(xué)科 。 特點(diǎn):針對(duì) 不確定性 數(shù)據(jù)進(jìn)行分析和推斷。 不確定性 :又稱 隨機(jī)性 ( random) 。 不確定性 數(shù)據(jù):人的血壓、體溫、脈搏等;小麥畝產(chǎn) 量;氣溫;地震發(fā)生的時(shí)間、地點(diǎn)等。 確定性 數(shù)據(jù):人的骨骼數(shù)、牙齒數(shù)等;水的沸點(diǎn);企 業(yè)商品生產(chǎn)量等。 statistics, the science of collecting, analyzing, presenting, and interpreting data.
3、 Statistics is the study of the collection, organization, analysis, and interpretation of data. 2013.3.3 6 我們知道事物的發(fā)展是 偶然性 與 必然性 并存 的 , 而實(shí)際當(dāng)中往往 偶然性 掩蓋了 必然性 , 妨礙 了我們正確認(rèn)識(shí)事物的 必然性 ( 即規(guī)律性 ) 。 例 1: 張三心跳 68次 /min 李四心跳 72次 /min 偶然性 正常成人心率 60 100次 /min 必然性 (正常值范圍) 醫(yī)學(xué)上絕大多數(shù)生理、生化指標(biāo)的正常值范圍都可 利用統(tǒng)計(jì)學(xué)方法求得 。 2013.3.3 7
4、 例 2: 甲病人 乙病人 偶然性 該藥物在絕大多數(shù)病人中的 治愈率 必然性 醫(yī)學(xué)上治愈率可利用統(tǒng)計(jì)學(xué)方法求得 。 在同等條件下,用同一種藥物治療某病, 痊愈 死亡 必然性 是不可避免地通過(guò)大量的 偶然性 為自 己開(kāi)辟道路的 。 統(tǒng)計(jì)學(xué) 是找出這種 必然性 的重要 工具 。 2013.3.3 8 統(tǒng)計(jì)學(xué) 在不同領(lǐng)域的應(yīng)用形成了不同的應(yīng)用 統(tǒng)計(jì)學(xué)科 , 如人口統(tǒng)計(jì) 、 經(jīng)濟(jì)統(tǒng)計(jì)等等 , 在醫(yī)學(xué) 中應(yīng)用 ,就產(chǎn)生了 醫(yī)學(xué)統(tǒng)計(jì)學(xué) (medical statistics)。 衛(wèi)生統(tǒng)計(jì)學(xué) (health statistics)是以預(yù)防醫(yī)學(xué)的 理論為指導(dǎo) , 用 統(tǒng)計(jì)學(xué) 的原理和方法研究公共衛(wèi) 生領(lǐng)域的數(shù)
5、據(jù)的搜集 、 整理 、 分析與推斷的一門 應(yīng)用學(xué)科 。 第三節(jié) 統(tǒng)計(jì)學(xué)的若干概念 一、變量 2013.3.3 9 變量 ( variable) 指觀察對(duì)象的某項(xiàng)特征值 。 變量值 ( value of variable) 指 變量 的觀察結(jié)果 。 變量值 可以分為: 定量 (qualitative)和 定性 (quantitative)兩種類型。 數(shù)值變量 ( numerical variable) 又稱 測(cè)量變量 (measurement data)。用定量的 方法測(cè)定觀察對(duì)象的某項(xiàng)特征值。如身高 (cm)、 脈搏 (次 /min)、 紅細(xì)胞數(shù) ( 1012/L)、 孕婦的產(chǎn) 前檢查次數(shù)等。
6、 2013.3.3 10 定量變量 離散型變量 (discrete variable) 連續(xù)型變量 (continuous variable) 離散型變量只能取整數(shù)值。例如,一月中的 手術(shù)病人數(shù),一年里的新生兒數(shù)。 連續(xù)型變量可以取實(shí)數(shù)軸上的任何數(shù)值。例 如,血壓、身高、體重等。 當(dāng)離散型變量的取值非常大時(shí),可以視為連 續(xù)型變量。例如紅細(xì)胞記數(shù) ( 1012/L)。 2013.3.3 11 分類變量 ( categorical variable) 又稱 名義變量 (nominative variable)。將觀察 對(duì)象按某種屬性或類別分組計(jì)數(shù)值。根據(jù)屬性的 特點(diǎn)又可分為: 1. 無(wú)序分類 (
7、unordered categories) 屬性之間 無(wú)程度上的差別。如性別 、 陰性與陽(yáng)性 、 血型等。 所得資料常稱 計(jì)數(shù)資料 (enumeration data)。 2. 有序分類 ( ordinal categories) 屬性之間有 程度上的差別。如某檢驗(yàn)結(jié)果表達(dá)為 、 、 +、 2013.3.3 12 +;臨床療效分為治愈、顯效、好轉(zhuǎn)、無(wú)效四級(jí) 等。所得資料常稱 等級(jí)資料 (rank data)。 變量間的轉(zhuǎn)化 根據(jù)統(tǒng)計(jì)分析需要,各類變量間可相互轉(zhuǎn)化。 年齡( 定量 ) 成人 (20 歲 ) 非成人 ( 20歲 ) ( 定性 ) 性別( 定性 ) 0(男 ) 1(女 ) ( 定量代
8、碼 ) 2013.3.3 13 血紅蛋白含量 ( 定量 ) 重度貧血 中度貧血 ( 等級(jí) ) 輕度貧血 正 常 血紅蛋白增高 二、同質(zhì)與變異 同質(zhì) ( homogeneity) 指觀察對(duì)象的共同特征 。 變異 ( variation) 指觀察對(duì)象之間的差異 。 2013.3.3 14 三、總體與樣本 總體 ( population) 是根據(jù)研究目的確定的 同質(zhì) 觀 察對(duì)象某項(xiàng) 變量值 的全體集合 。 直接研究無(wú)限總體是不可能的,即使對(duì)于有 限總體,當(dāng)觀察對(duì)象過(guò)多,直接研究常常是不現(xiàn) 實(shí)的。 總體 有限總體 無(wú)限總體 2013.3.3 15 樣本 ( sample) 是從 總體 中 隨機(jī) 抽取的
9、部分觀察 對(duì)象某項(xiàng) 變量值 的集合。 實(shí)際中,我們往往抽取 總體 中有 代表性 的一 部分進(jìn)行研究,來(lái)推斷 總體 的特征。 抽樣必須遵循 隨機(jī)化原則 ( randomization), 即保證 總體 中每一個(gè)體都有均等的機(jī)會(huì)被抽取。 統(tǒng)計(jì)學(xué)中有很多隨機(jī)抽樣方法可供使用 。 2013.3.3 16 四、參數(shù)與統(tǒng)計(jì)量 參數(shù) ( parameter) 總體的特征值 。 統(tǒng)計(jì)量 ( statistic) 由樣本計(jì)算出來(lái)的用于反映總 體特征的值 。 通常稱 樣本指標(biāo) 。 五、誤差 六、概率 頻率 ( frequency) 是指某事件 實(shí)際 發(fā)生的強(qiáng)度或 頻度 。 2013.3.3 17 我們知道 , 投
10、擲一枚硬幣 , 其落地出現(xiàn)哪一 面是一個(gè) 隨機(jī) 事件 。 若做一個(gè)投幣實(shí)驗(yàn) , 共投 50 次 , 結(jié)果出現(xiàn)某面 20次 。 這里 20次是一個(gè) 頻數(shù) , 40%( =20/50) 就 是一個(gè) 頻率 , 它代表了這次投 幣實(shí)驗(yàn)中該面 實(shí)際 出現(xiàn)的強(qiáng)度 。 概率 則是硬幣未 投之前應(yīng)知道的某面可能出現(xiàn)的強(qiáng)度數(shù)值 。 我們 都知道 , 投擲一枚硬幣 , 其落地出現(xiàn)某一面的 概 率 是 0.5 ( =1/2) 。 概率 ( probability) 是描述 隨機(jī) 事件發(fā)生 可能性 大 小的數(shù)值 。 2013.3.3 18 概率 用 P表示 , 其值介于 0到 1之間 。 P越接近 1, 表示該事件發(fā)
11、生的可能性越大 , 反之越小 。 P=1為必然事件 , P=0為不可能事件 。 小概率事件 是指 P0.05或 P0.01的事件 。 若 小概 率事件 出現(xiàn) , 我們 認(rèn)為 不發(fā)生 。 統(tǒng)計(jì)學(xué)中統(tǒng)計(jì)推斷結(jié)論就是利用小概率事件原理 。 2013.3.3 19 醫(yī)學(xué)統(tǒng)計(jì)工作分為:設(shè)計(jì) 、 收集資料 、 整理 資料 、 分析資料四個(gè)步驟 。 四步緊密聯(lián)系 , 缺一 不可 。 第四節(jié) 醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟 設(shè)計(jì) 收集資料 整理資料 分析資料 附加內(nèi)容 2013.3.3 20 一、設(shè)計(jì) 設(shè)計(jì) ( design) 是醫(yī)學(xué)統(tǒng)計(jì)工作中最重要的一 步 。 設(shè)計(jì)的好壞直接關(guān)系到下三步的工作 。 設(shè)計(jì) 的不合理可
12、導(dǎo)致錯(cuò)誤的結(jié)論 , 也可導(dǎo)致浪費(fèi)過(guò)多 的藥品 、 經(jīng)費(fèi) 、 時(shí)間等 。 設(shè)計(jì) 確定研究目的和研究假說(shuō) 確定研究對(duì)象和觀察單位 確定資料的收集方法、整理方法 確定統(tǒng)計(jì)分析方法 2013.3.3 21 設(shè)計(jì)的目的是盡可能用較少的人力 、 物力和 時(shí)間獲得準(zhǔn)確可靠的結(jié)論 。 醫(yī)學(xué)科研設(shè)計(jì) 調(diào)查設(shè)計(jì) 實(shí)驗(yàn)設(shè)計(jì) 二、收集資料 收集資料 ( collection of data) 任務(wù)是取得準(zhǔn)確 、 可靠的原始數(shù)據(jù) 。 醫(yī)學(xué)統(tǒng)計(jì)資料主要來(lái)自以下四個(gè)方面: 2013.3.3 22 統(tǒng)計(jì)報(bào)表 報(bào)告卡 經(jīng)常性工作記錄 專題調(diào)查或?qū)嶒?yàn)研究 三、整理資料 整理資料 ( sorting data) 任務(wù)是以統(tǒng)計(jì)學(xué)的思
13、 想去凈化原始數(shù)據(jù) 。 錯(cuò)誤的更正 , 缺少的補(bǔ)上; 去粗取精 , 去偽存真 , 使數(shù)據(jù)系統(tǒng)化 、 條理化 , 便于下一步的統(tǒng)計(jì)分析 。 2013.3.3 23 資料整理采用手工匯總和計(jì)算機(jī)匯總兩種方 式 。 前者適合數(shù)據(jù)量較小的資料 , 適合數(shù)據(jù)量較 大的資料 。 四、分析資料 分析資料 ( analysis of data) 利用統(tǒng)計(jì)學(xué)的原 理和方法 , 借助于有力的計(jì)算工具去處理數(shù)據(jù) , 從而反映出數(shù)據(jù)的綜合特征 , 進(jìn)而從中闡明事物 的內(nèi)在聯(lián)系和變化規(guī)律 。 統(tǒng)計(jì)分析 統(tǒng)計(jì)描述 ( statistical description ) 統(tǒng)計(jì)推斷 ( statistical inferen
14、ce) 2013.3.3 24 分布 ( distribution) 是一個(gè)統(tǒng)計(jì)概念 。 第二章 定量變量的統(tǒng)計(jì)描述 第一節(jié) 頻率分布表與頻率分布圖 分布在生活、醫(yī)學(xué)等上的理解是很具體的。 如綠化地帶在城市中的分布;血液中紅細(xì)胞的分 布;某種疾病的發(fā)病部位在人體中的分布;某班 全體學(xué)生的考試成績(jī)的分布等。 分布上升到數(shù)學(xué)上 , 就被抽象起來(lái) 。 抽象的 目的在于概括具體 。 2013.3.3 25 我們以后要學(xué)習(xí)很多統(tǒng)計(jì)的分布理論 , 如正 態(tài)分布 、 t分布 、 二項(xiàng)分布 、 Poisson分布等等 。 我們正是利用統(tǒng)計(jì)分布的理論方法來(lái)揭示具 體事物的內(nèi)在聯(lián)系和變化規(guī)律 。 頻數(shù)分布表 (
15、frequency distribution table) 通 過(guò)變量值分布在其取值范圍內(nèi)各組段中的頻數(shù)大 小來(lái)揭示具體資料的分布規(guī)律 。 了解資料的分布規(guī)律對(duì)于我們選擇合理的統(tǒng) 計(jì)方法來(lái)分析資料大有幫助 。 2013.3.3 26 一、離散型定量變量的頻率分布 例 2-1 某山區(qū) 1998年 96名 孕婦產(chǎn)前檢查次數(shù)資料如下: 0, 3, 2, 0, 1, 5, 6, 3, 2, 4, 1, 0, 6, 5, 1, 3, 3, , 4, 7。 試編制產(chǎn)前檢查次數(shù)的頻率分布表 。 檢查次數(shù) 0 4 4 . 2 4 4 . 2 1 7 7 . 3 11 1 1 . 5 2 11 1 1 . 5
16、22 2 2 . 9 3 13 1 3 . 5 35 3 6 . 5 4 26 2 7 . 1 61 6 3 . 5 5 23 2 4 . 0 84 8 7 . 5 5 12 1 2 . 5 96 1 0 0 . 0 合計(jì) 96 1 0 0 . 0 表 2 - 1 1 9 9 8 年某地 96 名婦女產(chǎn)前檢查次數(shù)頻率分布 累計(jì)頻數(shù) 累計(jì)頻率 ( % ) 頻數(shù) 頻率 ( % ) 2013.3.3 27 離散型定量變量的頻率分布圖可用直條圖( bar chart) 表達(dá)。 圖 2- 1 某地96名婦女產(chǎn)前檢查次數(shù)頻率分布 0 5 10 15 20 25 30 0 1 2 3 4 5 5 產(chǎn)前檢查次
17、數(shù) 頻率 ( % ) 2013.3.3 28 二、連續(xù)型定量變量的頻率分布 例 2-2 抽樣調(diào)查某地 120名 18歲 35歲健康男性居民血清鐵含 量 (mol/L), 數(shù)據(jù)如下 。 試編制血清鐵含量的頻率 分布 表 。 7. 42 8. 65 23 .0 2 21 .6 1 21 .3 1 21 .4 6 9. 97 22 .7 3 14 .9 4 20 .1 8 21 .6 2 23 .0 7 20 .3 8 8. 40 17 .3 2 29 .6 4 19 .6 9 21 .6 9 23 .9 0 17 .4 5 19 .0 8 20 .5 2 24 .1 4 23 .7 7 18 .3
18、 6 23 .0 4 24 .2 2 24 .1 3 21 .5 3 11 .0 9 18 .8 9 18 .2 6 23 .2 9 17 .6 7 15 .3 8 18 .6 1 14 .2 7 17 .4 0 22 .5 5 17 .5 5 16 .1 0 17 .9 8 20 .1 3 21 .0 0 14 .5 6 19 .8 9 19 .8 2 17 .4 8 14 .8 9 18 .3 7 19 .5 0 17 .0 8 18 .1 2 26 .0 2 11 .3 4 13 .8 1 10 .2 5 15 .9 4 15 .8 3 18 .5 4 24 .5 2 19 .2 6 2
19、6 .1 3 16 .9 9 18 .8 9 18 .4 6 20 .8 7 17 .5 1 13 .1 2 11 .7 5 17 .4 0 21 .3 6 17 .1 4 13 .7 7 12 .5 0 20 .4 0 20 .3 0 19 .3 8 23 .1 1 12 .6 7 23 .0 2 24 .3 6 25 .6 1 19 .5 3 14 .7 7 14 .3 7 24 .7 5 12 .7 3 17 .2 5 19 .0 9 16 .7 9 17 .1 9 19 .3 2 19 .5 9 19 .1 2 15 .3 1 21 .7 5 19 .4 7 15 .5 1 10 .8
20、 6 27 .8 1 21 .6 5 16 .3 2 20 .7 5 22 .1 1 13 .1 7 17 .5 5 19 .2 6 12 .6 5 18 .4 8 19 .8 3 23 .1 2 19 .2 2 19 .2 2 16 .7 2 27 .9 0 11 .7 4 24 .6 6 14 .1 8 16 .5 2 2013.3.3 29 1. 計(jì)算全距 全距 ( range) 亦稱 極差 ,用 R 表示, R=最大值最小值。本例 R=29.64 7.42 =22.22( mmol/L)。 2. 確定組距和組段 組距即組段間隔數(shù),用 i 表示。常取全距的 1/10取整 作為組距。 本例
21、 i = 22.22/10 = 2.2222。 組段即由組距分隔的區(qū)間,每個(gè)組段的起點(diǎn) 稱 下限 ,終點(diǎn)稱 上限 。每個(gè)組段規(guī)定為: 下限 , 上限 ) 2013.3.3 30 要求第一組段包含最小值,最后組段包含最 大值;一般劃分 8 15個(gè)組段為宜。 本例 第一組段可定為 6, 8), 最后一個(gè) 組段為 28, 30),共 分 12個(gè)組段 。 3. 列表劃記計(jì)頻 列成如表 2-2的形式,采 用劃記法把全部原始數(shù)據(jù)劃歸到每個(gè)組段中,以 頻數(shù)統(tǒng)計(jì)。劃記法可采用劃 “ 正 ” 字法或劃 “ ” 法, 最后統(tǒng)計(jì)出每個(gè)組段的筆畫總數(shù)即得頻數(shù)。 本例見(jiàn)下 表 2-2: 2013.3.3 31 2013
22、.3.3 32 表 2-2中的第( 1)和第( 2)欄構(gòu)成頻數(shù)表 。 三 *、直方圖 (頻率分布圖 ) 頻率分布圖 是頻率分布表的直觀表達(dá) , 亦稱 直方圖 ( histogram) 。 本例見(jiàn)圖 2-2。 0 2 4 6 8 10 12 7 9 11 13 15 17 19 21 23 25 27 29 血清鐵( m ol / L ) 頻率密度( % ) 頻率密度 =頻率 /組距 2013.3.3 33 四 *、頻率分布特征 頻率分布有兩個(gè)特征: 集中趨勢(shì) ( central tendency) 離散趨勢(shì) ( tendency of dispersion) 五 *、頻率分布類型 對(duì)稱分布 正
23、態(tài)分布是最常用的對(duì)稱分 布。醫(yī)學(xué)上常見(jiàn)的有體溫、身高、脈搏等的頻數(shù) 分布。 偏態(tài)分布 即不對(duì)稱分布。 2013.3.3 34 偏態(tài) 正偏態(tài)( 頻數(shù)多集中在觀察值較小的一側(cè) ) 負(fù)偏態(tài)( 頻數(shù)多集中在觀察值較大的一側(cè) ) 下圖為一正偏態(tài)的直方圖。 圖 2 - 3 某地居民 238 人發(fā)汞含量( m o l/ k g )分布 0 2 4 6 8 10 12 14 16 2.5 4.5 6.5 8.5 10.5 12.5 14.5 16.5 18.5 20.5 發(fā)汞組中值( m o l/ k g ) 頻率密度( % ) 2013.3.3 35 六 *、頻率分布表 (圖 )的用途 揭示資料的分布特征和
24、分布類型。 便于發(fā)現(xiàn)某些特大或特小的可疑值。 第二節(jié) 描述平均水平的統(tǒng)計(jì)指標(biāo) 平均數(shù) ( average) 是統(tǒng)計(jì)學(xué)中描述定量資料 的集中趨勢(shì),反映資料的平均水平或集中位置的 最常用、最重要的指標(biāo)體系。常用的平均數(shù)有: 均數(shù) 、 幾何均數(shù) 和 中位數(shù) 。 便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析。 2013.3.3 36 一、算術(shù)均數(shù) 算術(shù)均數(shù) 簡(jiǎn)稱 均數(shù) ( arithmetic mean, 簡(jiǎn)稱 mean)。 總體均數(shù)用希臘字母 表示,樣本均數(shù) 用 表示。 適用于描述對(duì)稱分布,尤其是正態(tài)分 布或近似正態(tài)分布的數(shù)值變量資料的平均水平。 計(jì)算方法有: X 1. 直接法 將所有觀測(cè)值相加求和除以觀測(cè) 值個(gè)數(shù)
25、。公式為: n X n XXXXX n .321 式中 是希臘字母,為求和符號(hào) 。 公式 (2-1) 2013.3.3 37 例 2-3 測(cè)得 8只正常大鼠血清總酸性磷酸酶 ( TACP) 含量 ( U/L) 為 4.20, 6.43, 2.08, 3.45, 2.26, 4.04, 5.42, 3.38。 試求其 算術(shù)均數(shù) 。 代入 公式( 2-1) 得 : 2. 加權(quán)法 適合于頻數(shù)分布表資料求均數(shù)。 公式為: n fX f fX ffff XfXfXfXfX k kk . . 321 332211 公式 (2-2) )(9 0 7 53 8 383425044262453082436204
26、 L/U. n X X 2013.3.3 38 式中 k是組段 ; fi為每組段的頻數(shù) ; Xi為每組段的組 中值 。 組中值等于本組段的下限和上限相加除以 2。 i=1,2 k 。 用加權(quán)法計(jì)算例 2-1的均數(shù)見(jiàn)表 2-3。 組段 6 1 7 7 8 3 9 27 10 6 11 66 12 8 13 104 14 12 15 180 16 20 17 340 18 27 19 513 20 18 21 378 22 12 23 276 24 8 25 200 26 4 27 108 28 30 1 29 29 合計(jì) 120 2228 表 2 - 3 頻率表法計(jì)算均數(shù) f X = 頻數(shù) f
27、組中值 ( X) 2013.3.3 39 代入 公式( 2-2) 得 : Lm o lffXX /57.18131 29193710 二、幾何均數(shù) 幾何均數(shù) ( geometric mean) 用 G表示。 適用 于描述各觀測(cè)值之間呈倍數(shù)關(guān)系(等比數(shù)列), 或偏態(tài)分布資料的變量值經(jīng)對(duì)數(shù)變換后呈正態(tài)分 布(簡(jiǎn)稱對(duì)數(shù)正態(tài)分布)資料的平均水平。 2013.3.3 40 計(jì)算方法有: 1. 直接法 公式為: n nXXXXG 321 G X X X Xn Xnn lg ( lg lg lg . . . lg ) lg ( lg )1 1 2 3 1 式 (2-4) 例 2-5a 現(xiàn)有 7份血清的抗體效
28、價(jià)為: 1:2、 1:4、 1:8、 1:32、 1:32、 1:64、 1:64 。 求其平均效價(jià) 。 式中 lg-1表示 lg 的反函數(shù) , 即 lg-1 =10 x。 為簡(jiǎn)化計(jì)算,用抗體效價(jià)的倒數(shù)為 X代入 式 (2-4)得 : 式 (2-3) 2013.3.3 41 1610)204.1(lg)7 64lg.8lg4lg2lg(lg 204.111 G 該 7份血清的平均抗體效價(jià)為 1 : 16。 2. 加權(quán)法 適合于有較多觀測(cè)值或頻率分布 表資料。公式為: G f X f X f X f Xf f f f n n n lg ( lg lg lg . . . lg. . . )1 1
29、1 2 2 3 3 1 2 3 lg ( lg ) lg ( lg )1 1 f Xf f Xn式 (2-5) 式中 X是觀測(cè)值或組中值 。 2013.3.3 42 例 2-6a 某地 60人的血清抗體效價(jià) , 分別為: 7人 1:5, 11人 1:10, 22人 1:20, 12人 1:40, 8人 1:80, 見(jiàn)表 2-6a的 ( 1) 、 ( 2) 欄 , 求其平均抗體效價(jià) 。 抗體滴度 頻數(shù) f 效價(jià)倒數(shù) X l g X ( 1) ( 2) ( 3) ( 4) 1 : 5 7 5 0.6990 4.8928 1 : 10 11 10 1.0000 11.0000 1 : 20 22 2
30、0 1.3010 28.6227 1 : 40 12 40 1.6021 19.2247 1 : 80 8 80 1.9031 15.2247 合計(jì) ( f =) 60 ( f l g X =) 78.9649 f l g X ( 5) =( 2) ( 4) 表 2 -6 a 某地 60 人的血清抗體平均效價(jià)計(jì)算表 2013.3.3 43 代入 式( 2-5) 得 : 706.20)3 1 6 1.1(lg)609 6 4 9.78(lg)lg(lg 111 f XfG 60人的平均抗體效價(jià)為 1 : 20.706。 三、中位數(shù)與百分位數(shù) 中位數(shù) ( median) 用 M表示。一組觀測(cè)值從
31、小到大順序排列,位次居中的觀測(cè)值即為中位數(shù)。 適用于各種資料,但常用于描述 偏態(tài)分布 分 布不清 有特大、特小值 端點(diǎn)無(wú)確定數(shù)值的資 料的集中位置。 計(jì)算方法有: 2013.3.3 44 1. 直接法 適合例數(shù)較少的資料。先將所有 觀測(cè)值從小到大排序,當(dāng)例數(shù)為奇數(shù)時(shí),居中的 觀測(cè)值即為中位數(shù);當(dāng)例數(shù)為偶數(shù)時(shí),居中的兩 個(gè)觀測(cè)值相加除以 2即為中位數(shù)。公式為: M X n ( )12 M X Xn n / 2 2 1 2 n為奇數(shù)時(shí) n為偶數(shù)時(shí) 式 (2-6) 式 (2-7) 式中下標(biāo)為排序后的觀測(cè)值的位次 。 2013.3.3 45 例 2-7a 某傳染病患者 9例 , 他們的潛伏期分別為:
32、6、 5、 4、 7、 12、 4、 5、 7、 9天 。 求中位數(shù) 。 首先排序: 4、 4、 5、 5、 6、 7、 7、 9、 12 位次: 1 2 3 4 5 6 7 8 9 本例 n=9為奇數(shù),故 M=6天 。 用 式( 2-6) , )(65) 2 19( 天 XXM 例 2-7b 若例 10.5增加 潛伏期為 20天的一例 。 求中位數(shù) 。 首先排序: 4、 4、 5、 5、 6、 7、 7、 9、 12、 20 位次: 1 2 3 4 5 6 7 8 9 10 本例 n=10為偶數(shù),故 M=(6+7)/2=6.5(天 )。 用 式( 2-7) , )(5.62/)(2/ 651
33、 22 天 XXXXM nn 2013.3.3 46 2. 頻率分布表法 適用于頻率分布表資料。 公式為: )2( L M fnf iLM 式 (2-8a) 式中 L為中位數(shù)所在組段的下限 ; fM為該組段的頻數(shù) ; i為該組段的組距 ; fL為小于 L的各組段累計(jì)頻數(shù) 。 要想判斷出中位數(shù)所在組段,可從頻率分布 表中先計(jì)算累計(jì)頻數(shù)或累計(jì)頻率,再利用 n/2或 50%找出 中位數(shù)所在組段,最后代入 式 (2-8a)求中 位數(shù)。 2013.3.3 47 例 2-8a 某研究者測(cè)得某年某市 308名 6歲以下兒童的尿鉛值 , 見(jiàn)表 2-8a的 ( 1) 、 ( 2) 欄 , 求其中位數(shù) ( 即平均
34、尿鉛值 ) 。 頻數(shù) ( f ) (1 ) (2 ) (3 ) 0 27 27 8.77 25 54 81 26.30 50 95 176 57.14 75 55 231 75.00 100 39 270 87.66 125 21 291 94.48 150 12 303 98.38 175 5 308 100.00 合計(jì) 308 (4 )= (3 )/ n 表 2- 8a 308 名 6 歲以下兒童的尿鉛值 的中位數(shù)及百分位數(shù)計(jì)算表 尿鉛值 ( m m ol / L ) 累計(jì)頻數(shù) ( f ) 累計(jì)頻率 (%) 2013.3.3 48 求出累計(jì)頻數(shù)或累計(jì)頻率,見(jiàn)表 2-8a的 (3)、 (4)
35、欄。 本例 n/2=308/2=154, 累計(jì)頻數(shù) 176剛好包含 n/2, 則中位數(shù) 落在 176所在的第三組段; 累計(jì)頻率 57.14%剛好包含 50%, 則中位數(shù)落在 57.14%所在的第三組段。 則 L =50, i =25 , fM =95 , fL =81。 代入 式 (2-8a)得 : )/(21.69)812308(952550 Lm m olM 308名 6歲以下兒童的尿鉛值中位數(shù)為 69.21mmol/L。 2013.3.3 49 例 2-8 試?yán)帽?2-2的頻率表求例 2-2中血清鐵含量的中位數(shù) 。 組段 6 1 0 . 8 3 1 0 . 8 3 8 3 2 . 5
36、0 4 3 . 3 3 10 6 5 . 0 0 10 8 . 3 3 12 8 6 . 6 7 18 1 5 . 0 0 14 12 1 0 . 0 0 30 2 5 . 0 0 16 20 1 6 . 6 7 50 4 1 . 6 7 18 27 2 2 . 5 0 77 6 4 . 1 7 20 18 1 5 . 0 0 95 7 9 . 1 7 22 12 1 0 . 0 0 107 8 9 . 1 7 24 8 6 . 6 7 115 9 5 . 8 3 26 4 3 . 3 3 119 9 9 . 1 7 28 30 1 0 . 8 3 120 1 0 0 . 0 0 合計(jì) 120
37、 1 0 0 . 0 0 表 2 - 2 1 2 0 名正常成年男子血清鐵含量 ( m o l/ L ) 頻率分布 累計(jì)頻數(shù) 累計(jì)頻率 ( % ) 頻數(shù) 頻率 ( % ) 2013.3.3 50 從表 2-2可判斷出 M位于“ 18”這個(gè)組段。將相應(yīng)數(shù) 據(jù)代入 式 (2-8a) )/(74.1850100 1205027218 Lm o lM 985.182/)08.1989.18( 2/)(2/ 6160 1 2 1 2 0 2 1 2 0 XXXXM 若按 式 (2-7) 別忘先排序呦! 2013.3.3 51 百分位數(shù) ( percentile, Px) 百分位數(shù)是一組 從小到大排列的觀
38、測(cè)值的 百等份分割值 。 和中位 數(shù)一樣,都是位置指標(biāo)。中位數(shù)是一個(gè)特定的百 分位數(shù),即 M=P50。 百分位數(shù)的計(jì)算公式為: P L if n x fx x L ( % ) 式 (2-8) 式中 L為 Px所在組段的下限 ; fx為該組段的頻數(shù) ; i為 該組段的組距 ; fL為小于 L的各組段累計(jì)頻數(shù) 。 2013.3.3 52 例 2-8b 某傳染性疾病的潛伏期 ( 天 ) 見(jiàn)表 2-8b, 求平均潛 伏期 M和潛伏期的第 25、 75與 95百分位數(shù) P25, P75與 P95 。 頻數(shù) ( f ) (1 ) (2 ) (3 ) 2 26 26 23.64 4 48 74 67.27
39、6 25 99 90.00 8 6 105 95.45 10 3 108 98.18 12 2 110 100.00 合計(jì) 110 (4 )= (3 )/ n 表 2- 8b 某傳染性疾病的潛伏期(天) 的中位數(shù)及百分位數(shù)計(jì)算表 潛伏期(天) 累計(jì)頻數(shù) ( f ) 累計(jì)頻率 (%) 2013.3.3 53 首先根據(jù)表 2-8b的 (4)欄累計(jì)頻率,累計(jì)頻率 67.27% 剛好包含 25%,則 P25落在 67.27%所在的第二組段。 則 L=4, i=2, fx=48, fL=26。 代入 式 (2-8) 得 : )(06.4)26%25110(482425 天P 同理可知: P50 (M)
40、也落在第二組段,則 L=4, i=2, fx =48, fL=26。 代入 式 (2-8)得 : )(21.5)26%50110(482450 天 PM 2013.3.3 54 )(68.6)74%75110(252675 天P 同理可得 : )(83.9)99%95110(62895 天P 四、眾數(shù) 眾數(shù) ( mode) 一組觀測(cè)值中出現(xiàn)頻率最高 的觀測(cè)值即為眾數(shù)。 2013.3.3 55 第三節(jié) 描述變異程度的統(tǒng)計(jì)指標(biāo) 本章前面講授的頻率分布有 集中趨勢(shì) 和 離散 趨勢(shì) 兩個(gè)特征,說(shuō)明描述資料的全面變化規(guī)律需 把二者結(jié)合起來(lái)。通過(guò)下例可說(shuō)明這個(gè)問(wèn)題。 例 2-11a 現(xiàn)有 3組健康女大學(xué)生
41、的口腔溫度測(cè)得值如下 , 試 分析其集中趨勢(shì)和離散趨勢(shì) 。 1組 36.8 36.9 37.0 37.1 37.2 2組 36.5 36.9 37.0 37.1 37.5 3組 36.5 36.7 37.0 37.3 37.5 0.371 X 0.372 X 0.373 X 2013.3.3 56 前面三組學(xué)生的平均口腔溫度都是 37.0( ), 即 集中趨勢(shì) 相同 , 但能說(shuō)明三組數(shù)據(jù)的變化規(guī)律 相同嗎 ? 我們通過(guò)把上述三組數(shù)據(jù)轉(zhuǎn)化成數(shù)軸上 的點(diǎn)看看這個(gè)問(wèn)題 。 2013.3.3 57 顯然三組學(xué)生的口腔溫度值參差不齊的程度 都各不相同 。 第 1組數(shù)值較為集中 , 第 2、 3組數(shù) 值較
42、為發(fā)散 。 說(shuō)明三組數(shù)據(jù)的 離散趨勢(shì) 是不相同 的 。 統(tǒng)計(jì)學(xué)中常用描述變量值的 離散程度 (亦稱 變異程度 )的指標(biāo)有: 極差 、 四分位數(shù)間距 、 方 差 、 標(biāo)準(zhǔn)差 和 變異系數(shù) 。 一、 極差 極差 亦稱 全距 ,用 R表示。 極差 是所有變量 2013.3.3 58 值中最大值與最小值之差 , 它反映了變量值的變 異范圍大小 。 極差 大變異程度大; 極差 小變異程 度小 。 例 2-11a中 , R1=37.2-36.8=0.4、 R2=1.0、 R3= 1.0。 說(shuō)明 第 1組數(shù)據(jù)的 離散趨勢(shì) 比第 2、 3組小 。 全距 計(jì)算簡(jiǎn)便,但粗略,不穩(wěn)定。 例 2-11a中 , R2=
43、R3=1.0, 并不能說(shuō)明 兩組數(shù)據(jù) 的 離散趨勢(shì) 一樣 。 極差 易受極大或極小值的影響。 2013.3.3 59 二、 四分位數(shù)間距 四分位數(shù) ( InterQuartile Range, IQR) 是特定 的百分位數(shù)。第 25百分位數(shù)( P25 )稱為 下四分 位數(shù) ( lower quartile) ,常用 QL表示;第 75百分 位數(shù)( P75 )稱為 上四分位數(shù) ( upper quartile) , 常用 QU表示。 四分位數(shù)間距 即 QU與 QL之差,用 IQR表示。 2013.3.3 60 四分位數(shù)間距 可用于各種分布的資料,特別 對(duì)偏峰分布資料,尤其是有特大或特小值;分布
44、末端無(wú)確切數(shù)值的資料。 例 2-13a 用表 2-8b資料計(jì)算 四分位數(shù)間距 IQR。 在前面百分位數(shù)中已求得 P25 =4.06天 , P75 =6.68天 , 則 四分位數(shù)間距 IQR為: )(62.206.468.6 天 LU QQI Q R 四分位數(shù)間距 雖比 極差 穩(wěn)定,但仍未考慮所 有變量值的變異程度。 2013.3.3 61 三、 方差 方差 ( variance) 是常用的變異指標(biāo)。 總體方 差 用 2表示, 樣本方差 用 S2表示。 總體方差 往往 未知,常用 樣本方差 來(lái)估計(jì)。 方差 的計(jì)算公式為: 1 )( 22 n XXS N X 22 )( 式 (2-10) 式 (2
45、-11) William Sealy Gosset (1876-1937) Student 英國(guó)統(tǒng)計(jì)學(xué)家 Gosset建議用 n-1代替 n計(jì)算 S2, 可證明 S2總在 2的周 圍(無(wú)偏估計(jì))。 n-1稱為 自由度 ( degree of freedom )。 稱為 離均差平方和 In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary. 2013.3.3 62 標(biāo)準(zhǔn)差 ( stand
46、ard deviation) 是 方差 的平方根。 因 方差 使度量衡單位變成平方,故對(duì) 方差 開(kāi)平方 根恢復(fù)原單位就得到 標(biāo)準(zhǔn)差 。 總體標(biāo)準(zhǔn)差 用 表 示, 樣本標(biāo)準(zhǔn)差 用 S表示。計(jì)算公式為: N X 2)( 四、 標(biāo)準(zhǔn)差 1 )( 2 n XXS 式 (2-10a) 式 (2-11a) 2013.3.3 63 離均差平方和 常用 SS或 lxx表示。 其展開(kāi)式為: 2)( XX n XXXX 222 )()( 把上述展開(kāi)式代入 式 (2-11a)則得到直接由原始 數(shù)據(jù)求 標(biāo)準(zhǔn)差 的公式: 1 22 n nXXS 式 (2-12a) 式中 是 變量值平方 的和 ; 是 變量值和 的平方
47、。 上式為直接法的計(jì)算公式,下式為加權(quán)法的: 2X 2)( X 2013.3.3 64 1 22 n nfXfXS 式 (2-13a) 式中 X 是各組段的組中值 , f 是相應(yīng)的頻數(shù) 。 例 2-14a 求例 2-11a三組數(shù)據(jù)的各自 標(biāo)準(zhǔn)差 。 1.6 8 4 52.371.370.379.368.36 222222 X 求第 1組的 S1: 34225185)2.371.370.379.368.36()( 222 X )(15 8.0 15 518 51.68 45 1 222 1 Cn nXXS 同理得: )(361.0 2 CS )(412.03 CS 2013.3.3 65 例 2
48、-15 用加權(quán)法求例 2-2數(shù)據(jù)的 標(biāo)準(zhǔn)差 。 由下表 2-3的 ( 2)、( 4)、( 5)欄可得: 1 2 0 fn 2228 Xf 4 3 6 4 02 Xf 組段 6 1 7 7 49 8 3 9 27 243 10 6 11 66 726 12 8 13 104 1352 14 12 15 180 2700 16 20 17 340 5780 18 27 19 513 9747 20 18 21 378 7938 22 12 23 276 6348 24 8 25 200 5000 26 4 27 108 2916 28 30 1 29 29 841 合計(jì) 120 ( f ) 222
49、8 ( f X) 43640 ( f X 2 ) f X 2 = 表 2 - 3 頻率表法計(jì)算均數(shù)和標(biāo)準(zhǔn)差 f X = 頻數(shù) f 組中值 ( X) 2013.3.3 66 代入 式 (2-13a)得 : )/(37.41120 120/22284 3 6 4 01 /)( 222 Lm o ln nfXfXS 標(biāo)準(zhǔn)差 適用于描述對(duì)稱分布,尤其是正態(tài)分 布或近似正態(tài)分布的數(shù)值變量資料的變異程度。 2013.3.3 67 五、 變異系數(shù) 變異系數(shù) ( coefficient of variation) 常記為 CV。 它被定義為 標(biāo)準(zhǔn)差 與 均數(shù) 之比,即 CV SX 100% 式 (2-14)
50、變異系數(shù) 適用于比較度量衡單位不同的 或 均 數(shù)相差懸殊的多組資料的變異程度。 例 2-16a 某地 7歲女孩身高均數(shù)為 120.25cm, 標(biāo)準(zhǔn)差為 4.42cm;胸圍均數(shù)為 56.63cm, 標(biāo)準(zhǔn)差為 2.91cm。 試比較身高與胸圍 的變異程度 。 2013.3.3 68 C 身高 %68.3%10025.120 42.4 CV 胸圍 %14.5%10063.56 91.2 CV 例 2-16b 某地調(diào)查 150名女大學(xué)生身高均數(shù)為 162.05cm, 標(biāo) 準(zhǔn)差為 4.67cm;體重均數(shù)為 50.10kg, 標(biāo)準(zhǔn)差為 4.98kg。 試比較身高 與體重的變異程度 。 身高 %88.2%10005.162 67.4 CV 體重 %94.9%10010.50 98.4 CV
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 川渝旅游日記成都重慶城市介紹推薦景點(diǎn)美食推薦
- XX國(guó)有企業(yè)黨委書記個(gè)人述責(zé)述廉報(bào)告及2025年重點(diǎn)工作計(jì)劃
- 世界濕地日濕地的含義及價(jià)值
- 20XX年春節(jié)節(jié)后復(fù)工安全生產(chǎn)培訓(xùn)人到場(chǎng)心到崗
- 大唐女子圖鑒唐朝服飾之美器物之美繪畫之美生活之美
- 節(jié)后開(kāi)工第一課輕松掌握各要點(diǎn)節(jié)后常見(jiàn)的八大危險(xiǎn)
- 廈門城市旅游介紹廈門景點(diǎn)介紹廈門美食展示
- 節(jié)后開(kāi)工第一課復(fù)工復(fù)產(chǎn)十注意節(jié)后復(fù)工十檢查
- 傳統(tǒng)文化百善孝為先孝道培訓(xùn)
- 深圳城市旅游介紹景點(diǎn)推薦美食探索
- 節(jié)后復(fù)工安全生產(chǎn)培訓(xùn)勿忘安全本心人人講安全個(gè)個(gè)會(huì)應(yīng)急
- 預(yù)防性維修管理
- 常見(jiàn)閥門類型及特點(diǎn)
- 設(shè)備預(yù)防性維修
- 2.乳化液泵工理論考試試題含答案