Pearson相關(guān)系數(shù)簡(jiǎn)介.ppt
《Pearson相關(guān)系數(shù)簡(jiǎn)介.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《Pearson相關(guān)系數(shù)簡(jiǎn)介.ppt(26頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
兩變量關(guān)聯(lián)性分析pearson相關(guān)系數(shù)介紹 世間萬物是普遍聯(lián)系的 醫(yī)學(xué)上 許多現(xiàn)象之間也都有相互聯(lián)系 例如 身高與體重 體溫與脈搏 年齡與血壓 產(chǎn)前檢查與嬰兒體重 乙肝病毒與乙肝等 在這些有關(guān)系的現(xiàn)象中 它們之間聯(lián)系的程度和性質(zhì)也各不相同 相關(guān)的含義 圖5 0 a 函數(shù)關(guān)系 客觀現(xiàn)象之間的數(shù)量聯(lián)系存在著函數(shù)關(guān)系和相關(guān)關(guān)系 當(dāng)一個(gè)或幾個(gè)變量取定值時(shí) 另一個(gè)變量有確定的值與之對(duì)應(yīng) 稱為函數(shù)關(guān)系 可用Y f X 表示 當(dāng)一個(gè)變量增大 另一個(gè)也隨之增大 或減少 我們稱這種現(xiàn)象為共變 或相關(guān) correlation 兩個(gè)變量有共變現(xiàn)象 稱為有相關(guān)關(guān)系 相關(guān)關(guān)系不一定是因果關(guān)系 主要探討線性相關(guān) pearson相關(guān)系數(shù) 主要內(nèi)容 一 散點(diǎn)圖二 相關(guān)系數(shù)三 相關(guān)系數(shù)的假設(shè)檢驗(yàn) 一 散點(diǎn)圖 為了確定相關(guān)變量之間的關(guān)系 首先應(yīng)該收集一些數(shù)據(jù) 這些數(shù)據(jù)應(yīng)該是成對(duì)的 例如 每人的身高和體重 然后在直角坐標(biāo)系上描述這些點(diǎn) 這一組點(diǎn)集稱為散點(diǎn)圖 作法 為了研究父親與成年兒子身高之間的關(guān)系 卡爾 皮爾遜測(cè)量了1078對(duì)父子的身高 把1078對(duì)數(shù)字表示在坐標(biāo)上 如圖 用水平軸X上的數(shù)代表父親身高 垂直軸Y上的數(shù)代表兒子的身高 1078個(gè)點(diǎn)所形成的圖形是一個(gè)散點(diǎn)圖 它的形狀象一塊橄欖狀的云 中間的點(diǎn)密集 邊沿的點(diǎn)稀少 其主要部分是一個(gè)橢圓 2 相關(guān)類型 3 作用 粗略地給出了兩個(gè)變量的關(guān)聯(lián)類型與程度 通過相關(guān)散布圖的形狀 我們大概可以判斷變量之間相關(guān)程度的強(qiáng)弱 方向和性質(zhì) 但并不能得知其相關(guān)的確切程度 為精確了解變量間的相關(guān)程度 還需作進(jìn)一步統(tǒng)計(jì)分析 求出描述變量間相關(guān)程度與變化方向的量數(shù) 即相關(guān)系數(shù) 總體相關(guān)系數(shù)用p表示 樣本相關(guān)系數(shù)用r表示 二 相關(guān)系數(shù) 變量的取值區(qū)間越大 觀測(cè)值個(gè)數(shù)越多 相關(guān)系數(shù)受抽樣誤差的影響越小 結(jié)果就越可靠 如果數(shù)據(jù)較少 本不相關(guān)的兩列變量 計(jì)算的結(jié)果可能相關(guān) 相關(guān)系數(shù)取值 1 r 1 相關(guān)系數(shù)的性質(zhì) r 表明兩變量間相關(guān)的程度 r 0表示正相關(guān) r 0表示負(fù)相關(guān) r 0表示零相關(guān) 相關(guān)系數(shù)的性質(zhì) r 越接近于1 表明兩變量相關(guān)程度越高 它們之間的關(guān)系越密切 r 的取值與相關(guān)程度 Pearson相關(guān)系數(shù)的計(jì)算 適用條件1 兩變量均應(yīng)由測(cè)量得到的連續(xù)變量 2 兩變量所來自的總體都應(yīng)是正態(tài)分布 或接近正態(tài)的單峰對(duì)稱分布 3 變量必須是成對(duì)的數(shù)據(jù) 4 兩變量間為線性關(guān)系 Pearson相關(guān)系數(shù)的計(jì)算 X的離均差平方和 Y的離均差平方和 X與Y間的離均差積和 離均差平方和 離均差積和的展開 例13 1 測(cè)得某地15名正常成年人的血鉛X和24小時(shí)的尿鉛Y 試分析血鉛與24小時(shí)尿鉛之間是否直線相關(guān) 15名自愿者的血鉛和24小時(shí)尿鉛測(cè)量值 mol L X 3 00 Y 3 17 X2 0 7168 Y2 0 7681 XY 0 7388n 15 0 9787 相關(guān)系數(shù)的假設(shè)檢驗(yàn) 意義 上例中的相關(guān)系數(shù)r等于0 9787 說明了15例樣本中血鉛與尿鉛之間存在相關(guān)關(guān)系 但是 這15例只是總體中的一個(gè)樣本 由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差 因?yàn)?總體相關(guān)系數(shù) 為零時(shí) 由于抽樣誤差 從總體抽出的15例 其r可能不等于零 所以 要判斷該樣本的r是否有意義 需與總體相關(guān)系數(shù) 0進(jìn)行比較 看兩者的差別有無統(tǒng)計(jì)學(xué)意義 這就要對(duì)r進(jìn)行假設(shè)檢驗(yàn) 判斷r不等于零是由于抽樣誤差所致 還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系 相關(guān)系數(shù)的假設(shè)檢驗(yàn) 步驟1 提出假設(shè)H0 p 0無關(guān)H1 p 0相關(guān)2 確定顯著性水平 0 05如果從相關(guān)系數(shù) 0的總體中取得某r值的概率P 0 05 我們就接受假設(shè) 認(rèn)為此r值的很可能是從此總體中取得的 因此判斷兩變量間無顯著關(guān)系 如果取得r值的概率P 0 05或P 0 01 我們就在 0 05或 0 01水準(zhǔn)上拒絕檢驗(yàn)假設(shè) 認(rèn)為該r值不是來自 0的總體 而是來自 0的另一個(gè)總體 因此就判斷兩變量間有顯著關(guān)系 3 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 查表得到P值 拒絕H0 則兩變量相關(guān) 否則 兩變量無關(guān) 相關(guān)系數(shù)的假設(shè)檢驗(yàn) t檢驗(yàn)法計(jì)算檢驗(yàn)統(tǒng)計(jì)量tr 查t界值表 得到P值 例題 H0 0無關(guān)H1 0相關(guān) 0 05r 0 9787 n 15 代入公式v 15 2 13 查界值表 P 0 001 拒絕H0 認(rèn)為血鉛與尿鉛之間有正相關(guān)關(guān)系 三 相關(guān)注意事項(xiàng) 線性相關(guān)的前提條件是X Y都服從正態(tài)分布 雙變量正態(tài)分布 當(dāng)散點(diǎn)圖有線性趨勢(shì)時(shí) 才可進(jìn)行線性相關(guān)分析必須在假設(shè)檢驗(yàn)認(rèn)為相關(guān)的前提下才能以r的大小判斷相關(guān)程度相關(guān)關(guān)系并不一定是因果關(guān)系 有可能是伴隨關(guān)系 如何判斷兩個(gè)變量的相關(guān)性 1 找出兩個(gè)變量的正確相應(yīng)數(shù)據(jù) 2 畫出它們的散布圖 散點(diǎn)圖 3 通過散布圖判斷它們的相關(guān)性 4 給出相關(guān) r 的解答 5 對(duì)結(jié)果進(jìn)行評(píng)價(jià)和檢驗(yàn) Thankyou- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- Pearson 相關(guān)系數(shù) 簡(jiǎn)介
鏈接地址:http://www.3dchina-expo.com/p-8622535.html