數(shù)字圖象處理-第10章模式識別的理論與方法.ppt
《數(shù)字圖象處理-第10章模式識別的理論與方法.ppt》由會員分享,可在線閱讀,更多相關(guān)《數(shù)字圖象處理-第10章模式識別的理論與方法.ppt(61頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第10章模式識別的理論和方法 一個(gè)圖像識別系統(tǒng)可分為三個(gè)主要部分 其框圖如圖 10 1 所示 1 圖像信息的獲取 2 信息的加工和處理 抽取特征 3 判斷或分類 圖10 1圖像識別系統(tǒng)框圖 被識圖像 圖像獲取 信息處理特征抽取 判決 結(jié)果 10 1概述 模式識別的主要方法可分為兩大類 統(tǒng)計(jì)學(xué)方法語言學(xué)方法 兩類方法的不足 第一種方法沒有利用圖像本身的結(jié)構(gòu)關(guān)系第二類方法沒有考慮圖像在環(huán)境中受噪聲的干擾 10 2統(tǒng)計(jì)模式識別法 1 常用的決策規(guī)則基于最小錯(cuò)誤率的貝葉斯決策在圖像識別中 我們總希望盡量減少分類錯(cuò)誤 利用貝葉斯 Bayes 公式能夠得到錯(cuò)誤率最小的分類規(guī)則 這就是基于最小錯(cuò)誤率的貝葉斯決策 10 2 1決策理論方法 設(shè) 為狀態(tài)下觀察X類的條件概率密度 為狀態(tài)下觀察X類的條件概率密度 利用貝葉斯公式 得到的條件概率稱為狀態(tài)的后驗(yàn)概率 基于最小錯(cuò)誤率的貝葉斯決策規(guī)則為 如果 則把X歸類為 如果 則把X歸類為 基于最小風(fēng)險(xiǎn)的貝葉斯決策最小風(fēng)險(xiǎn)的貝葉斯決策是考慮各種錯(cuò)誤造成損失而提出的決策規(guī)則 2 線性判別函數(shù) 線性判別函數(shù)是指判別函數(shù)是圖像所有特征量的線性組合 即 式中代表第i個(gè)判別函數(shù) 是系數(shù)或權(quán) 為常數(shù)項(xiàng)或稱為閾值 在兩類之間的判決界處有下式的形式 10 4 10 5 3 最小距離分類器線性分類器中重要的一類是用輸入模式與特征空間中作為模板的點(diǎn)之間的距離作為分類的準(zhǔn)則 假設(shè)有m類 給出m個(gè)參考向量與模式類相聯(lián)系 4 最近鄰域分類法 在最小距離分類法中 取一個(gè)最標(biāo)準(zhǔn)的向量作為代表 將這類問題稍微擴(kuò)張一下 一類不能只取一個(gè)代表 把最小距離的概念從一個(gè)點(diǎn)和一個(gè)點(diǎn)間的距離擴(kuò)充到一個(gè)點(diǎn)和一組點(diǎn)之間的距離 這就是最近鄰域分類法的基本思路 10 20 式 10 20 是一個(gè)二次型判別函數(shù) 通常二次型判別函數(shù)的決策邊界是一個(gè)超二次曲面 5 非線性判別函數(shù) 統(tǒng)計(jì)學(xué)習(xí)理論是一種小樣本統(tǒng)計(jì)理論 它為研究有限樣本情況下的統(tǒng)計(jì)模式識別和更廣泛的機(jī)器學(xué)習(xí)問題建立了一個(gè)較好的理論框架 同時(shí)也發(fā)展了一種新的模式識別方法 支持向量機(jī) 能夠較好地解決小樣本學(xué)習(xí)問題 10 2 4統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī) 圖10 34機(jī)器學(xué)習(xí)的基本模型 有三類基本的機(jī)器學(xué)習(xí)問題 模式識別函數(shù)逼近概率密度估計(jì)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化并不一定意味著期望風(fēng)險(xiǎn)最小 學(xué)習(xí)機(jī)器的復(fù)雜性不但與所研究的系統(tǒng)有關(guān) 而且要和有限的學(xué)習(xí)樣本相適應(yīng) 支持向量機(jī) 支持向量機(jī) SupportVectorMachines 簡稱SVM方法 是實(shí)現(xiàn)統(tǒng)計(jì)學(xué)習(xí)理論的一種具體方法 其主要內(nèi)容在1992年 1995年間才基本完成 目前仍處在不斷發(fā)展階段 設(shè) 線性可分樣本為 i 1 n 是類別標(biāo)號 d維空間中線性判別函數(shù)的一般為 分類面方程為 10 161 而要求分類線對所有樣本正確分類 就是要求它滿足 i 1 2 n 10 162 因此 滿足上述條件且使 最小的分類面就是最優(yōu)分類面 過兩類樣本中離分類面最近的點(diǎn)且平行于最優(yōu)分類面的超平面H1 H2上的訓(xùn)練樣本就是式 10 162 中使等號成立的那些樣本 它們叫做支持向量 SupportVectors 因?yàn)樗鼈冎瘟俗顑?yōu)分類面 最優(yōu)分類面的示意圖如下圖 圖中用圓圈標(biāo)出的點(diǎn)為支持向量 圖10 39D4和D84組成的紋理圖像 圖10 40D5和D92組成的紋理圖像 圖10 42自建的測試圖像 圖10 41D12和D17組成的紋理圖像 圖10 43自建的測試圖像 10 3句法結(jié)構(gòu)模式識別 統(tǒng)計(jì)決策識別法的基本做法是首先從待識別模式中提取特征參數(shù) 然后用這些特征參數(shù)把模式表達(dá)為特征空間中的點(diǎn) 然后再根據(jù)各點(diǎn)之間的距離進(jìn)行分類和識別 缺點(diǎn) 對比較復(fù)雜的模式需要較多的特征才能描述它 而特征提取是比較困難的環(huán)節(jié) 對于同一模式往往有不同的抽取方法 就目前來看尚沒有統(tǒng)一的理論依據(jù) 簡單的分類并不能代表識別 對于復(fù)雜的模式 識別的目的并不是僅僅要求把它分配到某一類別中去 而且還要對不同的對象加以描述 在這方面統(tǒng)計(jì)決策法就有極大的局限性 句法結(jié)構(gòu)模式識別法主要著眼于模式結(jié)構(gòu) 采用形式語言理論來分析和描述模式結(jié)構(gòu) 因此 它具有統(tǒng)計(jì)識別法所不具備的優(yōu)點(diǎn) 10 3 1形式語言概述 所謂句法結(jié)構(gòu)就是將一個(gè)復(fù)雜的模式一部分一部分地加以描述 將復(fù)雜的模式分成若干子模式 如此分下去直至最簡單的子模式 或稱基元 為止 10 3 2句法結(jié)構(gòu)方法 預(yù)處理主要包括編碼 濾波 復(fù)原 增強(qiáng)及縫隙填補(bǔ)等一系列操作 基元抽取包括分割 特征 基元 抽取 基元的選擇要盡可能少 而且容易被識別 結(jié)構(gòu)分析可判別所得到的表達(dá)式在句法上是否正確 如果句法是正確的 就能得到模式的完整描述 即一個(gè)剖析式或剖析樹 句法方法在以下領(lǐng)域多有應(yīng)用 波形分析 聲音識別與理解 文字識別 二維數(shù)學(xué)表示式 指紋分類 圖像分析與理解 機(jī)器部件識別 自動(dòng)視覺檢查 LANDSAT資源勘探用陸地衛(wèi)星數(shù)據(jù)解釋等 10 4模糊集識別法簡介 在模式識別中 有些問題是極其復(fù)雜的 要使計(jì)算機(jī)識別某一模式 就要分析綜合所有的特征 計(jì)算和比較大量的信息后才能作出判斷 而人在識別過程中只根據(jù)一些模糊的印象就可以做到較準(zhǔn)確的識別 10 4 1模糊集合及其運(yùn)算 1 模糊子集 沒有明確外延的概念就稱作模糊概念論域是指被討論的全體對象 有時(shí)也稱為空間 論域元素總是分明的論域中元素從屬于模糊集合的程序不是絕對的0或1 它可介于0和1之間在模糊數(shù)學(xué)中 把元素對普通集合的絕對隸屬關(guān)系加以靈活化 提出隸屬度的概念隸屬度用隸屬函數(shù)來描述 10 4 2模糊模式識別的方法 例子 任何三角形都可用三個(gè)邊a b c及三個(gè)頂角A B C來表示 把等腰三角形 等邊三角形 直角三角形 等腰直角三角形看成是模糊集 要運(yùn)用直接方法識別 首先要確定它們的從屬函數(shù) 取論域 其中A B C表示三角形的三個(gè)內(nèi)角 由此 可定義它們的從屬函數(shù) 進(jìn)一步求得模糊幾何圖形的從屬度 設(shè) 分別為等腰三角形 直角三角形 等邊三角形 等腰直角三角形及非典型一般三角形的從屬函數(shù) 則有 10 107 10 108 10 109 由隸屬原則 判定三角形甲是直角三角形 由隸屬原則 判定三角形乙是一般三角形 相似系數(shù)有夾角余弦 相關(guān)系數(shù)等幾種定義 如果用表示樣本與樣本之間的距離 則也有如下一些距離的定義 3 模糊聚類分析 絕對值距離 10 125 歐氏距離 10 126 馬氏距離 10 127 式中V是一個(gè)階的協(xié)方差矩陣 其元素為 4 蘭氏距離 10 128 聚類分析的基本思想是將比較接近的樣本歸為一類 系統(tǒng)聚類法可分三個(gè)步驟進(jìn)行 第一 計(jì)算各樣本之間距離 將距離最近的兩點(diǎn)合并為一類 第二 定義類與類間的距離 將最近的兩類合并為新的一類 類與類之間的定義有最小距離法 最大距離法 中間距離法 重心法等 第三 反復(fù)做第二步 使類與類之間不斷合并 最后完成聚類分析 10 5模式識別的幾種應(yīng)用 模式識別的應(yīng)用較廣 大致可有如下幾個(gè)方面 字符識別 醫(yī)學(xué)診斷 遙感圖像解譯 人臉和指紋鑒別 污染監(jiān)測 自動(dòng)檢查和自動(dòng)化 可靠性 社會經(jīng)濟(jì) 語音識別和理解 考古等 10 5 1生物特征識別 指紋識別 指紋具有兩大特性 1 沒有兩個(gè)人的指紋是相同的 2 當(dāng)指紋不受損傷時(shí)終生不變 首先 指紋分為七類 平斗 左箕 右箕 平弓 帳弓 左雙箕 右雙箕 第一類再分為十八個(gè)小類 然后測量斜率 總的過程是分類 分層 分窗口 在這個(gè)過程中包括細(xì)化 連接斷線等處理 爾后整個(gè)窗口用一個(gè)樹代表 樹的每一個(gè)分支是窗口中的一根隆線 然后找出文法 最后做一樹狀自動(dòng)機(jī) 1 人臉識別系統(tǒng)的基本組成 人臉識別 2 人臉識別基本算法 基于幾何特征的方法該方法要求選取的特征矢量有一定的獨(dú)特性 既要反映不同人臉的差異 還要具有一定的彈性 以減少或者消除光照差異等影響 幾何特征向量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征向量 其分量通常包括人臉指定兩點(diǎn)間的歐式距離 曲率 角度等 基于神經(jīng)網(wǎng)絡(luò)的方法早期用于人臉識別的神經(jīng)網(wǎng)絡(luò)主要是Kohonen自聯(lián)想映射神經(jīng)網(wǎng)絡(luò) 當(dāng)人臉圖像受噪聲污染嚴(yán)重或部分缺損時(shí) 用Kohonen網(wǎng)絡(luò)恢復(fù)完整的人臉的效果較好 Cottrell等人使用級聯(lián)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別 對部分受損的 光照有所變化的人臉圖像識別能力也較好 基于代數(shù)特征的方法這類算法是采用代數(shù)特征向量 即人臉圖像在由 特征臉 張成的降維子空間上的投影 基于代數(shù)特征識別的主要原理是利用統(tǒng)計(jì)方法提取特征 從而形成子空間進(jìn)行識別 3 當(dāng)前主流算法 1 特征臉 eigenface 算法特征臉方法的優(yōu)點(diǎn) 圖像的原始灰度數(shù)據(jù)直接用來學(xué)習(xí)和識別 不需要任何低級或中級處理 不需要人臉的幾何和反射知識 通過低維可以有效的對高維數(shù)據(jù)進(jìn)行壓縮 與其它匹配方法相比 識別簡單有效 特征臉方法存在的不足 圖像中所有的像素被賦予了同等的地位 可是角度 光照 尺寸及表情等干擾會導(dǎo)致識別率下降 因此 須先進(jìn)行尺度歸一化處理 在姿態(tài)和光照變化時(shí)識別率明顯下降 要求背景單一 學(xué)習(xí)時(shí)間長 只能離線計(jì)算 2 彈性圖匹配方法彈性圖匹配方法 ElasticGraphMatching 是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu) DynamicLinkArchitecture DLA 的方法 它將人臉用格狀的稀疏圖 即拓?fù)鋱D 表示 圖中的節(jié)點(diǎn)用圖像位置的Gabor小波分解得到的特征向量標(biāo)記 圖的邊用連接節(jié)點(diǎn)的距離向量標(biāo)記 其優(yōu)點(diǎn)是 人臉稀疏圖 即拓樸圖 的頂點(diǎn)采用了小波變換特征 對光照 位移 旋轉(zhuǎn)及尺度變化都不敏感 彈性圖匹配法能保留二維圖像的空間相關(guān)信息 而特征臉方法在將圖像排成一維向量后 丟失了很多空間相關(guān)信息 4 人臉識別的統(tǒng)計(jì)結(jié)果 根據(jù)圖5 1和圖5 2所示的訓(xùn)練和識別的流程圖在MicrosoftVisualC 6 0環(huán)境下編程測試KPCA人臉識別效果 采用美國的Yale人臉庫 圖像庫中共15人 每人11張照片 人臉數(shù)目共計(jì)為165 每人10幅圖像作訓(xùn)練 一幅做測試 識別率定義如下 其中 n為正確識別出的人臉個(gè)數(shù) N為訓(xùn)練集中的人數(shù) 利用PCA進(jìn)行人臉識別的實(shí)驗(yàn)結(jié)果為 87 5 4 2模式識別在醫(yī)學(xué)上的應(yīng)用 4 3 1印刷電路板自動(dòng)外觀檢查裝置 4 3模式識別在自動(dòng)檢測中的應(yīng)用 圖10 39產(chǎn)品質(zhì)量檢測實(shí)例 圖10 40產(chǎn)品質(zhì)量檢測實(shí)例 圖10 41汽車牌照識別 圖10 42電路板零件缺失檢測- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖象處理 10 模式識別 理論 方法
鏈接地址:http://www.3dchina-expo.com/p-7471460.html