模式識別、人工智能與醫(yī)學專家系統(tǒng)之間的關系.ppt
《模式識別、人工智能與醫(yī)學專家系統(tǒng)之間的關系.ppt》由會員分享,可在線閱讀,更多相關《模式識別、人工智能與醫(yī)學專家系統(tǒng)之間的關系.ppt(69頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、人工智能、模式識別與醫(yī)學專家系統(tǒng),第一節(jié) 人工智能,“智能化”是當前新技術、新產(chǎn)品、新產(chǎn)業(yè)的重要發(fā)展方向、開發(fā)策略和顯著標志,例如:智能控制(Intelligent Control)、智能自動化(Intelligent Automation)、智能管理(Intelligent Management)、。因此,人工智能具有廣泛的用途??梢哉f,哪里有計算機應用,哪里就在用人工智能;哪里需要自動化或半自動化,哪里就在應用人工智能的理論、方法和技術。,一.人工智能概述 什么是智能 智能(Intelligence)即智力功能,是人類大腦所具有的感知、認識、學習、理解、分析、綜合、判斷、推理、創(chuàng)造等局部功
2、能的總和與它們的有機綜合的統(tǒng)稱;因此,完善的智能中不能不包含有人類的情感、意識、意志等這種高級因素。,智能究竟是什么? 智能是解決感性問題的能力。所謂感性就是個別的、特殊的、隨機的、模糊的、感官的、情緒化的、個人意志的。解決這類問題需要經(jīng)驗的積累和歸納推理并形成新的經(jīng)驗。也就是具有自動學習、經(jīng)驗積累和應用知識的能力。 對電腦而言,智能就是必須具有優(yōu)化、擴展和改變主體已有程序和創(chuàng)建新程序的能力,即具有我們過去常說的主觀能動性。智能可以利用一般經(jīng)驗或理論解決特殊問題,也可以歸納總結個別的經(jīng)驗使之上升到普遍的理論。,人的行為可分為社會行為和個人行為。 智能在人的社會行為中的作用主要是制定社會規(guī)則、
3、探索和發(fā)現(xiàn)自然規(guī)則以及選擇和套用這些規(guī)則。 而智能在人的個人行為中主要是通過個人情感和意志起作用以處理新鮮感受。,什么是人工智能 人工智能(Artificial Intelligence) 是利用設備或機器,用人工的方法,對人腦的思維活動過程進行模擬;當使得設備或機器的功能與腦功能大體等價時,這種設備或機器的功能就可以認為是具有某種程度的人工智能。人工智能應該以平均智力商為評定標準,并在與對比者(人)同等條件狀況下進行全面地綜合測試或進行某幾種局部功能的單項測試;當測試結果不低于規(guī)定的智力商數(shù)時,應當承認該設備或機器具有某種程度或某種意義的人工智能。,所謂人工智能,又稱為智能模擬,是計算機技術
4、的一個分支,它研究如何利用計算機來完成用人的智慧才能完成的工作。 人工智能問題是一個古老的但又是十分新穎的研究課題。近十多年來,各國研究人員在人工智能的研究上都已經(jīng)獲得巨大的進展。然而各種傳統(tǒng)的或新穎的智能模型迄今還不能完全而圓滿地對大腦思維活動的過程進行解釋和模擬,人們還不十分了解信息在大腦中的底層結構和編碼方法;其中特別是象人們的概念、意識、情感和創(chuàng)造性思維過程等,還根本無從著手;同時關于這一方面,在哲學上、自然科學上還有很大的爭論,還不能得到哲學界和自然科學界的一致認同。,人工智能與計算機 人們早已習慣于把計算機稱之為“電腦”,但是人們忽略了這樣一個事實無論電腦的功能有多么強大,用途有
5、多么廣泛,它也不過是個具有超級能力的白癡。 嚴格地講,電腦只能執(zhí)行特定的指令,而人腦則是處理所有感受到的信息。所謂“特定的指令”是指電腦程序可接受的或可執(zhí)行的外部輸入。顯然執(zhí)行指令與處理信息有著本質(zhì)的不同。 這并不是否認電腦具有處理信息的能力,這里說的電腦處理信息與人腦處理信息是不同的概念。其實電腦處理信息過程也是在執(zhí)行外部指令或給定程序中的指令。,電腦的軟硬件都不是自發(fā)進化而成的。電腦程序是人根據(jù)自然規(guī)律、法則和社會經(jīng)驗的歸納總結,是由人編制的。 電腦程序集中的是人的經(jīng)驗總結,其本質(zhì)是理性的。所謂理性就是理論的、有序的、精確的、數(shù)字化的、結論性的、有規(guī)律的、普遍性的、公共的、合乎邏輯的。簡單
6、類比就如同是一本操作手冊,人們只要照它去做就是了。 顯然智能不是被用來解決這類理性化的問題的。(智能是解決感性問題的能力。)因為當一切都規(guī)定好了、程序化了,就根本不需要智能了。由此我們得出一個結論無論電腦的功能有多么強大,只要它只能按給定的程序來工作,它就不能算作具有智能。,記憶、歸納推理與信息處理 通常記憶內(nèi)容包括兩個部分一是記錄所接受或感受到的信息,這主要是指外部進來的信息。二是自動記錄主體自身的活動過程。電腦只能記憶前者,而不能記憶后者。而人腦則兩者都可以做到。電腦的記憶過程是被動地執(zhí)行指令,它所能記住的東西僅僅是工作所需的程序和要處理的數(shù)據(jù)。而人腦所記錄的東西不僅僅是感受到的信息,而且
7、最重要的是能夠記錄處理信息的過程,或者說能夠記錄大腦自身有意識的活動內(nèi)容。記憶內(nèi)容第二部分所指的過程是自動的、不受控的,而第一部分則是可以被控制的。,記憶、歸納推理與信息處理 利用已有的經(jīng)驗來解決新的問題需要歸納和推理。人的這種能力是由人腦的記憶構造決定的。人腦在發(fā)育的早期階段記憶過程主要是素材和基本經(jīng)驗塊堆的建立和積累,即機械記憶。人腦在成熟階段記憶過程主要是經(jīng)驗塊堆的關聯(lián)和重組,即關聯(lián)記憶。由關聯(lián)記憶形成的人腦活動使人的思維模式天生具有歸納推理能力。經(jīng)驗的重組使人得到了新的經(jīng)驗,獲得了進步。人腦的這種記憶構造的優(yōu)點是具有模糊識別和記憶修補能力,缺點是老的關聯(lián)成分會因打散而消退, 即產(chǎn)生忘卻
8、。,記憶、歸納推理與信息處理 人記住一張臉至少不比記住一個外語單詞要難,而電腦恰恰相反,它寧愿去記一個城市的電話簿。電腦幾乎完全靠機械般的精確記憶,而且不能利用記憶進行歸納推理,因而無法實現(xiàn)智能所必須的利用自身經(jīng)驗之功能。電腦雖能記憶,但不能具有經(jīng)驗。 電腦在記憶時會把所有的素材都記錄下來。嚴格地講,電腦中的磁盤并不完全屬于它的腦子,磁盤中的數(shù)據(jù)部分就象人的筆記本和資料庫那樣,是腦外之物。而我們?nèi)四X中已經(jīng)固有了基本素材和經(jīng)驗,記憶時只需要把已有的各個素材和經(jīng)驗的關聯(lián)記錄下來。這里所說的素材就是人對最基本物理感受的機械記憶。,記憶、歸納推理與信息處理 其實這些素材的量并不是很多,當出生的嬰兒一開
9、始感受這個世界,只需要不長的時期就可以得到他一生所需的基本記憶素材。其他時間的記憶就是把這些素材關聯(lián)成塊,再把塊關聯(lián)成堆。塊塊堆堆之間的再關聯(lián)就構成了我們腦袋里的復雜記憶。對人類大腦的解剖分析也支持這一論點,另外人的記憶和經(jīng)驗的增加并沒有使大腦越長越大,這還可以解釋我們大腦在工作時為什么消耗很小的物理能量。關聯(lián)記憶使得我們成年人腦袋的大小并不與記憶的多少成正比。要是我們把所有的感受象錄音、錄像那樣全都記下來,要么把我們的腦子脹爆,要么我們的腦袋長得比樓房還大。,記憶、歸納推理與信息處理 人類的情感和智能都與我們大腦的記憶特性密切相關,我們大腦有意識的活動在相當程度上是記憶活動。探索和認識人腦的
10、記憶原理是實現(xiàn)人工智能的重要一環(huán),也是電腦模擬或實現(xiàn)人腦智能的必經(jīng)之路。任何試圖逃避這一關的做法都不會成功。 電腦科技的高速發(fā)展并未導致電腦在智能化方面有什么進展,其重要原因之一就是電腦的記憶方式一直停留在它的初始階段。,二、人工智能的發(fā)展軌跡,(1) 模擬人類的思維規(guī)律,即推理方法的研究和程序化;(2) 正確的知識表示,運用知識進行推理,即知識的形式化;(3) 從大量已有的知識推出新的知識,即專家系統(tǒng)。,三、人工智能的基本方法,人工智能的基本方法有以下幾種:1、啟發(fā)式搜索:人們解決問題的基本方法是方案--試驗法,對各種可能的方案進行試驗,直至找到正確的方案。搜索策略有盲目搜索、啟發(fā)式搜索之分
11、。盲目搜索是對可能方案進行順序的試驗;啟發(fā)式搜索是依照經(jīng)驗或某種啟發(fā)式信息,摒棄希望不大的搜索方向。啟發(fā)式搜索大大加快搜索過程,使得人們處理問題效率得到提高。,2、規(guī)劃:人們待解決的問題一般可以分解轉化為若干小問題,對于每個小問題還可以進行分解。由于解決小問題的搜索大為減少,使得原問題的復雜度降低,問題的解決得到簡化。規(guī)劃要依靠啟發(fā)式信息,成功與否,很大程度上決定于啟發(fā)信息的可靠程度。3、知識的表達技術:知識在計算機內(nèi)的表達方式是用計算機模擬人類智能必須解決的重要問題。問題解決的關鍵是如何把各類知識進行編碼、存儲;如何快速尋找需要的知識;如何對知識進行運算、推理;如何對知識進行更新、修改。,四
12、、人工智能的研究和應用領域,人工智能的研究和應用領域概括起來有8個:1、問題求解:我們通過對人們求解問題的一般規(guī)律、求解問題的思路的研究,編制一個智能程序,依照人們解決問題的方法與步驟,解決問題。2、自然語言處理:自然語言處理是研究計算機如何運用已有的詞法和語法規(guī)則,正確理解人們的自然語言,以方便用戶的使用與表達。3、模式識別:模式識別是研究如何從龐大的信息中提取特征,根據(jù)特征識別不同事物的基本原理。,4、智能數(shù)據(jù)庫:智能數(shù)據(jù)庫是研究利用人的推理、想象、記憶原理,實現(xiàn)對數(shù)據(jù)庫的存儲、搜索和修改。智能數(shù)據(jù)庫通過有效的組織,能夠滿足人們快速檢索和修改數(shù)據(jù)庫的要求。 5、智能機器人:智能機器人能夠對
13、外部環(huán)境具有一定的適應能力,根據(jù)實際的環(huán)境信息進行綜合處理,并做出正確的響應。這種機器人用于航天、軍事、工業(yè)制造等領域。6、博奕:博弈是研究使自己取勝、戰(zhàn)勝對手的策略。在決策過程中要對形勢做出恰當?shù)墓烙?,搜尋各種可能的策略組合,通過對比分析確定對自己最有利的策略。其中運用到問題求解、模式識別等方法。,7、程序自動設計:程序自動化是為了設計一種算法。該算法是分層結構的,先提出一些規(guī)定,形成最高一級的算法,并提出下一層算法的規(guī)定,然后按照這些規(guī)定形成下一級的算法和再下一級的規(guī)定,最后完成整個程序。程序自動化較多的研究工作放在了自動程序驗證方面,即讓計算機自動查找程序中的錯誤。8、定理的自動證明:計
14、算機通過模仿人的推理和演繹過程,從最基本的公理出發(fā),證明定理的正確性?,F(xiàn)在信息技術的飛速發(fā)展,使得Al有更廣泛的研究和應用領域,如專家咨詢系統(tǒng)、組合調(diào)度問題、虛擬現(xiàn)實等等。,五、應用舉例,指紋識別技術是指利用計算機進行的指紋自動識別技術,它是一項綜合技術,其研究發(fā)展涉及到多個前沿及邊緣科學,如模糊數(shù)學、數(shù)學形態(tài)學、神經(jīng)網(wǎng)絡、模式識別、計算機視覺、人工智能、數(shù)據(jù)壓縮、并行處理以及網(wǎng)絡技術等。這種技術的原理是通過指紋掃描儀上的光電識別器(攝像頭)對人指尖的卷狀紋理和渦進行掃描后,計算機把特定的隆起部位的位置制成表和記錄下來而形成一個對每一個人來說都是唯一的一個壓痕模式,存入計算機指紋數(shù)據(jù)庫。,計算
15、機指紋掃描儀能夠區(qū)分人的手指與偽造的如蠟制的手指或橡膠手套上的指紋,這是由于對人的手指其掃描儀傳感系統(tǒng)能分辨出血液的流動情況、血壓等信息。當進行身份認證時,指紋自動識別系統(tǒng)會將人現(xiàn)場通過指紋掃描儀收集到的指紋經(jīng)軟件系統(tǒng)與數(shù)據(jù)庫的指紋相對照而進行確認,對主流機型只需2秒左右的時間。由于兩個人擁有完全相同指紋的概率估計少于10億分之一,因此識別率極高,如美國Identix公司的指紋掃描設備在用一個右手指正確匹配上接近100%。指紋相對人的其它生物特征具有個體差異大、實現(xiàn)識別所需的軟硬件資源較小等優(yōu)勢,因此具有較大的應用空間。,第二節(jié) 模式識別,人工智能中有一個很重要的領域就是模式識別。但對于什么是
16、“模式”,或者什么是機器能夠辯別的“模式”,迄今尚無確切的定義。我們只能形象地解釋說,人之所以能識別圖像、聲音、動作、文字、面部表情等,是因為它們都存在著反映其特征的某種模式。但這一解釋根本沒有詮釋模式的內(nèi)涵和外延。,,一模式識別與模式識別的定義與目的 按照廣義的定義,模式是一些供模仿用的、完美無缺的標本。 模式識別就是識別出特定客體所模仿的標本。,識別能力是人類和其它生物的一種基本屬性,根據(jù)被識別的客本的性質(zhì)可以將識別活動分為兩個主要類型:具體的客體和抽象的客體。 字符、圖畫、音樂是具體的客體,它們通過對感官的刺激而被識別;論點、思想、信仰則是非物質(zhì)的客體,對它們的研究主要屬于哲學、政治學的
17、范疇。 我們主要是研究具體客體的識別,而且僅局限于研究用機器完成與識別任務有關的基本理論與實用技術。這一類課題屬于工程學、計算機科學、應用數(shù)學的范疇。對我們將要討論的內(nèi)容,我們對模式、模式識別作如下狹義的定義:,模式是對某些感興趣的客體的定量的或結構的描述,模式類是具有某些共同特征的模式的集合。 模式識別是研究一種自動技術,依靠這種技術,機器將自動地(或人盡量少地干涉)把待識模式分配到各自的模式類中去。 但模式識別不是簡單的分類學,其目標包括對于識別對象的描述、理解與綜合。,,模式識別是伴隨著計算機的研究、應用日益發(fā)展起來的。其應用領域涉及社會生活的各個方面,而且還在不斷擴大。人們親切地稱計算
18、機為電腦,幾乎所有本來由人腦實現(xiàn)的功能,都謀略用“電腦”來完成。而且已經(jīng)取得,并不斷取得令人振奮的成就。,,但比起人腦來,電腦畢竟是小巫見大巫,不僅僅在于人腦約有10111012個腦細胞(被稱為神經(jīng)元),更在于每個神經(jīng)元約有103104個突觸,即一個神經(jīng)元可通過突觸與8000 個其它神經(jīng)元交換信息,當生物電流通過某一突觸時,神經(jīng)元就將信息傳送到下一神經(jīng)元。所以人腦有極豐富的聯(lián)想能力??梢猿綍r空,任意跳躍。因此計算機的聯(lián)想、判別與推理能力遠不如人腦,特別是在對外界信息的感知能力方面,更遠不如人腦。,識別是人對感覺的認知和判斷能力。 識別能力的高低體現(xiàn)了智能水平。識別由低到高分為三個層次。 儀
19、器水平物理識別 動物水平模糊識別 人類智能水平情感識別,物理識別是對接受到的信息實現(xiàn)物理、化學和生物學的量化認識。視覺包括明暗、顏色、大小、形狀、遠近、運動狀態(tài)等。聽覺包括聲音大小、頻率、方位、波形等。觸覺包括溫度、導熱率、硬度、粘度、大小、形狀、受力、活動狀態(tài)等。嗅覺和味覺包括物質(zhì)的組成及化學成分。 現(xiàn)代科技與電腦相結合在物理識別范圍和識別精度方面早已大大超過人自身的能力。幾乎所有的科學儀器都是用于這種識別。這種識別的特點是識別內(nèi)容分別獨立互不相關,事件具有精確的重復性,無需經(jīng)驗和智能,完全可以程序化。所以它是最低層次的識別。,模糊識別是在大量復雜的信息中識別出有用的部分,即對接收的信息與以
20、往的記憶和經(jīng)驗進行關聯(lián)認識,剔除無關的信息。視覺包括在復雜的背景中辨認特定的人和物或以往經(jīng)歷過的人和物。聽覺包括在嘈雜的背景中辨別出特定的聲音,特別是不同人的講話聲。模糊識別可解決有誰、有什么、是誰、是什么的問題。這種對人來說輕而易舉的能力對電腦來說真是太難了。目前電腦可通過對照記錄的方式實現(xiàn)單一識別能力,例如指紋、圖形、語音等。由于電腦不能實現(xiàn)關聯(lián)記憶,所以它在模糊識別方面難以有突破性進展。這個層次的識別與我們常見的寵物、牲畜、鳥、昆蟲的識別能力大致相當,因此它不能產(chǎn)生高級智能。,情感識別是最高級的識別。它是完全的感性識別。這種識別主要是針對人際之間的信息交流。它包括文字、語言、歌曲、表情、
21、外表、氣味和動作所表達的含義,既識字又聽得懂說話,甚至包括自然現(xiàn)象、事件、環(huán)境和物品的人文美學含義。這種識別已經(jīng)超出了人工智能的模糊識別,達到了人工高級生命的能力。以單一語音識別為例初級識別能夠知道有聲音,模糊識別能夠知道說什么或誰在說話,而高級識別則能通過說話的內(nèi)容、音調(diào)、節(jié)奏知道說話者的情緒和態(tài)度。這種識別要求電腦具有人類的情感。由此可見,高級智能與情感是完全相關的。,二模式識別的全過程,模式識別的全過程可用下圖簡要的表示:,以上過程中,每一階段設計的好壞都會對全盤的工作產(chǎn)生嚴重的影響,所以每一階段都應爭取尺可能完美的效果。,由于被識別的對象多半是具有不同特征的非電量,如灰度、色彩、聲音、
22、壓力、溫度等,所以第一步就要將它們轉變?yōu)殡娦盘枺缓蠼?jīng)A/D轉換,將它們轉換為能由計算機處理的數(shù)字量。 數(shù)字化后的電信號需經(jīng)預處理,以濾除樣品采集過程中摻入的干擾、噪聲,并人為地突出有用信號,以得到良好的識別效果。,經(jīng)改善后的有用信號,還要作特征抽取或基元抽取,才能對其分類。由于特征的抽取與待識模式的類別密切相關,很難有某種泛泛的規(guī)律可依循。隨著工作的深入,要不斷修改與完善此階段的工作,這也是圖8.1 中虛線回溯的含義。 模式分類就是在前幾步準備工作的基礎上,把被識別對象歸并分類,確認其為何種模式的過程。這是模式識別“出成果”的階段,直接以其分類結果表明本次識別的結束。,模式分類按其方法,大致
23、可分為四大類 統(tǒng)計決策法 句法結構法 模糊判決法 人工智能法,,電腦模式識別技術最初起源于圖像識別的需要,比如協(xié)助警方根據(jù)照片從茫茫人海中搜尋某個罪犯,或者幫助醫(yī)生把顯微鏡下的細菌進行分類。 人腦在接受到視覺器官傳遞來的信息時,是怎樣識別和區(qū)分大千世界的萬物的呢? 一種方案是,大腦用一個神經(jīng)元與圖像上的每一點一一對應并逐一判別,最后綜合為整體;但既使只描述圖像局部的大致輪廓,神經(jīng)元的數(shù)目仍不夠使用。,另一種更符合實際的方案是:大腦感知的不是圖像上的所有的點,而是輪廓中最典型的特征,如線段、角度、弧度、反差、顏色等,把它們從圖像中抽取出來,然后結合頭腦中過去的記憶和有關經(jīng)驗和知識分析判斷。這種“
24、特征抽取”也是電腦圖像識別的基礎。 要根據(jù)一張照片讓電腦在一群人中辯認出某個人,可以先把這張照片輸入電腦,抽取照片上人像上的特征,如鼻子、嘴巴、眼睛和輪廓特點,進行分類和加工,存放在機器里作為識別那個人的“模板”。然后,讓所有人都接受光電設備的描掃,把他們的圖像與機器事先存放的“模板”一一匹配。,只要待辯認的人躲在這群人中間,哪怕他化了裝,留了長發(fā),蓄了胡須,也逃不脫電腦的“火眼金睛”。這種圖像處理方法也叫“模板匹配”,它已廣泛應用于公安部門識別犯罪嫌疑人的偵破工作。 圖像識別技術比較成功的運用領域是文字識別。如果把每一個漢字或西文字母都視為一個小圖形,模板匹配的方法自然可以移植到文字識別過程
25、中。目前印刷體文字識別軟件早已進行商品化階段。,,通常將印刷品上的文字用掃描儀輸入,首先經(jīng)過特征抽取處理,例如,某字的筆畫有幾筆,收尾端點有幾個,拐角有多少等。在電腦中已預先保存了各種字的圖形和它們的特征,也稱為“模板”,全部模板就構成一部“模板字典庫”。由于要考慮字體、字號、紙張、油墨等因素影響,每個字都有若干套不同的模板。接下來就是將抽取到的文字特征與模板字典逐一匹配,直到在字典庫中找到最接近的模板為止。運用這種方法,對于印刷體文字,電腦能夠以“一目十行”的速度進行閱讀。,電腦的語音識別也是一個非常重要的人工智能技術,是人工智能多年追逐的目標。與“視覺”輸入設備掃描儀對應的“聽覺”輸入設備
26、是話筒,語音識別的基礎技術也是模式識別。由于每個人說話的音色和音調(diào)都有一定的差異,發(fā)聲頻率各不相同。人腦對語音似乎有一種自適應的能力,既能區(qū)分不同性別、不同年齡的語音差異,又能調(diào)整為能夠理解的音素,從而聽懂各色人說出的話語。采用模板匹配方式的電腦不可能具備這種本領,它通常只能“聽懂”特定某人的聲音,而且是經(jīng)過了一段時間的“學習”的結果。學習過程稱為“訓練”即對著電腦大聲重復地講述某些字詞,直到它把這些字詞的聲音頻譜特征“記住”,存放在參考樣本庫作為識別這個字詞的模板。當換了另一個人說話,電腦的正確識別率可能就會下降。,,此外,語音識別對說話者使用的詞匯必須作出限制,否則要求電腦具有極大的存儲容
27、量和極高處理速度。 1998年IBM公司發(fā)布ViaVoice98,使中文語音識別技術取得了實質(zhì)性突破,該軟件具有語音導航功能,在普通話的基礎上能適應廣東、四川、上海三種口音,用平常速度口音讀一般文章的識別率達到85%95% ,并具有自適應功能,快速口音適應只需訓練5個詞、3句話,5分鐘左右即可建立一個語音模型。已被廣泛使用。,人工智能模式識別的進展,已經(jīng)在一定程度上使電腦具備了“聽”、“說”、“讀”的能力,但距離理想的目標還有較長的路程。對人類來說,哪怕你把字寫得龍飛鳳舞,哪怕你把話說的含糊不清,我們也能根據(jù)對上下文的理解做出正確的識別。這表明人腦模式識別的方法不是或者不完全是“模板匹配”,對
28、模糊信息的處理,人腦比電腦要強得多。此外,電腦儲存的模板庫或樣本庫,與它的判斷識別機構兩相分離,當模板庫容量十分龐大時,搜索匹配就顯得力不從心;而人腦記憶的知識與其判斷機構渾然一體,它的模式識別是尋找、運用知識的思維決策。,,模式識別已廣泛應用于生物醫(yī)學工程領域。生物醫(yī)學信號的自動分類和識別,醫(yī)學圖像的識別都有相當多的應用實例。隨著計算機的發(fā)展與普及,模式識別的應用必定會越來越廣泛。,第三節(jié) 專家系統(tǒng),所謂的專家系統(tǒng)實質(zhì)上是某一專門知識,例如某種疾病的診斷、處方,某些礦物的資源勘探數(shù)據(jù)分析等的計算機咨詢系統(tǒng)(軟件)。 專家系統(tǒng)的基礎是專家知識。專家知識可以分成兩大類,一類是已經(jīng)總結在書本上的定
29、律、定理和公式等,另一類是專家們在實際工作中長期積累的經(jīng)驗、教訓。這后一類知識往往難以總結成書面的規(guī)律或條文,但這類知識卻是十分寶貴的,它們在專家做出決策、指導工作和解決疑難問題等方面起著重要作用。,第三節(jié) 專家系統(tǒng),什么是專家系統(tǒng):“專家系統(tǒng)”(Expert System)是指具有相當于專家的知識和經(jīng)驗水平,以及解決專門問題能力的計算機系統(tǒng),通常指計算機軟件。,,自一九六八年由費根鮑姆主持研制完成的第一個專家系統(tǒng)DENDRAL(質(zhì)譜數(shù)據(jù)分析、推斷化學分子結構的系統(tǒng))以來,已經(jīng)在各行各業(yè)中研制了大量的專家系統(tǒng)。專門為專家系統(tǒng)設計的語言軟件Lisp和Prolog也已誕生。盡管有報道說某些專家系統(tǒng)
30、的分析判斷能力超過了專家水平,并創(chuàng)造了大量社會財富。但是絕大多數(shù)的專家系統(tǒng)只能達到或接近專家水平。 在專家系統(tǒng)的研制過程中,人們越來越感到專家知識的獲取并轉換成計算機能夠接受的形式是專家系統(tǒng)研究的瓶頸。,,在研究人工智能的過程中,神經(jīng)生理學和心理學等方面的研究也是一個重要的側面。現(xiàn)代腦科學已證實,人腦在結構上是左腦和右腦左右對稱的器官,但左右腦的功能卻截然不同。左腦主司讀、寫、聽、說這類文字、語言理解和生成的功能,專門處理邏輯推里、數(shù)學運算等“串行”任務。右腦主要負責形象思維的任務,例如圖像識別與處理、模式識別、音樂與藝術、模糊推理與學習等“并行”任務。當我們力圖用當代最先進的串行計算機來實現(xiàn)
31、右腦的形象思維功能時遇到了極大困難。,,一個對人來說是非常簡單的識別或判斷的任務,串行計算機卻要用大量的內(nèi)存和漫長的計算時間才能完成,以至當問題獲得解答時已沒有實際使用的價值。因而許多研究人員力圖模擬神經(jīng)系統(tǒng)的工作原理來研制新一代的計算機,這種計算機將與傳統(tǒng)計算機有完全不同的工作原理,它是全并行式運行的具有分布式存儲能力,這就是在目前吸引了大量研究人員關注的人工神經(jīng)網(wǎng)絡。人工神經(jīng)網(wǎng)絡具有自學習的能力,不需要復雜的編程,可以解決當前專家系統(tǒng)研制的知識獲取和語言軟件兩大瓶頸問題。,,專家系統(tǒng)的一個重要應用領域就是醫(yī)療診斷系統(tǒng)。早在一九七一年就由斯坦福大學的EHShortiffe等研制了血液感染病醫(yī)
32、療診斷系統(tǒng)MYCIN,它已成為成功的專家系統(tǒng)的一個典型。此外,世界上比較著名的醫(yī)療診斷系統(tǒng)還有青光眼醫(yī)療診斷系統(tǒng)CASNET,內(nèi)科病醫(yī)療診斷系統(tǒng)INTERNIST,腎病醫(yī)療診斷系統(tǒng)PIP,處理精神病的系統(tǒng)PARRY等。我國的研究者根據(jù)我國的特點,在中醫(yī)專家系統(tǒng)方面做了大量的工作,有一些已投入實際應用。,,MYCIN系統(tǒng)研制發(fā)起人EHShortiffe(愛德華持肖持利夫)是哈佛大學數(shù)學系畢業(yè)生,他獲得了斯坦福大學面向醫(yī)學的計算機應用方面的獎學金,到斯坦福大學當研究生。他在計算機科學和醫(yī)學之間的邊緣領域一一醫(yī)療診斷的研究中,進行了開創(chuàng)性的工作。當他在一九七一年完成MYCIN系統(tǒng)時,他只是一名研究生
33、,到了一九七九年成為斯坦福大學的內(nèi)科副教授。一九八零年召開第二屆醫(yī)療中的人工智能(AIM)學術會議時,他成為大會的組織委員會主席。,,MYCIN是有關傳染病診斷和治療的咨詢系統(tǒng)。它能教會不擅長診治傳染病的醫(yī)生,怎樣從患者癥狀出發(fā),確定病的種類及相應的治療方法。我們知道,傳染病種類繁多,與其相應的抗生素種類也不少。要在限定的時間內(nèi)確定病癥,選擇出恰當?shù)闹委煼椒?,決非易事。似乎這就是開發(fā)MYCIN系統(tǒng)的著眼點。,MYCIN系統(tǒng)存放有大量傳染病專家長期積累的知識,它們是肖特利夫與許多著名的傳染病專家交談,推理和總結得到的,他把這些知識歸納成200多條規(guī)則(后擴充至500多條)存放在計算機中,這些規(guī)則
34、具有“如果那么”這種形式,稱為產(chǎn)生式規(guī)則。這是目前專家系統(tǒng)使用得最廣泛的推理方式之一。當系統(tǒng)獲得一個數(shù)據(jù)且與某個“如果”相一致時(稱為匹配),則相應的“那末”就代替了該數(shù)據(jù),再繼續(xù)搜尋是否存在與這個新數(shù)據(jù)匹配的“如果”,這樣一個過程含有“產(chǎn)生”、“做出”的含義,因此獲得“產(chǎn)生式”的名子。當使用MYCIN進行醫(yī)療診斷時,醫(yī)生通過計算機的人機交互接口,將病人數(shù)據(jù)送入計算機,MYCIN系統(tǒng)將外來數(shù)據(jù)不斷與內(nèi)部知識進行匹配,直到獲得最終結果。,人工神經(jīng)網(wǎng)絡,1 神經(jīng)元模型的提出“人工神經(jīng)網(wǎng)絡”(ARTIFICIAL NEURAL NETWORK,簡稱A.N.N.)是在對人腦組織結構和運行機智的認識理解
35、基礎之上模擬其結構和智能行為的一種工程系統(tǒng)。早在本世紀40年代初期,心理學家McCulloch、數(shù)學家Pitts就提出了人工神經(jīng)網(wǎng)絡的第一個數(shù)學模型,從此開創(chuàng)了神經(jīng)科學理論的研究時代。其后,F(xiàn).Rosenblatt、Widrow和Hopf、J.J.Hopfield等學者又先后提出了感知模型,使得人工神經(jīng)網(wǎng)絡技術得以蓬勃發(fā)展。,神經(jīng)系統(tǒng)的基本構造是神經(jīng)元(神經(jīng)細胞),它是處理人體內(nèi)各部分之間相互信息傳遞的基本單元。據(jù)神經(jīng)生物學家研究的結果表明,人的一個大腦一般有10101011個神經(jīng)元。每個神經(jīng)元都由一個細胞體,一個連接其他神經(jīng)元的軸突和一些向外伸出的其它較短分支樹突組成。軸突的功能是將本神經(jīng)元
36、的輸出信號(興奮)傳遞給別的神經(jīng)元。其末端的許多神經(jīng)末梢使得興奮可以同時傳送給多個神經(jīng)元。樹突的功能是接受來自其它神經(jīng)元的興奮。神經(jīng)元細胞體將接受到的所有信號進行簡單地處理(如:加權求和,即對所有的輸入信號都加以考慮且對每個信號的重視程度體現(xiàn)在權值上有所不同)后由軸突輸出。神經(jīng)元的樹突與另外的神經(jīng)元的神經(jīng)末梢相連的部分稱為突觸。,,大腦之所以能夠處理極其復雜的分析、推理工作,一方面是因為其神經(jīng)元個數(shù)的龐大,另一方面還在于神經(jīng)元能夠對輸入信號進行非線性處理。,2 人工神經(jīng)網(wǎng)絡的工作原理人工神經(jīng)網(wǎng)絡首先要以一定的學習準則進行學習,然后才能工作?,F(xiàn)以人工神經(jīng)網(wǎng)絡對手寫“A”、“B”兩個字母的識別為例
37、進行說明,規(guī)定當“A”輸入網(wǎng)絡時,應該輸出“1”,而當輸入為“B”時,輸出為“0”。所以網(wǎng)絡學習的準則應該是:如果網(wǎng)絡作出錯誤的的判決,則通過網(wǎng)絡的學習,應使得網(wǎng)絡減少下次犯同樣錯誤的可能性。首先,給網(wǎng)絡的各連接權值賦予(0,1)區(qū)間內(nèi)的隨機值,將“A”所對應的圖象模式輸入給網(wǎng)絡,網(wǎng)絡將輸入模式加權求和、與門限比較、再進行非線性運算,得到網(wǎng)絡的輸出。在此情況下,網(wǎng)絡輸出為“1”和“0”的概率各為50%,也就是說是完全隨機的。這時如果輸出為“1”(結果正確),則使連接權值增大,以便使網(wǎng)絡再次遇到“A”模式輸入時,仍然能作出正確的判斷。,如果輸出為“0”(即結果錯誤),則把網(wǎng)絡連接權值朝著減小綜合
38、輸入加權值的方向調(diào)整,其目的在于使網(wǎng)絡下次再遇到“A”模式輸入時,減小犯同樣錯誤的可能性。如此操作調(diào)整,當給網(wǎng)絡輪番輸入若干個手寫字母“A”、“B”后,經(jīng)過網(wǎng)絡按以上學習方法進行若干次學習后,網(wǎng)絡判斷的正確率將大大提高。這說明網(wǎng)絡對這兩個模式的學習已經(jīng)獲得了成功,它已將這兩個模式分布地記憶在網(wǎng)絡的各個連接權值上。當網(wǎng)絡再次遇到其中任何一個模式時,能夠作出迅速、準確的判斷和識別。一般說來,網(wǎng)絡中所含的神經(jīng)元個數(shù)越多,則它能記憶、識別的模式也就越多。,,人工神經(jīng)網(wǎng)絡的特點和優(yōu)越性,主要表現(xiàn)在三個方面: 第一,具有自學習功能。例如實現(xiàn)圖像識別時,只在先把許多不同的圖像樣板和對應的應識別的結果輸入人工
39、神經(jīng)網(wǎng)絡,網(wǎng)絡就會通過自學習功能,慢慢學會識別類似的圖像。自學習功能對于預測有特別重要的意義。預期未來的人工神經(jīng)網(wǎng)絡計算機將為人類提供經(jīng)濟預測、市場預測、效益預測,其前途是很遠大的。,第二,具有聯(lián)想存儲功能。人的大腦是具有聯(lián)想功能的。如果有人和你提起你幼年的同學張某某,你就會聯(lián)想起張某某的許多事情。用人工神經(jīng)網(wǎng)絡的反饋網(wǎng)絡就可以實現(xiàn)這種聯(lián)想。 第三,具有高速尋找優(yōu)化解的能力。尋找一個復雜問題的優(yōu)化解,往往需要很大的計算量,利用一個針對某問題而設計的反饋型人工神經(jīng)網(wǎng)絡,發(fā)揮計算機的高速運算能力,可能很快找到優(yōu)化解。,幾種典型神經(jīng)網(wǎng)絡簡介,(1)多層感知網(wǎng)絡(誤差逆?zhèn)鞑ド窠?jīng)網(wǎng)絡):在1986年以R
40、umelhart和McCelland為首的科學家出版的Parallel Distributed Processing一書中,完整地提出了誤差逆?zhèn)鞑W習算法,并被廣泛接受。多層感知網(wǎng)絡是一種具有三層或三層以上的階層型神經(jīng)網(wǎng)絡。典型的多層感知網(wǎng)絡是三層、前饋的階層網(wǎng)絡,即:輸入層I、隱含層(也稱中間層) J、輸出層K。相鄰層之間的各神經(jīng)元實現(xiàn)全連接,即下一層的每一個神經(jīng)元與上一層的每個神經(jīng)元都實現(xiàn)全連接,而且每層各神經(jīng)元之間無連接。,除了競爭的方法外,還有通過抑制手段獲取勝利的方法,即網(wǎng)絡競爭層各神經(jīng)元抑制所有其它神經(jīng)元對輸入模式的響應機會,從而使自己“脫穎而出”,成為獲勝神經(jīng)元。除此之外還有一種
41、稱為側抑制的方法,即每個神經(jīng)元只抑制與自己鄰近的神經(jīng)元,而對遠離自己的神經(jīng)元不抑制。這種方法常常用于圖象邊緣處理,解決圖象邊緣的缺陷問題。競爭型神經(jīng)網(wǎng)絡的缺點和不足:因為它僅以輸出層中的單個神經(jīng)元代表某一類模式。所以一旦輸出層中的某個輸出神經(jīng)元損壞,則導致該神經(jīng)元所代表的該模式信息全部丟失。,(3)Hopfield神經(jīng)網(wǎng)絡:1986年美國物理學家J.J.Hopfield陸續(xù)發(fā)表幾篇論文,提出了Hopfield神經(jīng)網(wǎng)絡。他利用非線性動力學系統(tǒng)理論中的能量函數(shù)方法研究反饋人工神經(jīng)網(wǎng)絡的穩(wěn)定性,并利用此方法建立求解優(yōu)化計算問題的系統(tǒng)方程式?;镜腍opfield神經(jīng)網(wǎng)絡是一個由非線性元件構成的全連接
42、型單層反饋系統(tǒng).,,神經(jīng)網(wǎng)絡的研究內(nèi)容相當廣泛,反映了多學科交叉技術領域的特點。迄今為止,在人工神經(jīng)網(wǎng)絡研究領域中,有代表性的網(wǎng)絡模型已達數(shù)十種,而學習算法的類型更難以統(tǒng)計其數(shù)量。神經(jīng)網(wǎng)絡研究熱潮的興起是本世紀末人類科學技術發(fā)展全面飛躍的一個組成部分。它與多種科學領域的發(fā)展密切相關,縱觀當代新興科學技術的發(fā)展歷史,人類在征服宇宙空間、基本粒子、生命起源等科學領域的進程之中歷經(jīng)了崎嶇不平之路。我們也會看到,探索人腦功能和神經(jīng)網(wǎng)絡的研究將伴隨著重重困難的克服而日新月異。,學習規(guī)則及過程:它以一種有教師示教的方式進行學習。首先由教師對每一種輸入模式設定一個期望輸出值。然后對網(wǎng)絡輸入實際的學習記憶模式
43、,并由輸入層經(jīng)中間層向輸出層傳播(稱為“模式順傳播”)。實際輸出與期望輸出的差即是誤差。按照誤差平方最小這一規(guī)則,由輸出層往中間層逐層修正連接權值,此過程稱為“誤差逆?zhèn)鞑ァ薄K哉`差逆?zhèn)鞑ド窠?jīng)網(wǎng)絡也簡稱BP(Back Propagation)網(wǎng)。隨著“模式順傳播”和“誤差逆?zhèn)鞑ァ边^程的交替反復進行。網(wǎng)絡的實際輸出逐漸向各自所對應的期望輸出逼近,網(wǎng)絡對輸入模式的響應的正確率也不斷上升。通過此學習過程,確定下來各層間的連接權值之后就可以工作了。,由于BP網(wǎng)及誤差逆?zhèn)鞑ニ惴ň哂兄虚g隱含層并有相應的學習規(guī)則可尋,使得它具有對非線性模式的識別能力。特別是其數(shù)學意義明確、步驟分明的學習算法,更使其具有廣泛
44、的應用前景。目前,在手寫字體的識別、語音識別、文本語言轉換、圖象識別以及生物醫(yī)學信號處理方面已有實際的應用。但BP網(wǎng)并不是十分的完善,它存在以下一些主要缺陷:學習收斂速度太慢、網(wǎng)絡的學習記憶具有不穩(wěn)定性,即:當給一個訓練好的網(wǎng)提供新的學習記憶模式時,將使已有的連接權值被打亂,導致已記憶的學習模式的信息的消失。,(2)競爭型(KOHONEN)神經(jīng)網(wǎng)絡:它是基于人的視網(wǎng)膜及大腦皮層對剌激的反應而引出的。神經(jīng)生物學的研究結果表明:生物視網(wǎng)膜中,有許多特定的細胞,對特定的圖形(輸入模式)比較敏感,并使得大腦皮層中的特定細胞產(chǎn)生大的興奮,而其相鄰的神經(jīng)細胞的興奮程度被抑制。對于某一個輸入模式,通過競爭在
45、輸出層中只激活一個相應的輸出神經(jīng)元。許多輸入模式,在輸出層中將激活許多個神經(jīng)元,從而形成一個反映輸入數(shù)據(jù)的“特征圖形”。,競爭型神經(jīng)網(wǎng)絡是一種以無教師方式進行網(wǎng)絡訓練的網(wǎng)絡。它通過自身訓練,自動對輸入模式進行分類。競爭型神經(jīng)網(wǎng)絡及其學習規(guī)則與其它類型的神經(jīng)網(wǎng)絡和學習規(guī)則相比,有其自己的鮮明特點。在網(wǎng)絡結構上,它既不象階層型神經(jīng)網(wǎng)絡那樣各層神經(jīng)元之間只有單向連接,也不象全連接型網(wǎng)絡那樣在網(wǎng)絡結構上沒有明顯的層次界限。它一般是由輸入層(模擬視網(wǎng)膜神經(jīng)元)和競爭層(模擬大腦皮層神經(jīng)元,也叫輸出層)構成的兩層網(wǎng)絡。兩層之間的各神經(jīng)元實現(xiàn)雙向全連接,而且網(wǎng)絡中沒有隱含層,如圖5。有時競爭層各神經(jīng)元之間還存在橫向連接。,,競爭型神經(jīng)網(wǎng)絡的基本思想是網(wǎng)絡競爭層各神經(jīng)元競爭對輸入模式的響應機會,最后僅有一個神經(jīng)元成為競爭的勝者,并且只將與獲勝神經(jīng)元有關的各連接權值進行修正,使之朝著更有利于它競爭的方向調(diào)整。神經(jīng)網(wǎng)絡工作時,對于某一輸入模式,網(wǎng)絡中與該模式最相近的學習輸入模式相對應的競爭層神經(jīng)元將有最大的輸出值,即以競爭層獲勝神經(jīng)元來表示分類結果。這是通過競爭得以實現(xiàn)的,實際上也就是網(wǎng)絡回憶聯(lián)想的過程。,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023年六年級數(shù)學下冊6整理和復習2圖形與幾何第7課時圖形的位置練習課件新人教版
- 2023年六年級數(shù)學下冊6整理和復習2圖形與幾何第1課時圖形的認識與測量1平面圖形的認識練習課件新人教版
- 2023年六年級數(shù)學下冊6整理和復習1數(shù)與代數(shù)第10課時比和比例2作業(yè)課件新人教版
- 2023年六年級數(shù)學下冊4比例1比例的意義和基本性質(zhì)第3課時解比例練習課件新人教版
- 2023年六年級數(shù)學下冊3圓柱與圓錐1圓柱第7課時圓柱的體積3作業(yè)課件新人教版
- 2023年六年級數(shù)學下冊3圓柱與圓錐1圓柱第1節(jié)圓柱的認識作業(yè)課件新人教版
- 2023年六年級數(shù)學下冊2百分數(shù)(二)第1節(jié)折扣和成數(shù)作業(yè)課件新人教版
- 2023年六年級數(shù)學下冊1負數(shù)第1課時負數(shù)的初步認識作業(yè)課件新人教版
- 2023年六年級數(shù)學上冊期末復習考前模擬期末模擬訓練二作業(yè)課件蘇教版
- 2023年六年級數(shù)學上冊期末豐收園作業(yè)課件蘇教版
- 2023年六年級數(shù)學上冊易錯清單十二課件新人教版
- 標準工時講義
- 2021年一年級語文上冊第六單元知識要點習題課件新人教版
- 2022春一年級語文下冊課文5識字測評習題課件新人教版
- 2023年六年級數(shù)學下冊6整理和復習4數(shù)學思考第1課時數(shù)學思考1練習課件新人教版