《《計算機視覺》課程綜合作業(yè)》由會員分享,可在線閱讀,更多相關《《計算機視覺》課程綜合作業(yè)(8頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、《計算機視覺》課程綜合作業(yè)
一、論述題
1. 計算機視覺的研究領域及其主要支持技術?簡述當前的技術進展。
答:計算機視覺是使用計算機及相關設備對生物視覺的一種模擬。它的主要任務就是通
過對采集的圖片或視頻進行處理以獲得相應場景的三維信息,就像人類和許多其他類生物每
天所做的那樣。計算機視覺既是工程領域,也是科學領域中的一個富有挑戰(zhàn)性重要研究領域。計算機視覺是一門綜合性的學科,它已經(jīng)吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數(shù)學和統(tǒng)計學,神經(jīng)生理學和認知科學等。有不少學科的研究目標與計算機視覺相近或與此有關。
主要支持技術包括圖象
2、處理、模式識別或圖象識別、景物分析、圖象理解等。由于歷史發(fā)展或領域本身的特點這些學科互有差別,但又有某種程度的相互重迭。
圖象處理
圖象處理技術把輸入圖象轉(zhuǎn)換成具有所希望特性的另一幅圖象。例如,可通過處理使輸
出圖象有較高的信-噪比,或通過增強處理突出圖象的細節(jié),以便于操作員的檢驗。在計算機視覺研究中經(jīng)常利用圖象處理技術進行預處理和特征抽取。
模式識別
模式識別技術根據(jù)從圖象抽取的統(tǒng)計特性或結構信息,把圖象分成予定的類別。例如,文字識別或指紋識別。在計算機視覺中模式識別技術經(jīng)常用于對圖象中的某些部分,例如分
割區(qū)域的識別和分類。
圖象理解
給定一幅圖象,圖象理解程序不僅描述圖象
3、本身,而且描述和解釋圖象所代表的景物,以便對圖象代表的內(nèi)容作出決定。在人工智能視覺研究的初期經(jīng)常使用景物分析這個術語,以強調(diào)二維圖象與三維景物之間的區(qū)別。圖象理解除了需要復雜的圖象處理以外還需要具有
關于景物成象的物理規(guī)律的知識以及與景物內(nèi)容有關的知識。
當前的技術進展:
人工智能所研究的一個主要問題是:如何讓系統(tǒng)具備“計劃”和“決策能力”?從而使之完成特定的技術動作(例如:移動一個機器人通過某種特定環(huán)境)。這一問題便與計算機
視覺問題息息相關。在這里,計算機視覺系統(tǒng)作為一個感知器,為決策提供信息。另外一些
研究方向包括模式識別和機器學習(這也隸屬于人工智能領域,但與計算機視覺有著重
4、要聯(lián)
系),也由此,計算機視覺時常被看作人工智能與計算機科學的一個分支。
計算機視覺關注的目標在于充分理解電磁波一一主要是可見光與紅外線部分一一遇到
物體表面被反射所形成的圖像,而這一過程便是基于光學物理和固態(tài)物理,一些尖端的圖像感知系統(tǒng)甚至會應用到量子力學理論,來解析影像所表示的真實世界。同時,物理學中的很多測量難題也可以通過計算機視覺得到解決,例如流體運動。也由此,計算機視覺同樣可以被看作是物理學的拓展。
另一個具有重要意義的領域是神經(jīng)生物學,尤其是其中生物視覺系統(tǒng)的部分。
在整個20世紀中,人類對各種動物的眼睛、神經(jīng)元、以及與視覺刺激相關的腦部組織
都進行了廣泛研究,這些研究
5、得出了一些有關“天然的”視覺系統(tǒng)如何運作的描述(盡管仍略嫌粗略),這也形成了計算機視覺中的一個子領域一一人們試圖建立人工系統(tǒng),使之在不
同的復雜程度上模擬生物的視覺運作。同時計算機視覺領域中,一些基于機器學習的方法也
有參考部分生物機制。
計算機視覺的另一個相關領域是信號處理。很多有關單元變量信號的處理方法,尤其對
是時變信號的處理,都可以很自然的被擴展為計算機視覺中對二元變量信號或者多元變量信號的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計算機視覺中發(fā)展起來的方法,在單元信
號的處理方法中卻找不到對應版本。這類方法的一個主要特征,便是他們的非線性以及圖像
信息的多維性,以上二點作為
6、計算機視覺的一部分,在信號處理學中形成了一個特殊的研究
方向。
2. 雙目立體視覺技術原理及其研究現(xiàn)狀?
答:雙目立體視覺是計算機視覺的一個重要分支,即由不同位置的兩臺或者一臺攝像機
(CCD經(jīng)過移動或旋轉(zhuǎn)拍攝同一幅場景,通過計算空間點在兩幅國像中的視差,獲得該點的三維坐標值。
基本原理如下:
立體視覺系統(tǒng)由左右兩部攝像機組成。如圖二所示,圖中分別以下標I和r標注左、右
攝像機的相應參數(shù)。世界空間中一點A(X,Y,Z)在左右攝像機的成像面CI和Cr上的像點
分別為al(ul,vl)和ar(ur,vr)。這兩個像點是世界空間中同一個對象點A的像,稱為"共
軛點”。知道了這兩個共
7、軛像點,分別作它們與各自相機的光心OI和Or的連線,即投影線
alOl和arOr,它們的交點即為世界空間中的對象點A(X,Y,Z)。這就是立體視覺的基本原
理。
虛擬現(xiàn)實。
目前研究現(xiàn)狀如下:
日本大阪大學自適應機械系統(tǒng)研究院研制了一種自適應雙目視覺伺服系統(tǒng),禾U用雙目體視的原理,如每幅圖像中相對靜止的三個標志為參考,實時計算目標圖像的雅可比短陣,從而預測出目標下一步運動方向,實現(xiàn)了對動方式未知的目標的自適應跟蹤。該系統(tǒng)僅要求
兩幅圖像中都有靜止的參考標志,無需攝像機參數(shù)。而傳統(tǒng)的視覺跟蹤伺服系統(tǒng)需事先知道
攝像機的運動、光學等參數(shù)和目標的運動方式。
日本奈良科技大學信
8、息科學學院提出了一種基于雙目立體視覺的增強現(xiàn)實系統(tǒng)(AR)注
冊方法,通過動態(tài)修正特征點的位置提高注冊精度。該系統(tǒng)將單攝像機注冊(MR與立體視
覺注冊(SR相結合,利用MR和三個標志點算出特征點在每個圖像上的二維坐標和誤差,利用SR和圖像對計算出特征點的三維位置總誤差,反復修正特征點在圖像對上的二維坐標,
直至三維總誤差小于某個閾值。該方法比僅使用MR或SR方法大大提高了AR系統(tǒng)注冊深度
和精度。實驗結果如圖2,白板上三角開的三頂點被作為單攝像機標定的特征點,三個三角形上的模型為虛擬場景,烏龜是真實場景,可見基本上難以區(qū)分出虛擬場景(恐龍)和現(xiàn)實
場景(烏龜)。
日本東京大學將實時
9、雙目立體視覺和機器人整體姿態(tài)信息集成,開發(fā)了仿真機器人動態(tài)
行長導航系統(tǒng)。該系統(tǒng)實現(xiàn)分兩個步驟:首先,利用平面分割算法分離所拍攝圖像對中的地面與障礙物,再結合機器人身體姿態(tài)的信息,將圖像從攝像機的二維平面坐標系轉(zhuǎn)換到描述軀體姿態(tài)的世界坐標系,建立機器人周圍區(qū)域的地圖;基次根據(jù)實時建立的地圖進行障礙物
檢測,從而確定機器人的行走方向。
日本岡山大學使用立體顯微鏡、兩個CCD攝像頭、微操作器等研制了使用立體顯微鏡控制微操作器的視覺反饋系統(tǒng),用于對細胞進行操作,對鐘子進行基因注射和微裝配等。
麻省理工學院計算機系統(tǒng)提出了一種新的用于智能交通工具的傳感器融合方式,由雷達
系統(tǒng)提供目標深度的大
10、致范圍,利用雙目立體視覺提供粗略的目標深度信息,結合改進的圖像分割算法,能夠在高速環(huán)境下對視頻圖像中的目標位置進行分割。
華盛頓大學與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng),使“探
測者”號能夠在火星上對其即將跨越的幾千米內(nèi)的地形進行精確的定位玫導航。系統(tǒng)使用同
一個攝像機在“探測者”的不同位置上拍攝圖像對,拍攝間距越大,基線越寬,能觀測到越遠的地貌。系統(tǒng)采用非線性優(yōu)化得到兩次拍攝圖像時攝像機的相對準確的位置,利用魯棒性
強的最大似然概率法結合高效的立體搜索進行圖像匹配,得到亞像素精度的視差,并根據(jù)此
視差計算圖像對中各點的三維坐標。相比傳統(tǒng)的體視系統(tǒng),能夠更精確
11、地繪制“探測者”號
周圍的地貌和以更高的精度觀測到更遠的地形。
國內(nèi)研究動態(tài)
浙江大學機械系統(tǒng)完全利用透視成像原理,采用雙目體視方法實現(xiàn)了對多自由度機械裝
置的動態(tài)、精確位姿檢測,僅需從兩幅對應圖像中抽取必要的特征點的三維坐標,信息量少,
處理速度快,尤其適于動態(tài)情況。與手眼系統(tǒng)相比,被測物的運動對攝像機沒有影響,且不
需知道被測物的運動先驗知識和限制條件,有利于提高檢測精度。
東南大學電子工程系基于雙目立體視覺,提出了一種灰度相關多峰值視差絕對值極小化
立體匹配新方法,可對三維不規(guī)則物體(偏轉(zhuǎn)線圈)的三維空間坐標進行非接觸精密測量。
哈工大采用異構雙目活動視覺系統(tǒng)實現(xiàn)了全自
12、主足球機器人導航。將一個固定攝像機和
一個可以水平旋轉(zhuǎn)的攝像機,分別安裝在機器人的頂部和中下部,可以同時監(jiān)視不同方位視
點,體現(xiàn)出比人類視覺優(yōu)越的一面。通過合理的資源分配及協(xié)調(diào)機制,使機器人在視野范圍、
測跟精度及處理速度方面達到最佳匹配。雙目協(xié)調(diào)技術可使機器人同時捕捉多個有效目標,觀測相遇目標時通過數(shù)據(jù)融合,也可提高測量精度。在實際比賽中其他傳感器失效的情況下,僅僅依靠雙目協(xié)調(diào)仍然可以實現(xiàn)全自主足球機器人導航。
火星863計劃課題“人體三維尺寸的非接觸測量”,采用“雙視點投影光柵三維測量”
原理,由雙攝像機獲取圖像對,通過計算機進行圖像數(shù)據(jù)處理,不僅可以獲取服裝設計所需
的特征尺
13、寸,還可根據(jù)需要獲取人體圖像上任意一點的三維坐標。該系統(tǒng)已通過中國人民解
放軍總后勤部軍需部鑒定??蛇_到的技術指標為:數(shù)據(jù)采集時間小于5s/人;提供身高、胸
圍、腰圍、臀圍等圍度的測量精度不低于1.0cm。
3. 機器視覺的應用原理及場合,機器人視覺屬于計算機視覺應用嗎?
答:機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是指通過機器視覺產(chǎn)
品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些
信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結果來控制現(xiàn)場的設備動作
14、。
應用原理:機器視覺檢測系統(tǒng)采用CCD照相機將被檢測的目標轉(zhuǎn)換成圖像信號,傳送
給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號,圖像處理
系統(tǒng)對這些信號進行各種運算來抽取目標的特征,如面積、數(shù)量、位置、長度,再根據(jù)預設的允許度和其他條件輸出結果,包括尺寸、角度、個數(shù)、合格/不合格、有/無等,實現(xiàn)
自動識別功能。
應用場合:1.自動光學檢查
2. 人臉偵測
3. 無人駕駛汽車
機器人視覺屬于計算機視覺應用。
4. 立體視覺與立體電視有無區(qū)別,為什么?
答:立體視覺是人眼在觀察事物時所具有的立體感。再進一步講,人眼對獲取的景象有相當?shù)纳疃雀兄芰?De
15、pthPerception),而這些感知能力又源自人眼可以提取出景象中的深度要素(DepthCue)。
立體電視是一種能夠模擬實際景物的真實空間關系的電視系統(tǒng)。又稱三維電視
(Three-dimensionaltelevision,3D-TV)。立體電視圖像不僅能給觀眾一種深度感覺,而且
能給觀眾一種景物伸展于熒光屏之外似乎伸手可觸的感覺。
人眼的立體視覺特性是立體電視的基礎。人類在觀看四周世界時,不僅能看到物體的寬
度和高度,而且能知道它們的深度,能判定物體之間或觀看者與物體之間的距離。這種三維
視覺特性產(chǎn)生的主要原因是:人們通??偸请p目同時觀看物體,而由于兩只眼睛視軸的間距
16、(約65mm),左眼和右眼在看一定距離的物體時,所接收到的視覺圖像是不同的,因而大腦通過眼球的運動、調(diào)整,綜合了這兩幅圖像的信息,產(chǎn)生立體感。在單用左眼和右眼觀看
物體時,所產(chǎn)生的圖像移位感覺就叫視差。理論分析可知,在沒有任何工具的情況下,人眼
可看到立體物體的最遠距離不超過1km。由經(jīng)驗得知,人的立體視覺還不是絕對靠視差,
一只眼睛的人同樣能判定物體深度和距離,他們主要是靠光線明暗、物體的相對尺寸、清楚
程度、運動速度等來進行判定的,把眼球視線注視于一點或一小區(qū)域后,利用眼睛上下左右
轉(zhuǎn)動來對物體上下、左右、前后掃描觀察,以便使物體能在眼球運動、肌肉做功過程中,獲得多幅稍有差別的物
17、體圖像信息,通過長期以來所積累的觀察事物的經(jīng)驗進行判定等就足可
獲得立體感,由此可見,兩只眼睛觀察觀看同一物體的視覺信號,可以獲得立體感,而用一
個眼睛對同一物體從兩個稍有差別的觀察點來獲得圖像信息,也能使人獲得立體感。
也就是說,立體電視是立體視覺中的一項技術成果,電視利用人的立體視覺
原理發(fā)明的
5. 基于圖像內(nèi)容的視頻圖像檢索如何進行?簡述方法與步驟
答:視頻數(shù)據(jù)的本質(zhì)是一組連續(xù)的圖像幀,除了存在時間上的先后關系外,其本身并不具有任何結構信息。要實現(xiàn)基于內(nèi)容的視頻檢索,必須為視頻建立不同層次的結構索引,并進一步為視頻的檢索和瀏覽提供基本訪問單元。
基于內(nèi)容的視頻檢索系統(tǒng)框圖
18、如下:
用戶輸出
6. 基于灰度和特征的兩種匹配算法各有何不同?目前研究較多是基于哪種匹配算法?
答:基于灰度的匹配算法是指圖象處理中所稱的區(qū)域相關方法,它是解決對應問題的一
個最直觀最簡單的方法。在一幅圖象中以一點為中心選定一區(qū)域(窗口),在另一幅圖象中
尋找與該區(qū)域相關系數(shù)最大的區(qū)域,把該找到的區(qū)域的中心認為是原來那區(qū)域中心的對應點。
基于圖像特征方法提取各類圖像中保持不變的特征,如邊緣點、閉區(qū)域的中心等,作為兩幅圖像匹配的參考信息。這類方法的主要優(yōu)點是它提取了圖像的顯著特征,大大壓縮了圖像的信息量,使得計算量小,速度較快,而且這種方法對特征提取和特征匹配的錯誤更敏感,
19、需要可靠的特征提取和特征一致性?;趫D像特征的匹配方法包括特征提取、特征匹配選取、變換模型及求取參數(shù)坐標、變換與插值四個主要組成部分。
基于灰度和特征的兩種匹配算法的不同:基于灰度的匹配算法計算量大,但可以得到整幅圖象的視差圖。該算法對噪音很敏感,考慮到計算量,窗口不宜開得過大,因而可能匹配的選擇較大,誤對應可能性大,不適于灰度分布均勻的圖象,較適于灰度分布很復雜的圖象,如自然景物等。采用該方法的關鍵在于排除或減輕噪音的影響。通常采用多層次相關對應及多幅圖象的統(tǒng)計平均處理方式來實現(xiàn)。基于特征的匹配算法特別適用于特殊的比較簡單的環(huán)境如室內(nèi)環(huán)境,具有
速度快、精度高的特點,但對于自然環(huán)境,由于
20、缺少顯著的主導特征,該方法也遇到了很大困難。
目前研究較多的是基于圖像特征的匹配算法。也有將基于灰度和基于特征結合起來的匹配算法,比如基于投影特征的圖像匹配算法。
二、程序分析題
選擇一個基于OpenCV勺計算機視覺小程序,進行分析。(可以選擇附件中包含的8個程序)
1)簡述程序的主要功能或算法;
2)給出編譯環(huán)境及相關設置;
3)給出運行結果或圖像。
答:該程序?qū)崿F(xiàn)了運動目標跟蹤,用到卡爾曼濾波器算法;
我的電腦環(huán)境是WindowXP編譯環(huán)境是VC++2008配置OpenCV2.1版本
二、程序設計題
根據(jù)上題所選擇的程序,對小程序進行一些修改和功能的擴展
1)明確指出自己完成的算法和修改主要有哪些?
2)給出運行結果或圖像;
3)進行簡要的算法分析與總結。
4)提供最終的源代碼,發(fā)送到ruanjun@。