機械專業(yè)外文文獻翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)
《機械專業(yè)外文文獻翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)》由會員分享,可在線閱讀,更多相關(guān)《機械專業(yè)外文文獻翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)(15頁珍藏版)》請在裝配圖網(wǎng)上搜索。
國際性刊物 魯棒非線性控制 2000; 10:875覺跟蹤問題 :向魯棒非線性控制挑戰(zhàn) 艾倫 泰勒保蒙 美國亞特蘭大 0082號格魯吉亞工學院電子和計算機研究部門 視覺跟蹤問題 :向魯棒非線性控制挑戰(zhàn) 摘要 : 視覺跟蹤是在控制活動圖象中關(guān)鍵性問題之一。因為模型中存在不可靠性和噪音信號、使它變成魯棒控制中一挑戰(zhàn)性問題。在此論文中、我們將概略一些涉及的關(guān)鍵問題和一些可能的解答方案,我們想需要聯(lián)系機器視覺和多刻度圖像處理技術(shù)來實現(xiàn)這個工作任務。 特別地,我們會概略一些必需的方法例如:計算機視覺和圖像處理包含光學流程圖在內(nèi)、活動的輪廓(橫向振蕩),和幾何學上的被驅(qū)動流程。該論文如此也便會有指導意義 。版權(quán) ?2000 約翰懷利和幾個有限公司 關(guān)鍵字 :目視跟蹤 魯棒控制 視覺運動 活動輪廓 光學流程 通用換算圖像處理 1. 引言 在這論文里、我們考慮那些被控制的跟蹤眼運動活動圖象問題。這個問題的解決方案需綜合控制理論、信號處理和計算機視覺等技術(shù)。我們想表明有可能由利用能適應的魯棒控制與信號處理通用換算方法以及計算機視覺形狀識別理論協(xié)同一起來處理此問題,跟 蹤是一基點控制問題即我們需要的輸出的遵循或跟蹤基準信號,或相當于我們想使那跟蹤誤差相對于一些定義明確的標準(說能量、能力、峰值、等等 .)盡可能小的。即使鏡頭推進存在的一些干擾是一典型控制問題、這個手頭上的問題是很難和挑戰(zhàn)性,因為有非常不確定的自然干擾性。一個可以認為眼球運動跟蹤問題是在一人機連接的環(huán)境之下。特別地,我們將推斷計算機用戶視覺運動,哪個動作是用戶打算完成的。例如:在電腦熒屏上打開一個文件夾、展開一下拉菜單項等等。這類電腦跟蹤系統(tǒng)將作為包含我們的視覺跟蹤方法學一個具體的實例。重要強調(diào)是已經(jīng)有相當多 在測量視覺運動方面的研究已經(jīng)在被控制的實驗室環(huán)境下完成、何況研究上已經(jīng)在應用中用到此知識。從此我們將考慮接下來在大范圍中跟蹤問題的適應性,包括機器人、遠距操縱的車輛,并且飛行員帶瞄準器的飛行帽當前也正在發(fā)展中。后者是系統(tǒng)的結(jié)合鋼盔支柱頭和視覺跟蹤能力以分辯隸屬的正確的視線。顯而易見,正當?shù)拈_發(fā)跟蹤觀察者眼睛的人類視覺系統(tǒng)的那動態(tài)特性將導致大大幅度削減傳輸中所需要的信息。關(guān)于視覺跟蹤和眼運動(與大量的信息一樣)的討論多半被發(fā)現(xiàn)在參考 [1 . 我們應該明白視覺跟蹤問題不同于標準追蹤問題,因為反饋信號是用 圖像感應器測量的。尤其是,它必須在經(jīng)由計算機視覺運算法提取而且在被用于控制回之前被一個推論運算法解釋。反應速度是關(guān)鍵性因素。因為明顯的理由、一視覺跟蹤系統(tǒng)應該是盡可能的非侵入的。眼球運動通過由灰度或紅外線照相機或由一系列感應器得到的獲取圖象來完成跟蹤的 低能級數(shù)據(jù)獲取和識別的完成是經(jīng)由一通用換算技術(shù)得到的。此技術(shù)提供許多優(yōu)越性。第一,它使得信號處理的查找和醫(yī)學上的圖象獲取過程明朗化、它導致實時信號捕獲和了解程序快速化。識別將利用一通用換算方法和一新的計算理論形 式來完成。 因此、從該視頻信息交換窗的控制點出發(fā)、我們有一跟蹤問題在非常不可預測的干擾哪個我們想使其衰減的。注意到該不可靠應歸于傳感器噪音(典型的)、該算法的構(gòu)成如上所述(不可測性求出起重要作用、各種各樣的假設(shè)的可能性、等等 .),和模型不定性。我們應該注意到論文將擁有指導氣息。實際上,我們的一個關(guān)鍵目的是引進從活動圖象到該魯棒控制共同體的一些核心概念。我們堅信共同體便會從研究彼此方法和問題得益。尤其是、因為視覺跟蹤和該眼球運動跟蹤的特有的課題、該魯棒控制在明確地處理不可靠性的技術(shù)我們將要在接下來做相應的討論 。 2. 視覺 跟 蹤 視覺跟蹤存在許多論文,通過利用視力在貨車交貨、特別是在機器人共同體(看例如、涉及 [1, 2, 5和那參考在那里面的 .)代表性地、該問題定位在本研究中是通過利用視覺跟蹤服務機械手(或一等值的難題)。該動機于使用視力在這一體制中是非常清晰的,那就是說,該綜合計算機視覺和控制可以是用到改善測量,因為改善圖像處理技術(shù)和硬件中、機器人技術(shù)到達指向就是要視覺信息可以變成不可分割那部分反饋信號。因為問題帶有少量不定性、單純的 且越來越用于嘈雜的系統(tǒng)、能適應的方案以及隨機建 立的已經(jīng)使用的線性二次高斯控制器。 許多控制原理圖已經(jīng)建議使用視覺信息來控制回路。這已經(jīng)綿亙傳感零件到表征多級控制結(jié)構(gòu)應用范圍而言、傅里葉描述符,和局部圖像分析法;看參考 [ 9和那里面的參考。以光學的流程為基礎(chǔ)的有好的方法已經(jīng)被當作機械手的計算一個主要成份使用驅(qū)動信號(閱讀詳細的,請參考 [ 7, 8],和我們以下的論述)。的確,因為在一個圖像中的一個物體由光亮式樣組成 , 如同物體搬進空間一樣光亮也是式樣。 光學的流程然后是光亮的明顯運動式樣 ;參考 [12]。在標準的假定之下 , 被提供的一個靜態(tài)的目 標和一臺感人的照相機 ( 或相等地 ,一個靜態(tài)的物體和一臺感人的照相機 ),一個可以在快速時寫下象平面上對象凸出點的時差。若干方法已經(jīng)討論適合于計算此速度。此知識也將能用來跟蹤圖像。 讓我們考慮追蹤一個計算機熒屏上的目標具體問題。然后我們有唯一的一二維的跟蹤目標點,我們?yōu)楹唵纹鹨娂俣悄繕酥苄谠幽茱w機垂直于光軸照相機,如果那照相機移動然后帶有翻譯速度的移動 : ????????和旋轉(zhuǎn)速度盎司(就那照相機設(shè)計)而言、可能形成二維的跟蹤問題如同下述適合于一個目標。讓電 壓互感器標志目標的投影在象平面區(qū)域, 那照相機設(shè)計)。有類似的描述適合于跟蹤的零件。現(xiàn)在由此機構(gòu),就可以寫下運動的照相機光流產(chǎn)生的 其控制變量是由包括照相機的跟蹤運動在內(nèi)的流程所給定的。那可執(zhí)行代碼程序帶表格可能在參考 [ 13、 7]查到,并且無須涉及我們現(xiàn)在所討論的課題 (同那定時在 .. 之后接納那表格。 x(n+1)=x(n)+ n)=Td(n)+v(n) z(n)=x(n)+w(n) 這里 ,d 是外界產(chǎn)生的干擾 , v 是‘噪音 ',稱做適合于模型不定性, z 是是那量度與噪聲分量 w 一起。 ( 所有的矢量都包含在。 x , y 和搖晃因素形成的跟蹤誤差構(gòu)成的 )。 有許多重要的控制問題與這樣的設(shè)備有關(guān)系、當然,一個人量度延遲(我們想工作實時)和抽樣時間選擇的問題。但是我們感覺有許多深刻地和很多難題,必須被編址合理可選擇的控制策略成功之前。換句話說 ,一般說來不定性( v w)是塑造成均 勻頻譜噪聲。這模型是保守的,沒有加入使用帳戶任何可能噪聲環(huán)境的結(jié)構(gòu)?,F(xiàn)代魯棒控制一個關(guān)鍵貢獻考慮了的結(jié)構(gòu)不定性(參考 [ 14]和以及里面其他內(nèi)容)。在我們現(xiàn)在的情形中,我們倡導深刻的研究有關(guān)不定性方面的問題。這將導致信號處理的關(guān)鍵元素,尤其是,新的強大的計算機通用換算方法 雅各比理論為基準將會起到一個關(guān)鍵角色。以下我們將討論此話題,尤其是討論更多明確地處理那眼球運動信息并在反饋電路使用它的方法。 3、眼睛運動信息 當許多研究已經(jīng)完成眼睛運動測量的時候,少量研究已經(jīng)在應用中采 用這些知識。一些侵入的視覺跟蹤技術(shù)測量角膜和視網(wǎng)膜電勢差而其他的人正在使用 侵入的技術(shù)識別零件位于眼睛的圖像上,比如虹膜或瞳孔或那角膜的界限條件反射的眼睛敏感的光線,并且從此零件推論出運動的眼睛,所以此零件的運動還可以應歸于頭部的運動,重要的是跟蹤若干零件并求出此零件差速運動。例如:、電學上近紅外眼睛跟蹤系統(tǒng)使用角膜表面反射的光的相對運動而且反射視網(wǎng)膜跟隨用戶的目光。關(guān)于眼睛跟蹤技術(shù)的好的調(diào)查報告參考 [ 3, 15] 16]。 大部分從事利用眼球運動知 識已經(jīng)集中于聯(lián)絡殘疾人使用者,例如,參考 [ 17, 18]。其他的研究強調(diào)應用于類似于我們在考慮包含 [ 19的。這開創(chuàng)性研究嘗試通過利用眼球運動在人機通信并且證明理論的可能性 . 他們也確定這些趨近于人機通信的實用真實問題和缺陷,其必須解決以便使其實用逼真以至可以對抗和補充其他的人機連接工具比如鼠標、鋼筆和圖形輸入卡、駕駛桿以及鍵盤。 趨近于人機通信的視覺跟蹤幕后的理論基礎(chǔ)是目標被一受支配的似人的結(jié)構(gòu)發(fā)現(xiàn)。如果是這樣,在視網(wǎng)膜成像的小的區(qū)域稱作小凹。因此使用者的眼睛位置提供有關(guān)他集中于屏蔽的區(qū)域的信 息。該信息是精確到內(nèi)部小凹角寬度的(大約一度)。此精度已經(jīng)被認為是適宜于上述研究中的人機通信(好的精確度可能需要眼肌的研究,但是我們這里不討論 .)生物學研究者指出大量普遍的眼睛運動分成二類∶掃視與定位。(參考 [3, 24, 4]與該參考中一些掃視與定影的論述以及他們和生物學幻像的關(guān)系。這些研究同時包含大規(guī)模視覺跟蹤的一些基本問題 .)掃視是突然運動視覺從場景中的一個感興趣區(qū)到另一個。掃視通常伴隨間隔為 200到 600毫秒的定影,該視覺仍然完成包括小于一度的小的神經(jīng)過敏運動。其他的形式的眼睛運動可能在人機通信期中可能被忽略。 建立人機通信的視覺跟蹤的基本問題是確定定影周期(亦即,用戶感覺他在視覺上已經(jīng)定位在一目標上的時間),然后在肌肉神經(jīng)過敏視覺運動定位在目標上。注意人類忽視這定影期間的神經(jīng)過敏視覺運動,那就是說我們注視一個目標我們以為我們是早看現(xiàn)場的單個斑點。也要注意到純理論的過濾器接近于除去該眼睛神經(jīng)過敏不是令人滿意地,既它也可能減緩正確位置掃視的響應時間。 4. 數(shù)據(jù)獲得 有二基本對數(shù)據(jù)獲得的方法 : 與那一個類似的活躍方式藉著追蹤系統(tǒng)和圖 像技術(shù)的無源現(xiàn)在眼睛用。 在有效的方法中,一種無害近紅外線燈用來照明用 戶的臉。兩個來自眼睛的反射波被求得。是前者反射信號起因于角膜表面被稱作反射。后者反射發(fā)生來自視網(wǎng)膜被稱作明亮視覺成分。為最小化背景輻射效果,目前的系統(tǒng)一般需要暗淡的光。本文中,我們將鉆研無源的方法。 5. 追蹤及光學 流程 一旦我們想要跟蹤與對象相當?shù)男畔⒁呀?jīng)確定,我們使用一個光學流程估計各零件從兩個連續(xù)圖象,只包含那個零件。該圖象是當時和以前的 產(chǎn)生運動判斷問題比用純理論的強度成像的傳統(tǒng)的流程判斷適應度好了很多。該光學流程的計算機應用已經(jīng)被用于解決活動幻像中出現(xiàn) 的問題的一個重要的工具。該光流域是一序列的成像的明亮圖像的視在運動的速度矢量場 [ 41]。假定該明亮圖像是相對運動的結(jié)果,足夠大的空間來寄存圖像上光亮度在空間分配方面的改變。因此,一個目標和一架相機的相對運動能夠引起光學流程。同樣地,一工人靜電照相機成像的場景中目標的相對運動可以引起光學流程。在我們光學流程的計算機應用上,我們使用通用化粘性溶液的漢密爾頓 技術(shù)似乎理論上適于這種變化,歐拉拉格朗日接近于此問題(參見 [ 41面相關(guān)的內(nèi)容)。利用這種通用的方法,我們已能處理那些在光 學流程區(qū)域出現(xiàn)的若干相異的變分公式的奇異性和規(guī)律性問題。這類方法論已經(jīng)被用于描影法造型問題 [ 44, 45],和邊緣檢測 [ 46]。 ⒍分割和數(shù)據(jù)分析 從一數(shù)據(jù)列提取是有干擾的視覺軌跡,然后問題變?yōu)閿?shù)據(jù)斷片進入掃視和定位間隙和測定預定注視點。一個非常接近的通用換算也被用于這些步驟中。該定位判斷問題由于若干干擾來源而變得復雜。特別地,眼光閃爍及其他人為現(xiàn)象可能沒有終止地發(fā)生在定位過程中。在這些人為現(xiàn)象有的能夠持久 200毫秒,數(shù)據(jù)可能丟失。為更好的目標定位和分裂眼睛運動跟蹤,可以使用點連續(xù)/離散最大概似法接近 于細化開始和結(jié)束間歇以及定點的測定可能值。該方式是結(jié)點連續(xù)/非連續(xù)的測定問題因為注視點能夠取連續(xù)的值,然而分割成 '定位 '和 '非定位 '間隔是一個二元問題。它是建立在視覺活動定位和持續(xù)的統(tǒng)計學上的模型,它是建立在最理想的貝葉斯定理概念上的。它用一個預測步驟來填充在掃視過程中丟失的數(shù)據(jù)。該推算步驟以假設(shè)視覺或者在定位方式或者在掃視方式為基準提出兩個推定量。該假設(shè)任何一個取舍是在監(jiān)視若干讀取信息后計算各可能性之后取舍的。延遲關(guān)聯(lián)文件這過程限于大約毫秒,這個過程將不會為用戶所注意到。 如上所述還可以容易地貝葉斯統(tǒng)計放 到遞減率蛇形線來處理抽取的輪廓;參考[ 50]。因此建立邊緣檢測算法的通用換算幾何學上的橫向振蕩很自然地變成其貝葉斯定理的框架。注意我們不需要發(fā)送有關(guān)掃視運動的相關(guān)信息。當注視點改變時,我們唯一的提供有關(guān)跟蹤程序初始的和最后的定點的信息。然而,加快人機通信過程,我們使用掃視運動去推算下一個定點將會在哪。 掃視運動可以由一隱藏的馬爾可夫模型描述參考 [ 51]中相關(guān)內(nèi)容。此外,馬爾可夫模型可能用來綜述在當前上內(nèi)容可能的用戶操作。在隱藏的馬爾可夫模型描述的這掃視各狀態(tài)關(guān)聯(lián)到特別的運動形式階段的隨機模型。經(jīng)結(jié)合用戶 意圖的隨機的描述是以呈現(xiàn)背景和掃視的隱藏的馬爾可夫模型為基準的,我們可以導出一推算下一個注視點將在的位置的判斷法則。 ⒎結(jié)論 在論文中,我們考慮用一通用方法論來研究眼光跟蹤問題。我們應該注意因為信號和模型中的不定性,此類問題為在魯棒控制方面的研究工作者提供了一個極其難得的機會。我們論述個綜合魯棒控制、計算機視覺,和信號處理通用換算的方法。最近、存在多種人員參加在研究幻像和控制。大部分研究到目前已經(jīng)分支。當分支已經(jīng)結(jié)束時很多基本控制算法已經(jīng)用于混合的結(jié)果。利用視覺信息在反饋電路中能夠提供珍貴的新的研究來源,它 有潛力推動控制研究的一個新的領(lǐng)域。在本問中論述的視覺跟蹤問題可以作為一范例適合于活動圖象控制的整個范圍。的確,該問題向魯棒控制系統(tǒng)開啟了一次有力的挑戰(zhàn)。 感謝 我們要感謝明尼蘇達大學的加里 特費科教授,他們提供了許多非常有用的關(guān)于視覺跟蹤的交談。該研究在某種程度上得到以下各單位的授權(quán)和支持:國家科學基金會電子計算機系統(tǒng) 家科學基金會局部信息處理系統(tǒng),自動跟蹤科學研究空軍辦公室/ 98 - 1 - 0168、軍隊 98 - 1 - 0169研究 室。 F J. 000; 10:875n a . is of in of in it a In we of as as We to in In we of ‘, a as 2000 . n we of of of We it is to by in is a in we to or a or we to as as to . in of a is a at is of of in of a In we to of of a to a on a a of as a of is in It is to in of in a on in we a of in a of in to a s of of of by of s to in of to be of an of be 1 We of in is In it to be by a in is a an be as as is by by or or by an of to of is a a of as is in it to be a a of of we a in of a we to is to in of , We a of is to to We by s In of of be as we 2. a of on of in in ( 1, 2, 5 in is of a or an in a is of be to of in is an of ID as as QG A of of in of to 9 A on as a in of s in 7, 8], an in an is up of as in so do is of 12]. a a or a a of a of of be to us of on a we a We in a is to of If : ????????to as an 13]. t on is of to q to t of of by of by of by s be 13, 7], us is be in on x(n+1)=x(n)+ T (n)=Td(n)+v(n) z(n)=x(n)+w(n) is d is v is a &z is w. (of up of x, y, of a of to a Of of we to in of we is a be a of be in v w) is as is of of of in of in 14] In we a of to of in of in a in as be We in of it in a 3. on of on in of on an of as of or or of a at of of of be to a of it is to of of to s A of be 3, 15]. 16]. of on on 17, 18]. to we 19 of in of of to be in to it a as to is an is by a if it is on a of a s of he is is of to of of to be by (be of is (3, 24, 4] of to on of A is a of of in to A is by a 00 00 ms of be in in is of he is at an of in of to do we an we we at a in a to is it to a 4. to an to by a In a is to s is- 1.請仔細閱讀文檔,確保文檔完整性,對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
6 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 機械 專業(yè) 外文 文獻 翻譯 視覺 跟蹤 問題 非線性 控制 挑戰(zhàn)
鏈接地址:http://www.3dchina-expo.com/p-18372.html