購(gòu)買設(shè)計(jì)請(qǐng)充值后下載,,資源目錄下的文件所見即所得,都可以點(diǎn)開預(yù)覽,,資料完整,充值下載可得到資源目錄里的所有文件。。?!咀ⅰ浚篸wg后綴為CAD圖紙,doc,docx為WORD文檔,原稿無水印,可編輯。。。具體請(qǐng)見文件預(yù)覽,有不明白之處,可咨詢QQ:12401814
南 京 理 工 大 學(xué) 紫 金 學(xué) 院
畢業(yè)設(shè)計(jì)(論文)外文資料翻譯
系: 機(jī)械工程系
專 業(yè): 機(jī)械工程及自動(dòng)化
姓 名: 劉學(xué)偉
學(xué) 號(hào): 060104212
外文出處:Neurocomputing 72 (2009) 3624–3630
附 件: 1.外文資料翻譯譯文;2.外文原文。
指導(dǎo)教師評(píng)語:
簽名:
年 月 日
注:請(qǐng)將該封面與附件裝訂成冊(cè)。
附件1:外文資料翻譯譯文
新興的運(yùn)動(dòng)特性:學(xué)習(xí)鉸接式移動(dòng)機(jī)器人中關(guān)節(jié)的協(xié)調(diào)性
Diego Pardo,Cecilio Angulo,Sergi del Moral, Andreu Catal_a
CETpD,技術(shù)研究中心,ESAII-UPC,自動(dòng)控制系,加泰羅尼亞技術(shù)大學(xué)、VilanovailaGeltr′u, 巴塞羅那,西班牙
關(guān)鍵字:
鉸接式移動(dòng)機(jī)器人
運(yùn)動(dòng)特性
機(jī)器人的學(xué)習(xí)
摘要
在這篇文章中,我們分析評(píng)價(jià)鉸接式移動(dòng)機(jī)器人運(yùn)動(dòng)特性一般方法背后的意義而這種鉸接式移動(dòng)結(jié)構(gòu)處于折衷動(dòng)態(tài)平衡下,針對(duì)這些問題,我們提出了新的方法和方法論,而此方法論描述了機(jī)器人運(yùn)動(dòng)時(shí)關(guān)節(jié)的運(yùn)動(dòng)特性,除了常見的方法,我們還假定解決方法中運(yùn)動(dòng)信息的有效性,但其不涉及工作區(qū),控制結(jié)構(gòu)根據(jù)當(dāng)?shù)仃P(guān)于關(guān)節(jié)加速度標(biāo)準(zhǔn)來確定控制策略,使驅(qū)動(dòng)自由度達(dá)到理想結(jié)構(gòu)。同時(shí),得到的非驅(qū)動(dòng)自由度狀態(tài)被看作是這種策略的間接性概述,控制策略圍繞施加的簡(jiǎn)單基元進(jìn)行參數(shù)化的控制,通過改變參數(shù)的方法實(shí)現(xiàn)變形,這種方法是最優(yōu)的。通過隨機(jī)算法去實(shí)現(xiàn)對(duì)非驅(qū)動(dòng)自由度的控制,從而達(dá)到理想的運(yùn)動(dòng)特性。
1.導(dǎo)言
鉸接式移動(dòng)機(jī)器人是一種自主系統(tǒng),這些系統(tǒng)的功能允許系統(tǒng)的類型有多樣話的運(yùn)動(dòng)特性,但對(duì)這些特性也加以限制。它的初始示例是由機(jī)器人比賽提供的,其中的標(biāo)準(zhǔn)機(jī)器人用來踢足球。研究小組嘗試通過給定的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)結(jié)構(gòu)使產(chǎn)生的運(yùn)動(dòng)特性更好,如:跑,踢,頭球和守門。因此,改善運(yùn)動(dòng)特性的性能是一項(xiàng)挑戰(zhàn)。然而,一些問題是:(i)機(jī)器人的高效或速度不夠快是默認(rèn)步態(tài)嗎?(ii)機(jī)器人能跳嗎?(iii)機(jī)器人能舉起超過限重的重量嗎?因此,設(shè)計(jì)新的運(yùn)動(dòng)特性和克服身體本身的約束和限制是一項(xiàng)挑戰(zhàn)性的問題。
鉸接式移動(dòng)機(jī)器人是一種非驅(qū)動(dòng)系統(tǒng),不是所有的自由度都被驅(qū)動(dòng),因此普遍的動(dòng)平衡系統(tǒng)不斷遭到破壞。另外,它們也是多余的,比起那些象征意義上的機(jī)器人的控制元件有更多的自由度。如何去控制這一類型的機(jī)械裝置是不明顯的,這些對(duì)于研究機(jī)器人來說一直都是開放的領(lǐng)域。我們?cè)谶@篇文章中找到了鉸接式機(jī)器人的人工合成方法,明白了運(yùn)動(dòng)特性是人們對(duì)機(jī)器人結(jié)構(gòu)和結(jié)論的解釋說明。
為了限制一些問題,我們會(huì)集中討論可能通過的其余部分的運(yùn)動(dòng)實(shí)現(xiàn)運(yùn)動(dòng)特性的編碼,運(yùn)動(dòng)由初始狀態(tài)和最終狀態(tài)等于零時(shí)定義,盡管如此,大多數(shù)鉸接式機(jī)器人的運(yùn)動(dòng)特性還是可以理解為一系列的間隙性運(yùn)動(dòng),例如:伸出,拋和簡(jiǎn)單的姿態(tài)轉(zhuǎn)變。此外,循環(huán)和組成的過程可以被分解成這種類型的動(dòng)作序列。
文獻(xiàn)[9]中研究有關(guān)工作區(qū)機(jī)器人的運(yùn)動(dòng)學(xué)和剛體動(dòng)力學(xué),但其實(shí)現(xiàn)的條件通常是建立足夠的理論特性上。當(dāng)合適的加速度被用來實(shí)現(xiàn)運(yùn)動(dòng)時(shí),重力可以忽略不計(jì),因此,機(jī)器人的能量消耗是人步行過程中所需能量的15倍,然而,它已經(jīng)被證明當(dāng)人步行時(shí)重力不是總是可以忽略不計(jì)而且重力是實(shí)際存在的。看來前面所給定的運(yùn)動(dòng)特性目前的解決方案只適合于在一個(gè)特定的情況。因此,解決問題的方案是縮小理論的使用范圍而不是由機(jī)器人的性能來決定的。
然而,一些結(jié)果表明采用新的方案也可以解決問題,也證實(shí)了新方案的可行性同時(shí)新方案還能增強(qiáng)機(jī)器人的性能。例如,在文獻(xiàn)[19]中寫到,在探索新領(lǐng)域解決方案時(shí)用合適的方法可以很大地提高工業(yè)機(jī)械手的最大負(fù)載。用參數(shù)化地手段制定最佳控制方法來解決自身動(dòng)力學(xué)和時(shí)間范圍的限制。與以往的步驟有所不同,該控制方法導(dǎo)致機(jī)器人更加容易操縱,沿著同樣的思路,一個(gè)相似的結(jié)論不久就出現(xiàn)在文獻(xiàn)[15]中,文獻(xiàn)中提到一個(gè)簡(jiǎn)單的二維三自由度的機(jī)器人能夠完成舉重的動(dòng)作,這樣能避免機(jī)器人工作時(shí)被局部化地限制。它除了最大化解除負(fù)載外,還能完全地用其他方式來完成同樣的動(dòng)作。以上兩種方法都是直接聯(lián)接在運(yùn)轉(zhuǎn)和扭矩命令之間,工作區(qū)所需的必要條件幾乎為零,這樣系統(tǒng)能夠更自由地結(jié)束運(yùn)轉(zhuǎn)。兩種方法都被最有效地作為主要途徑使用。
最近,越來越多地把注意力放到了學(xué)習(xí)開發(fā)機(jī)器人性能的領(lǐng)域。最新的期刊刊登的都是圍繞著早期仿制機(jī)器人,這些機(jī)器人的工作區(qū)都是屬于人為的,隨后,機(jī)器人關(guān)節(jié)都是通過一些參數(shù)的設(shè)計(jì)來控制的,這就是所謂地動(dòng)力控制系統(tǒng)。大多數(shù)RL算法同樣適用于計(jì)算機(jī)控制機(jī)器人,此控制政策已經(jīng)在文獻(xiàn)[13]中寫到。
在作者寫的這篇文章中,我們假設(shè)所得到的運(yùn)動(dòng)學(xué)初期和末期的信息是相同的,我們的控制準(zhǔn)則是建立在當(dāng)?shù)仃P(guān)節(jié)變速水平的基礎(chǔ)上,使驅(qū)動(dòng)自由度達(dá)到最終的理想狀態(tài)。同時(shí),非驅(qū)動(dòng)自由度的最終形態(tài)以驅(qū)動(dòng)自由度的分布圖的形式畫出來。用作加速控制器提供所需的系統(tǒng)屬性控制DSs。
隨后,我們?cè)谶@篇文章中提供了相關(guān)問題實(shí)質(zhì)性的描述。站立運(yùn)動(dòng)特性表明那些非驅(qū)動(dòng)系統(tǒng)的運(yùn)動(dòng)特性的動(dòng)力平衡問題是可以調(diào)試的。圖一顯示了起初和最終的運(yùn)動(dòng)狀態(tài)。其中特別提到了它的運(yùn)動(dòng)特性是初速和最終速度都等于零的運(yùn)動(dòng)過程。機(jī)器狗開始是躺倒的姿勢(shì),隨后將會(huì)站立并以圖1-b所示的動(dòng)作結(jié)束。然而重力和其他非線性運(yùn)動(dòng)可能會(huì)讓機(jī)器狗以不同的方式結(jié)束運(yùn)動(dòng),如圖1-c所示。
(a)起初機(jī)器狗將要站立 (b)期望的站立方式 (c)站立失敗
圖1
我們?cè)诘诙鹿?jié)寫了基本的定義和正規(guī)的公式化問題。接著,在第三章節(jié)中提到了計(jì)算操作器的方法論。在第四章節(jié)中,應(yīng)用這些方法論展示機(jī)器人模仿人的運(yùn)動(dòng)特性。最終,結(jié)論都匯集在第五章節(jié)中。
2.控制機(jī)器人的運(yùn)動(dòng)特性
以一個(gè)參照系為基準(zhǔn),機(jī)器人的結(jié)構(gòu)確定了機(jī)械裝置所有部分的位置 ,機(jī)器人的結(jié)構(gòu)是由獨(dú)立位置變化的矢量q決定的, ;q定義了機(jī)械裝置自由度的數(shù)量。機(jī)器人關(guān)節(jié)之間的空隙是一組不確定值的集合,以方向和速度規(guī)定的機(jī)器人用坐標(biāo)的形式表示為:。
這些機(jī)器人的結(jié)構(gòu)定義了工作區(qū),記作,。q和x的關(guān)系如下:
(1)
其中該機(jī)器人的自由度數(shù)量比x大,比操作所需的自由度數(shù)量多的多,因此顯得有些多余。
速度和加速度之間的關(guān)系可以通過對(duì)(1)式的求導(dǎo)和二次求導(dǎo)得出:
(2)
其中是的雅可比矩陣
既然,描述機(jī)器人運(yùn)動(dòng)的原理已經(jīng)形成了,現(xiàn)在專注于機(jī)器人的應(yīng)力,其中應(yīng)力和加速度的關(guān)系可以寫成:
(3)
當(dāng)瞬時(shí)加速度和矢量q的方向一致時(shí),系統(tǒng)是沒有驅(qū)動(dòng)力的。對(duì)于鉸接式移動(dòng)機(jī)器人而言,自由度可以被看作成一個(gè)建立在機(jī)器人身上的慣性參數(shù)。
假設(shè)鉸接式機(jī)器人是不能彎曲的,它們的運(yùn)動(dòng)形態(tài)可以作為二階邏輯系統(tǒng)來描述,如果這樣扭矩就會(huì)影響到其它力在構(gòu)件上的相互作用。我們可以把它們之間的關(guān)系表達(dá)成:
(4)
驅(qū)動(dòng)加速度自由度表示為,非驅(qū)動(dòng)加速度的自由度表示為,考慮到個(gè)別特殊的情況,我們可以增強(qiáng)系統(tǒng)在(4)中的原動(dòng)力
(5)
其中慣性矩陣被分離成,因此如上式所知,M、驅(qū)動(dòng)加速度、非驅(qū)動(dòng)加速度三者之間有著密切地關(guān)聯(lián)。
在用加速度等級(jí)控制驅(qū)動(dòng)關(guān)節(jié)的基礎(chǔ)上采用原動(dòng)力系統(tǒng)作為策略,這樣可以隨時(shí)限制加速度命令。所設(shè)計(jì)的策略讓每個(gè)關(guān)節(jié)地最終狀態(tài)都以順暢的運(yùn)動(dòng)方式進(jìn)行,并把它的結(jié)構(gòu)形式定義為:,我們起初定義它的運(yùn)動(dòng)方式為:
(6)
上式表示關(guān)節(jié)的坐標(biāo)有誤差時(shí),t用i代替其速度和位置。
我們用下式定義一個(gè)局部的策略
(7)
其中是關(guān)節(jié)的理想加速度,在這里,我們假設(shè)存在一個(gè)低級(jí)控制器使理想加速度符合轉(zhuǎn)矩命令。由此得到,我們假設(shè)的驅(qū)動(dòng)自由度的實(shí)際加速度就是文獻(xiàn)[7]中所給出的。
緊接著,我們定義下式作為基本的方法:
(8)
當(dāng)這個(gè)基本方法被使用時(shí),有誤差的關(guān)節(jié)的位置和速度就可以表示為。當(dāng)非對(duì)角線上的額外力不等于零時(shí),系統(tǒng)的原動(dòng)力就會(huì)發(fā)生改變。
整個(gè)完整的方法一般地被定義為,它能夠完全表達(dá)出使用時(shí)間,用一種簡(jiǎn)單的表達(dá)式:
(9)
其中矩陣,矩陣。
帶著分析機(jī)器人全身運(yùn)動(dòng)關(guān)節(jié)性能的目的,在文獻(xiàn)[5]寫到的結(jié)果對(duì)非驅(qū)動(dòng)自由度的影響:一般用表示,更精確地表示成,
(10)
記下外力和力的相互關(guān)系,可以看得出,它們一起改變了機(jī)器人的運(yùn)動(dòng)特性。它們?cè)谟绊懀?)式的同時(shí)還影響機(jī)器人內(nèi)部動(dòng)力的工作軌跡。
如果函數(shù)被定義為(11),那么計(jì)算機(jī)器人運(yùn)動(dòng)特性的問題能夠得到有效地解決。
得到:
(12)
在(7)中所提到的參數(shù)需滿足上面的的限制條件,在下一章節(jié)我們將會(huì)涉及到最佳結(jié)構(gòu)的機(jī)器人,此機(jī)器人的加速度和運(yùn)動(dòng)特性都是最佳的。
3.學(xué)習(xí)控制方法
找到合適的加速度是解決這一變量問題的必要途徑。我們通過測(cè)量機(jī)器人完成任務(wù)時(shí)的動(dòng)作結(jié)合一些參數(shù)定義了如下式的目標(biāo)函數(shù):
(13)
其中,是代表機(jī)器人在特定參數(shù)條件下結(jié)構(gòu)和運(yùn)動(dòng)形態(tài)的標(biāo)量,在(13)中我們已經(jīng)進(jìn)行了詳細(xì)地描述。我們給定機(jī)器人結(jié)構(gòu)一個(gè)最初值和最終值,結(jié)果顯示相比理想結(jié)構(gòu),最終結(jié)構(gòu)能夠有效地表示出操縱器的優(yōu)點(diǎn)
(14)
另外,當(dāng)非驅(qū)動(dòng)自由度是一個(gè)假設(shè)的概念時(shí),那么一個(gè)相等的目標(biāo)函數(shù)就能夠算出工作矢量的實(shí)際值和理論值
(15)
這樣意味著,x必須是已知的。
如果降低函數(shù)的次數(shù)是我們的目標(biāo),那么優(yōu)化參數(shù)的計(jì)算方法可能會(huì)是降低函數(shù)次數(shù)的最佳方法,
(16)
其中,r是循環(huán)數(shù),并且。R的梯度W在寫成。我們舉一個(gè)PGRL算法的例子,梯度的隨機(jī)近似值在[4]中通過特別項(xiàng)的理論值被給出
(17)
其中是梯度在中的估算值,是隨機(jī)矢量,u是一個(gè)系數(shù);是參數(shù)向量的值。它在[4]中已經(jīng)介紹過,梯度的近似值導(dǎo)致集合趨于極小值。
為了解決(17),嘗試讓機(jī)器人所有關(guān)節(jié)都伸展,結(jié)果表明它只適合于單個(gè)關(guān)節(jié)的伸展。實(shí)際上,單個(gè)關(guān)節(jié)只滿足[4]中梯度的運(yùn)算。在這兒我們寫了相關(guān)的計(jì)算程序
輸入:u,b,
1. 重復(fù)
2. 選擇
3. 用攝動(dòng)參數(shù)完成延伸
4. 自動(dòng)檢測(cè)約束構(gòu)件
5. 計(jì)算性能
6. 估算梯度向量
7. 直到梯度估算值等于
返回:梯度估算值
其中定義為梯度估算值的平均值
4.結(jié)果
在一個(gè)簡(jiǎn)單的仿人機(jī)器人實(shí)驗(yàn)中,機(jī)器人剛開始處于站立的位置,最終讓機(jī)器人伸出一條腿時(shí)保持平衡狀態(tài),圖2中是機(jī)器人運(yùn)動(dòng)的示意圖
(a)初始姿態(tài) (b)最終姿態(tài)
圖2
仿人機(jī)器人在移動(dòng)過程中使用了四個(gè)關(guān)節(jié):左踝關(guān)節(jié),右踝關(guān)節(jié),臀部和膝蓋,b=4.(詳細(xì)地見圖3)。然而,由于仿人機(jī)器人的動(dòng)力平衡條件,廣義坐標(biāo)向量的數(shù)值需要確定其姿勢(shì)和方向,其中。作為在第二章節(jié)所描述的方法,每個(gè)驅(qū)動(dòng)自由度都是用手工建立的。機(jī)器人關(guān)節(jié)的加速度的變化如圖4所示。在(8)中明確地用基本原理的方法形成加速度,盡管實(shí)際運(yùn)動(dòng)軌跡不能達(dá)到理想軌跡,但非驅(qū)動(dòng)自由度的機(jī)器人能夠用一種完全不同的方式完成下蹲動(dòng)作。
在第三章節(jié)中我們介紹了梯度下降的方法,把假設(shè)的自由度降到最低,緊接著就出現(xiàn)了:機(jī)器人在沒有下蹲的情況下完成了運(yùn)動(dòng)過程。在圖5中畫出了四個(gè)驅(qū)動(dòng)自由度的速度分布圖。
(a)臀部關(guān)節(jié)
(b)踝關(guān)節(jié) (c)膝蓋
圖3
(a)左踝關(guān)節(jié)軌跡 (b)右踝關(guān)節(jié)軌跡
圖4
(a)膝蓋 (b)臀部
(c)左踝關(guān)節(jié) (d) 右踝關(guān)節(jié)
圖5:虛線為正常軌跡,實(shí)線為變形軌跡
5討論和結(jié)論
隨著鉸接式移動(dòng)機(jī)器人適用性的增強(qiáng),高效的處理器和適用的用戶界面,機(jī)器人正離開實(shí)驗(yàn)室走進(jìn)人們的日常生活中。沒有輪子的運(yùn)動(dòng)系統(tǒng)正被普遍地用于各種平臺(tái)。這在機(jī)器人的發(fā)展過程是中一項(xiàng)挑戰(zhàn)。
從機(jī)器人運(yùn)動(dòng)意圖的角度出發(fā),對(duì)這些運(yùn)動(dòng)特性進(jìn)行分類。這類的運(yùn)動(dòng)特性包括:舉重,跳高,扔鏈球,坐下。通常,用機(jī)器人運(yùn)轉(zhuǎn)來解決有關(guān)工作區(qū)的問題,而不能解決機(jī)器人本身運(yùn)動(dòng)所帶來的問題。對(duì)應(yīng)的工作區(qū)似乎破壞了機(jī)器人性能和運(yùn)動(dòng)目的之間的關(guān)系。這里我們已經(jīng)分析過了這些現(xiàn)象并用不同的觀點(diǎn)解決了運(yùn)動(dòng)特性的所帶來的問題。
在我們的觀點(diǎn)中,我們要求取消工作區(qū)的限制條件,同時(shí),一個(gè)簡(jiǎn)單的運(yùn)動(dòng)學(xué)信息可以對(duì)驅(qū)動(dòng)自由度的機(jī)器人提供一個(gè)獨(dú)一無二的指南。不過,非驅(qū)動(dòng)自由度的關(guān)節(jié)直接依賴于驅(qū)動(dòng)自由度關(guān)節(jié)所產(chǎn)生的加速度。
從驅(qū)動(dòng)關(guān)節(jié)的最終形態(tài)的前提出發(fā),產(chǎn)生的加速度能夠使每個(gè)關(guān)節(jié)都能夠運(yùn)動(dòng)至最終的目的地。在加速度水平的前提下,我們定義的控制策略只能夠使單個(gè)關(guān)節(jié)達(dá)到它的理想值。然而,就我們所知道的機(jī)器人關(guān)節(jié)加速度的分布圖是不能夠完全解決非驅(qū)動(dòng)加速度的運(yùn)動(dòng)特性。我們選用當(dāng)?shù)貐?shù)DSs ,通過調(diào)節(jié)參數(shù)來改變加速度的大小。這種策略和其他策略一樣都是依賴于當(dāng)?shù)氐募铀俣?。我們把這一效應(yīng)稱之為加速度的控制策略。
在整體控制策略的規(guī)劃下,非驅(qū)動(dòng)關(guān)節(jié)的理論值和采用當(dāng)?shù)夭呗运玫降慕Y(jié)果幾乎是一致的。
該策略擁有這些測(cè)量特性,它讓迭代梯度值最小化。其中關(guān)鍵的是要讓該策略與參數(shù)值有直接關(guān)系。如果在每次迭代時(shí),目標(biāo)函數(shù)是已知的,則只需改變參數(shù)的大小就能改善關(guān)節(jié)的性能??蛇@種關(guān)系又是不明確的,因此,我們便用一個(gè)隨機(jī)變量來逼近梯度值,這是基于系統(tǒng)性能的迭代方法,對(duì)此我們有證據(jù)顯示這是機(jī)械的推斷學(xué)習(xí),在該情況下學(xué)習(xí)綜合的運(yùn)動(dòng)特性。