【溫馨提示】 dwg后綴的文件為CAD圖,可編輯,無水印,高清圖,,壓縮包內(nèi)文檔可直接點開預(yù)覽,需要原稿請自助充值下載,請見壓縮包內(nèi)的文件及預(yù)覽,所見才能所得,請細心查看有疑問可以咨詢QQ:414951605或1304139763
實時自適應(yīng)運動規(guī)劃(機坪)在動態(tài)
環(huán)境下移動機器人無法預(yù)見的變化
約翰凡諾伊和靜肖,高級會員,電機及電子學工程師聯(lián)合會
抽象介紹了新穎的實時自適應(yīng)運動規(guī)劃(機坪)的方式規(guī)劃適合 高自由度或余的機器人,如移動軌跡 機械手,在動態(tài)環(huán)境中的障礙與移動 未知的軌跡。在RAMP方式,能同時 路徑和軌跡規(guī)劃,同步規(guī)劃和實施 在實時的議案。它助于實時優(yōu)化在不同的軌跡優(yōu)化的標準,如減少精力和時間,最大限度地提高可操作性。它還可容納部分指定的目標任務(wù)的機在RAMP方式器人很容易。該方法利用冗余(冗余機器人運動等在移動與操縱機械臂)通過機器人配置變量,以最好地實現(xiàn)松散耦合的障礙避免和優(yōu)化的目標。已落實和在一個多樣化的模擬測試集工作環(huán)境,包括與環(huán)境中的多個移動機器人。結(jié)果(以及附帶的視頻)顯示說了RAMP計劃者,其高效率和靈活性,而不是只處理一個單一的移動機人在動態(tài)環(huán)境良好與未知的議案,除了各種障礙靜態(tài)的障礙,但也可以很容易和有效地計劃的議案為機每個移動械臂在多個共享的環(huán)境移動機械臂和其他移動障礙。指數(shù)計算,自適應(yīng),動態(tài)不明運動障礙,松散的耦合,移動機器人,部分指定的目標,真正的時間,冗余機器人,軌跡優(yōu)化。
一, 引言
運動規(guī)劃是一個根本問題機器人技術(shù)[1],[2設(shè)計一個有關(guān)]一個機可取的議案器人到達目標。運動規(guī)劃高自由度移動機械臂的關(guān)節(jié)機械手或更具挑戰(zhàn)性比移動機器人,因為高維配置機器人空間5月收到很少或根本沒有相似之處物理空間的機器人工程,以及如何構(gòu)建
手稿16,2007;修改2007年12月13日和3月5日 2008年。首先公布2008年10月1出版的最新版本,2008年。本文建議由副主編出版山根光屬帕克和編輯后,評論者的評價意見。這份文件的部分已提交初步的IEEE國際會議智能機器人與系統(tǒng),仙臺,日本,2004年。
提交人與智能,多媒體和互動系統(tǒng)(IMI)的實驗室,計算機科學系,中北大學
在北卡羅來納州夏洛特,夏洛特,北卡羅來納州28223美國(電子郵件:jmvannoy @
gmail.com; xiao@uncc.edu)。
本文的補充材料可在下載http://ieeexplore.ieee.org,由作者提供:1視頻的實時顯示規(guī)劃和執(zhí)行移動機械臂運動我們的爬坡算法。這部影片是14 MB的大小。
更多的數(shù)字,這個文件是在網(wǎng)上提供顏色版本在http://ieeexplore.ieee.org。
數(shù)字對象標識符10.1109/TRO.2008.2003277 空間配置效率高于三個層面在很大程度上仍是一個未解決的問題。
運動相關(guān)研究規(guī)劃隨機算法,如流行的概率路線圖(PRM)是法[3]和快速擴展隨機樹 復審庭)方法[4],發(fā)現(xiàn)是非常有效的尋找一個具有高自由度機器人無碰撞路徑脫機,因為這種算法避免建造機器人的配置明確抽樣的空間配置空間。大羅馬尼亞黨方法有很大的啟發(fā)提高抽樣工作
和路線圖施工[2],包括最近的一篇文章[5]生產(chǎn)緊湊的路線圖,以便更好地捕捉不同倫路徑組。通過建立一個樹,而不是一圖,隨機回應(yīng)法更是產(chǎn)生在一個合適的拍攝或路徑直接產(chǎn)生的軌跡,從而更適合在線操作[6]。這兩種方法都看到很多變種[2]。
也有基于遺傳路徑規(guī)劃方法算法(氣),或者更廣泛地說,進化計算[7] [8],這是總的框架隨機搜索受到用戶定義的優(yōu)化準則。這種優(yōu)化技術(shù)已被廣泛使用,并成功 在許多應(yīng)用領(lǐng)域[8] 優(yōu)化 問題。有兩種主要方式的應(yīng)用。一個簡單的方法是映射到窗體問題適合標準的,現(xiàn)成的,的遺傳算法,解決運行它聯(lián)大,然后,地圖的結(jié)果返回到應(yīng)用程序域。這一個可以適用于所有的方法是有效的,因為往往不它的力量把東西人工改造的一個問題還有就是在一個標準遺傳算法,但只限于格式可能會失去某些原問題的一個重要性質(zhì)。一些基于遺傳算法的路徑規(guī)劃方法[10],[1采用這種方法其中C -空間離散成一個網(wǎng)格,而路徑是在條件一格點固定長度的序列。為標準
GA對固定長度的位串操作,搜索往往是非常緩慢。一個更有效的方法是采用一般的思想進化計算解決一個問題更為自然和適當?shù)拇硇?。報告的路徑?guī)劃方法[12] - [14]屬于這種定制方式。一個實時路徑規(guī)劃方法報道[12] 2點移動自由度機器人,這是擴展[13]點的三自由度飛行機器人
具體限制。阿多分辨率路徑代表建議在[路徑規(guī)劃14]。但是,所有的進化 算法有一個必須設(shè)置參數(shù)的數(shù)量 適當,這往往不是一個簡單的任務(wù)。
規(guī)劃,運動規(guī)劃,已產(chǎn)生一對于一個可執(zhí)行的軌跡在配置機器人×時間空間,或CT空間,而不僅僅是一個幾何路徑。一個常見的做法是在路徑的基礎(chǔ)上軌跡規(guī)劃所產(chǎn)生的路徑規(guī)劃師。一個值得注意的框架的彈性條法[15],它可以變形為機器人的軌跡當?shù)匾员苊庖苿觾?nèi)無碰撞“隧道障礙”連接在一個三維的機器人的初始位置和目標工作區(qū)。這樣的“隧道”是由一項分解基于路徑規(guī)劃策略[16]。另一種方法是路徑與軌跡規(guī)劃進行同步。然而,這一類中最努力的重點是離線算法假設(shè)環(huán)境是完全事先知道,也就是說,靜態(tài)對象是已知的,和移動的物體被稱為與[17] - [20]已知的軌跡。至于處理未知運動障礙,只是在最近的一些方法介紹
移動機器人[21],[22]。
能力相結(jié)合使移動機器人適用于更廣泛的范圍比固定基地或移動機器人機械手的任務(wù)。對于移動機器人,任務(wù)目標狀態(tài)往往是部分指定無論是作為的最終效應(yīng),我們稱之為配置地點與地點之間的任務(wù),或所需路徑(或軌跡的最總效益)我們稱之為一個輪廓,下面的任務(wù)和目標
位置/基路徑往往不明。
在這里,一個重要的問題是運動規(guī)劃的協(xié)調(diào)移動基地和機械手。這個問題,因為它涉及冗余的決議,提出了挑戰(zhàn)與機遇并存。存在著豐富的文學處理這個問題從許多方面。一些研究人員把機械手和移動基地一起作為一個在規(guī)劃路徑冗余機器人為逐地任務(wù)[23] - [25]。一些重點規(guī)劃序列“減刑配置為移動基地”當機器人執(zhí)行任務(wù)序列[26],[27] 受到各種限制和優(yōu)化準則。他人重點是協(xié)調(diào)移動基地和控制在一個輪廓,下面的任務(wù)機械臂[試圖28],[29] 定位移動基地最大化操作性。許多考慮非完整約束。
雖然現(xiàn)有的工作環(huán)境進行最假設(shè)與移動機械臂,少數(shù)已知的障礙研究人員認為是未知的地方避碰,移動上網(wǎng)的障礙。一種方法[30]采用隨機回應(yīng)作為地方企劃來更新原先產(chǎn)生的一大羅馬尼亞黨的路線圖處理移動障礙。輪廓跟蹤任務(wù),高效率法[31]允許基地調(diào)整路線,以避免一如果可能的話,同時保持移動的最終效應(yīng)下列障礙 如直線輪廓。另一種方法[29] 允許暫?;A(chǔ),以便讓一個意想不到的障礙通過持續(xù)的手臂,而其輪廓跟蹤議案下一個事件為基礎(chǔ)的控制方案。其他方法包括:基于對潛在領(lǐng)域之一[32],以避免未知障礙和在神經(jīng)模糊控制器的一[33]修改基地的議案,以避免當?shù)匾苿诱系K穩(wěn)定。那里也是一個特殊用途的規(guī)劃線上規(guī)劃師兩個機器人手臂的動作越來越從一個地方輸送機帶[34]。
但是,我們不是任何現(xiàn)有工作計劃,可以知道高自由度機器人運動在全球許多未知動態(tài)障礙。
二我們的問題與途徑
規(guī)劃高自由度在這樣的環(huán)境中機器人運動許多未知的動態(tài)障礙物構(gòu)成的特殊挑戰(zhàn)。首先,規(guī)劃要做到實時,不能做脫機而不能基于某種原因預(yù)置地圖環(huán)境是不斷變化的不可預(yù)見的方式,即配置空間的障礙是未知的和不斷變化的。這種環(huán)境的例子包括一個大型的公共廣場
全部以不同的方式,一個倉庫充分地的人繁忙的移動機器人和人類的工人,等等。這樣一環(huán)境是非常不同的靜態(tài)或基本靜止環(huán)境或已知的動態(tài)環(huán)境中(即與其他對象軌跡已知的),在那里可以合理地運動規(guī)劃依靠探索的C -空間已知的靜態(tài)環(huán)境()或電腦斷層空間已知的動態(tài)環(huán)境()脫機(如羅馬尼亞黨)。彈性地帶方法提供了靈活性,使 一個機器人運動小調(diào)整,以避免未知的議案 障礙,如果在C -空間的基本拓撲不 改變。對于一個不斷變化的C -空間的拓撲環(huán)境 在未知的方式,有計劃的路徑/軌跡可以被宣布為無效完全在任何時間,因此,實時自適應(yīng)全局規(guī)劃
能力是需要作出重大改變的機器人議案。規(guī)劃和運動應(yīng)同時執(zhí)行并根據(jù)檢測,從而確定規(guī)劃必須非??焓冀K能適應(yīng)環(huán)境的變化。
從本質(zhì)上看,解決運動規(guī)劃中的未知動態(tài)環(huán)境不能產(chǎn)生一個完整的規(guī)劃算法。也就是說,沒有算法能夠保證成功,這種未知環(huán)境。我們只能爭取一個合理的算法
作為“最佳司機高自由度機器人”,但是,即使是最好的驅(qū)動程序不能保證是無事故,如果其他的東西在環(huán)境沒有受到他/她的控制。
本文針對問題的實時同步路徑和高自由度機器人,軌跡規(guī)劃等移動機械臂,表演一般地到地方工作在一個未知的動態(tài)環(huán)境障礙的議案。該議案的障礙可以阻擋無論是基礎(chǔ)或手臂移動機械手或兩者。我們介紹一個獨特的,一般的實時自適應(yīng)運動規(guī)劃(機坪)的方法。我們爬坡的方法是建立在無論是隨機的想法規(guī)劃和隨時隨地的,并行和優(yōu)化
規(guī)劃進化計算,同時避免缺點。其結(jié)果是一個獨特的和原始的方法有效的有關(guān)問題。
在RAMP方法有以下幾個特點。
1)所有軌跡的代表在一次的CT空間在不斷改善同步規(guī)劃和執(zhí)行,建立一個不同的算法路徑/軌跡順序(或遞增),使一整個路徑/軌跡可以成為只有在最后規(guī)劃過程。我們隨時可以提供規(guī)劃者
一個快速,有效的軌跡繼續(xù)生產(chǎn)。后任何時間,軌跡,以適應(yīng)實際需要的時間全球規(guī)劃。
2)不同的優(yōu)化準則(例如減少能源和時間,優(yōu)化操作性),可靈活,方便地安置在一個無縫的方式優(yōu)化是直接在原來,連續(xù)電腦斷層空間,而不是局限在某一個有限的圖形或路線圖。軌跡規(guī)劃和優(yōu)化的條件,而不是直接的結(jié)果路徑規(guī)劃。
3)我們的計劃者在本質(zhì)上是不同的并行多目前所有的時間軌跡,讓瞬間的,如果必要時,機器人的運動急劇調(diào)整,以適應(yīng)意識到在新的環(huán)境的變化。這是不同的從規(guī)劃者的只是本地軌跡調(diào)整能力基于對已知的同倫路徑設(shè)置。這也是從,規(guī)劃不同的順序,如隨時阿*搜索[35],這也要求建立一個獨立的國家空間搜索的限制,我們的規(guī)劃師不有。
4)軌道搜索和評估(其最優(yōu))的不斷適應(yīng)變化的結(jié)果,但經(jīng)建以前的搜索(即知識積累)被
高效的實時處理。
5由于規(guī)劃和執(zhí)行)(即機器人的運動以下到目前為止,該計劃的結(jié)果)是同時的,可行的部分
軌跡是允許的,而機器人可以按照可行的一部分這樣一個軌跡(如果它是當前最好的)并切換到一個更好的軌道,以避免不可行部分。
6)由我們的策劃者,每多軌跡軌跡可以結(jié)束在目標區(qū)域中的一個不同的目標位置,也就是說,部分指定的目標,而不是一個單一的目標配置。
7)我們的規(guī)劃師代表了一種冗余機器人軌跡,移動機器人,作為松耦合軌跡多余的變量采取了冗余的優(yōu)勢為了最好地實現(xiàn)避障各種優(yōu)化目標。
該文件的其余部分組織如下。第二節(jié)是我們爬坡方法的介紹;第三節(jié)和第四節(jié)描述問題的代表性和初始化;第五節(jié)概述了軌跡的評估,并優(yōu)化準則
介紹了評價的策略。第六和第七部分描述策略改變軌道,以產(chǎn)生更好的工作。第八節(jié)介紹了如何利用RAMP計劃者可以創(chuàng)建和維持一個多樣化的軌道。第九節(jié)規(guī)定的執(zhí)行情況與實驗結(jié)果和討論表現(xiàn)該規(guī)劃師。第十組的結(jié)論文件。
二概述在舷梯方法
我們的方法的一個基本前提是規(guī)劃過程和運動執(zhí)行相互交織,使同步機器人運動規(guī)劃和執(zhí)行。這是實現(xiàn)通過我們隨時規(guī)劃算法,始終保持一個在CT -空間的所謂機器人一套完整的軌跡 人口。的可行性和最優(yōu)每個軌跡,所謂健身,是通過評價評價函數(shù)編碼優(yōu)化標準??尚行允侵笩o異性無。雙方都不可行,可行的軌跡允許在一個人口。被認為是可行的軌跡鉗工比trajectories.Within每個類型,軌跡而在健身最優(yōu)。
最初的人口是隨機生成的組合故意種子軌跡。故意種子軌跡包括那些代表不同的亞群的構(gòu)造為了實現(xiàn)人口的某些差異。如果環(huán)境包含已知的靜態(tài)障礙,基于軌跡關(guān)于預(yù)先計劃與可行路徑已知的靜態(tài)障礙,也可包括在內(nèi)。見第四節(jié)了解更多詳情。
一旦最初的人口組成,它是那么提高到1 鉗工通過改善人口,被稱為一代迭代。在每一代人,一個是隨機選擇的軌跡并以隨機選擇修改運營商之間的改變不同的運營商數(shù)量修改,以及由此產(chǎn)生軌跡可能被用來取代軌跡是不是 優(yōu)勝劣汰,形成一個新的一代。適者生存軌跡總是存放在人口,只能從一代提高到一代。每一代人也被稱為一個規(guī)劃周期。
為了提高初始種群健身,有多少初步規(guī)劃周期可能會運行基礎(chǔ)上,初步檢測環(huán)境信息前,機器人開始執(zhí)行適者生存軌跡。該機器人不需要等待一個可行軌跡出現(xiàn),如果沒有可行的軌跡可用,機器人將開始沿可行的移動軌跡適者生存同時繼續(xù)為鉗工搜索,希望能找到一個可行的軌跡前在距離門限D(zhuǎn)第一預(yù)測碰撞或奇異的執(zhí)行軌跡。這一戰(zhàn)略是有道理的因為:1)目前預(yù)計可能成為可行不可行軌跡稍后反之亦然; 2)被形容后,我們的策劃者使機器人切換到一個更好的軌跡,如果有可用的,因此,是目前在隨后的軌跡不可行的一部分遇到,機器人可能已經(jīng)切換到一個更好的軌道; 3)策略使有限的遙感,機器人可在其中沒有感覺,直到越來越近的障礙,以及4)它提供了一個在彈道測量的安全評價(見第五節(jié))。由于機器人移動規(guī)劃將繼續(xù)提高人口的軌跡,直到下一個控制周期,當機器人可以切換到一個鉗工軌跡,以便它始終遵循最佳軌跡。為此,每個軌跡是不斷更新要從當前的配置與目前的機器人當一個新的速度控制周期開始。對于軌跡的正在其次,這意味著已執(zhí)行的部分軌跡是下降的軌跡,而對所有其他
軌跡,這意味著,只有起點和速度配置正在改變,對結(jié)點的軌跡休息 (第三節(jié))保持不變。請注意,這里每個控制周期不一定是低層次的伺服周期控制器。我們的控制周期,這對控制高法律適應(yīng)化率,能比一個伺服周期,以確保不再一個控制周期內(nèi),可以有一個以上的規(guī)劃循環(huán)。這是因為適應(yīng)是通過規(guī)劃指導
圖。 1。規(guī)劃之間的關(guān)系,控制和檢測周期。
在動態(tài)環(huán)境的變化是感應(yīng)和反饋到規(guī)劃師在每個感測周期,從而導致更新健身值的軌跡在隨后規(guī)劃周期,運動障礙,預(yù)測未知的議案在健身評價機器人軌跡。在一個多樣化的人口存在的不斷高快速軌道使機器人適應(yīng)環(huán)境的變化。它這樣做是遵循適者生存軌跡在每個情況:當電流軌跡該機器人如下變差或不再隨后由于即將碰撞(即D是門達),機器人可能不需要停止運動,并重新規(guī)劃從零開始,而是策劃者往往只需要切換機器人在人口迅速可行的或更好的軌跡在一個無縫的方式。所選擇的軌跡可以是一個非常不同的同倫群和上一次處理激烈的大變化。
在機器人的情況下,當達到當前軌跡D但發(fā)現(xiàn)沒有更好的軌跡轉(zhuǎn),將停止其議案扶貧,即所但停止,斜坡規(guī)劃師(即機器人的“思維”的過程)從未停止,并繼續(xù)計劃并為更好地為機器人軌跡搜索。該機器人一旦恢復它的運動軌跡是一個更好的發(fā)現(xiàn)。
這種規(guī)劃/控制/傳感周期繼續(xù)進行互動,并 在走向一個最佳的目標配置的機器人實時方式:改進它遵循的軌跡,如果有沒有環(huán)境的改變,或同時調(diào)整和完善軌跡是否有感覺到的變化。圖。 1說明一間規(guī)劃,控制可能的關(guān)系,和傳感周期(請注意,實際的規(guī)劃周期長度不同)。
在RAMP算法簡述算法1。
進化算法不同的是,我們使用隨機選擇和隨機修改,不能被稱為“變異算子”運營商,因為他們采取嚴厲而不是小變化的軌跡,以創(chuàng)造一個不同的人口準適應(yīng)不斷變化的環(huán)境。我們進一步RAMP的算法在保持多樣性和防止人口的同質(zhì)性通過創(chuàng)建和維護軌跡不同亞群作為的軌跡在第八節(jié)詳細解釋。此外,在RAMP算法不需要調(diào)整概率以及因為大多數(shù)其他參數(shù),許多進化算法做。這樣做的結(jié)果,很容易實現(xiàn)并具有較強的不同工作環(huán)境。事實上,我們的算法只需要決定參數(shù)的人口規(guī)模,但值可以不變或者說有很多不同的環(huán)境不敏感,因為會在后面介紹第八節(jié)。該評估程序的RAMP健身也是原始的,納入經(jīng)常是沒有考慮到在多個條件許多其他運動規(guī)劃算法,不僅是可行的而且還不可行軌跡進行了評價。我們的爬坡方法還支持部分規(guī)格一個目標:只有最終效應(yīng)與位置和方向?qū)τ谑澜缱鴺讼到y(tǒng)是必要的。不同軌跡可能有不同的目標,基本配置和手臂配置(即達到同一最終效應(yīng)目標)在移動機械臂的情況下,使冗余是用來實現(xiàn)動態(tài)變化環(huán)境中的靈活性。在舷梯算法的詳細情況的章節(jié)下一步。
三。
軌跡的表示我們代表了一個獨特的移動機器人軌跡機械手的松耦合和堿基保守黨具有以下特點。
1)為機器人子系統(tǒng),配置路徑的結(jié)在共同指定的空間,在此基礎(chǔ)上一立方花鍵軌道的使用二為基礎(chǔ)子系統(tǒng)),一個結(jié)配置路徑 在世界笛卡兒空間坐標中指定
2) 對于基本的子系統(tǒng),結(jié)配置道路是在世界坐標的解析的空間的指定系統(tǒng),線性與拋物面混和彈道半新的
3)無論是作為時間的函數(shù)軌跡可能包含固定值變量段,即每隔沒有運動,這些時間間隔可能或可能不會兩個重疊的軌跡。這是成功的關(guān)鍵實現(xiàn)松耦合的行為:要么子系統(tǒng)移動,而其他沒有一也可以在全體同一時間。
4)兩個子系統(tǒng)軌跡排列,形成時間一個軌跡,它唯一確定的議案整個系統(tǒng)。
圖。 2說明此一關(guān)節(jié)軌跡和一個概念維基軌跡。
主要利用松散耦合的地點與地點之間的任務(wù)是它在處理不確定動態(tài)環(huán)境中的靈活性:當一個動態(tài)障礙物的出現(xiàn),有時是靈活的手臂運動使一個比一個沉重基地更好避稅議案運動,有時是更有效地改變了運動而不是有一個手臂的(尤其是大運動基地如果是一個大型有效載荷舉行的最終效應(yīng)),有時兩需要移動作出回避;,有時更能源,甚至只停留時間,有效地對整個系統(tǒng)一段時間,讓障礙通過。我們的爬坡規(guī)劃師松散耦合的議案允許所有以前的品種發(fā)生的情況而定。
阿軌跡領(lǐng)導移動機械臂從目前配置(具有一定速度和加速度),以一目標配置。每個保守黨可能包括一任意數(shù)量的部分,由結(jié)配置分離,也稱為結(jié)點。對于每一部分的數(shù)據(jù)結(jié)構(gòu)包含該段,結(jié)點的信息包圍可行性和部分健身(見第五節(jié)),以及理想速度和加速度在邊界結(jié)點如果段是可行的。
每個部分是非常數(shù)軌跡生成使用最起碼的時間最慢的聯(lián)合(包括底座)的機器人移動結(jié)點從開始到結(jié)束的結(jié)點的部分,考慮到速度的限制 加速度。對于手臂,每個聯(lián)合部分是三次多項式的時間,并為基地,部分是線性函數(shù)拋物混合。具體來說,最低各關(guān)節(jié)的執(zhí)行時間瞬停節(jié)我為每個路徑段J是第一計算三次軌跡,在其最大加速度和最高速度的限制聯(lián)合島對于
1Note,當我們說“基地手臂動作,而不會移動,”我們 意味著手臂沒有相對運動的基地。圖。 3。插圖和夾鉗臂軌跡人口目標的基礎(chǔ)上“G”相同的路徑段J以來,最低的基本I = 0時還計算了線性與拋物線軌跡共混物在其最大加速度和速度的限制。
接下來,各關(guān)節(jié)(包括基準最大瞬停節(jié)),Tmax分別,強,被用作需要完成的時間段的路徑 j的根據(jù)Tmax為,強,相應(yīng)的軌跡段(為手臂和基地)可以生成。請注意,更復雜的方法,同時考慮到動力和扭矩的限制[36],[37]可以用來確定最小時間軌跡。然而,在這里我們需要真正的妥協(xié)計算最低時的軌跡實時性能的規(guī)劃。
圖。 3說明了一個機器人,它的手臂和基地軌跡人口,
分別。每個軌跡是由線段表示連接在每個結(jié)手腕位置或基地位置點。請注意該行本身只是為了顯示該命令其中結(jié)點訪問了每個路徑,當然沒有實際的路徑。在每行顯示的數(shù)字重路徑與軌跡最高為健身。
四,初始化初步的人口是隨機生成的組合故意種子軌跡
。在RAMP算法生成隨機軌跡組成的隨機選擇的結(jié)配置,內(nèi)的聯(lián)合限制制服樣本機械手和基地的工作區(qū)的邊界。該最初的基礎(chǔ)和手臂配置,分別確定每個起點?;九渲檬且粋€隨機結(jié)束在一個合理的目標附近生成的手爪 夾持器位置,以便能夠達到目標。逆運動學用來找到相應(yīng)的配置結(jié)束手臂聯(lián)合空間。一個中間結(jié)點的隨機數(shù)插入到該基地的軌跡和手臂的軌跡。每一個結(jié)點是一個隨機抽樣的配置。一旦結(jié)點的創(chuàng)建,可以計算的軌跡(見上一節(jié))。有關(guān)每個軌跡等信息在段段的數(shù)據(jù)結(jié)構(gòu)是通過確定健身評價軌跡。
在RAMP算法也故意種子初始 人口與軌跡的基礎(chǔ)上建立不同的“出發(fā)指示“,以提供多樣性(更第八節(jié))這一點
圖。 2。松散的耦合的運動和操縱
圖。 3。插圖和夾鉗臂軌跡人口目標的基礎(chǔ)上 “G”
此外,還可以包括初始種群軌跡 根據(jù)預(yù)先計劃的可行路徑就已知的靜態(tài)障礙。這種預(yù)先計劃的路徑,可從1現(xiàn)有方法(例如,羅馬尼亞黨或復審庭)或從我們的離線運行師(見算法3)。這樣,停機坪可利用現(xiàn)有的離線規(guī)劃部門在處理能力具有挑戰(zhàn)性的,如處理“窄(靜態(tài)環(huán)境靜態(tài)通道“的一些變種主要集中在羅馬尼亞黨)。
五,適應(yīng)度評估制定
明確的健身評價函數(shù)的使用可以靈活應(yīng)用不同的標準和優(yōu)化組合和聚集的多重標準。
在我們的規(guī)劃師,健身評價包括兩部分:可行性檢查和優(yōu)化標準。我們使用兩種不同的評價函數(shù)可行的和不可行的軌跡。在每一種情況下,評價函數(shù)是一個成本函數(shù)來衡量一個軌跡健身。在較高的評價職能,經(jīng)濟條件較差或價值少安裝一個軌跡。
A:可行性檢查目前
我們使用兩個硬約束來定義的可行性一個軌跡:碰撞,無奇無。 一旦軌跡生成(第三節(jié)),我們的規(guī)劃師檢查一個可行性離散軌跡。因此,它需要以確保沒有遺漏碰撞或奇異的配置兩個相鄰的,離散的配置。我們的策略,以避免丟失碰撞是擴大的障礙 輕微碰撞前的檢查。本著同樣的精神,我們認為配置的可操作性的成本[38]是高于一個門檻,即非常接近奇異的配置,是一個奇異的配置。一個軌跡是可行的,如果它是無碰撞無奇
在整個時期。阿段是可行的軌跡如果每一個插在其配置是可行的時間步長;同樣地,如果所有軌道段是可行的,是一個軌跡可行的。否則,它被稱為不可行。
B.對評價功能的可行性
軌跡對于一個可行的評價函數(shù)結(jié)合軌跡3優(yōu)化準則,這其實是軟約束:1)時間(最小化); 2)能源(最小化); 3)可操作性(最大化)。一個軌跡,只是執(zhí)行時間的總和 Tmax分別,其所有環(huán)節(jié)的時間持續(xù)時間因子。由于提案的移動基地和機械手手臂不脫鉤,使他們能夠一起發(fā)生,盡量減少時間一措施并不能區(qū)分有效率的軌跡從另一個不必要的一份最低議案手臂或基本移動t而它們具有相同的執(zhí)行時間。因此,我們用另一種最低能量最優(yōu)的措施。這樣,我們可以區(qū)分兩種軌跡其時間要求是平等的,但能源需求是
不,那個所消耗的能源是首選。對于一個軌跡能量計算是一個簡單而有效逼近:我們的興趣并不在確定在執(zhí)行一個精確的軌道能量消耗,而是在比較和排名不同的軌跡能源消耗。因此,估計我們需要足夠的。我們近似的基礎(chǔ)環(huán)節(jié)和手臂的形狀移動由氣缸機械手,以簡化計算慣性張量。經(jīng)過一個可行的軌跡生成,我們計算每個環(huán)節(jié)的基礎(chǔ)治療(能源消耗作為連結(jié)0)的總動能變化的聯(lián)系方面在整個軌跡,總結(jié)能源消耗作為能源消費的各個環(huán)節(jié)彈道.2 最后,評估與相關(guān)的可操作的軌跡,我們要在每個配置中的可操作性措施在每個軌道段。此值將逆增長的比例,接近奇點,并且可以因此,給出了成本的措施。我們采取這樣的平均一直作為關(guān)系到整個軌跡逆成本值可操作性。對于一個可行的軌跡是一個整體的健身價值組合 é的能源成本,時間成本T和成本M 相關(guān)的可操作的軌跡
C1的成本=é 格A1 + C2的 ? A2的 補體C3 + M 答3
whereCi,我= 1,2,3,是一個重量,指示的重要性各自的成本,愛是一個正常化的因素決定的最大的估計各自的成本。
C.對評價函數(shù)的軌跡不可行
如果一個軌跡是不可行的,我們定義為適應(yīng)值的總和一個主宰懲罰項P和軌跡的評價函數(shù)值的成本,就好像它是可行.3大罰款長期P有兩個目的。一個目的是要確保不可行的軌跡是可行的軌跡不到合適的。該另一種是作為一個相對安全的措施,使服務(wù)不可行較小的處罰條款被認為是安全和軌跡因此,鉗工比更大的懲罰條款。對于后者為此,我們定義一個不可行軌跡懲罰項為P =的Q / Tcoll,其中Q是一個大constant4和Tcoll是2Note,由于線性速度垂直組件被認為是在計算,潛在的能量變化已經(jīng)包括在內(nèi)。由于所有軌跡共享相同的初始狀態(tài),它們共享同一起跑線能源。3For與奇點的軌跡,我們計算其猶如“可操作它是可行的“,排除奇異配置。第四季度是設(shè)置為104我們的實驗無論是在第一時間預(yù)測碰撞或第一個奇異配置,以先到者為準,在軌跡。也就是說,我們考慮一個更安全,如果是不可行的軌跡有一個較長的時間在第一個預(yù)測碰撞/奇點。成本的價值是用來作為一個潛在的健身指標不可行如果它變得可行軌跡因修改操作。通過允許在一個人口不可行軌跡,我們的算法積極最大化的機會來優(yōu)化機器人實時行動效率。通常不可行的軌跡可能導致后來好可行的軌跡。四備注應(yīng)該指出的是,除了標準的優(yōu)化考慮其他標準可用于聚合成評價函數(shù)不是可行或不可行的軌跡軌跡,只有在規(guī)定的評價程序的變化,而不是整體的算法。我們可以選擇優(yōu)化任何標準,其中包括基于可行的軌跡,例如,安全與穩(wěn)定的措施[39]。對于非完整移動機器人,非完整約束可以添加額外的硬約束作為評價一個軌跡的可行性和評價納入函數(shù)不可行的軌跡。還要注意,無論是否可行或軌跡不可行,相應(yīng)的評價函數(shù)的計算作為對個別軌跡段的費用總和。這財產(chǎn)大大方便高效的軌跡評價每一代人,因為只有改變算法的斜道受影響的軌跡和部分需要重新評估,尤其是在實時。該評價是不可行的軌跡通過進一步加快,一旦首次碰撞檢測一個機器人之間的障礙和單鏈路,整個軌跡標記為不可行,并沒有進一步的碰撞核對所要求的評價函數(shù)不可行軌跡()。
六,修改操作
回想一下,在每個,我們的爬坡算法某些代修改操作上執(zhí)行某些軌跡希望鉗工軌跡生成。我們使用以下六個修改操作。 1)插入,游記,隨機結(jié)點之間插入2 隨機選擇了一個路徑相鄰結(jié)點。2)刪除一個隨機選擇的結(jié)點被刪除。3)變更,Arandomly選擇結(jié)點被替換 一個新的,隨機生成的結(jié)點。4)交換,隨機選取兩個相鄰結(jié)點單一路徑的交換。5)交叉打結(jié)的兩條路徑點名單,并按隨機分為兩部分,分別與重組:在與第二部分的第一條道路的第一部分第二條路徑,以及與第二條道路的第一部分第二部分的第一條道路。6)停止,該基地的運動或手臂動作停在一隨機選擇的一個隨機的時間結(jié)點。首五個操作用來改變路徑形狀,隨后,相應(yīng)的軌跡。停止操作是用來改變軌跡只。我們只是隨機選擇其中的一個操作(也稱為經(jīng)營者)申請選定的軌跡(第)。所有的經(jīng)營者用來改變該基地的機械臂軌跡和單獨或一起隨機方式。該站經(jīng)營者可以對變量的子集松散耦合那些在一個冗余機器人,冗余的,在移動機械手的情況下,松散的耦合方式軌跡該基地和機械手。這兩個子系統(tǒng)可以停止他們的行動獨立或聯(lián)合。概率我們的方法就是大自然提供了一個可能停止;在停止的情況下是有利的,對策劃者將利用它。請注意,除交叉,上述其他行動是,改變單一的軌跡一元的轉(zhuǎn)變。該從兩個交叉產(chǎn)生兩個子女的父母軌跡。一個新的軌跡評價可以非??欤驗槊看问中g(shù)只改變某些軌跡段,只有更改的部分需要重新評估。列在爬坡算法(算法1),鉗工后代被放回把人口,以取代軌跡是不是唯一的一個亞群的成員,維護多樣性(有關(guān)此在第八節(jié))。在整個人口適者生存軌跡始終保持在下一代新的人口P(噸+ 1)注意的P(噸)和P(噸+ 1)的尺寸相同,在一個不同的軌跡。
七,實時適應(yīng)性算法
1所示,在每個控制周期結(jié)束時,在人口的所有軌跡更新,使他們的初始配置和速度成為機器人的當前配置和速度。由于可能成為可行的軌跡持續(xù)規(guī)劃的結(jié)果,機械手可隨時這個變化過程中執(zhí)行新的最佳軌跡,而不是當新的控制周期開始。請注意,當機器人的變化當然,從一個軌道到另一個新的軌跡,實在 更好即使考慮到變化的成本(即,加速或減速的可能需要的變化)為確保評價工作的適應(yīng)度(第五節(jié))。因此,的變化是平穩(wěn)的,與實際執(zhí)行的軌跡該機器人是最好的或最合理的結(jié)果。當環(huán)境中的變化是感覺到(從傳感循環(huán)),不斷適應(yīng)的運行軌跡規(guī)劃師會人口在該實時變化軌跡可行性和健身價值復查反對改變或改變環(huán)境的一部分。努力的處理重新評估是保持最少:策劃者只碰撞檢查對已經(jīng)在移動或正在障礙該檢測周期。當有移動障礙,我們的規(guī)劃師預(yù)測未來的發(fā)展軌跡每個移動的障礙。從一個障礙的意識到在過去的兩年周期和配置的傳感電流檢測周期,即在時間鈦- 2,鈦- 1,和TI(現(xiàn)行時間),我們可以計算(約)的線性和角度對象五(安迪- 1速度),五(體),和ω(體)。障礙的議案預(yù)計為4個簡單的類型:1)翻譯只有具有非零五(安迪)如果ω(TI)的接近零; 2)自我旋轉(zhuǎn)
圖。 4。動態(tài)陷阱所造成的高頻率循環(huán)障礙的議案。
(1)機器人計劃的議案,以避免運動障礙。 (二)障礙逆轉(zhuǎn)
方向;機器人做的是同樣。 (三)再障方向逆轉(zhuǎn),其過程。
圖。
圖。 5。低頻循環(huán)障礙的議案并沒有一個圈套。 (一)
機器人計劃的動議,以避免運動障礙。 (二)障礙尚未
扭轉(zhuǎn)方向。 (三)障礙的方向逆轉(zhuǎn),但已達到機器人
目標。
和自我旋轉(zhuǎn)與非零五(TI)和ω(體)如果V(鈦- 1)和五(TI)的有類似的方向,以及4)一個全球性的輪換(約1不通過對象軸)與非零五(TI)和ω(體)如五(體- 1)和V(體)有不同的方向。為軸心的全球沿旋轉(zhuǎn)ω(TI)與遠離參考位置由一距離r(TI)的障礙,它可以計算出五(TI)和ω(體)。策劃者機器人的軌跡下次檢查針對這種每個障礙預(yù)測軌跡,看看是否有將是一個碰撞。我們的預(yù)測只需要足夠好很短的時間才能在未來傳感周期(可能是長于或短周期的控制),因為它會被糾正不斷增加的新感覺信息。因此,簡單的方法就足夠了。請注意,要預(yù)測任何一個對象的循環(huán)或周期行為,如移動相反的方向,更來回以前的狀態(tài)需要得到我們的議案的預(yù)測,與實測更多的計算量。幸運的是,如果有一個循環(huán)行為頻率非常高,我們可以發(fā)現(xiàn),從以前只是少數(shù)國家不會增加多少成本計算,并隨后策劃者會考慮的一環(huán)行為障礙在規(guī)劃可行的機器人軌跡,以避免動態(tài)的陷阱。如果該對象的循環(huán)運動頻率高于或相當于傳感頻率,然后盡可能少因為過去的四個感應(yīng)周期循環(huán)的趨勢可以檢討。相反,如果一個循環(huán)障礙的行為具有相當
低頻率,我們可以不檢測,因為它不真正的陷阱機器人。無花果。 4日和5說明這些概念。
八,多樣性的創(chuàng)作與保護
對于不同的軌跡人口的需求,可明顯從下面的例子。圖。 6顯示了一個任務(wù),需要一個機器人通過向門口一數(shù)
圖。 6。的任務(wù),需要一門可以關(guān)閉,作為人口和軌跡意外地打開最初的軌跡設(shè)置具有良好的多樣性,以支付環(huán)境。這個數(shù)字表明基地軌跡只。
另一邊的房間。但是,每個門可開啟或關(guān)閉意外地在任何時間,因此,應(yīng)始終機器人準備搬出一個軌跡,導致一個封閉的大門并切換到一個軌道,導致一打開了方便之門。由于軌跡通過不同的門道屬于不同的同倫群體,并因此十分不同,它是必要的人口爬坡的軌跡,創(chuàng)建和維護是多樣化的與許多不同的同倫群良好覆蓋。如圖所示圖。 6,一個隨機生成的初始種群基地軌跡可以相當多元化。關(guān)鍵則是在RAMP算法來保持或進一步促進這種多樣性。
顯然,由于機器人在不斷變化的經(jīng)營環(huán)境未知動力學,其電腦斷層空間不能事先知道。何況,即使是靜態(tài)的,已知的環(huán)境,如何興建的C - 1高自由度機器
圖。 7。亞群分配的基礎(chǔ)上在每個方向出發(fā)
控制周期:每個
圖。 8。沒有多樣性的保護,優(yōu)勝劣汰同倫集團占主導地位。
同倫群的軌跡正是任何時候可行的措施是必要的。
保留了不同的軌跡人口通過以下措施:1)不容許相同在一個人口軌跡; 2)隨機選擇一個軌跡變更,而不是基地的選擇上健身; 3)使用改性經(jīng)營者介紹劇變軌跡; 4)更換一個隨機選擇的軌跡,而比最不適合;及5)建立和維護亞群的軌跡。最后一個措施是非常重要的,是進一步下面解釋。
A:亞群及多樣性保護
我們的爬坡算法的軌跡人口劃分成 亞群時,一個新的控制周期開始根據(jù)他們的當時離開的方向。出境方向1軌跡定義為n維向量差從最初的配置第一個節(jié)點配置(一個具有n個自由度的機器人)。我們計算之間的角度φ離開一個和兩個方向的點的軌跡b 產(chǎn)品:1角b =從頭余弦φ。如果φ是一個閾值比大,那么這兩個軌跡可被視為屬于兩個不同的亞群。從在圖的例子。 7,我們可以看到一個強大的相關(guān)性每個基地軌跡的同倫群和亞群它屬于根據(jù)出發(fā)的方向
分組類似離境方向的N軌跡可昂貴的[因為它需要一個時間復雜度為O(n2)內(nèi)]。因此,隨著時間的推移,我們作出以下的妥協(xié)[復雜為O(n)]:選擇一個參考方向出發(fā),分成數(shù)的區(qū)間范圍φ,并比較各離開方向一分的軌跡人口進入亞群相對應(yīng)的時間間隔。這些亞群仍捕獲多樣性粗糙的水平。
請注意,由于亞群被更新或重新分配 在每個新的控制周期,從更新的方向出發(fā), 圖。 8。沒有多樣性的保護,優(yōu)勝劣汰同倫集團占主導地位。這個數(shù)字表明基地軌跡只。
隨著時間的推移多樣性捕獲和保存。如果兩個軌跡在兩個亞群是在時間t的基礎(chǔ)上出發(fā)的方向
當時控制周期變得非常相似,但在時間噸+ T,那么他們將不會被分配到兩個不同的亞群再次在未來使用周期相對應(yīng)或后噸+噸在本質(zhì)上,多樣性是提供更多的選擇每次一機器人需要來決定哪些軌跡跟蹤,而每一個新發(fā)生與控制周期。使用離境指示,以捕捉多樣性滿足這一要求。
回想一下,在每個規(guī)劃周期(見修改程序在第二部分),斜坡算法會產(chǎn)生一個或兩個新 軌跡,它會使用(更好),以取代新軌跡現(xiàn)有的軌跡。首先隨機挑選在RAMP算法現(xiàn)有的軌跡,然后檢查,如果它是唯一成員其亞群。如果是這樣,它不會被取代,并在RAMP
將隨機選擇另一個現(xiàn)有的軌跡,等等。在這這樣,多樣性保存。
如果沒有這些措施,以維護不同的亞群,適者生存亞群可支配經(jīng)過幾代人,正如圖中所示的例子。 8。如果這門 突然關(guān)閉,所有的軌道將成為不可行。同多樣性的保護,這是不太可能發(fā)生(見結(jié)果 在第九組,B和視頻也隨同本文在http://ieeexplore.ieee.org可用)。
圖。 9顯示了一個不同的例子來說明利益 多樣性保護的手臂軌跡。在這里,機器人前臂可能采取不同的路線去以下酒吧所示。再次,如果這些通道可能被阻止意外,不同的軌跡人口將幫助機器人很快找到一個可行的通道。
B.人口和亞群的大小
下限人口規(guī)模直接相關(guān)亞群的數(shù)量。為了選擇適當數(shù)量的亞群男,我們必須找到一個角度增量Δθ的劃分范圍[-180?180?]。例如,使用30?此范圍將劃分分為12組。
為了找到一個給定的環(huán)境中最小的增量,我們認為,在任何障礙最小尺寸環(huán)境,我們?yōu)長表示,以及距離門檻D(機器人之間的最小允許距離表明基地軌跡只。
圖。 9。任務(wù)顯示為不同的手臂運動軌跡的需要,與開始
配置(上)與目標配置(下)。該通道可
封鎖并重新打開意外。
圖。 10。任務(wù)環(huán)境1 - 6攜帶與動態(tài)障礙物棒(7)靜態(tài)障礙。
和障礙)。我們作為一個計算L和功能的角度γD作為上界上Δθ
γ = atan(L/D)
當然,我們可以選擇一個Δθ小于γ,但給我們γ解決所需的最低率的環(huán)境。我們現(xiàn)在有
M =360/Δθ
N = KM
其中N是總?cè)丝谝?guī)模和K是平均大小各亞群(k≥1個)。我們選擇一個適當?shù)腒表取決于可用計算機處理能力。
在一般來說,在N方向上可確定的基礎(chǔ)上最低數(shù)量占規(guī)劃控制周期循環(huán),使軌跡足夠快的改善。N上下限和上限反映了平衡我們的爬坡規(guī)劃者勘探和開采能力。我們的策劃者是相當?shù)膹妱疟憩F(xiàn)提供體面在不同的范圍內(nèi)?。
九,執(zhí)行情況,結(jié)果和討論
在本節(jié)中,我們提出我們的執(zhí)行結(jié)果和討論了RAMP算法的性能。
A. 執(zhí)行
為了測試了RAMP算法,我們建立了移動機器人模擬器為美洲獅560安裝在移動的基礎(chǔ)。無論是機器人和環(huán)境的對象模型作為一般性的多邊形網(wǎng)格。我們使用的軟件包[40]進行實時碰撞檢測。
為了模擬環(huán)境動態(tài),物體(或障礙)是允許以不同的方式在移動軌跡的執(zhí)行情況;不過,規(guī)劃算法沒有先驗知識這些運動。在每個檢測周期,開始位置(即位置和方向的障礙)的提供的應(yīng)該是從檢測。我們實施了爬坡算法在C#和C + +和執(zhí)行是一個四核至強電腦與每個在3.0 GHz的核心業(yè)務(wù)。
在我們的實驗中,我們設(shè)置下面的參數(shù)值。該機械臂和底座重量設(shè)置為35和20公斤。最高速度和聯(lián)合為彪馬加速被設(shè)置為120?/ s和60?/ s2中分別?;氐淖畲笏俣群图铀俣仍O(shè)置為2米/秒和1 m/s2分別。的頻率為移動機器人控制周期設(shè)定為60赫茲。該控制周期相當緩慢,因此,相對于計劃周期,其中有一個頻率的很多倍控制周期,根據(jù)工作環(huán)境。
B.業(yè)績評價
我們衡量方面的爬坡性能企劃有效性和效率。無花果。 10和11顯示了兩個工作環(huán)境。
1)是將在工作環(huán)境1,機器人的一項長期任務(wù)從地上桿到表中。該表是定位離得足夠遠的一個基地的運動是必需的。那里是一種靜態(tài)的環(huán)境和列數(shù)6移動作為動態(tài)障礙物兔子:2旋轉(zhuǎn)對不同的角速度,平行于表地板,和4個不同的對角方向移動(即,既不垂直也不水平,但在不同高度)。
2)在工作環(huán)境2,我們的任務(wù)是進入第二個房間在柜臺上和把握的對象。有一個靜態(tài)表在第一個房間里的機器人最初位置。那里有12個不同形狀的障礙,不斷變化的動態(tài)軌跡;一些改變其方向和速度,從線性到一些變化在不同的角運動倍。兩個動態(tài)障礙物移動第一室,并在第二個房間休息動議。
為了衡量一個執(zhí)行的軌跡最優(yōu)產(chǎn)生我們的實時動態(tài)環(huán)境匝道規(guī)劃師,在障礙議題并沒有事先知道,我們比較完全脫機產(chǎn)生這樣的軌跡軌跡為在相同的動態(tài)環(huán)境,但同樣的任務(wù)
圖。 11。任務(wù)環(huán)境2深遠就與12個柜臺(對象動態(tài)和靜態(tài)的墻壁和障礙表)
與已知障礙的議案。因為這是一個完全優(yōu)化軌跡只能生產(chǎn)環(huán)境時,充分眾所周知。
我們通過略微修改我們的離線規(guī)劃師在RAMP的算法,算法3所示。
離線規(guī)劃師之多規(guī)劃根據(jù)需要幾代人產(chǎn)附近最 優(yōu)解l軌跡連接配置和一開始目標配置。策劃者將終止時,最好軌跡是沒有得到更好的在1000代。請注意,我們我使用的指數(shù)來計算在脫機規(guī)劃師的后代,這不是在實時規(guī)劃者爬坡絕對時間噸。我們的離線完全可行的軌跡規(guī)劃師搜索連接一開始配置和配置中的一個目標從本質(zhì)上已知的隨機抽樣一樣的CT空間其他隨機規(guī)劃,如大羅馬尼亞黨或復審庭()。它不過大羅馬尼亞黨和難民審查法庭提供的優(yōu)勢:它有靈活性根據(jù)一些標準的優(yōu)化優(yōu)化在整個電腦斷層空間,而不是在一個有限的圖形或路線圖。它產(chǎn)生一個接近最優(yōu)的解決方案只是作為一個進化算法會給予足夠的運行時間。請注意,自他們的運動障礙,是完全知道,一個良好的,可行軌跡生成的,采取的所有障礙和帳戶議案將永遠是好的,可行的。因此,亞群,其中介紹,以應(yīng)付在爬坡的不可預(yù)測性,是不是這個離線規(guī)劃師必要的。
表一比較,我們的策劃者和爬坡的結(jié)果在這兩個任務(wù)顯示在脫機環(huán)境規(guī)劃師無花果。 10和11。所有的結(jié)果是超過25平均處決每個任務(wù),以M = 18和K = 1.1(這是發(fā)現(xiàn)我們的硬件產(chǎn)品上的最佳成績),使人口 數(shù)N =知識= 20(見第八節(jié)-乙)。第1欄列出了如在圖所示的環(huán)境。 10和11。第2欄列出總成本(即,健身價值的執(zhí)行軌跡)的我們的實時爬坡規(guī)劃師。第3列顯示了整體成本作為規(guī)劃的離線結(jié)果接近最優(yōu)軌跡。第4欄顯示的是實時增加百分之軌跡成本超出近最優(yōu)軌跡成本,作為一個措施我們的爬坡性能策劃者。
試驗結(jié)果表明,在RAMP生成的軌跡規(guī)劃師進行實時的成本,平均大約是20%-30%,高于脫機計劃,近最優(yōu)的
軌跡。能源成本E和T是時間成本大約每
表一,實時時間與近優(yōu)軌跡平均數(shù)
25日處決(每組公里= 20
表二,爬坡算法統(tǒng)計平均超過25決問題
N = KM = 20)
表三,T組和無軌跡停止算
20%-30%的average.5當然,我們從這個小小的增益成本增加的能力,處理未知的環(huán)境在實時變化,這可能是沒有離規(guī)劃。
表二列出了RAMP計劃者的統(tǒng)計技術(shù)這兩個例子任務(wù)。它顯示了規(guī)劃效率在RAMP規(guī)劃師。由于每個任務(wù)都有不同的環(huán)境旅行距離為移動機械手的長度,平均執(zhí)行時間也有所不同。
為了評估松散耦合,我們的成效比較我們的爬坡與停止經(jīng)營企劃的結(jié)果功能齊全的反對與停止策劃者的結(jié)果經(jīng)營者不使用。
表三顯示了E和能源成本時間成本的T和沒有停止運營,和百分每增加。表三清楚地表明有停止經(jīng)營的優(yōu)勢:較少的能源成本比未停止運營商和時間成本也是如此。在節(jié)能減排成本是特別重要的意義。這是因為停止許可證移動機器人的手臂或停止或基地(或兩者)避免運動時首選的一個不確定的障礙時尚(參見圖2。)而不是themobile器人“跳”,以避免使同一類。在停止運營商節(jié)省不能以犧牲能源浪費時間,而且還能節(jié)省時間以及,根據(jù)測試結(jié)果顯示。
最后,我們還使用了兩個在圖所示的環(huán)境。 6和 9,作為工作環(huán)境和任務(wù)環(huán)境4和 3,分別在測試的創(chuàng)建和維護的有效性5For兩個示例任務(wù)環(huán)境中,實時時間成本計劃 軌跡,這也是執(zhí)行時間,是在15-20 s的范圍,如表二所示。
表四,性能和無亞群平均超過25
EXECUTIONS (N = KM = 20)
軌跡多樣性的亞群。我們比較獲得的結(jié)果與亞群(即M = 18,鉀= 1.1,和N =知識= 20)和無亞群(即M = 1,K二20,和N =知識= 20),表四。顯然,我們希望以盡量減少時間或被迫停車次數(shù)。表四表明我們的技術(shù),通過亞群的多樣性能夠做到這一點,減少了運動的執(zhí)行,即總時間,
所用的時間。伴隨此視頻文件(可在 http://ieeexplore.ieee.org)顯示實時執(zhí)行數(shù)任務(wù),其中之一是該任務(wù)的實時執(zhí)行在任務(wù)環(huán)境圖。 6證明的效力通過亞群的多樣性的保護。多移動機器人三我們的方法也適用于RAMP的情況下直接與多移動機器人,每個機器人不知道另一個機器人運動障礙和意見作為其他機器人要避免的。在這種情況下,每個機器人都有自己的實例在舷梯規(guī)劃師,它的意見再移動機械手作為七,八(或障礙),6移動機構(gòu)組成由于鏈接(包括負載物)的每個手機號碼機械手。無花果。 12和13顯示了兩種不同的任務(wù)環(huán)境多個移動機器人。任務(wù)環(huán)境圖5。 12 有四個在采摘任務(wù)的移動機械臂合作最多12個網(wǎng)球。每個機器人隨機選擇一球,拿起它,并將其置于它在角落里桶。所有的機器人反復挑選和無球的地方,直到球留在地面上。在這個過程中,對于任何一個機器人,其他機器人目前不明議案動態(tài)障礙。在任務(wù)環(huán)境6圖。 13日,3移動機械臂共享相同的工作區(qū)分開,但執(zhí)行任務(wù):一好轉(zhuǎn)從地上的網(wǎng)球和地區(qū)在水桶他們; 一個動作從一個表中的其他小方塊,以及1 從一個位置移動長棒到另一個地方。每個機器人 反復動作一次一個對象,直到它應(yīng)該是所有對象動議的議案。在這個過程中,機器人反復交叉路徑,因此,創(chuàng)建一個相當復雜的,不確定動態(tài)環(huán)境下的所有機器人。在這兩個任務(wù)環(huán)境5和6,每個移動機械手多次通過移動多個對象執(zhí)行一項任務(wù)(一個在一時間),以便其在舷梯算法的應(yīng)用實例反復與不同的起點和目標配置。視頻第六條依賴于一些機構(gòu)如移動機械臂持有對象或不
圖。 12。特別工作環(huán)境5個機器人拿起網(wǎng)球。
圖。 13。任務(wù)環(huán)境6個機器人執(zhí)行各種任務(wù)。
伴隨這一文件(可在http://ieeexplore.ieee.org顯示了這些任務(wù)的實時執(zhí)行。
在這些多機器人任務(wù)環(huán)境中,我們看到了一個動態(tài)的相互作用之間的同步規(guī)劃和實施進程機械手的移動機械臂的同:每個移動代表其他的障礙和移動機械臂影響他人的軌跡規(guī)劃和執(zhí)行。這些移動機械臂的影響彼此的議案來回。在工作環(huán)境5,每個機器人自發(fā)的決定每次挑球,連它的任務(wù)目標是影響的行動和其他機器人動作。的種類自發(fā)和動態(tài)之間的相互作用在機器人這兩種環(huán)境5和6的不確定性和不可早知啟用脫機運動規(guī)劃。鑒于在RAMP計劃者與爬坡適合這些情況良好每個機器人,能夠找到并執(zhí)行一個可行和附近最優(yōu)解軌跡的機器人。表五列出每個爬坡規(guī)劃師統(tǒng)計移動機器人的多機器人任務(wù)環(huán)境56。每個移動機器人有一個實例的策劃者,它運行在一個單獨的CPU核心,因此,斜坡算法實現(xiàn)類似的每個移動實時性能機械手在單機器人案件。對于每一個爬坡舉例來說,再次,男= 18,鉀= 1.1,和N =知識= 20。該
表五,爬坡帶兩個機器人算法平均超過20決問題
(N = 20)
表中的平均執(zhí)行時間是平均總執(zhí)行時間為每個機器人來完成任務(wù)。在案件的任務(wù)環(huán)境 5,這是對每個機器人的工作時間,直到所有的球 被放進水桶,因為機器人共享相同的任務(wù), 他們可比總執(zhí)行時間,這意味著他們的 工作負荷或多或少相同,即使機器人有不同數(shù)量的被迫停止。在任務(wù)環(huán)境 6,然而,每個機器人都有不同的工作,因此,總時間完成的工作是從一個到另一個不同的機器人。表五所示,在移動機器人的三個長棒時間最長,以完成其工作。在這兩種環(huán)境中,
因為這些機器人同時工作,最長的時間個人機器人是整體的時間來完成所有的事實任務(wù)。
我們還開辦了RAMP計劃者沒有亞群 (即M = 1和N = 20)在環(huán)境和機器人5 6,結(jié)果表明,平均執(zhí)行時間的增加 由1%至7%,而被迫停止從數(shù)量增加 0.3倍,7.7倍,大多數(shù)的機器人,相比在表五(顯示的結(jié)果與亞群)。因此, 促進多樣性有助于產(chǎn)生更好的效果。
我們還測試了許多其他任務(wù)在RAMP規(guī)劃師環(huán)境,除了本文件所示的例子。在所有情況下,為移動機器人爬坡算法 能避免與動態(tài)障礙物和未知的議案讓移動機械手來完成其任務(wù)好。
十,結(jié)論
本文介紹了一種新的方法來計劃RAMP的高 自由度運動中的未知動態(tài)障礙物機器人運動。該方法具有以下特點。
1)它實現(xiàn)了路徑規(guī)劃和實時適應(yīng)性軌跡在一起,同時也規(guī)劃和執(zhí)行的議案。這是通過獨特的設(shè)計策劃,還利用速度區(qū)別物理和計算機處理的議案。
2)在環(huán)境中有效地dealswith劇變
通過多樣化的軌跡,并通過全球規(guī)劃進一步保存,如果需要的多樣性。
3)具有靈活性,以不同的優(yōu)化整合不改變標準,根據(jù)需要整體 規(guī)劃算法。
4)生產(chǎn)松散耦合冗余子系統(tǒng)軌跡 (如操縱和運動子系統(tǒng) 一種移動機械手),以利用在優(yōu)化的整體運動,同時避免重復未知的障礙的議案。
5)憑借其高效率和靈活性,還可以隨時有效地為每個高自由度機器人計劃的議案(如移動機器人)的環(huán)境中共享由多個這樣的機器人。因此,斜坡方法使得 真正的分布式規(guī)劃盡可能多的高自由度機器人在同一環(huán)境中工作。
在RAMP方式進行測試與模擬移動 在不同的任務(wù)環(huán)境機器人,非常有前途的結(jié)果。今后的工作包括進一步檢驗和完善為更復雜的機器人和機器人任務(wù),并納入算法現(xiàn)實感的情況和制約因素。測試一個真正的機器人也是必要的。
參考
[1]沈俊卿Latombe,機器人運動規(guī)劃。諾威爾,馬:Kluwer,1991。
[2]脊髓肌肉拉瓦爾,規(guī)劃中的應(yīng)用。劍橋,英國:劍橋大大學。出版社,2006。
[3]屬大腸桿菌Kavraki,第Svestka,沈俊卿Latombe,和王曼奧維馬斯,“概率 路線圖的路徑在高維配置規(guī)劃 空間“,碩士論文。機器人。工商汽車。火山。 12,沒有。 4,頁。566-580,1996。
[4]釤拉瓦爾和JJ庫夫納,“快速擴展隨機樹:進展與前景“的算法和計算機器人:新方向,商業(yè)登記唐納德,林奇知識和D羅斯,合編。韋爾斯利,馬:一個20彼得斯,2001年,頁。293-308。
[5]屬Jaillet和T.西蒙,“路徑變形路線圖”,在提交 第七詮釋。車間算法找到。機器人。,紐約市,2006年7月。
[6]蘇布魯斯和M.利娜貝洛索“實時路徑規(guī)劃機器人隨機導航,“國立。電機及電子學工程師聯(lián)合會/ RSJ詮釋。機密檔案。訴訟事件。機器人。用于Syst。,2002年,第一卷。三,頁。2383年至2388年。
[7] z的Michalewicz,遺傳算法+數(shù)據(jù)結(jié)構(gòu)=程序的演進,第三版。紐約:施普林格出版社,1996。
[8]噸回,美國哈默爾和H.-P.施韋費爾,“演化式計算:的歷史和現(xiàn)狀的評論“,碩士論文。 Evol。 Comput。第一卷。 1,沒有。 1頁。3-17,1997年4月。
[9]聚丙烯Bonissone河Subbu,注埃克倫德,和TR基爾,“進化算法+領(lǐng)域知識=現(xiàn)實世界的進化計算,“IEEE期刊。 Evol。 Comput?;鹕健?10,沒有。 3,頁。256-280,2006年04月。
[10]頁Bessiere,J.-M. Ahuactzin,E.-G.塔勒比,和E.梅澤說:“'阿里阿德涅的線索的算法:全球與地方的規(guī)劃方法,“國立。電機及電子學工程師聯(lián)合會/ RSJ詮釋。機密檔案。訴訟事件。機器人。用于Syst。,1993年7月,第一卷。 2,頁。1373-1380。
[11] X.-C.李D.-B.趙J.-Q.易,并X.-H.路,“一個協(xié)調(diào)和層次移動機械臂路徑規(guī)劃方法,“國立。詮釋。機密檔案。馬赫。學習Cybern。,2005年8月,第二卷。 5頁。3013-3018。
[12]蘇嘯,z的Michalewicz湖章,和K. Trojanowski,“適應(yīng)