機(jī)器視覺技術(shù)論文(2)
機(jī)器視覺技術(shù)論文
機(jī)器視覺技術(shù)論文篇二
智能機(jī)器人視覺仿生技術(shù)研究綜述
摘要:機(jī)器人視覺仿生技術(shù)是機(jī)器人視覺控制領(lǐng)域的新熱點(diǎn)。本綜述在詳細(xì)分析了靈長類動(dòng)物眼球運(yùn)動(dòng)的形式和特點(diǎn)基礎(chǔ)上,對(duì)國內(nèi)外應(yīng)用生物眼球運(yùn)動(dòng)控制機(jī)理來構(gòu)建仿生機(jī)器視覺的研究現(xiàn)狀、存在的問題及未來發(fā)展趨勢(shì)做了全面綜述,并針對(duì)目前機(jī)器人視覺仿生面臨的技術(shù)難題,提出了開展視覺仿生研究的新思路和新構(gòu)想。
Abstract: Robot vision bionic technology is the new hot shot in robot vision control area. In this review, based on a detailed analysis of primate eye movement forms and characteristics, the domestic and international research status of building bionic vision with the biological eye movement control mechanism, the problems and future trends are reviewed comprehensively, and new ideas for the visual bionic research are proposed for the current technical problems of robot vision bionic.
關(guān)鍵詞: 視覺仿生;仿生眼;機(jī)器人
Key words: bionic vision;bionic eye;robots
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2013)26-0195-02
0 引言
智能機(jī)器人是指:具有感知、識(shí)別、推理和決策能力,并且能獨(dú)立執(zhí)行任務(wù)的機(jī)器人。感知和識(shí)別技術(shù)是智能機(jī)器人最為關(guān)鍵的技術(shù)。研究最多的是基于視覺傳感器的感知技術(shù)。比如美國波士頓動(dòng)力公司研制的Big-Dog、Alpha-Dog、Little-Dog等系列四足機(jī)器人,采用立體視覺作為對(duì)環(huán)境進(jìn)行識(shí)別和感知。意大利IIT大學(xué)研制的HyQ[2]機(jī)器人能夠在復(fù)雜地形條件下高速移動(dòng),都不同程度地利用視覺實(shí)現(xiàn)感知。盡管如此還是滿足不了人們對(duì)智能“雙眼”的追求,假如能給智能機(jī)器人配備一雙智能雙眼,使其能像人類一樣感知和獲取環(huán)境信息、快速準(zhǔn)確地切換視眼和跟蹤目標(biāo),是人類對(duì)智能機(jī)器人夢(mèng)寐以求的愿望。為此,人們采用多種基于計(jì)算機(jī)視覺的方法和手段來構(gòu)建初步具備“視覺”功能的視覺系統(tǒng)。但目前智能機(jī)器人“眼睛”的功能還是比較低級(jí),特別是在雙目協(xié)調(diào)、以及對(duì)突然變化或事先未知的運(yùn)動(dòng)目標(biāo)的跟蹤、大視野與精確跟蹤之間的矛盾以及由于震動(dòng)引起的視線偏離補(bǔ)償?shù)确矫娴膯栴}到目前都沒得到很好的解決。近年來,視覺仿生成為前沿交叉學(xué)科的研究熱點(diǎn)。
由于生物視覺經(jīng)過千百萬年的進(jìn)化已具有極其發(fā)達(dá)和完善的內(nèi)外環(huán)境適應(yīng)能力。根據(jù)模擬生物視覺不同的功能表現(xiàn)及不同的應(yīng)用場(chǎng)合,視覺仿生的研究可歸納為兩大方面:一是從視覺感知、認(rèn)知的角度進(jìn)行研究;二是從眼球運(yùn)動(dòng)、視線控制的角度進(jìn)行研究。前者國內(nèi)外都有大量的研究方向和成果,主要研究視覺感知機(jī)制模型、信息特征提取和處理機(jī)制以及在復(fù)雜場(chǎng)景中目標(biāo)搜索等。而后者是根據(jù)人類和其它靈長類動(dòng)物的眼球運(yùn)動(dòng)控制機(jī)理來構(gòu)建智能機(jī)器人的“眼睛”,實(shí)現(xiàn)生物眼的多種優(yōu)異功能。
1 人類眼球運(yùn)動(dòng)的形式及特點(diǎn)
1.1 掃射與平滑追蹤運(yùn)動(dòng)
掃射是當(dāng)雙眼自由地看周圍環(huán)境是,視線很快從一個(gè)注視點(diǎn)轉(zhuǎn)向另一個(gè)注視點(diǎn)。其潛伏期一般為200~250m/s,速度約為400b/s。Young等最早建立了掃視采樣模,輸入輸出分別為目標(biāo)位置和眼球位置,Robinson修改了Young的模型,模擬大腦并行處理特性。當(dāng)前眼位與目標(biāo)位置之差經(jīng)過脈沖發(fā)生器進(jìn)入并行通路,經(jīng)積分器后產(chǎn)生位置信號(hào),與MLF直接通路共同作用于眼球運(yùn)動(dòng)裝置,產(chǎn)生掃射運(yùn)動(dòng)。平滑運(yùn)動(dòng)與掃射不同,屬于眼球運(yùn)動(dòng)速度的連續(xù)負(fù)反饋系統(tǒng),兩者發(fā)生的時(shí)間是獨(dú)立的。當(dāng)眼球追蹤一個(gè)運(yùn)動(dòng)物體時(shí)所發(fā)生的運(yùn)動(dòng),使視線平滑地跟蹤目標(biāo)。
1.2 反射性眼球運(yùn)動(dòng)
從驅(qū)動(dòng)眼動(dòng)的動(dòng)力源來分的話,眼球運(yùn)動(dòng)有與注意有關(guān)的眼動(dòng)(如saccades、smooth pursuit、vergence)和與頭動(dòng)相關(guān)的眼動(dòng)(即反射性眼動(dòng)如VOR 和 OKR)兩類。2005 年,Merfeld和 Ramat 分析了利用仿生機(jī)器人 iCub robot 對(duì)兩種常見的 VOR 模型進(jìn)行了模擬實(shí)驗(yàn),分析了小腦在自適應(yīng)特性及圖像穩(wěn)定中的重要作用。2007年Ojima指出,生物眼球運(yùn)動(dòng)具有典型的自適應(yīng)控制機(jī)制,能夠根據(jù)環(huán)境變化立即做出相應(yīng)的變化和適當(dāng)?shù)捻憫?yīng),受此啟發(fā),提出一種非線性耦合神經(jīng)振蕩器網(wǎng)絡(luò)模型及空間-時(shí)間學(xué)習(xí)算法,獲得了平滑追蹤中指令信號(hào)與運(yùn)動(dòng)增益及相位滯后的關(guān)系,建立的平滑追蹤VOR 復(fù)合模型,改善了目標(biāo)跟蹤特性。
1.3 注視轉(zhuǎn)移中頭眼協(xié)調(diào)運(yùn)動(dòng)
2009 年后,人們提出了頭眼協(xié)調(diào)運(yùn)動(dòng)的最優(yōu)控制方法,運(yùn)用最優(yōu)控制理論研究了頭眼運(yùn)動(dòng)與注視轉(zhuǎn)移的關(guān)系,提出頭眼運(yùn)動(dòng)最小貢獻(xiàn)力為準(zhǔn)則的最優(yōu)控制方法,并轉(zhuǎn)化為求解兩點(diǎn)邊值問題的微分方程組,仿真結(jié)果印證了“頭、眼分別受控制于不同的控制器”的結(jié)論。但該研究提出的模型不具備生物的自學(xué)習(xí)機(jī)能,在此基礎(chǔ)上提出了一種自學(xué)習(xí)最優(yōu)控制模型,在注視轉(zhuǎn)移過程中自適應(yīng)調(diào)整控制器參數(shù),對(duì)于再現(xiàn)生物頭眼協(xié)調(diào)特性更近了一步。通過分析視覺重定位中頭、眼運(yùn)動(dòng)的實(shí)驗(yàn)數(shù)據(jù),提出建立頭眼協(xié)調(diào)運(yùn)動(dòng)模型還須考慮一些尚未解決的問題。進(jìn)一步研究導(dǎo)致這些現(xiàn)象的神經(jīng)機(jī)制,才能揭示各運(yùn)動(dòng)子系統(tǒng)之間相互協(xié)調(diào)的本質(zhì)。
1.4 固視微動(dòng)
人眼在注視靜止目標(biāo)時(shí),眼球仍處于高頻率無意識(shí)的振動(dòng)之中,一旦振動(dòng)停止,成像就會(huì)變得模糊,這種振動(dòng)保證了圖像的獲取質(zhì)量。人眼的微動(dòng)機(jī)制啟發(fā)人們?nèi)ツM眼球振動(dòng)來改善圖像質(zhì)量。當(dāng)人眼凝視靜止物體時(shí),眼球自身的震顫(固視微動(dòng))具有突出物體邊緣的作用且包含深度信息。東京工業(yè)大學(xué)張曉琳先后建立了單眼和雙眼的水平眼球微動(dòng)控制系統(tǒng)的模型,使眼球微動(dòng)模型可以用于機(jī)器人眼的設(shè)計(jì)制造和控制上,并在此基礎(chǔ)上制作了一對(duì)具有與雙眼微動(dòng)控制系統(tǒng)模型相同的機(jī)器人眼實(shí)驗(yàn)?zāi)P汀J聦?shí)上,生物眼球運(yùn)動(dòng)在大多數(shù)情況下是包含上述多種運(yùn)動(dòng)成分的復(fù)合運(yùn)動(dòng)。此外,人們還研究了眼球運(yùn)動(dòng)系統(tǒng)中神經(jīng)積分器的作用、眼球運(yùn)動(dòng)的腦干控制機(jī)理,眼球運(yùn)動(dòng)與感知,以及眼球-頭頸的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)特性等,仿生眼的研究在國外成為前沿研究熱點(diǎn)。 2 仿生視覺面臨的問題及對(duì)策
目前機(jī)器人眼的研究多是基于工學(xué)方法,利用左右攝像機(jī)獲得目標(biāo)圖像分別進(jìn)行處理,左右眼和頭頸缺乏協(xié)調(diào)聯(lián)動(dòng)機(jī)制,在雙目、頭眼協(xié)調(diào)運(yùn)動(dòng)、視線偏離補(bǔ)償、不確定目標(biāo)追蹤等方面存在諸多技術(shù)障礙,采用仿生技術(shù)是尋求解決這些問題的重要途徑。
2.1 建立完善的仿生眼模型
基于國外生理學(xué)研究成果,采用工程仿生學(xué)和控制理論相結(jié)合的方法,將視覺控制生理模型轉(zhuǎn)化為工程技術(shù)模型,實(shí)現(xiàn)生物視覺的優(yōu)異性能,從根本上解決機(jī)器視覺面臨的技術(shù)難題,是智能機(jī)器人研究的重要方向。目前文獻(xiàn)中的仿生眼模型只模擬了人眼的一種或兩種運(yùn)動(dòng),且多為單眼或雙眼一維水平運(yùn)動(dòng)。普遍采用掃視與平滑追蹤分離的機(jī)制,難以同時(shí)實(shí)現(xiàn)多種眼球運(yùn)動(dòng)。進(jìn)一步研究各種眼球運(yùn)動(dòng)之間的內(nèi)部關(guān)聯(lián)與神經(jīng)機(jī)理,建立多自由度非線性仿生雙眼運(yùn)動(dòng)模型,同時(shí)實(shí)現(xiàn)掃視、平滑追蹤、異向運(yùn)動(dòng)和反射運(yùn)動(dòng)等多種眼球運(yùn)動(dòng),尚需進(jìn)行大量的研究。
2.2 引入生物神經(jīng)控制機(jī)理
當(dāng)進(jìn)行大幅度視線轉(zhuǎn)移時(shí),機(jī)器人的關(guān)節(jié)冗余需要有效地協(xié)調(diào)頭部和雙目的運(yùn)動(dòng)。目前提出的頭眼協(xié)調(diào)運(yùn)動(dòng)系統(tǒng)及學(xué)習(xí)算法多是基于水平方向的二維頭眼系統(tǒng),雖有學(xué)者提出3D頭眼協(xié)調(diào)運(yùn)動(dòng)控制算法,但采用的是先雙目聚焦,再轉(zhuǎn)動(dòng)頭部,后做眼睛補(bǔ)償?shù)?ldquo;分時(shí)”“分段”執(zhí)行方法,并未真正實(shí)現(xiàn)頭眼同時(shí)轉(zhuǎn)向目標(biāo)中的協(xié)調(diào)控制。目前3D頭眼協(xié)調(diào)運(yùn)動(dòng)仍是一項(xiàng)有待突破的技術(shù)難關(guān)。從生物頭眼協(xié)調(diào)運(yùn)動(dòng)中獲取靈感,研究靈長類動(dòng)物頭、眼和身體協(xié)調(diào)組合完成視線轉(zhuǎn)移的神經(jīng)控制機(jī)理,設(shè)計(jì)雙目頭頸協(xié)調(diào)運(yùn)動(dòng)控制算法,解決機(jī)器人3D頭眼協(xié)調(diào)控制問題不失為一條重要的研究途徑。
2.3 研究人眼跟蹤目標(biāo)的機(jī)理
機(jī)器人“眼”的重要功能之一是視覺跟蹤,目前常采用視覺伺服反饋控制的方法,但對(duì)于突然、快速變化以及行蹤無常的目標(biāo),常出現(xiàn)目標(biāo)丟失、跟蹤失敗的現(xiàn)象。人眼在跟蹤變化無常的目標(biāo)中表現(xiàn)出的非凡才能源于其視覺系統(tǒng)中眼球快速掃視和慢速平穩(wěn)追隨之間的協(xié)調(diào)配合和實(shí)時(shí)切換。深入研究人類眼球運(yùn)動(dòng)模式自動(dòng)切換快速準(zhǔn)確跟蹤目標(biāo)的神經(jīng)生理機(jī)制,將視覺跟蹤中掃視(saccade事件驅(qū)動(dòng))和平穩(wěn)追隨(smooth pursuit,速度連續(xù)驅(qū)動(dòng))模式的切換看作混雜系統(tǒng)的自適應(yīng)最優(yōu)控制問題加以研究,以期解決隨意性運(yùn)動(dòng)目標(biāo)跟蹤的快速性和準(zhǔn)確性問題。其中兩種模式之間的最佳切換時(shí)機(jī)和預(yù)測(cè)算法是研究的關(guān)鍵技術(shù)。
2.4 模擬人類反射性眼球運(yùn)動(dòng)機(jī)理
機(jī)器人在顛簸路段行走或在復(fù)雜的非結(jié)構(gòu)化環(huán)境中作業(yè)時(shí),自身機(jī)體振動(dòng)或姿態(tài)發(fā)生變化會(huì)引起較大的視線偏離。通常采用圖像處理(特征提取、目標(biāo)檢測(cè)與匹配、空間位置計(jì)算等)的方法來調(diào)節(jié)伺服機(jī)械云臺(tái),但補(bǔ)償范圍小,圖像穩(wěn)定性差,尚無解決大視線偏離的辦法。人眼具有很強(qiáng)的自適應(yīng)和自調(diào)節(jié)功能,當(dāng)頭部和身體姿態(tài)發(fā)生變化或背景動(dòng)態(tài)變化時(shí),仍能清楚地注視和跟蹤目標(biāo),緣于其前庭動(dòng)眼反射(VOR)和視動(dòng)反射(OKR)機(jī)能。研究人類反射性眼球運(yùn)動(dòng)機(jī)理,建立由基于視網(wǎng)膜滑動(dòng)信息的反饋控制器和基于前庭輸入的前饋控制器組成的自適應(yīng)VOR-OKR模型,主動(dòng)補(bǔ)償由機(jī)器人姿態(tài)本體變化引起的視覺誤差,解決機(jī)器人大范圍視覺偏差補(bǔ)償問題。
3 結(jié)論
機(jī)器人的視覺技術(shù)是機(jī)器人的共性技術(shù),也是一項(xiàng)關(guān)鍵技術(shù)。仿生型機(jī)器人眼運(yùn)動(dòng)控制系統(tǒng)使機(jī)器人眼具備人眼的諸多特殊自然功能,將其投入機(jī)器人產(chǎn)業(yè)應(yīng)用將開創(chuàng)仿生學(xué)在機(jī)器人技術(shù)領(lǐng)域嶄新的應(yīng)用前景。
參考文獻(xiàn):
[1]Erkelens CJ.A dual visual-local feedback model of the vergence eye movement system[J].Journal of Vision,2011,11(10):21:1-14.
[2]毛曉波.仿生機(jī)器眼運(yùn)動(dòng)系統(tǒng)建模與控制研究[D].鄭州:鄭州大學(xué),2011.
[3]Robinson DA.Models of the saccadic eye control system[J].Kybernetik,1973,14(2):71-83.
看了“機(jī)器視覺技術(shù)論文”的人還看: