人臉識別技術(shù)論文
人臉識別,特指利用人臉視覺特征信息的分析比較結(jié)果進行身份鑒別的計算機技術(shù)。下面是學習啦小編為大家整理的人臉識別技術(shù)論文,希望你們喜歡。
人臉識別技術(shù)論文篇一
人臉識別技術(shù)綜述
摘要:文章首先對人臉識別技術(shù)進行了介紹,其次回顧了人臉識別研究的發(fā)展歷程及識別方法的基本分類,然后對當前主流的人臉識別方法展開了詳細的論述,最后提出了人臉識別技術(shù)面臨的問題及研究方向。
關(guān)鍵詞:人臉識別;特征臉;線形判別分析;局部二值模式
中圖分類號:TP391
Survey of face recognition technology
He Chun
(Education and Information Technology Center, China West Normal University, Nanchong Sichuan 637002, China)
Abstract: This paper introduces technology of face recognition firstly, and reviews the development process and the basic classification method of face recognition. After that, the paper discusses the current methods of face recognition in detail, therefore proposes the existing problems in the research of recognition faces and future’s research direction.
Key words: face recognition; Eigenface; linear discrimination analysis; LBP
1 人臉識別技術(shù)簡介
人臉識別,特指利用人臉視覺特征信息的分析比較結(jié)果進行身份鑒別的計算機技術(shù)[1]。一般人臉識別有廣義和狹義之分,廣義是指包含人臉圖像采集、定位、預處理、身份確認與查找等在內(nèi)的技術(shù);而狹義僅指身份確認或查找系統(tǒng)。
通俗來講,人臉識別指運用計算機分析人臉視頻或圖像之后,提煉可用、有益的識別信息,再對人臉對象的身份構(gòu)建判斷與識別。人臉識別是身份識別研究中最主要的一種方法,重點建立在生物識別技術(shù)基礎(chǔ)之上,而且其中應用了諸多計算機相關(guān)的圖形學、人工智能等最新技術(shù)手段。
人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,其生物特征內(nèi)在的穩(wěn)定性和唯一性使其自然成為了身份識別的理想依據(jù)。學術(shù)界對人臉識別相關(guān)問題的研究已然趨近成熟,并形成了為數(shù)可觀的研究成果,到目前為止,仍然在不斷的探索與發(fā)展中,尤其在人臉身份識別方面的建樹頗多??焖?、直接、簡捷是人臉識別系統(tǒng)的獨有優(yōu)勢,并已廣泛運用于刑事偵破、信息安全等方面。在此,本次研究將對人臉識別技術(shù)給出全面的解析論述。
1 人臉識別發(fā)展歷程
早在20世紀50年代,心理學家即已著手對人臉識別展開研究,但是直至60年代,對人臉識別真正意義上的研究才正式開啟,具體是從工程應用層面出發(fā),研究得到一種半自動的人臉識別系統(tǒng),這種系統(tǒng)具備的特點可描述如下:
一是該系統(tǒng)是對局部的識別,對人臉的幾何特點識別,進而分析人臉器官特征信息及其之間的關(guān)系,優(yōu)勢在于識別手段簡易、清晰,劣勢在于一旦人臉的視角、表情等發(fā)生變動和變化,那么很難準確地得到識別效果;二是這種半自動的人臉圖像識別需要較為嚴苛的約束環(huán)境和條件,如果圖像存在單一或無背景的情況下,那么就將削弱最終的處理效果。
研究遞進到20世紀90年代以后,即已朝著整體和局部相結(jié)合的態(tài)勢演變。學者們認為需要將人臉的形狀拓撲結(jié)構(gòu)、局部灰度和全局灰度分布等多項人臉特征信息相結(jié)合,才能全面、準確地實現(xiàn)人臉圖像識別。1991年,Turk和Pentland [2]、首次提出著名的“特征臉”(Eigenface)方法,利用主成分分析(Principal Component Analysis,PCA)取得了不錯的識別效果;Belhumer在其論文中,則將Fisher判別準則成功應用到了人臉分類當中,由此而提出Fisherface方法[3]。
此后,這種應用線性子空間和統(tǒng)計特征的技術(shù)就已成為當時大眾化流行的識別技術(shù),可概括為利用成分分析、線性判別分析的特征識別手段。后期出現(xiàn)了基于機器學習理論的實用技術(shù),學者們相繼探索出遺傳算法、支持向量機等方法對人臉進行識別。
2 人臉識別方法分類
研究可知從不同的角度,人臉識別可有不同的分類方法,本次研究根據(jù)人臉識別發(fā)展階段的特征,把人臉識別技術(shù)分為初始以幾何特征為基礎(chǔ)、中期以代數(shù)特點為依據(jù)、后期以機器學習理論為原理三種。下面即對這3類研究給出功能實現(xiàn)概述。
2.1 以幾何特征為基礎(chǔ)的研究
這種方式是將人臉用一個幾何特征矢量予以有效表示,并根據(jù)模式識別中層次聚類的思想設(shè)計分類器,達到識別目的。識別所采用的幾何特征是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,本質(zhì)上是特征矢量之間的匹配,相應分量通常包括人臉指定2點間的歐式距離、曲率、角度等[4]。
該類研究方式優(yōu)點是簡單易懂,但是由于能量函數(shù)中加權(quán)系數(shù)的選擇表現(xiàn)出一定的經(jīng)驗性,并未能形成規(guī)范統(tǒng)一的特征提取標準;而且圖像穩(wěn)定的特征提取仍有難度,尤其是特征受阻時;另外,對于明顯的表達變化或不良的姿勢變化,其魯棒性均呈低弱。
2.2 以代數(shù)特點為依據(jù)的研究
這種方式往往基于代數(shù)特征圖像的像素變換投影空間,具有某種數(shù)量的基本圖像對人臉圖像線性編碼,典型的理論工作可首推主成分分析方法。
主成分分析方法早期是由Sirovitch和Kirby[5]引入人臉識別領(lǐng)域,并將其用于分析數(shù)據(jù),過程中是使用數(shù)量少的特點來描述為了降低特征空間維數(shù)的樣本,而且是基于K-L來展開和實現(xiàn)的。 2.3 以機器學習理論為原理的研究
由2.1節(jié)中的研究方式可知,人臉特征是預先定義形成的。本節(jié)討論的方式,則是通過使用統(tǒng)計分析和機器學習技術(shù),從中獲取信息。獲得的信息存在于確定的分布之中,并通過算法、模型和判別函數(shù),用作人臉圖像識別。這種分類器是時下至關(guān)重要的一門技術(shù),而且涵蓋了SVM、Hidden Markov模型與AdaBoost算法等在內(nèi)的綜合開發(fā)系統(tǒng)技術(shù)。
3 人臉識別主流方法介紹
3.1 特征臉方法
人臉方法來自主成分分析的人臉識別和描述技術(shù)。這種方法主要是把圖像區(qū)域當作隨機變量,運用K-L轉(zhuǎn)變成為正交K-L基,與較大特征值相關(guān)的對應基具有與人臉相似的形狀,所以也可稱做特征臉。使用這種線性組合能夠描述、展現(xiàn)近似的人臉圖像、人臉識別以及合成。具體表現(xiàn)為把人臉圖像映射到人臉子空間之上,同時對人臉圖像在特征臉子空間上的方位進行對比。
3.1.1 人臉空間的建立
研究假設(shè)人臉圖像包含了眾多像素點,并且可用N維向量Γ來表示,那么樣本庫就可用Γi(i=1,...,M)提供應用表達[6] 。人臉空間的基向量由協(xié)方差矩陣C的正交特征向量構(gòu)成,因此稱為特征臉。
把特征值由大到小排列:λ1≥λ2≥...≥λr ,其對應的特征向量為μk。在此條件下,不同的人臉圖像都能投影到由u1, u2, ..., ur組成的子空間中。結(jié)果就是不同的人臉圖像將映射為子空間中不同的點,反之亦然。
3.1.2 特征向量的選取
協(xié)方差矩陣Ω所生成的非零特征值的k(k遠小于M)個特征向量,一般來說k值比較大,但在常規(guī)情況下并非需要保留所有有的特征向量。因為投影的計算速度是同子空間向量數(shù)有著密切關(guān)聯(lián),如果能夠考慮到時間限度,就能夠提取有效信息的特征向量。
3.1.3 預測識別
人臉圖像置其投影可得到一組坐標系數(shù),該系數(shù)能夠表明圖像在子空間中的位置,因而可以作為人臉識別的基礎(chǔ)。換言之,每一幅人臉圖像皆能顯示出線性組合的“人臉”,加權(quán)系數(shù)為K-L變換的擴展系數(shù),也能作為圖像的代數(shù)特征。所以,提取特征臉信息后,可向?qū)Ψ降湫蜆颖具M行投影,并將得到的投影特征映射到各研究人臉的特征向量,作為后續(xù)識別匹配搜索空間的一個步驟。 圖1~圖3給出了不同情況下的特征臉圖像。
3.2 線性判別分析法
線性判別分析,可簡稱為LDA,本質(zhì)是多維模式空間到一維特征空間的映射,使用類的成員信息形成一組特征向量,構(gòu)建得到的特征空間稱為Fisherface。在理論上,這種方式主要是利用類之間的散射矩陣類中的訓練樣本和基于散射矩陣的最優(yōu)投影空間。和人臉識別方式比較,該種模式能夠抑制不確定圖像間的差異信息,并可以進一步提取利于識別的特征,因而具有較好的識別性能。
Lades等人認為人臉圖像皆有相似的拓撲結(jié)構(gòu),提出了關(guān)于建立在動態(tài)連接結(jié)構(gòu)的彈性圖匹配方式基礎(chǔ)上的物體識別問題。每節(jié)點涵蓋40個小波系數(shù),集合稱為射流,對小波系數(shù)進行原始圖像和一組5個頻率,8個方向的Gabor小波卷積。所以每一張圖像,就像標簽被逐一校準,而邊緣之間的距離則是通過點來設(shè)計校準。因此,針對圖中邊緣編碼后得到的是人臉的幾何形狀,而圖中節(jié)點編碼后的結(jié)果是灰度值的分布。實現(xiàn)過程示意如圖4所示。
由圖4可知,彈性圖匹配的意義在于尋找新的人臉,同時提取一張圖像,圖像類似于束圖,用其可以開展識別工作。當開始識別的時候,計算、測量人臉和目前束圖之間的相似性,具有最大相似性的面部實體就指明了測試人臉的身份。
3.3 局部二值模式
局部二值模式(Local Binary Pattern, LBP)是執(zhí)行紋理描述的最佳方法之一, 并已在于各類應用軟件中獲得全面功能發(fā)揮,同時經(jīng)由實踐證得該模式具備著強大的判別能力、計算效率及不變形單調(diào)灰度水平變化等顯著優(yōu)勢[7],因而可將其應用到不同復雜程度的圖像分析任務之中。
3.3.1 基本LBP算子
LBP算子最初是界定于3×3鄰域,將中心像素設(shè)置成閾值,并將灰度值與其建立對比,大于中心像素時就記1,反之記0。這時的8個點就能變換為一種8位沒有符號的二進制數(shù),此二進制數(shù)再轉(zhuǎn)換為十進制數(shù),也就是窗口的LBP值。LBP可整體反饋出區(qū)域的紋理信息?;镜腖BP算子如圖5所示。
LBP能夠用鄰域的大小不同,采用圓形面積與雙線性插值,鄰域半徑R和P的像素數(shù)能任意選擇,用符號(p,r)表示像素區(qū)域。常見的LBP算子參見圖6。
3.3.2 LBP人臉描述
使用LBP手段描述人臉,具體表現(xiàn)為運用紋理描述符對人臉局部展開詳細的繪制處理,然后將其組合成一體。人臉圖像就被分割成幾個局部區(qū)域,從這些不同的區(qū)域提取紋理描述符,并共同構(gòu)成人臉的整體視圖。
把臉部區(qū)域分成確定的m份R0、R1、R2、…、Rm-1,直方圖將依序計算每個區(qū)域,M的直方圖計算結(jié)果整合在一起形成空間,空間增加M×N大小的直方圖,其中的n表示一個直方圖的大小??臻g增強的直方圖可以有效地描述3個不同層次的臉部,具體的3個層次分別為:直方圖LBP標識包含一個像素級別的信息;地域級是由小的區(qū)域上的標志結(jié)合構(gòu)成的;這些區(qū)域的直方圖連接起來,最終形成完整的人臉。
4 人臉識別技術(shù)面臨的問題
人臉識別技術(shù)存在獨有優(yōu)勢和廣闊前景,但同時卻也面臨一定問題,而這些問題是卻均是源起于人臉具備的生物特征的某些顯性表象。人臉在視覺上的特點可實際剖析如下:
一方面由于個體間差別較小,人臉、人體器官構(gòu)成也比較類似,雖然對人臉定位是占優(yōu)勢的,而對區(qū)別個體卻產(chǎn)生干擾;另一方面,人臉的表情變化產(chǎn)生的視覺圖像也會導致差異。此外,人臉圖像識別時還會受到其他約束條件影響,比如光照、年齡、遮蓋物等。因此,解決上面提及的各類問題則既是創(chuàng)新,也是挑戰(zhàn),更是人臉識別技術(shù)開展未來研究的后續(xù)發(fā)展方向。
參考文獻:
[1] 吳巾一,周德龍. 人臉識別方法綜述[J]. 計算機應用研究, 2009, 26(9): 3205-3209.
[2] TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience, 1991, 3(1): 71-86.
[3] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D. et al. fisherfaces: Recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[4] BARTLETT M, LADES H, SEJNOWSKI T. Independent component representations for face recognition[C]//Proceeding of the SPIE Symposium on Electronic Imaging: Human Vision and Electronic Imaging . San Jose, CA:IEEE, 1998, 3299:528-539.
[5] KIRBY M, SIROVICH L. Application of the Karhunen-Loeve procedure for the characterization of human faces [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(1):103-108.
[6] SAMARIA F, YOUNG S. HMM based architecture for face identification [J]. Image and Computer Vision, 1994, 12(8): 537-543.
[7] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition [J]. IEEE Trans. Pattern Anal. 2006, 28(5): 2037-2041.
點擊下頁還有更多>>>人臉識別技術(shù)論文
人臉識別技術(shù)論文
上一篇:人機交互技術(shù)論文
下一篇:認知無線電技術(shù)論文