PCA及其在人臉識別中的應用與改進
出處:黃 昉, 劉金琨, 張寶昌 發(fā)布于:2011-06-21 12:24:19
人臉識別是模式識別研究領(lǐng)域的重要課題,也是一個目前非常活躍的研究方向。它一般可描述為:給定一個靜止或視頻圖像,利用已有的人臉數(shù)據(jù)庫來確認圖像中的一個或多個人。近年來,關(guān)于人臉圖像線性鑒別分析方法的研究激起了人們的廣泛興趣,其焦點是如何抽取有效的鑒別特征和降維。特征抽取研究肩負兩方面的使命:尋找針對模式的鑒別性的描述,以使此類模式的特征能地區(qū)別于彼類;在適當?shù)那闆r下實現(xiàn)模式數(shù)據(jù)描述的維數(shù)壓縮,當描述模式的原始數(shù)據(jù)空間對應較大維數(shù)時,這一點會非常有意義,甚至必不可缺。
在人臉圖像識別中,主成分分析 ( Principal Component Analysis , PCA )是一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復雜的問題。計算主成分的目的是將高維數(shù)據(jù)投影到較低維空間。給定 n 個變量的 m 個觀察值,形成一個 n ′ m 的數(shù)據(jù)矩陣, n 通常比較大。對于一個由多個變量描述的復雜事物,人們難以認識,那么是否可以抓住事物主要方面進行重點分析呢?如果事物的主要方面剛好體現(xiàn)在幾個主要變量上,我們只需要將這幾個變量分離出來,進行詳細分析。但是,在一般情況下,并不能直接找出這樣的關(guān)鍵變量。這時我們可以用原有變量的線性組合來表示事物的主要方面, PCA 就是這樣一種分析方法。
以上方法在處理人臉等圖像識別問題時,遵循一個共同的過程,即首先將圖像矩陣轉(zhuǎn)化為圖像向量,然后以該圖像向量作為原始特征進行線性鑒別分析。由于圖像矢量的維數(shù)一般較高,比如,分辨率為100×80的圖像對應的圖像向量的維數(shù)高達8 000,在如此高維的圖像向量上進行線性鑒別分析不僅會遇到小樣本問題,而且經(jīng)常需要耗費大量的時間,有時還受研究條件的限制(比如機器內(nèi)存小),導致不可行。針對這個問題,人們相繼提出不少解決問題的方法。概括起來,這些方法可分為以下兩類:從模式樣本出發(fā),在模式識別之前,通過降低模式樣本特征向量的維數(shù)達到消除奇異性的目的,可以降低圖像的分辨率實現(xiàn)降維;從算法本身入手,通過發(fā)展直接針對于小樣本問題的算法來解決問題[6,7].
本文基于主成分分析的思想,從原始數(shù)字圖像出發(fā),在模式識別之前,先對整個圖像訓練矩陣集進行分塊,該塊中的圖像盡可能具有同樣的性質(zhì),從而更接近于高斯分布;再用PCA方法對每個分塊得到的子圖像訓練矩陣進行分析,得到多個變換矩陣,通過這些變換矩陣將訓練圖片向量和測試圖片向量投影到特征空間進行鑒別。這樣做主要基于如下考慮:在傳統(tǒng)的PCA算法中,要求訓練集符合高斯分布,得到的結(jié)果才是理想的,但是實際操作中訓練樣本由于光照、表情、姿態(tài)等因素遠離高斯分布,而改進的PCA算法通過對其進行歸類訓練子訓練集(由于影響因素較小,更接近于高斯分布)提取主元,同時該方法可以增加主元的維數(shù),能提供更多的有效特征。在著名的FERET人臉庫上的試驗結(jié)果表明,本文提出的方法在識別性能上明顯優(yōu)于傳統(tǒng)的PCA方法,識別率有顯著提高。

1.2 特征抽取
原始圖像的維數(shù)較大,不利于直接用于分類,必須對原始數(shù)據(jù)進行降維。如何找出能代表原始圖像的低維數(shù)據(jù)是進行分類的關(guān)鍵。

2 推廣的PCA方法
2.1 思想與投影矩陣
傳統(tǒng)PCA的模型中存在諸多的假設(shè)條件,決定了它存在一定的限制,在有些場合可能會效果不好甚至失效。傳統(tǒng)的PCA算法要求標準訓練樣本矩陣符合高斯分布,也就是說,如果考察的數(shù)據(jù)的概率分布并不滿足高斯分布或是指數(shù)型的概率分布,那么PCA將會失效。在這種模型下,不能使用方差和協(xié)方差來很好地描述噪音和冗余,對教化之后的協(xié)方差矩陣并不能得到很合適的結(jié)果。

3 實驗結(jié)果與分析
實驗是在FERET人臉庫上進行的。FERET人臉庫由200個人、每人7幅圖組成:第1幅圖是人臉的正面照,第2~5幅圖是人臉角度的變換,第6幅圖表情的變換,第7幅圖是亮度的變化。每幅圖的分辨率是80×80.圖1是FERET人臉庫的某一人的7幅圖像。

FERET數(shù)據(jù)庫中每張圖片都有一個類別標號,代表其不同因素下采集的圖片,比如標號00012_930831_fa_a,其中00012表示類別ID,930831表示樣本生成時間,fa表示人臉偏轉(zhuǎn)角度,a表示光照強度。本文的實驗就是根據(jù)不同的圖像標號來劃分數(shù)據(jù)集合,從而達到外在因素較少的情況下,數(shù)據(jù)盡可能地滿足簡單的高斯分布。
將每類的前4幅圖作為訓練樣本,后3幅圖作為測試樣本,這樣訓練樣本總數(shù)為800,測試樣本為600.首先,利用傳統(tǒng)的PCA算法,即不對標準訓練樣本矩陣集進行分塊,計算出不同能量系數(shù)下的識別率。再利用推廣的PCA算法,分別實驗兩種情況:(1)將各個類訓練樣本的前兩幅圖組合為訓練樣本矩陣1,將各個類的訓練樣本的第3、4幅圖組合為訓練樣本矩陣2,這樣就將傳統(tǒng)PCA中的訓練矩陣集分為兩個子訓練矩陣集。對這兩個子訓練矩陣集進行計算得到變換矩陣[P1,P2].再將測試樣本和訓練樣本通過[P1,P2]投影到特征空間,對不同能量系數(shù)的情況計算得到識別率。(2)將每類的4個訓練樣本圖片分別組合為四子訓練矩陣集,然后用同樣的方法計算識別率。得到的實驗結(jié)果如圖2所示。

本文分別采用余弦分類器進行分辨率的計算。從圖中可以看出,對推廣的PCA的具體應用其識別率均優(yōu)于傳統(tǒng)的PCA方法。進一步分析其原因:推廣的PCA通過對標準訓練樣本矩陣集進行分塊,對每一個子訓練矩陣集抽取主元,雖然單個子訓練集抽取的主元維數(shù)可能比較低,但是由于有多個子訓練矩陣集,所以總體看來其抽取的主元維數(shù)還是較傳統(tǒng)的PCA主元維數(shù)多,因此能提高識別的。表1為當能量系數(shù)為0.9時不同方法抽取的主元維數(shù)。

本文提出了推廣的PCA的人臉識別方法,其本質(zhì)是通過對標準訓練樣本矩陣集做分塊,并對其子塊分別作PCA,抽取子塊的主元。這樣做是為了使影響因素較小,更接近于高斯分布,并且提高了主元的維數(shù),在分類器進行分類時能夠更好地減少誤差,便于模式識別。本實驗使用環(huán)境為 Microsoft Windows XP,硬件配置為Petium4,3.0 GHz CPU的計算機,優(yōu)化算法采用Matlab編寫。
在試驗中發(fā)現(xiàn),對同一數(shù)據(jù)庫,對樣本矩陣采用不同的分塊,獲得的識別率一般不同,如何尋求分塊方式有待進一步研究。
版權(quán)與免責聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負版權(quán)等法律責任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- ARM技術(shù)架構(gòu)與應用開發(fā)實踐指南2026/1/6 10:40:19
- 嵌入式實時操作系統(tǒng)(RTOS)選型與移植技術(shù)指南2025/12/31 10:42:31
- 工業(yè)嵌入式系統(tǒng):通信接口技術(shù)選型與抗干擾設(shè)計實踐2025/12/15 14:36:53
- 深入解析嵌入式 OPENAMP 框架:開啟異核通信新時代2025/7/22 16:27:29
- 一文快速了解OPENWRT基礎(chǔ)知識2025/7/14 16:59:04









