本站小編為你精心準備了稀疏表示的手寫數(shù)字識別參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
《信息技術(shù)雜志》2015年第二期
1.1預(yù)處理在識別分類之前,為了達到好的識別效果,進行一些的預(yù)處理是必要的。這些預(yù)處理步驟包括配準,閾值化,字符分割等。配準是將所有的圖片都放到同一個坐標框架下來比較。配準方法又分為剛性配準和彈性配準。剛性配準主要是指對圖像進行旋轉(zhuǎn)和平移操作,而剛性配準的主要操作包括伸縮和裁減等放射變化。本文實驗選擇的數(shù)字圖片庫是已配準過的。閾值化主要是將灰度圖像轉(zhuǎn)換為黑白二值圖像。本文中數(shù)字分割為手動分割。
1.2數(shù)字字符表示假設(shè)訓(xùn)練庫中共有N個樣本,k類手寫數(shù)字字符,每類數(shù)字有Ni(i∈[1,k])個訓(xùn)練樣本,則有N=N1+N2+…+Ni。每個數(shù)字字符圖像分辨率大小為w×h,將其按列排列成一個M維列向量V,其中M=w×h。
1.3L2、L1、L0和L1/2正則化比較在線性代數(shù)中,式(3)是一個欠定方程(M<N),其解并不唯一。常用解法為最小二乘法,即選擇最小化的L2范數(shù)正則化來求解。由于L0范數(shù)與L1范數(shù)的等價條件(滿足RIP等距性)的苛刻性,本文提出用L1/2來代替L1范數(shù),但是L1/2是非凸的,它的解不是全局最優(yōu),而是局部最優(yōu),但在稀疏表示的實際應(yīng)用中,局部最優(yōu)就已經(jīng)滿足不錯的近似解。式(10)中Aδi(x1)為測試圖像y的重構(gòu)圖像,根據(jù)和原圖像的殘差來進行分類。
2實驗結(jié)果及分析
本文改進的稀疏表示數(shù)字字符識別步驟如下:①輸入:K類目標的圖像字典A,測試圖像y。②歸一化y和A的列使其長度單位化。③求解凸最優(yōu)化問題,式(9)。④計算第i類的殘差ri(y)。⑤輸出識別結(jié)果ID(y)=argminri(y)。
2.1改進的L1/2正則化實驗采用標準的數(shù)字數(shù)據(jù)庫MNIST,它包括了60000個訓(xùn)練樣本和10000個測試樣本點,每個樣本點的輸入含有28×28個像素,在訓(xùn)練樣本集為每個類選取120作為樣本,0~9類總共1200個樣本,并訓(xùn)練成過完備字典,從測試集中選取500幅測試樣本。以上識別步驟,1~3步驟是求解稀疏系數(shù)解,4~5步驟根據(jù)求得的系數(shù)解進行分類。在步驟3分別采用以下2種方法(基于L1范數(shù)式(8)正則化和基于L1/2式(9)正則化),并從識別時間和識別率進行對比。所選用的機器配置為,CPUIntelPentiumDualCore1.86GHz,1G內(nèi)存。如表1所示,基于L1/2正則化所耗時間只比L1范數(shù)多一點,但在實驗中,500個測試樣本只錯1個,識別率最高。L1/2正則化能夠比L1正則化更好的恢復(fù)原始信號。在實驗中,比如識別“0”字符時,由于“8”最近“0”字符,往往在“8”字符類中某幾個樣本對應(yīng)的具有較大系數(shù),這些其他類的大系數(shù)會給識別產(chǎn)生干擾。L1范數(shù)方法是無法避免這種誤差的,而L1/2滿足局部最優(yōu),能夠弱化這種干擾,識別效果最好。所以在下面的實驗都是基于L1/2分類。
2.2帶噪聲手寫數(shù)字字符識別從表1可以看出本方法對無噪聲的數(shù)字塊能夠準確識別,識別率接近100%。對帶噪聲、不同程度光照下的數(shù)字進行識別。采用和2.1節(jié)實驗一樣的字典,進行手寫數(shù)字識別。圖1中,a,b,c三行分別為三組實驗,e列為待識別數(shù)字,分別受到噪聲和光照干擾,f列為二值化結(jié)果,g列為稀疏系數(shù)圖,h列為殘差圖,殘差最小的為識別結(jié)果。通過本實驗看出,即使數(shù)字圖像受到強烈的噪聲,也能很好的得到正確的識別結(jié)果。體現(xiàn)本方法具有較好的噪聲魯棒性。
2.3識別算法對比分析在相同實驗條件下,比較不同算法對手數(shù)字識別效果。本文利用數(shù)字數(shù)據(jù)庫MNIST,在訓(xùn)練集里為每個類選取120個樣本,從測試集中每類選取500幅測試樣本。手寫數(shù)字通常是隨意的,每個數(shù)字都有區(qū)別,并且?guī)в猩倭吭肼暋H绫?所示,稀疏表示算法的識別性能較其他方法超出很多,識別效果最好。而且SVM、HMM、RNN這些分類方法需要基于有效的特征提取方法,才能獲得較好的識別結(jié)果。
3結(jié)束語
本文將手寫數(shù)字字符圖像訓(xùn)練為過完備字典來進行手寫數(shù)字識別,并通過稀疏系數(shù)來進行分類。本文基于L1/2的正則化相比L1范數(shù)更能夠恢復(fù)原始信號,從而獲得更好的識別率。相比于SVM、HMM、RNN這些分類方法,稀疏算法具有更好的噪聲魯棒性,并可以避免目標識別問題中特征提取和分類器對結(jié)果的影響。然而本文對手寫數(shù)字字符識別研究,訓(xùn)練樣本比較多,如何降低訓(xùn)練樣本,并且能獲得好的字典,從而能得到較好的識別率,是接下來的主要工作。
作者:王崇陽傅迎華陳瑋單位:上海理工大學(xué)光電信息與計算機學(xué)院上海交通大學(xué)自動化系