本站小編為你精心準備了獨立成分在化學戰劑識別中的應用參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《紅外與激光工程雜志》2016年第四期
摘要:
在戰場等復雜環境得到的混合氣體的紅外光譜主次吸收峰交錯重疊,因此對其定性識別的特征提取方法就顯得尤為重要。采集到的各種化學戰劑和有機氣體的紅外光譜數據都是高維度數據,首先采用中心化后降維進行特征提取來盡可能多地捕獲到它所包含的本質信息,由于混合氣體的紅外光譜是非線性、非高斯性信號,把非高斯性作為獨立性度量將各成分作為獨立分量分離出來,為了滿足實時需求,在傳統快速獨立成分分析(FastICA)算法的基礎上對其迭代過程進行優化,并應用極限學習機(ELM)建立模型進行定量分析。實驗結果表明:改進算法的迭代次數較傳統算法減少,定量分析均方差E=2.3926×10-4,回歸系數R=0.999,說明該方法在不影響分離精度的前提下提高了混合物質中純物質光譜分離出來的效率。
關鍵詞:
混疊峰識別;紅外光譜;非高斯性;快速獨立成分分析
紅外光譜分析作為一種光譜測量技術與化學計量學的有機結合的新興分析技術,因其分析速度快、無損檢測、效率高、成本低和易于實現在線分析等特點已應用于諸多領域。紅外光譜吸收峰的頻率、強度和形狀是各物質所特有的,因此紅外光譜可以用來對某些單純環境下的樣品或者某些特殊的復雜環境和場合下的樣品進行定性定量分析[1]。戰時,當我軍遭受化學戰劑襲擊時,需要盡快獲得敵襲擊使用的化學戰劑類型,戰場上復雜的環境使得我們得到的紅外光譜的透過率光譜包括幾種神經性毒氣和一些有機氣體(煙氣成分)的混合氣體,組成成分相似和分子結構類似的各種有機氣體的紅外光譜由于特征譜帶的重疊或部分重疊而給譜峰的歸屬辨認帶來極大的困難,面對現今愈來愈復雜的混合物體系,尤其是復雜的有機混合物體系,化學計量學為試樣沒有驗前信息的黑色體系提供了多種波譜的解析方法,常用的有主成分分析(PCA),實際信號的大部分重要信息往往包含在高階統計特性中,而PCA方法利用協方差矩陣參與實際計算時只涉及輸入數據的二階統計特性,容易造成信息丟失[2]。
獨立成分分析[3](ICA)是信號處理領域在20世紀90年代后期發展起來的一項基于信號高階統計特性的分析方法,ICA方法已經在特征提取、生物醫學信號處理、語音信號處理、圖像處理及人臉識別等方面得到了廣泛的應用[4]。由于紅外光譜的多峰性和重疊性,使得許多波譜分辨方法無法直接應用于紅外光譜,特別是化合物紅外光譜的定性分析,ICA可以從非高斯信號中找到一個使組分變成統計獨立或者盡可能獨立的非線性表達,可廣泛應用于特征提取和信號分離,近年來部分研究人員已經將ICA結合光信號用于混合光譜中分離出獨立組分的光譜,基于紅外光譜無損檢測黃花梨可溶性固形物含量[5]和艦船氣泡尾流所產生的后向散射光信號[6]。它已經成為一種從混合體系中分離出獨立組分的強有力算法,并逐漸顯示了在分析化學領域的強大作用,ICA是從混合物譜中分離出獨立組分的紅外光譜,這種方法使得被分析信號各成分之間的統計依賴性最小,突出了源信號的本質結構,將ICA用于混合物的紅外光譜進行解析[7],則提供了一種將吸收峰重疊的光譜分離出來的途徑,方便后續建立定量分析模型[8]。ICA的實現算法根據目標函數的不同有最大非高斯性法、極大似然估計法和最小互信息法等,FastICA是以負熵作為衡量非高斯性指標的一種固定點迭代算法,它使用簡單、收斂速度快穩定性好,是一種能對大量采樣點進行批處理的快速算法,文中采用FastICA算法完成主次吸收峰混疊的紅外光譜特征提取,并對傳統的FastICA算法進行迭代優化,經過實驗驗證該優化算法在保證分離精度的前提下提升分離速度的能力。
1ICA算法
1.1基于ICA的紅外模型根據朗伯比爾定律,通常認為在未知混合體系中測得的紅外光譜是一些純物質(主要成分)光譜的線性組合。根據上述ICA數學模型,對應于紅外光譜數據矩陣可建模為Xm×n表示各成分的光譜信號與其貢獻度乘積。
1.2基于負熵最大的FastICA迭代算法根據信息論理論,在所有等方差的隨機變量中,高斯隨機變量具有最大的熵值,因而可以利用熵來度量分離結果的非高斯性,常用熵的修正形式負熵。在信噪分離過程中,可通過對分離結果的非高斯性度量來表示分離結果間的相互獨立性,當非高斯性度量達到最大時,則表明已完成對各獨立分量的分離[9]。在具有相同方差的隨機變量中,高斯分布的隨機變量具有最大的負熵,FastICA算法通過最大化負熵得到W(W=BT)的目標函數可定義。1.3優化的FastICA迭代算法在實際應用過程中,為了應對某些實時檢測的要求,需要在不影響分離效果保證精確度的同時減少迭代次數,加快算法迭代速度,在此基礎上對FastICA迭代過程進行優化。為了在牛頓迭代法求解過程中減少求雅可比矩陣的次數。
2實驗分析
2.1混合光譜的分離實際情況中往往得到的是混合氣體的透過率光譜,其中包括某幾種神經性毒氣和有機氣體(煙氣成分),用毒性較小的沙林模擬劑DMMP和反2丁烯(煙氣的一種)作為實驗的研究對象,實驗采用擴散法配制DMMP蒸氣,擴散管內加入DMMP液體置于廣口瓶中,擴散管通道半徑很細,可以近似認為其底部腔內的DMMP蒸汽處于飽和狀態,使用德國Bruker公司的VERTEX70型紅外光譜儀,EGOLD-A型長光程氣體吸收池,光程長20m,容積500ml,實驗溫度為296K,氣壓為101325Pa,不同濃度的混合氣體充入密閉氣室中,采集到樣品的透過率光譜400條,其中光譜范圍為大氣窗口8~14μm(1300~700cm-1),分辨率為4cm-1。實驗裝置如圖1所示。將得到的混合氣體光譜數據進行ICA解析,并且分別采用普通快速獨立分量分析FastICA算法和優化后的FastICA算法對吸收峰位置互相交錯重疊的特征光譜進行識別,也對兩種算法的識別率和迭代速度進行了對比,分別選取不同的數據量來對兩種算法的識別率和迭代速度進行比較,結果如圖2和表1所示。可以看出:就該實驗而言,FastICA算法和優化后的FastICA算法的分離能力基本一致,應用優化后的FastICA算法能夠減少FastICA的迭代次數,進一步加快收斂速度,也充分說明了該優化算法能夠在提高算法性能的情況下保持FastICA算法在特征提取方面的良好性能。圖3為FastICA和PCA處理后的譜圖。由圖3可以看出,PCA處理后由于一些信息的丟失導致吸收峰消失或者合并在強吸收峰內,使某一吸收峰的峰寬變窄或增大,消失的峰位很可能影響到對特征光譜的解析,也可能會影響后續的定量分析。為進一步檢驗FastICA算法在混合情況下對于特征峰交錯重疊中特征提取的優越性,分別用PCA算法和FastICA算法對光譜數據處理后進行定量分析。
2.2定量分析將優化FastICA和PCA算法各自分離出來的400個DMMP樣品光譜中的320個樣品作為訓練集,80個樣品作為測試集,用極限學習機(ELM)建立濃度預測模型進行定量分析,其中隱含層神經元個數為20,預測結果如圖4、5所示。優化FastICA處理后測試集預測結果中,均方誤差E=2.3926×10-4,回歸系數R=0.999,PCA處理后測試集預測結果中,均方差E=2.5013×10-4,回歸系數R=0.989,說明FastICA算法對于混疊峰的分離效果良好,定量分析結果更精確一點。
3結論
提出了一種以FastICA算法為基礎的紅外光譜主次吸收峰嚴重混疊的識別方法,它能夠提取高階統計信息,對混合氣體中各氣體吸收峰重疊的光譜進行識別分離,同時為了契合實時探測的要求,對傳統的FastICA算法的迭代過程進行優化。利用搭建的實驗系統采集多組化學戰劑模擬劑DMMP和反2丁烯混合氣體的紅外光譜數據,得到的數據分別經過傳統FastICA和優化FastICA在不同數據量下迭代次數的對比和分離精確度的對比,優化的FastICA迭代次數減少,分離精度與傳統FastICA相當。定量分析中分別用PCA和優化FastICA對數據進行處理,再經過建立ELM的定量分析模型,PCA處理后測試集預測結果中,均方差E=2.5013×10-4,回歸系數R=0.989,優化FastICA處理后測試集預測結果中,均方誤差E=2.3926×10-4,回歸系數R=0.999,該優化方法相比于常用的PCA算法精度上有一定的優越性。優化后的FastICA算法能夠在不影響普通FastICA良好分離性能的前提下有效地減少了普通FastICA算法的迭代次數,進一步加快收斂速度,這與光譜識別的實時要求是很好的契合,具有普遍的實用價值。
作者:陳媛媛 王芳 王志斌 李文軍 單位:電子測試技術重點實驗室 山西省光電信息與儀器工程技術研究中心 儀器科學與動態測試教育部重點實驗室 天津津航技術物理研究所