本站小編為你精心準備了短時統計分析的清濁音判別參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《電腦開發與應用雜志》2014年第六期
1.1貝葉斯分類器設計對于一幀語音信號,還不存在一種能夠完全準確的判別出是清音還是濁音的方法。面對研究對象的復雜性,不得不借助統計的方法。在語音信號中,清音幀、濁音幀不是孤立出現的,而是每當出現時,總是一段連續的清音或一段連續的濁音,且清音和濁音的過渡也是比較明顯的。可以通過手工標注的方法把清音段和濁音段分離,分別獲得清音幀和濁音幀的樣本訓練數據。為了對清音幀和濁音幀進行分類,使用貝葉斯方法建立清、濁音分類:作為清濁音的判定規則。當需要對語音信號中的某一幀進行清濁音判定時,首先采用統計模型中的訓練數據分別計算該幀為清音或濁音時的概率,然后求其概率的比值T。若T叟1,則認為幀為清音幀;若T芻1,則認為幀為濁音幀。
1.2清濁音幀能量的概率密度估計清音幀能量和濁音幀能量具體服從什么分布并不明確,對它們概率密度的估計采用了兩種函數逼近的方法。一種是伽馬分布的密度函數:其中μ、σ分別為均值和方差。為了便于觀測逼近效果,分別繪制了清、濁音分布直方圖(圖1),伽馬分布對清、濁音的逼近效果圖(圖2)和高斯分布對清、濁音的逼近效果圖(圖3)。
1.3算法步驟(1)選取語音信號s(n)作為處理對象,進行波、分幀、加窗、預加重,獲得預處理的信號sw(n),并用短時能量公式求出每一幀的短時能量。(2)統計訓練樣本中清音幀、濁音幀在總體中的比例,其值分別作為清音、濁音的先驗概率P(u)、P(v)。(3)分別選擇對清音、濁音幀能量的分布進行逼近的函數,分別得到相應的概率密度估計fu、fv。(4)任選取一未知幀語音信號,分別代入密度函數fu、fv,可分別求出其對應的類條件概率密度(fx/u)和(fx/v)。(5)在得到清音幀、濁音幀的先驗概率P(u)、P(v)和未知幀在清、濁音下的條件概率密度密度(fx/u)、(fx/v)后,可用上面設計的貝葉斯分類器進行清/濁音幀的判別。
2實驗結果
實驗中的測試數據是采用8000Hz采樣頻率,16bit量化的數字語音信號,幀長為240個采樣點。測試樣本為成年男聲,清音319幀,濁音479幀,共798幀。為探究該方法的有效性,試驗中與文獻中的組合判決法進行了比較,同時也為了探究伽馬度函數和高斯密度函數對清音幀能量、濁音幀能量分布的逼近效果,分成了4組進行比較。實驗的對比結果如表1所示。3結論從實驗結果可以看出,新的判決方法比傳統的組合參數判別方法具有更好的判別效果。從逼近函數的選擇上看,雖然都具有較高的判別率,但從實驗結果來看,清音伽馬逼近、濁音高斯逼近的組合逼近判別效果更好一點。
作者:程曉磊姜占才單位:青海師范大學計算機學院