
語音信號的時域特征,頻域特征,共振峰,基音周期特征。
基音周期的估計
基音是指發(fā)濁音時聲帶振動的周期性,而基音周期是指聲帶振動頻率的倒數(shù)?;舻淖兓J綖槁曊{(diào)。基因檢測,只能采用短時平均方法估計該周期。其難點表現(xiàn)在
1.語音信號變化十分復雜,聲門激勵的波形并不是一個完全的周期序列。在語音的頭、尾部并不具有聲帶振動那樣的周期性,對有些清濁音的過渡幀很難判斷他應(yīng)屬于周期性或非周期性,從而無法估計其基音周期。
2.要從語音信號中取出聲道的影響,直接取出僅與聲帶振動有關(guān)的生源信息并非易事。而聲道共振峰有時會嚴重影響激勵信號的諧波結(jié)構(gòu)
3.在濁音段很難精確地確定每個基音周期的開始和結(jié)束位置,這不僅因為語音信號本身是準周期的,也是因為波形的峰受共振峰結(jié)構(gòu)、噪聲等影響較大。
4.基音周期變化范圍大,從低音男生的80Hz到女孩的500Hz,這也給基音周期的檢測帶來一定的困難。另外,濁音信號可能包含有三四十次諧波風量,而基波分量往往不是最強的分量。語音的第一共振峰在300-1000Hz范圍內(nèi),2-8次諧波成分往往比基波分量還強,豐富的諧波成分是語音信號的波形變得很復雜,給基因檢測帶來困難,經(jīng)常發(fā)生基頻估計結(jié)果為實際基因頻率的二三次倍頻或二次分頻的情況。
基因檢測方法3類
波形估計法:直接有語音波形來估計基因周期,分析出波形上的周期峰值。包括并行處理法,數(shù)據(jù)減少法。
相關(guān)處理法:包括波形自相關(guān)法,平均振幅差分函數(shù)法,簡化逆濾波法等
變換法:將語音信號變換導頻或倒譜域來估計因周期,利用同態(tài)分析方法將聲道的影響消除,得到屬于激勵部分的信息,進一步求取基音周期。包括倒譜法,循環(huán)直方圖。
自相關(guān)法:濁音信號的自相關(guān)函數(shù)在基音周期的整數(shù)倍上出現(xiàn)峰值,而清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn)。由此判斷請濁音,而峰-峰值之間對應(yīng)的就是基音周期。影響的主要原因是聲道響應(yīng)部分??梢赃M行一些前期的預(yù)處理。語音信號的低幅值部分包含大量的共振峰信息,高幅值部分包含較多的基音信息。任何消減或者抑制低幅度部分的非線性處理都會使自相關(guān)方法的性能得到提高。中心削波就是一種,消除語音信號的低幅值部分。計算量大,采用三電平中心削波方法。還可以用一個帶通為900Hz的線性低通濾波器濾除高次諧波分量。短時自相關(guān)函數(shù)檢測時,與實際不符合,原因有二:一方面與窗長有關(guān),認為窗長應(yīng)該至少大于兩個基音周期。另一方面與聲道特性有關(guān)。
基于短時平均幅度差的基音周期的估計,平均幅度差只涉及加減何求絕對值運算。
倒譜法,對語音信號利用倒譜解卷原理,可以得到激勵序列的倒譜,它具有與基音周期相同周期。當采用無噪語 音時,倒譜法很理想。然而有加性噪聲時,在對數(shù)功率譜中的低電平部分被噪聲填滿,掩蓋了基因諧波的周期性。
簡化逆濾波法:簡化的逆濾波跟蹤算法先抽取聲道模型參數(shù),利用這些參數(shù)對原信號進行逆濾波,從預(yù)測誤差中得到聲源序列;再用自相關(guān)法求的基音周期。語音信號通過線性預(yù)測逆濾波器后達到頻譜的平坦化。預(yù)測誤差是自相關(guān)器的輸入,通過與門限的比較可以確定濁音,通過輔助信息可以減少誤差。在基因檢測中,廣泛采用對語音波形或誤差信號波形進行低通濾波,因為這種低通濾波對提高基音周期的檢測精度有良好的效果。低通濾波在去除了高階共振峰影響的同時,還可以補充自相關(guān)函數(shù)時間分辨率的不足。
無論采用哪一種算法求得的基音周期軌跡與真實的基音周期軌跡不可能完全吻合,實際情況是大部分段亂吻合,局部段落區(qū)域中有一個或幾個基音周期偏離正常的軌跡??梢圆捎闷交惴?,中值平滑算法和線性平滑算法。
共振峰的估計
共振峰是反應(yīng)聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源。共振峰信息包含在語音譜包絡(luò)中,因此提取共振峰參數(shù)的關(guān)鍵是估計語音的頻譜包絡(luò),一般認為譜包絡(luò)中的最大值是共振峰。實際受很多問題干擾
1.虛假峰值,在正常情況下,頻譜包絡(luò)中的極大值是由共振峰引起的。但在線性預(yù)測分析方法出現(xiàn)之前的的頻譜包估計器中,出現(xiàn)虛假峰值是相當普遍的現(xiàn)象。甚至采用線性預(yù)測方法時,也并非沒有虛假峰值。
2.共振峰合并,相鄰共振峰的頻率可能會靠的太近而難以分辨,這時會產(chǎn)生共振峰合并現(xiàn)象,而探討一種理想的能對共振峰合并進行識別的共振峰提取算法存在很多實際困難。
3.高音調(diào)語音
傳統(tǒng)的頻譜包絡(luò)估計方法是利用由諧波峰值提供的樣點。高音調(diào)語音的諧波間隔寬,因而為頻譜包絡(luò)估值樣點比較少,所以頻譜包絡(luò)本身的估計就不夠精確。
基于線性預(yù)測的共振峰求取方法
一種有效的頻譜包絡(luò)估計方法是從線性預(yù)測分析角度推導出聲道濾波器,根據(jù)這個聲道濾波器找出共振峰。線性預(yù)測共振峰估計有兩種途徑:一是利用一種標準的尋找復根的程序計算預(yù)測與茶濾波器的根,為求根法,一種是找出預(yù)測器導出的品譜包絡(luò)中的局部極大值,選峰法。
求根法是找出多項式復根,根據(jù)求得的根來確定共振峰。采用牛頓-拉夫遜搜索算法。該算法先猜測一個根值,并就此猜測計算多項式及其導數(shù)的值,然后利用計算結(jié)果再找出一個改進的猜測值。連個猜測之小于設(shè)定的閥值時,結(jié)束求根。
選峰法
計算出語音信號的頻譜包絡(luò),然后通過對頻譜包絡(luò)中局部極大值進行搜索找出共振峰。缺點是對共振峰合并無能力。方法是減少從極點到計算頻譜包絡(luò)曲線的距離。原則上,只要函數(shù)求值曲線與極點相距足夠近,任何共振峰合并問題可以解決。也會將諧波峰值誤認為共振峰,利用諧波頻率及其上下兩個次級值頻率求的共振峰頻率。
倒譜法
可以構(gòu)造倒譜濾波器,將聲道倒譜分離。從而可以由此確定共振峰及其聲道和激勵參數(shù)。
愛華網(wǎng)



