從應(yīng)用平臺(tái)來(lái)看,可以把回聲消除分為兩大類:基于DSP等實(shí)時(shí)平臺(tái)的回聲消除技術(shù)和基于Windows等非實(shí)時(shí)平臺(tái)的回聲消除技術(shù)。兩者的技術(shù)難度和重點(diǎn)是不一樣的。
基于DSP平臺(tái)的回聲消除技術(shù)
回聲消除技術(shù)傳統(tǒng)的應(yīng)用領(lǐng)域是各種嵌入式設(shè)備,包括各種電信網(wǎng)絡(luò)設(shè)備和終端設(shè)備。網(wǎng)絡(luò)設(shè)備比如交換機(jī),網(wǎng)關(guān)等等,終端則包括移動(dòng)電話終端,視頻會(huì)議終端等?,F(xiàn)代通訊產(chǎn)品里面大量應(yīng)用了回聲消除技術(shù),包括在我們看得到的終端產(chǎn)品(比如手機(jī))和看不到的局端產(chǎn)品(比如交換機(jī))。這種嵌入式設(shè)備的共同點(diǎn)就是采用各種型號(hào)的DSP芯片作為回聲消除的載體。一個(gè)有效的回聲消除算法需要持續(xù)的在一顆DSP芯片上面運(yùn)行,會(huì)遇到以下方面的難點(diǎn):實(shí)時(shí)性與高效性,因?yàn)镈SP芯片資源有限。雖然自從二十世紀(jì)七十年代DSP應(yīng)用以來(lái),日新月異的硬件芯片技術(shù)使許多沉睡在教科書上的信號(hào)處理理論算法大規(guī)模應(yīng)用,但是回聲消除算法需要的資源還是大得驚人。以視頻會(huì)議系統(tǒng),大規(guī)模的會(huì)議室可以產(chǎn)生超過(guò)512ms的回音,要消除這么長(zhǎng)延時(shí)的回音,即使按照8k赫茲采樣率計(jì)算,自適應(yīng)濾波器W(n)的長(zhǎng)度都會(huì)達(dá)到4096個(gè)點(diǎn),這樣一方面需要非常大的存儲(chǔ)空間來(lái)存儲(chǔ)W(n),另一方面,W(n)的更新需要的計(jì)算量也是成倍增長(zhǎng),同時(shí),W(n)的收斂難度也在加大,傳統(tǒng)自適應(yīng)濾波器的效率很難保證。對(duì)于電信設(shè)備中的應(yīng)用,雖然回聲消除不需要這么長(zhǎng)的延時(shí),但是在交換機(jī)等設(shè)備中,成本和效率就是生命,所有的處理算法都是按路或按線計(jì)算的,對(duì)算法的優(yōu)化效率提出了無(wú)止境的要求。相對(duì)而言,只有像車載免提這種應(yīng)用對(duì)效率要求不那么高,因?yàn)檐噧?nèi)空間小,回音延時(shí)有限,又不要求多路應(yīng)用。傳統(tǒng)的回聲消除技術(shù)是從國(guó)外二十世紀(jì)七十年代的早期算法發(fā)展而來(lái),這類技術(shù)的采用一直相當(dāng)昂貴,提供電信級(jí)回聲消除硬件應(yīng)用(包括芯片或者設(shè)備)的廠家都是國(guó)外的。對(duì)于移動(dòng)網(wǎng)絡(luò)用戶來(lái)說(shuō),語(yǔ)音品質(zhì)一直是他們最關(guān)切的議題,對(duì)電信業(yè)者來(lái)說(shuō),語(yǔ)音也仍是他們最能獲利的服務(wù)項(xiàng)目,因此語(yǔ)音的品質(zhì)是不容妥協(xié)的。為了滿足今日與未來(lái)的網(wǎng)路需求,回聲消除技術(shù)的挑戰(zhàn)正在于如何有效地降低成本并持續(xù)改善語(yǔ)音品質(zhì)。算法級(jí)的DSP軟件解決方案,也是解決嵌入式設(shè)備回音問題的一種途徑,對(duì)用戶也有一定的靈活性,用戶只需要把回聲消除模塊集成到自己的DSP軟件中,再簡(jiǎn)單調(diào)整幾個(gè)相關(guān)參數(shù),就能達(dá)到較好的回聲消除效果。目前基于DSP的回聲消除算法已經(jīng)比較成熟,市場(chǎng)上也有一批專門的算法/芯片公司的能夠?qū)ν馓峁┮呀?jīng)優(yōu)化好的基于DSP的軟件回聲消除模塊:如俄羅斯SpriritDSP、加拿大Octastic Semiconductor、瑞典GIPS、國(guó)內(nèi)科萊特斯科技ConatusTechnologies以及美國(guó)Adaptive Digital、和GAOResearch、英國(guó)CSR等等,另外還有美國(guó)Fortemedia、AcousticTechnologies和日本OKI等可以提供專用的回聲消除DSP芯片。其中性能較好的有Octastic、Conatus、和Spririt這三家,Octastic可以提供完整的從專用芯片、板卡到DSP算法的完整方案,而Conatus和Spririt的回聲消除效果更好,值得一提的是Conatus公司是目前市面上唯一提供針對(duì)專業(yè)視訊會(huì)議應(yīng)用寬帶回聲消除模塊的公司,其音頻采樣率可以達(dá)到48k赫茲。基于Windows平臺(tái)的回聲消除技術(shù)
回聲消除技術(shù)最新的應(yīng)用領(lǐng)域是基于Windows平臺(tái)的各種VoIP應(yīng)用,比如軟件視頻會(huì)議,VoIP軟件電話等。當(dāng)回聲消除算法應(yīng)用到Windows平臺(tái),相對(duì)于傳統(tǒng)的DSP平臺(tái),既帶來(lái)優(yōu)勢(shì),也帶來(lái)了新的難點(diǎn)。高效性在Windows平臺(tái)已經(jīng)不是問題,現(xiàn)在的pc機(jī),擁有豐富的cpu資源和海量的內(nèi)存資源,再?gòu)?fù)雜的回聲消除算法都可以運(yùn)行自如。但是,新增加的麻煩比帶來(lái)的好處要多。
首先,Windows平臺(tái)是一個(gè)非實(shí)時(shí)的平臺(tái),音頻的采集和播放對(duì)回聲消除算法而言,也是非實(shí)時(shí)的。和DSP平臺(tái)不一樣,DSP平臺(tái)可以直接控制AD/DA芯片的采集播放,獲得實(shí)時(shí)的音頻流(不存在同步問題),但是Windows平臺(tái)下,應(yīng)用程序很難在底層直接控制聲卡的采集播放,獲得的是非實(shí)時(shí)的音頻流,從而帶來(lái)了采集和播放音頻流的同步問題。實(shí)際應(yīng)用時(shí),傳給回聲消除算法的兩個(gè)聲音信號(hào)(采集的回音信號(hào)ne和播放的參考信號(hào)fe),必須同步得非常的好。就是說(shuō),本地接收到遠(yuǎn)端說(shuō)的話以后,要把這些話音數(shù)據(jù)傳給回聲消除算法做參考,這是一個(gè)算法需要的輸入信號(hào);然后再傳給聲卡,聲卡放出來(lái)后經(jīng)過(guò)回音路徑,這時(shí),本地再采集,然后傳給回聲消除算法,這是算法需要的另一個(gè)輸入信號(hào)。這里的同步是指:兩個(gè)信號(hào)雖然存在延時(shí),但這個(gè)延時(shí)必須固定,在時(shí)序上要保持連貫,不能一個(gè)信號(hào)多來(lái)幾個(gè)幀,另外一個(gè)信號(hào)少來(lái)幾個(gè)幀。如果傳給回聲消除算法的兩個(gè)信號(hào)同步得不好,即兩個(gè)信號(hào)發(fā)生幀錯(cuò)位,就沒有辦法進(jìn)行消除了。因?yàn)檫@時(shí)系統(tǒng)會(huì)變成了非因果系統(tǒng),比如期望信號(hào)收到了,參考信號(hào)還沒來(lái),時(shí)間上都沒有因果關(guān)系,肯定是沒有辦法消除的。實(shí)際情況是,在一般的VoIP軟件中,接收對(duì)方的聲音并傳到聲卡中播放是在一個(gè)線程中進(jìn)行的,而采集本地的聲音并傳送到對(duì)方又是在另一個(gè)線程中進(jìn)行的,而聲學(xué)回聲消除算法在對(duì)采集到的聲音進(jìn)行回聲消除的同時(shí),還需要播放線程中的數(shù)據(jù)作為參考,而要同步這兩個(gè)線程中的數(shù)據(jù)是非常重要的,因?yàn)樯陨杂行┎煌?,聲學(xué)回聲消除算法中的自適應(yīng)濾波器就會(huì)發(fā)散,不但消除不了回音,還會(huì)破壞原始采集到的聲音,使聲音難以分辨。另外,pc機(jī)器的聲卡種類繁多,各種各樣的聲卡特性進(jìn)一步加劇了同步問題的復(fù)雜性。所以,同步和聲卡等問題對(duì)回聲消除算法的內(nèi)部特性提出了更多苛刻的要求。從上面分析來(lái)看,由于Windows平臺(tái)的非實(shí)時(shí)性,基于Windows平臺(tái)的回聲消除技術(shù)比DSP平臺(tái)要難得多。在PC平臺(tái)語(yǔ)音通訊領(lǐng)域,目前公認(rèn)音質(zhì)做得比較好的國(guó)外軟件是Skype,記得幾年前Skype一直是在用瑞典一家叫GIPS(GlobalIPSound)公司的語(yǔ)音引擎技術(shù)。GIPS是最早介入PC平臺(tái)語(yǔ)音通訊領(lǐng)域的廠商之一,在改領(lǐng)域具有一定的權(quán)威性,其主要優(yōu)勢(shì)表現(xiàn)在對(duì)IP網(wǎng)絡(luò)的延時(shí)、抖動(dòng)和丟包等處理較好,基于Windows平臺(tái)的回音消除也做得不錯(cuò),不過(guò)最近的新版本Skype上已經(jīng)看不到GIPS的標(biāo)志了,據(jù)說(shuō)是因?yàn)镾kype自己研發(fā)了一套新的更好的語(yǔ)音引擎的緣故。目前大家接觸最多的采用了GIPS語(yǔ)音引擎技術(shù)的通訊軟件就是騰訊QQ了,其超級(jí)語(yǔ)音的效果普遍評(píng)價(jià)都還不錯(cuò)。另外微軟經(jīng)過(guò)多年的研發(fā),其最新版本的MSN語(yǔ)音特別是回音消除效果終于有了質(zhì)的提升,目前網(wǎng)上評(píng)價(jià)也還不錯(cuò)。另外還有一些專業(yè)廠商也對(duì)外提供包含回音消除功能的語(yǔ)音引擎,如俄羅斯的SpiritDSP、美國(guó)的GH Innovation和國(guó)內(nèi)的科萊特斯科技(Conatus Technologies)以及賽聲科技(SoftAcoustic)等等。除此之外,網(wǎng)絡(luò)上還可以下載到一個(gè)很好的開源的語(yǔ)音軟件Speex也提供了回音消除功能。為了進(jìn)一步了解目前PCWindows平臺(tái)回音消除技術(shù)的業(yè)界水平,筆者對(duì)各家的回音消除技術(shù)做一個(gè)詳細(xì)的橫向?qū)Ρ葴y(cè)試(所有測(cè)試都是免提狀態(tài))為了對(duì)比,各家語(yǔ)音引擎的版本信息列舉如下:國(guó)外廠商:Skype V3.8.4.182Spirit DSP(廠家DEMO)GIPS(QQ 2009beta)Micorsoft (Windows Live Messenger 2009V14.0.8064.2006)GH Innovation(廠家DEMO)國(guó)內(nèi)廠商:ConatusTechnologies(廠家DEMO)Soft Acoustic(廠家DEMO)開源算法:Speex(V1.2RC1 自己寫了測(cè)試軟件)測(cè)試結(jié)果:
| 測(cè)試項(xiàng)目 | Skype | MSN | Conatus | Spirit | Speex | SoftAcoustic | GH I | |
| 筆記本免提模式,外接麥克風(fēng)和音箱應(yīng)用模式的適應(yīng)性 | 兩種模式都無(wú)回音 | 筆記本免提模式有時(shí)一直有較小回音 | 筆記本免提模式偶爾有較小回音 | 兩種模式都無(wú)回音 | 筆記本免提模式有時(shí)一直有較小回音 | 兩種模式都有一直較小回音 | 兩種模式有時(shí)都會(huì)出現(xiàn)較大回音 | 筆記本免提模式一直有很小回音 |
| 單方講話效果 | 無(wú)回音,效果很好 | 基本無(wú)回音,效果好 | 基本無(wú)回音,效果好 | 無(wú)回音,效果很好 | 基本無(wú)回音,效果好 | 一直有較小回音,效果差 | 有時(shí)有很大回音,效果差 | 基本無(wú)回音,效果好 |
| 雙方同時(shí)講話效果 | 雙方交流流暢無(wú)回音,對(duì)方聲音偶爾有輕微斷續(xù) | 雙方交流流暢,但對(duì)方聲音中會(huì)夾雜著輕微回音 | 雙方交流流暢,但對(duì)方聲音中會(huì)夾雜著一些回音 | 雙方交流流暢無(wú)回音,對(duì)方聲音偶爾有輕微斷續(xù) | 雙方交流流暢,但對(duì)方聲音中間會(huì)夾雜著一些回音 | 雙方交流比較流暢,但一直聽到一個(gè)較小的回音 | 雙方交流不流暢,對(duì)方聲音經(jīng)常會(huì)斷續(xù) | 雙方交流無(wú)回音,但對(duì)方聲音很小很難聽清楚 |
| 麥克風(fēng)和揚(yáng)聲器相對(duì)的位置改變等 | 收斂比較快,基本沒有回音出現(xiàn)。 | 收斂比較快,基本沒有回音出現(xiàn)。 | 收斂比較快,基本沒有回音出現(xiàn)。 | 收斂比較快,基本沒有回音出現(xiàn)。 | 收斂比較快,基本沒有回音出現(xiàn)。 | 收斂速度慢,有好幾句回音 | 收斂速度慢,有好幾句回音 | 收斂比較快,基本沒有回音出現(xiàn)。 |
| CPU重載(CPU負(fù)載達(dá)到100%)時(shí)效果 | XP和Vista下聲音都流暢,基本不會(huì)出現(xiàn)回音和聲音斷續(xù)現(xiàn)象 | XP和Vi【】sta下聲音都流暢,基本不會(huì)出現(xiàn)回音和聲音斷續(xù)現(xiàn)象 | XP下聲音流暢,基本不會(huì)出現(xiàn)回音;Vista下聲音斷續(xù),偶爾會(huì)出現(xiàn)回音 | XP和Vista下聲音都流暢,基本不會(huì)出現(xiàn)回音和聲音斷續(xù)現(xiàn)象 | XP下聲音流暢,基本不會(huì)出現(xiàn)回音;Vista下聲音斷續(xù),偶爾會(huì)出現(xiàn)回音 | 此項(xiàng)未測(cè) | XP下聲音流暢,基本不會(huì)出現(xiàn)回音;Vista下聲音斷續(xù),偶爾會(huì)出現(xiàn)回音 | XP下聲音流暢,基本不會(huì)出現(xiàn)回音;Vista下不加負(fù)載聲音都是斷續(xù)的 |
| PC和聲卡適應(yīng)性 | 穩(wěn)定,基本都能消除回音 | 穩(wěn)定,基本都能消除回音 | 比較穩(wěn)定,偶爾有些筆記本免提時(shí)有回音 | 穩(wěn)定,基本都能消除回音 | 穩(wěn)定,基本都能消除回音 | 不穩(wěn)定,有時(shí)無(wú)法消除回音 | 不穩(wěn)定,經(jīng)常無(wú)法消除回音 | 穩(wěn)定,基本都能消除回音 |
| 噪聲抑制 | 噪聲抑制效果弱 | 噪聲抑制效果一般 | 噪聲抑制效果弱 | 噪聲抑制效果強(qiáng) | 噪聲抑制效果一般 | 噪聲抑制效果強(qiáng) | 噪聲抑制效果強(qiáng) | 噪聲抑制效果強(qiáng) |
| 自動(dòng)硬件增益控制和免提時(shí)能達(dá)到的最大播放音量 | 支持,音量較大 | 支持,音量較小 | 支持,音量適中 | 支持,音量適中 | 支持,音量較小 | 不支持 | 支持,音量較小 | 支持,音量非常小 |
| 整體效果評(píng)價(jià)(0-10分評(píng)分) | 很好,基本沒有回音,雙方交流很順暢,9分 | 較好,有的筆記本免提時(shí)偶爾有回音且音量較小,雙方交流比較順暢,7.5分 | 較好,有的筆記本免提時(shí)偶爾有回音,雙方交流順暢,8分 | 很好,基本沒有回音,音量比skype略小,雙方交流很順暢, 8.5分 | 較好,有的筆記本免提效果稍差且音量比較小,vista效果稍差,7分 | 不好,一直有個(gè)較小的殘余回音,雙方交流困難,3分 | 不好,經(jīng)常有完整的回音,感覺不穩(wěn)定,雙方交流比較困難,5分 | 一般,沒有回音,但是音量太小,雙方交流困難,且VISTA下聲音斷續(xù),5.5分 |
| 測(cè)試項(xiàng)目 | Skype | MSN | Conatus | Spirit | Speex | SoftAcoustic | GH I |

可以看出,Skype、 Conatus和 QQ(GIPS)的效果最好, MSN和Spirit的效果還不錯(cuò),而GH Innovation、Soft Acoustic效果一般,Speex的效果較差。
回聲消除已經(jīng)成為語(yǔ)音通訊中提供全雙工音頻的標(biāo)準(zhǔn)方法。聲學(xué)回聲消除是通過(guò)消除或者移除本地話筒中拾取到的遠(yuǎn)端的音頻信號(hào)來(lái)阻止遠(yuǎn)端的聲音返回去的一種處理方法。這種音頻的移除都是通過(guò)數(shù)字信號(hào)處理來(lái)完成的。回聲消除技術(shù)是數(shù)字信號(hào)處理的典型應(yīng)用之一。
愛華網(wǎng)



