日韩欧美自拍在线观看-欧美精品在线看片一区二区-高清性视频一区二区播放-欧美日韩女优制服另类-国产精品久久久久久av蜜臀-成人在线黄色av网站-肥臀熟妇一区二区三区-亚洲视频在线播放老色-在线成人激情自拍视频

非特定人車載音響語音控制系統(tǒng)

出處:chetazo 發(fā)布于:2012-02-08 09:06:55

  隨著現(xiàn)代電子技術(shù)在汽車系統(tǒng)中的不斷應(yīng)用,越來越多的車載電器加入到車身電子行列中,使得汽車的各種性能都得到了極大的改善,但汽車駕駛室的開關(guān)也越來越多, 這就為駕駛員行車中對車載電器的操作提出了更高的要求,同時也給行車過程帶來了不安全的隱患。隨著語音識別算法的改進(jìn)和新一代Soc專用語音處理芯片的問世,使用語音命令控制汽車電器的操作能夠部分用口代替手的功能,從而減輕駕駛員操作負(fù)擔(dān),提高行車安全系數(shù)。

  目前我國的車身電子語音控制主要集中在汽車導(dǎo)航系統(tǒng)的應(yīng)用上,沒有充分發(fā)揮語音識別技術(shù)在車身電子中的應(yīng)用價值。本文提出了一種的以專用語音處理芯片UniSpeech-SDA80D51為控制車載音響操作的設(shè)計方案,并在SL1102C1型車載音響上實現(xiàn)了對非特定人的語音識別與控制。

  語音控制器硬件

  車載語音控制器系統(tǒng)由定向拾音器、語音識別模塊、控制模塊和音響模塊組成。系統(tǒng)的功能是:由拾音器采集駕駛員發(fā)出的語音命令,利用語音識別模塊將拾音器輸出的語音物理聲音信號轉(zhuǎn)變成語音數(shù)字信號,并識別出語音命令對應(yīng)的漢字或詞語,之后由控制模塊產(chǎn)生與之對應(yīng)的詞條編碼指令,通過系統(tǒng)I/O口線將控制命令傳達(dá)給音響,車載音響接收到控制指令產(chǎn)生動作,響應(yīng)駕駛員的語音命令,比如快進(jìn)、快退或音量調(diào)節(jié)等。系統(tǒng)結(jié)構(gòu)及原理框圖如圖1 所示:

  語音識別模塊主要由UniSpeech-SDA80D51芯片及外圍電路組成。本模塊主要實現(xiàn)對輸入的非特定人語音信號的識別和處理功能,輸出與語音命令對應(yīng)的詞條編碼。

  SDA80D51是Infineon公司專為語音識別和語音處理應(yīng)用領(lǐng)域新推出的專用芯片,采用高集成度的Soc系統(tǒng)結(jié)構(gòu)以0.18μm半導(dǎo)體工藝制造,擁有8位高速增強型M8051(25MIPS)和16位定點DSPOAK(100MIPS)的雙核架構(gòu),片內(nèi)集成了直接雙訪問快速SRAM、2路ADC和2路DAC(有效為12Bit)、多種通信接口和通用GPIO等設(shè)備,外部只需擴(kuò)展Flash存儲器等少量外圍電路即可構(gòu)成完整應(yīng)用系統(tǒng)。

  控制模塊由MCU和模擬開關(guān)電路構(gòu)成,本模塊主要完成對語音識別模塊輸出的識別結(jié)果--詞條編碼信號進(jìn)行邏輯分析和處理,通過模擬開關(guān)電路產(chǎn)生對應(yīng)功能的控制信號輸出到音響,控制音響的操作。其中MCU選用美國ATMEL公司產(chǎn)品AT89S51,由于車載音響SL1102C1上的按鍵控制面板為電阻式分流鍵盤電路,采用電壓采樣識別模式,對不同鍵值進(jìn)行識別,綜合SDA80D51芯片輸出的I/O電壓特性,確定使用繼電器模擬SL1102C1控制面板按鍵的閉合和斷開動作。

  本設(shè)計是基于安徽森力公司的SL1102C1汽車音響。SL1102C1是專門為中檔轎車設(shè)計的汽車音響,具有MP3播放、收音機和顯示時間等功能,目前大量使用在江淮同悅轎車上。SL1102C1前板共有15個按鍵和一個用來調(diào)節(jié)音量的編碼開關(guān)。分別為開關(guān)機/靜音、音效設(shè)置、6個臺位、播放/暫停、隨機播放、重復(fù)播放、瀏覽播放、選擇下曲(快進(jìn))、選擇上曲(快退)、向下搜臺/上一曲、向上鎖臺/下一曲、模式轉(zhuǎn)換、電臺瀏覽/自動存儲臺、波段切換、顯示時間/時間設(shè)置和復(fù)位等功能。

  音響前板上的按鍵為電壓采樣識別方式,按鍵包含短按(延時小于0.2s)和長按(延時大于1s)兩種動作,控制模塊MCU(AT89S51)的輸出電壓為TTL電平,直接采用MCU信號驅(qū)動音響按鍵動作容易引起誤識別,造成系統(tǒng)誤操作,因此本文采用模擬開關(guān)電路,很好地解決了上述問題。當(dāng)AT89S51接收到語音模塊輸出的一個語音命令識別結(jié)果編碼信號后,立即進(jìn)行邏輯分析并輸出對應(yīng)的控制信號驅(qū)動相應(yīng)繼電器吸合模擬按鍵動作,按鍵的短按和長按功能是通過軟件實現(xiàn)的。

  系統(tǒng)軟件設(shè)計

  系統(tǒng)的軟件包括:非特定人語音識別模塊和邏輯控制模塊。

  非特定人語音識別模塊基于HMM 模型算法。該算法通過對大量語音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計,建立識別詞條的統(tǒng)計模型語音庫,然后從待識別語音中提取特征,與模型庫進(jìn)行匹配,由比較匹配分?jǐn)?shù)得到識別結(jié)果,并通過SDA80D51的GPIO口輸出識別結(jié)果對應(yīng)的詞條編碼信號。語音識別模塊主要由信號預(yù)處理、特征參數(shù)提取、模型匹配和Viterbi算法部分組成。

  信號預(yù)處理部分主要完成輸入語音信號的采樣、 模/數(shù)轉(zhuǎn)換功能。A/D變換由SDA80D51內(nèi)嵌12位A/D變換器實現(xiàn),采樣頻率固定為8 kHz.

  特征參數(shù)提取基于語音幀,采用分幀提取特片。先對語音信號進(jìn)行重疊分幀,前一幀和后一幀重疊一半(幀信號重疊是體現(xiàn)相鄰兩幀數(shù)據(jù)之間的相關(guān)性),幀長為25ms,對每幀提取語音特片。

  MFCC參數(shù)屬于感知頻域倒譜參數(shù),反映了語音信號短時幅度譜的特征。p維MFCC參數(shù)的提取過程如圖1所示。

  其中:m是幀號,N是單位幀內(nèi)的采樣點數(shù)。

  HMM是描述語音信號的一種概率統(tǒng)計模型,使用 MarKov鏈來模擬語音信號統(tǒng)計特性的變化,HMM模型是在Markov鏈的基礎(chǔ)上發(fā)展起來的。

  Viterbi算法是一種幀同步動態(tài)規(guī)整算法,在給定觀察值序列和模型時,Viterbi算法給出了一個概率密度P(Q,O | λ)的狀態(tài)序列。

  控制模塊的主要功能是:在單片機查詢到語音模塊輸出的語音詞條信號后,查表獲得詞條編碼,根據(jù)編碼判斷對應(yīng)按鍵是長按或短按,分別進(jìn)入相應(yīng)的子程序處理,長按子程序延時1s,短按子程序延時0.2s.在子程序中,輸出語音命令所對應(yīng)的I/O控制信號驅(qū)動繼電器吸合模擬按鍵或編碼開關(guān)動作,并及時復(fù)位I/O口。為了避免語音控制和手動控制之間沖突,語音控制模塊可以完全兼容于手動控制,在語音控制操作時,同時可以進(jìn)行手動控制。

  實驗結(jié)果及結(jié)論

  本系統(tǒng)的樣機實驗主要是測試非特定人的語音識別率和模擬開關(guān)動作的準(zhǔn)確率。由于汽車音響的語音詞條為2~4個字,語音識別率實驗內(nèi)容為車載音響常用2字詞條指令18條、3字詞條指令12條、4字詞條指令10條,實驗對象為6人4男、2女(普通話和方言),實驗環(huán)境為噪聲干擾環(huán)境和相對安靜環(huán)境,樣機測試結(jié)果如表1所示。

  由表1可知,系統(tǒng)的識別率與語音指令詞條字?jǐn)?shù)、麥克接收距離、說話人方言及環(huán)境有關(guān)。4字詞識別率高于2字詞,相對安靜環(huán)境下識別率可以達(dá)到90%以上,男聲和女聲的識別率接近。有噪聲干擾環(huán)境中識別率下降。為了提高系統(tǒng)的識別率,系統(tǒng)樣機采用奧林巴斯 ME52定向麥克(在表中沒有反映),提高了麥克接收范圍,使系統(tǒng)總體的識別率上升到95%.

  在系統(tǒng)樣機控制電路實驗中,模擬開關(guān)動作達(dá)到了較高的準(zhǔn)確率,測試結(jié)果為98%以上,只要控制程序運行正常,各路繼電器就能按照程序安排執(zhí)行閉合和斷開模擬手動開關(guān)操作。

  實現(xiàn)汽車電器的語音控制是未來車載電器的發(fā)展趨勢,越來越多的解決方案在不斷的被提出和驗證。本文提出的設(shè)計是在SL1102C1型車載音響上使用SDA80D51芯片,實現(xiàn)了車載音響非特定人的語音識別與控制。由于該芯片集成度高,需要外圍模塊少,設(shè)計的硬件電路簡單,便于調(diào)試檢測。該設(shè)計得到的樣機,有較高的識別率、工作穩(wěn)定、可擴(kuò)展性強,達(dá)到預(yù)期的設(shè)計目標(biāo),整個設(shè)計方案和實現(xiàn)方法是可行的。由于語音識別率隨著環(huán)境,說話人不同而變化,雖然HMM在噪聲很少的環(huán)境下可以獲得很高的識別率,但當(dāng)測試語音或者環(huán)境中含有不同程度的噪聲污染時,語音識別系統(tǒng)的性能會很快地下降。提高系統(tǒng)的抗噪性和魯棒性是語音識別系統(tǒng)走向?qū)嵱没年P(guān)鍵之一。

關(guān)鍵詞:非特定人車載音響語音控制系統(tǒng)

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

廣告
OEM清單文件: OEM清單文件
*公司名:
*聯(lián)系人:
*手機號碼:
QQ:
有效期:

掃碼下載APP,
一鍵連接廣大的電子世界。

在線人工客服

買家服務(wù):
賣家服務(wù):
技術(shù)客服:

0571-85317607

網(wǎng)站技術(shù)支持

13606545031

客服在線時間周一至周五
9:00-17:30

關(guān)注官方微信號,
第一時間獲取資訊。

建議反饋

聯(lián)系人:

聯(lián)系方式:

按住滑塊,拖拽到最右邊
>>
感謝您向阿庫提出的寶貴意見,您的參與是維庫提升服務(wù)的動力!意見一經(jīng)采納,將有感恩紅包奉上哦!