女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址

當(dāng)前位置:首頁(yè) > 測(cè)試測(cè)量 > 測(cè)試測(cè)量
[導(dǎo)讀]1 引言 IVR系統(tǒng)(Interactive Voice Response),即交互式語(yǔ)音應(yīng)答系統(tǒng),它被應(yīng)用于呼叫中心(Call Center),以提高呼叫服務(wù)的質(zhì)量、減輕服務(wù)員的工作強(qiáng)度并節(jié)省費(fèi)用,是呼叫中心實(shí)現(xiàn)人機(jī)交互的重要門戶,在傳統(tǒng)的IVR

1  引言
IVR系統(tǒng)(Interactive Voice Response),即交互式語(yǔ)音應(yīng)答系統(tǒng),它被應(yīng)用于呼叫中心(Call Center),以提高呼叫服務(wù)的質(zhì)量、減輕服務(wù)員的工作強(qiáng)度并節(jié)省費(fèi)用,是呼叫中心實(shí)現(xiàn)人機(jī)交互的重要門戶,在傳統(tǒng)的IVR系統(tǒng)中,用戶與系統(tǒng)交互的方式是通過(guò)電話的鍵盤。通常,用戶在進(jìn)入IVR系統(tǒng)后,會(huì)聽(tīng)到相關(guān)的語(yǔ)音提示選單,根據(jù)自己的需要可以按下鍵盤上相關(guān)的按鍵。系統(tǒng)通過(guò)DTMF信號(hào)傳送用戶按下的鍵,同時(shí)也將用戶的請(qǐng)求傳送給系統(tǒng),從而觸發(fā)相關(guān)的語(yǔ)音信息。然而,傳統(tǒng)的電話僅能通過(guò)DTMF信號(hào),傳送有限的幾個(gè)數(shù)字及符號(hào)按鍵。這使得用戶與系統(tǒng)的交互界面受到很大的限制,同時(shí)也就使得IVR系統(tǒng)的信息查詢范圍變得相當(dāng)狹窄,用戶在實(shí)際使用時(shí)會(huì)感到諸多不便。

隨著計(jì)算機(jī)技術(shù)和人工智能總體技術(shù)的發(fā)展,自然語(yǔ)言理解不斷取得進(jìn)展。語(yǔ)音識(shí)別系統(tǒng)已成為一個(gè)越來(lái)越廣泛的應(yīng)用方向。由于電話網(wǎng)絡(luò)的普及性,自然語(yǔ)言處理系統(tǒng)在電話信道上的應(yīng)用已成為最重要的應(yīng)用之一。而且隨著移動(dòng)通信技術(shù)的發(fā)展和人們對(duì)于信息獲取的移動(dòng)性的需求不斷增加,市場(chǎng)對(duì)于電話語(yǔ)音識(shí)別系統(tǒng)的需求也不斷的增加。因此在新一代呼叫中心的IVR系統(tǒng)中引入了語(yǔ)音識(shí)別技術(shù)作為用戶的輸入手段,用戶可以直接用語(yǔ)音與系統(tǒng)進(jìn)行交互,這樣大大提高了工作效率。

2  系統(tǒng)流程及主要模塊
本系統(tǒng)目標(biāo)是支持多用戶并發(fā)查詢車輛違章信息和駕駛證信息。用戶使用自然的語(yǔ)言說(shuō)出需查詢信息的類別和車牌號(hào)碼,系統(tǒng)識(shí)別后將識(shí)別結(jié)果反饋給用戶,經(jīng)用戶確認(rèn)后,系統(tǒng)把識(shí)別結(jié)果作為后臺(tái)數(shù)據(jù)庫(kù)查詢的關(guān)鍵字進(jìn)行查詢,并將查詢結(jié)果播放給用戶。其流程見(jiàn)圖1。本系統(tǒng)主要包括以下幾個(gè)模塊:

話路處理模塊:以并發(fā)的方式控制和管理各電話話路。

語(yǔ)音識(shí)別模塊:負(fù)責(zé)查詢類別和車牌號(hào)碼的識(shí)別。

后臺(tái)數(shù)據(jù)庫(kù)查詢模塊:將語(yǔ)音識(shí)別的結(jié)果作為數(shù)據(jù)庫(kù)查詢的關(guān)鍵字進(jìn)行查詢。

 


圖1 車輛違章信息和駕駛證信息查詢系統(tǒng)流程圖

3  話路處理模塊的實(shí)現(xiàn)
本系統(tǒng)的硬件部分是由電話語(yǔ)音卡和一臺(tái)PC機(jī)組成,語(yǔ)音卡通過(guò)其提供的語(yǔ)音處理和信令處理能力,來(lái)實(shí)現(xiàn)用戶的接入請(qǐng)求和掛機(jī)信號(hào)的檢測(cè),并負(fù)責(zé)錄音和回放語(yǔ)音。本系統(tǒng)采用的是東進(jìn)D161A語(yǔ)音卡。該語(yǔ)音卡可接入16條模擬電話線,提供16路以內(nèi)的話路并行處理能力。其主要功能有:(1)自動(dòng)增益控制及語(yǔ)音信號(hào)的壓擴(kuò)變換;(2)采集和播放各種格式的電話語(yǔ)音信號(hào),實(shí)現(xiàn)A律PCM、μ律PCM、ADPCM等算法;(3)辨識(shí)和產(chǎn)生DTMF信號(hào);(4)ITU-TSS G3傳真功能。

話路處理的主要任務(wù)是電話振鈴檢測(cè),播放系統(tǒng)提示語(yǔ)音信息,接受用戶的按鍵請(qǐng)求和語(yǔ)音請(qǐng)求,與后臺(tái)數(shù)據(jù)庫(kù)模塊通訊,檢索結(jié)果的語(yǔ)音合成和播放。整個(gè)模塊有點(diǎn)類似于一個(gè)有限狀態(tài)機(jī),在程序設(shè)計(jì)時(shí)要跟蹤系統(tǒng)所處的狀態(tài)進(jìn)行相應(yīng)的動(dòng)作,并進(jìn)入下一個(gè)狀態(tài),其程序流程如圖2所示。

                               

本系統(tǒng)話路處理模塊的關(guān)鍵部分是語(yǔ)音數(shù)據(jù)的實(shí)時(shí)采集。東進(jìn)語(yǔ)音卡在這方面提供了一系列接口函數(shù),如:StartRecordFile、StartRecordFileNew、VR_StartRecord等。這幾個(gè)函數(shù)都能夠?qū)崿F(xiàn)對(duì)通道的錄音,所不同的是前兩個(gè)函數(shù)將語(yǔ)音數(shù)據(jù)保存到磁盤文件,后一個(gè)函數(shù)則將語(yǔ)音數(shù)據(jù)保存到存儲(chǔ)器緩沖區(qū)。由于我們要實(shí)現(xiàn)的是一個(gè)實(shí)時(shí)語(yǔ)音識(shí)別系統(tǒng),因此我們采用后者來(lái)采集語(yǔ)音數(shù)據(jù)。在開(kāi)始錄音之前,我們首先調(diào)用VR_SetEcrMode函數(shù)啟動(dòng)回聲抑制功能,然后每隔一段時(shí)間調(diào)用一次VR_GetRecordData函數(shù)取得錄音數(shù)據(jù),并將其送入語(yǔ)音識(shí)別引擎。當(dāng)語(yǔ)音識(shí)別引擎有識(shí)別結(jié)果返回時(shí),停止錄音,并根據(jù)識(shí)別結(jié)果轉(zhuǎn)入下一個(gè)狀態(tài)。

                                    
圖2 話路處理流程

4  語(yǔ)音識(shí)別模塊的實(shí)現(xiàn)
語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā)可以采用基于模板匹配的動(dòng)態(tài)時(shí)間規(guī)整(DTW)、基于統(tǒng)計(jì)參數(shù)模型的隱馬爾可夫模型(HMM),神經(jīng)網(wǎng)絡(luò)等技術(shù),他們都是針對(duì)某些具體應(yīng)用的,其模型參數(shù)的獲得需要對(duì)大規(guī)模的樣本進(jìn)行學(xué)習(xí),對(duì)于非特定人語(yǔ)音識(shí)別往往需要采集數(shù)百人的語(yǔ)音樣本,其工作量是相當(dāng)大的。隨著語(yǔ)音研究的不斷發(fā)展,已經(jīng)出現(xiàn)了眾多的語(yǔ)音識(shí)別開(kāi)發(fā)工具:如Microsoft Speech SDK,IBM ViaVoice等。他們都提供了語(yǔ)音識(shí)別和語(yǔ)音合成的二次開(kāi)發(fā)平臺(tái),并且微軟的Speech SDK是完全免費(fèi)的,它具有識(shí)別率高,識(shí)別速度快,可移植性好,支持多種語(yǔ)言等優(yōu)點(diǎn)。因此它被廣泛應(yīng)用于各個(gè)領(lǐng)域。

4.1  Microsoft Speech SDK 5.1簡(jiǎn)介
SAPI SDK是微軟公司免費(fèi)提供的語(yǔ)音應(yīng)用開(kāi)發(fā)工具包,這個(gè)SDK中包含了語(yǔ)音應(yīng)用設(shè)計(jì)接口(SAPI)、微軟的連續(xù)語(yǔ)音識(shí)別引擎(MCSR)以及微軟的語(yǔ)音合成(TTS)引擎等等。目前的5.1版本一共可以支持3種語(yǔ)言的識(shí)別 (英語(yǔ),漢語(yǔ)和日語(yǔ))以及2種語(yǔ)言的合成(英語(yǔ)和漢語(yǔ))。SAPI中還包括對(duì)于低層控制和高度適應(yīng)性的直接語(yǔ)音管理、訓(xùn)練向?qū)?、事件、語(yǔ)法編譯、資源、語(yǔ)音識(shí)別(SR)管理以及TTS管理等強(qiáng)大的設(shè)計(jì)接口。

語(yǔ)音識(shí)別的功能主要由一系列COM接口協(xié)調(diào)完成。其中主要的接口有下面這些:

IspRecognizer接口:用于創(chuàng)建語(yǔ)音識(shí)別引擎的實(shí)例,識(shí)別引擎有兩種:獨(dú)占引擎(InProcRecognizer)和共享引擎(SharedRecognizer)。獨(dú)占的引擎對(duì)象是在本程序的進(jìn)程中創(chuàng)建,只能由本應(yīng)用程序使用,而共享的引擎是在一個(gè)單獨(dú)的進(jìn)程中創(chuàng)建,可以供多個(gè)應(yīng)用程序共同使用。

IspRecoContext接口:主要用于接受和發(fā)送與語(yǔ)音識(shí)別消息相關(guān)的事件消息,裝載和卸載識(shí)別語(yǔ)法資源

IspRecoGrammar接口:通過(guò)這個(gè)接口,應(yīng)用程序可以載入并激活語(yǔ)法規(guī)則,而語(yǔ)法規(guī)則里定義了待識(shí)別的單詞、短語(yǔ)和句子。通常語(yǔ)法規(guī)則有兩種:聽(tīng)寫語(yǔ)法(DictationGrammer)和命令控制語(yǔ)法(CommandandControlGrammer)。聽(tīng)寫語(yǔ)法用于連續(xù)語(yǔ)音識(shí)別,可以識(shí)別出引擎詞典中大量的詞匯;命令控制語(yǔ)法用于識(shí)別用戶自定義的詞匯。

IspPhrase接口:通過(guò)這個(gè)接口,應(yīng)用程序可以獲得識(shí)別信息,如:如識(shí)別結(jié)果、識(shí)別的規(guī)則、語(yǔ)義標(biāo)示和屬性信息等。

IspAudioPlug接口:通過(guò)這個(gè)接口,應(yīng)用程序可以將內(nèi)存中的語(yǔ)音數(shù)據(jù)送到語(yǔ)音識(shí)別引擎,進(jìn)行識(shí)別。

4.2  識(shí)別模塊的具體實(shí)現(xiàn)
由于命令控制語(yǔ)法方式可以限制識(shí)別的詞匯量,并且這種識(shí)別技術(shù)不需要對(duì)說(shuō)話人事先進(jìn)行訓(xùn)練,因此在實(shí)際應(yīng)用中具有較高的魯棒性和較高的識(shí)別效率。本系統(tǒng)的識(shí)別詞匯包括:“車輛信息查詢”、“駕駛證信息查詢”和26個(gè)英文字母10個(gè)數(shù)字,我們首先編寫了包含這些特定詞匯的語(yǔ)法文件。

在使用接口函數(shù)前,首先調(diào)用CoInitialize(NULL)初始化COM對(duì)象,然后創(chuàng)建語(yǔ)音識(shí)別引擎、語(yǔ)法規(guī)則上下文和識(shí)別語(yǔ)法,并調(diào)用函數(shù)LoadCmdFromFile裝載文法識(shí)別規(guī)則。微軟識(shí)別引擎是通過(guò)SAPI由事件觸發(fā)來(lái)通知上層的應(yīng)用程序??梢哉{(diào)用SetInterest來(lái)注冊(cè)自己感興趣的事件。系統(tǒng)默認(rèn)的事件為SPEI_RECOGNITION,該事件表明當(dāng)前已有識(shí)別結(jié)果返回,這時(shí)上層應(yīng)用程序可以通過(guò)調(diào)用ISpRecoResult接口的GetText方法獲得識(shí)別結(jié)果。

微軟識(shí)別引擎的語(yǔ)音輸入有多種方式,通常都是通過(guò)聲卡直接輸入,也可以通過(guò)其他語(yǔ)音輸入流。本系統(tǒng)的語(yǔ)音數(shù)據(jù)是從語(yǔ)音卡取得的實(shí)時(shí)數(shù)據(jù),將其存入內(nèi)存,然后通過(guò)調(diào)用ISpAudioPlug的SetData方法將其送入識(shí)別引擎。

4.3  系統(tǒng)實(shí)現(xiàn)的難點(diǎn)和解決方案
車牌的識(shí)別詞匯中包含10個(gè)數(shù)字和26個(gè)英文字母,這些詞匯的發(fā)音有許多是相同或相近的,比如:E和1,R和2,T和7,D和B,M和N,X和S。這些詞匯在識(shí)別時(shí)很容易產(chǎn)生誤識(shí),有的甚至完全不能識(shí)別。如果單從算法上來(lái)考慮,是很難解決這些問(wèn)題的。因此我們考慮從系統(tǒng)的流程出發(fā),當(dāng)用戶認(rèn)為識(shí)別有誤時(shí),可以輸入識(shí)別錯(cuò)誤的位數(shù),然后系統(tǒng)根據(jù)用戶的輸入,提供幾個(gè)備選結(jié)果,供用戶選擇,這樣極大的提高了系統(tǒng)識(shí)別率。

然而Microsoft Speech SDK 5.1在命令控制語(yǔ)法方式下是不提供多選的,只有在聽(tīng)寫方式下才提供多選,但是聽(tīng)寫方式下的詞匯量又無(wú)法限制。對(duì)此我們的想法是這樣的:當(dāng)系統(tǒng)識(shí)別出結(jié)果以后,將有效語(yǔ)音段保存起來(lái),并且把識(shí)別結(jié)果從命令控制方式下的詞匯量中移除,然后將保存有效語(yǔ)音段再次送入識(shí)別引擎,當(dāng)系統(tǒng)識(shí)別出結(jié)果以后,再次重復(fù)以上步驟,直到識(shí)別出給定個(gè)數(shù)的結(jié)果。

5  操作方法
用戶用清晰、自然的語(yǔ)調(diào)說(shuō)出需查詢信息的類別,如:車輛信息查詢、駕駛證信息查詢,系統(tǒng)識(shí)別模塊識(shí)別出結(jié)果后,轉(zhuǎn)入相應(yīng)的信息查詢模塊。當(dāng)用戶需要查詢車輛信息時(shí),首先要求用清晰、較緩慢的語(yǔ)調(diào)說(shuō)出車牌號(hào),系統(tǒng)識(shí)別模塊識(shí)別出結(jié)果后,通過(guò)TTS將結(jié)果播放給用戶。這時(shí)用戶可以輸入車牌號(hào)碼中識(shí)別錯(cuò)誤的位數(shù),系統(tǒng)根據(jù)用戶的輸入提供7個(gè)備選結(jié)果讓用戶進(jìn)行選擇。用戶選擇確認(rèn)無(wú)誤后,系統(tǒng)將結(jié)果遞交給后臺(tái)數(shù)據(jù)庫(kù)進(jìn)行查詢,并將檢索到的信息播放給用戶。

6  試驗(yàn)結(jié)果及分析
對(duì)于信息類別的識(shí)別由于其詞匯量少,音節(jié)較多,所以識(shí)別率很高,達(dá)到了100%。但是對(duì)于字母和數(shù)字的組合識(shí)別,由于其詞匯量較多,音節(jié)簡(jiǎn)單,而且有大量相同和相近的詞匯,很容易受到噪聲的干擾,所以識(shí)別率不是很理想。然而,當(dāng)我們提供七個(gè)備選結(jié)果后,即使在有一定噪音的環(huán)境下,系統(tǒng)的識(shí)別率達(dá)也能達(dá)到96%以上。由此表明該系統(tǒng)是穩(wěn)定的和實(shí)用的。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開(kāi)發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績(jī)預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入7.54億元至8.33億元,同比增長(zhǎng)60.24%至77.03%;歸母凈利潤(rùn)預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國(guó)軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長(zhǎng)59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國(guó))在華深耕經(jīng)營(yíng)12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國(guó)際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國(guó)進(jìn)出口商品交易會(huì)("廣交會(huì)")于"云端"開(kāi)幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過(guò)140,...

關(guān)鍵字: 中國(guó)智造 BSP 手機(jī) CAN

要問(wèn)機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對(duì)是其中的佼佼者。近來(lái)年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開(kāi)發(fā)的機(jī)器人會(huì)后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車

麗思卡爾頓攜旗下首艘游輪Evrima開(kāi)拓行業(yè)全新版圖,傳奇品牌銳意革新締造海上旅行新奢享 上海2022年10月18日 /美通社/ -- 麗思卡爾頓近日宣布開(kāi)啟麗思卡爾頓游輪盛大首航,與全球旅行者共同見(jiàn)證這一傳奇酒店品牌...

關(guān)鍵字: VR RIM EV LDO

測(cè)試測(cè)量

28621 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉