版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第第5章章 多媒體通信系統(tǒng)中的關(guān)鍵技多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 多媒體通信是信息時(shí)代通信的主題,隨著多媒體通信是信息時(shí)代通信的主題,隨著互聯(lián)網(wǎng)業(yè)務(wù)的迅速發(fā)展,電信公司和電視互聯(lián)網(wǎng)業(yè)務(wù)的迅速發(fā)展,電信公司和電視公司都在其運(yùn)營(yíng)的網(wǎng)絡(luò)中開(kāi)放互聯(lián)網(wǎng)通信公司都在其運(yùn)營(yíng)的網(wǎng)絡(luò)中開(kāi)放互聯(lián)網(wǎng)通信業(yè)務(wù)。多媒體技術(shù)的發(fā)展離不開(kāi)相關(guān)技術(shù)業(yè)務(wù)。多媒體技術(shù)的發(fā)展離不開(kāi)相關(guān)技術(shù)的支持,如媒體輸入輸出技術(shù)、超媒體技的支持,如媒體輸入輸出技術(shù)、超媒體技術(shù)、網(wǎng)絡(luò)同步技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)等。下術(shù)、網(wǎng)絡(luò)同步技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)等。下面將逐一介紹這些在
2、多媒體技術(shù)發(fā)展過(guò)程面將逐一介紹這些在多媒體技術(shù)發(fā)展過(guò)程中發(fā)揮著重大作用的關(guān)鍵技術(shù)。中發(fā)揮著重大作用的關(guān)鍵技術(shù)。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.1 多媒體信息輸入輸出技術(shù)多媒體信息輸入輸出技術(shù) 多媒體計(jì)算機(jī)所涉及的多媒體計(jì)算機(jī)所涉及的輸入輸出技術(shù)輸入輸出技術(shù)包括視頻圖包括視頻圖像技術(shù)、音頻技術(shù)、語(yǔ)音技術(shù)、圖形技術(shù)和文本像技術(shù)、音頻技術(shù)、語(yǔ)音技術(shù)、圖形技術(shù)和文本技術(shù)等。技術(shù)等。 多媒體系統(tǒng)通過(guò)一些具有多媒體系統(tǒng)通過(guò)一些具有特定功能的卡特定功能的卡來(lái)支持媒來(lái)支持媒體數(shù)據(jù)的輸入輸出。(如視頻卡、聲卡、體數(shù)據(jù)的輸入輸出。(如視頻卡、聲卡、VGA與與
3、TV轉(zhuǎn)換卡、圖形加速卡、光盤(pán)接口卡等)轉(zhuǎn)換卡、圖形加速卡、光盤(pán)接口卡等) 多媒體計(jì)算機(jī)多媒體計(jì)算機(jī)正是通過(guò)這些卡,完成與各種外部正是通過(guò)這些卡,完成與各種外部設(shè)備的連接,從而形成一個(gè)設(shè)備的連接,從而形成一個(gè)制作和播放制作和播放多媒體應(yīng)多媒體應(yīng)用的工作環(huán)境。用的工作環(huán)境。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.1.1 視頻信息輸入輸出技術(shù)視頻信息輸入輸出技術(shù) 視頻卡是多媒體計(jì)算機(jī)用來(lái)完成視頻信息視頻卡是多媒體計(jì)算機(jī)用來(lái)完成視頻信息輸入輸出功能的主要器件。輸入輸出功能的主要器件。 主要種類主要種類: 電視接收卡電視接收卡 視頻轉(zhuǎn)換視頻轉(zhuǎn)換/捕獲卡捕獲
4、卡 視頻編碼卡視頻編碼卡 MPEG卡卡實(shí)際應(yīng)用中常把多種功能集成于一塊卡中實(shí)際應(yīng)用中常把多種功能集成于一塊卡中多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)1. 視頻卡的基本工作原理視頻卡的基本工作原理選選擇擇視視頻頻源源ADCADCVRAMVRAM顯示器顯示器DACDACVGAVGA卡卡視頻視頻處理芯片處理芯片PC總線總線視頻源視頻源0 0視頻源視頻源1 1視頻源視頻源2 2錄像機(jī)錄像機(jī)影碟機(jī)影碟機(jī)攝像機(jī)攝像機(jī)I/O多制式多制式數(shù)字解碼器數(shù)字解碼器RGB用于視頻信號(hào)用于視頻信號(hào)捕獲、播放和捕獲、播放和顯示的專用控顯示的專用控制芯片制芯片可以完成輸入信號(hào)的
5、裁剪、比例可以完成輸入信號(hào)的裁剪、比例變化、變化、VGA同步、色鍵控制、同步、色鍵控制、PC總線接口和對(duì)幀存儲(chǔ)器的操作總線接口和對(duì)幀存儲(chǔ)器的操作視頻隨機(jī)視頻隨機(jī)訪問(wèn)存儲(chǔ)器訪問(wèn)存儲(chǔ)器數(shù)模轉(zhuǎn)換數(shù)模轉(zhuǎn)換多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)2. 常用視頻卡常用視頻卡 視頻接收卡(電視接收卡)視頻接收卡(電視接收卡) 一般與視頻轉(zhuǎn)換一般與視頻轉(zhuǎn)換/捕獲卡組合在一起捕獲卡組合在一起電視電視信號(hào)信號(hào)高頻高頻調(diào)諧器調(diào)諧器模擬模擬視頻信號(hào)視頻信號(hào)視頻視頻數(shù)字化數(shù)字化幀存儲(chǔ)器幀存儲(chǔ)器VGA卡卡數(shù)字?jǐn)?shù)字視頻信號(hào)視頻信號(hào)顯示器顯示器模擬信號(hào)模擬信號(hào)VGA RGB數(shù)字信號(hào)
6、數(shù)字信號(hào)主要功能:主要功能:接收電視臺(tái)發(fā)送的電視信號(hào);將模擬電視信號(hào)數(shù)字化后疊加接收電視臺(tái)發(fā)送的電視信號(hào);將模擬電視信號(hào)數(shù)字化后疊加顯示在顯示在VGA中并完成最后的顯示。中并完成最后的顯示。接收電視臺(tái)發(fā)接收電視臺(tái)發(fā)送的電視信號(hào)送的電視信號(hào)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 視頻轉(zhuǎn)換視頻轉(zhuǎn)換/捕獲卡捕獲卡 視頻轉(zhuǎn)換卡視頻轉(zhuǎn)換卡完成計(jì)算機(jī)視頻信號(hào)和電視視頻完成計(jì)算機(jī)視頻信號(hào)和電視視頻信號(hào)間的轉(zhuǎn)換信號(hào)間的轉(zhuǎn)換 完成由計(jì)算機(jī)的完成由計(jì)算機(jī)的VGA信號(hào)到各種標(biāo)準(zhǔn)制式的電視信號(hào)到各種標(biāo)準(zhǔn)制式的電視信號(hào)的轉(zhuǎn)換并在電視機(jī)上播放或進(jìn)行錄像(信號(hào)的轉(zhuǎn)換并在電視機(jī)上
7、播放或進(jìn)行錄像(PC-TV,VGA-TV) 完成將標(biāo)準(zhǔn)的各種制式電視信號(hào)轉(zhuǎn)換成計(jì)算機(jī)屏完成將標(biāo)準(zhǔn)的各種制式電視信號(hào)轉(zhuǎn)換成計(jì)算機(jī)屏幕上顯示的幕上顯示的VGA信號(hào)(信號(hào)(TV-VGA) 該類卡在電視上的顯示質(zhì)量不能與專業(yè)視頻該類卡在電視上的顯示質(zhì)量不能與專業(yè)視頻卡相比,且有些轉(zhuǎn)換卡不能在卡相比,且有些轉(zhuǎn)換卡不能在VGA和和TV上同時(shí)輸上同時(shí)輸出視頻圖像。出視頻圖像。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 視頻轉(zhuǎn)換視頻轉(zhuǎn)換/捕獲卡捕獲卡 視頻捕獲卡視頻捕獲卡主要功能是從視頻圖像信息中實(shí)主要功能是從視頻圖像信息中實(shí)時(shí)或非實(shí)時(shí)地捕獲靜態(tài)或短時(shí)間的動(dòng)態(tài)視頻時(shí)或
8、非實(shí)時(shí)地捕獲靜態(tài)或短時(shí)間的動(dòng)態(tài)視頻圖像。圖像。視頻轉(zhuǎn)換視頻轉(zhuǎn)換/捕獲卡的基本原理捕獲卡的基本原理:A/D轉(zhuǎn)換轉(zhuǎn)換解碼解碼YUV矩陣變換矩陣變換RGB幀存儲(chǔ)器幀存儲(chǔ)器VGA卡卡顏色查找表顏色查找表D/A轉(zhuǎn)換器轉(zhuǎn)換器顯示器顯示器VGA輸入輸入視頻信號(hào)視頻信號(hào) 輸入輸入多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) MPEG卡卡 壓縮卡:對(duì)靜止和動(dòng)態(tài)圖像按照相應(yīng)的標(biāo)準(zhǔn)進(jìn)行實(shí)時(shí)壓縮卡:對(duì)靜止和動(dòng)態(tài)圖像按照相應(yīng)的標(biāo)準(zhǔn)進(jìn)行實(shí)時(shí)和非實(shí)時(shí)的壓縮和還原處理。和非實(shí)時(shí)的壓縮和還原處理。 解壓縮卡(影碟卡):把解壓縮卡(影碟卡):把MPEG文件進(jìn)行解壓縮并恢文件進(jìn)行解壓縮并恢復(fù)
9、播放。它可以播放復(fù)播放。它可以播放MPEG-1標(biāo)準(zhǔn)壓縮的數(shù)字影視片標(biāo)準(zhǔn)壓縮的數(shù)字影視片(如(如VCD)。)。 視頻卡發(fā)展方向視頻卡發(fā)展方向 與影視技術(shù)的結(jié)合:可以在一塊高檔卡上集成視頻輸與影視技術(shù)的結(jié)合:可以在一塊高檔卡上集成視頻輸入輸出、壓縮和解壓縮、特技效果及視頻編輯功能。入輸出、壓縮和解壓縮、特技效果及視頻編輯功能。 與網(wǎng)絡(luò)通信技術(shù)結(jié)合:完成多媒體視頻會(huì)議、可視電與網(wǎng)絡(luò)通信技術(shù)結(jié)合:完成多媒體視頻會(huì)議、可視電話和多媒體通信功能話和多媒體通信功能多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)3. 攝像頭攝像頭 針對(duì)網(wǎng)絡(luò)視頻應(yīng)用針對(duì)網(wǎng)絡(luò)視頻應(yīng)用 模擬攝像
10、頭模擬攝像頭:獲得的視頻信號(hào)必須通過(guò)計(jì)算機(jī)的視頻卡數(shù)獲得的視頻信號(hào)必須通過(guò)計(jì)算機(jī)的視頻卡數(shù)字化并壓縮才能送進(jìn)計(jì)算機(jī)進(jìn)行處理。字化并壓縮才能送進(jìn)計(jì)算機(jī)進(jìn)行處理。 數(shù)字?jǐn)z像頭數(shù)字?jǐn)z像頭:直接捕捉視頻圖像,然后通過(guò)直接捕捉視頻圖像,然后通過(guò)USB或或IEEE1394高速接口輸入計(jì)算機(jī)。高速接口輸入計(jì)算機(jī)。 工作原理工作原理:外界景物通過(guò)鏡頭生成光學(xué)圖像,再投射到圖外界景物通過(guò)鏡頭生成光學(xué)圖像,再投射到圖像傳感器表明轉(zhuǎn)換為模擬信號(hào),經(jīng)像傳感器表明轉(zhuǎn)換為模擬信號(hào),經(jīng)A/D變換轉(zhuǎn)為數(shù)字圖像信變換轉(zhuǎn)為數(shù)字圖像信號(hào),送到數(shù)字處理芯片號(hào),送到數(shù)字處理芯片DSP進(jìn)行加工,在通過(guò)與計(jì)算機(jī)的接進(jìn)行加工,在通過(guò)與計(jì)算機(jī)
11、的接口傳輸?shù)接?jì)算機(jī)中進(jìn)行處理,最后通過(guò)顯示器顯示。口傳輸?shù)接?jì)算機(jī)中進(jìn)行處理,最后通過(guò)顯示器顯示。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 主要性能指標(biāo)主要性能指標(biāo) 攝像器件:攝像器件:CCD(成像質(zhì)量高)(成像質(zhì)量高),CMOS 像素分辨率:像素分辨率:30萬(wàn)、萬(wàn)、130萬(wàn)。萬(wàn)。 顏色深度:顏色深度:24真彩、真彩、30真彩。真彩。 視頻捕獲速度:幀率,影響流暢度視頻捕獲速度:幀率,影響流暢度 接口方式:接口方式:USB速度快,連接簡(jiǎn)單,即插拔速度快,連接簡(jiǎn)單,即插拔多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)
12、4. 投影儀投影儀 多媒體顯示設(shè)備多媒體顯示設(shè)備 分類分類 CRT:實(shí)現(xiàn)最早、應(yīng)用最廣、技術(shù)成熟、分辨率高實(shí)現(xiàn)最早、應(yīng)用最廣、技術(shù)成熟、分辨率高亮度較低、機(jī)身體積大、對(duì)焦匯聚調(diào)整復(fù)雜亮度較低、機(jī)身體積大、對(duì)焦匯聚調(diào)整復(fù)雜 LCD:體積小、重量輕、便攜、亮度高、色彩豐富體積小、重量輕、便攜、亮度高、色彩豐富 DLP:畫(huà)面質(zhì)量穩(wěn)定、圖像顯示細(xì)膩畫(huà)面質(zhì)量穩(wěn)定、圖像顯示細(xì)膩多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 技術(shù)指標(biāo)技術(shù)指標(biāo)亮度亮度分辨率分辨率燈泡壽命燈泡壽命多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.1.2
13、 音頻信息輸入輸出技術(shù)音頻信息輸入輸出技術(shù) 實(shí)現(xiàn):音頻卡(聲卡),安裝在實(shí)現(xiàn):音頻卡(聲卡),安裝在PC內(nèi)部使內(nèi)部使PC發(fā)發(fā)出各種聲音的硬件板卡,是出各種聲音的硬件板卡,是PC進(jìn)行所有與聲音進(jìn)行所有與聲音相關(guān)處理的硬件設(shè)備。相關(guān)處理的硬件設(shè)備。 音頻卡工作原理音頻卡工作原理混音器混音器總線接口芯片總線接口芯片A D數(shù)字音頻數(shù)字音頻處理芯片處理芯片音樂(lè)音樂(lè)合成器合成器話筒輸入話筒輸入線性輸入線性輸入揚(yáng)聲器輸出揚(yáng)聲器輸出線性輸出線性輸出MIDI接口接口CD接口接口計(jì)算機(jī)總線計(jì)算機(jī)總線為各個(gè)部分與總線間提供握為各個(gè)部分與總線間提供握手信號(hào),緩沖(聲卡與總線手信號(hào),緩沖(聲卡與總線間指令和數(shù)據(jù)的傳送)
14、間指令和數(shù)據(jù)的傳送)記記錄錄播播放放用軟件控制音量用軟件控制音量將數(shù)字音頻的波形數(shù)據(jù)將數(shù)字音頻的波形數(shù)據(jù)和和MIDI信息合成為聲音信息合成為聲音多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 音頻卡的主要功能音頻卡的主要功能 錄制和播放聲音文件錄制和播放聲音文件 對(duì)聲音文件進(jìn)行編輯和合成對(duì)聲音文件進(jìn)行編輯和合成 倒播、增加回音、淡入淡出、循環(huán)放音、交換聲道等倒播、增加回音、淡入淡出、循環(huán)放音、交換聲道等 對(duì)數(shù)字聲音文件進(jìn)行壓縮和解壓縮對(duì)數(shù)字聲音文件進(jìn)行壓縮和解壓縮 MIDI音樂(lè)錄制和合成音樂(lè)錄制和合成 利用計(jì)算機(jī)完成對(duì)外部電子樂(lè)器的操作和控制利用計(jì)算機(jī)完成
15、對(duì)外部電子樂(lè)器的操作和控制 文語(yǔ)轉(zhuǎn)換和語(yǔ)音識(shí)別文語(yǔ)轉(zhuǎn)換和語(yǔ)音識(shí)別 讓計(jì)算機(jī)朗讀文本和讓計(jì)算機(jī)聽(tīng)懂聲音信息讓計(jì)算機(jī)朗讀文本和讓計(jì)算機(jī)聽(tīng)懂聲音信息多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 聲卡的主要作用聲卡的主要作用是對(duì)聲音信息進(jìn)行錄制和回是對(duì)聲音信息進(jìn)行錄制和回放放 可支持的采樣頻率可支持的采樣頻率 8kHz,11.025kHz針對(duì)一般語(yǔ)音質(zhì)量的要求針對(duì)一般語(yǔ)音質(zhì)量的要求 16kHz,22.05kHz,32kHz針對(duì)普通音樂(lè)效果針對(duì)普通音樂(lè)效果 44.10kHz,48kHz針對(duì)高保真音樂(lè)效果針對(duì)高保真音樂(lè)效果多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多
16、媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.1.3 語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù) 語(yǔ)音識(shí)別技術(shù)語(yǔ)音識(shí)別技術(shù) 狹義語(yǔ)音識(shí)別:排除不同人的發(fā)音差異,提取代表語(yǔ)音狹義語(yǔ)音識(shí)別:排除不同人的發(fā)音差異,提取代表語(yǔ)音的共性特征。的共性特征。 說(shuō)話人語(yǔ)音識(shí)別:尋求說(shuō)話者的個(gè)性特征以辨別說(shuō)話人說(shuō)話人語(yǔ)音識(shí)別:尋求說(shuō)話者的個(gè)性特征以辨別說(shuō)話人的身份。的身份。 最早的語(yǔ)音識(shí)別系統(tǒng)出現(xiàn)在最早的語(yǔ)音識(shí)別系統(tǒng)出現(xiàn)在1955年(年(Bell)。隨著)。隨著識(shí)別技術(shù)的發(fā)展,一些研究機(jī)構(gòu)相繼推出語(yǔ)音識(shí)別識(shí)別技術(shù)的發(fā)展,一些研究機(jī)構(gòu)相繼推出語(yǔ)音識(shí)別系統(tǒng):系統(tǒng):IBM的的Via Vioce系統(tǒng);劍橋大學(xué)的系統(tǒng);劍
17、橋大學(xué)的HTK系統(tǒng);系統(tǒng);微軟的微軟的Whisper系統(tǒng)等。系統(tǒng)等。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 語(yǔ)音識(shí)別技術(shù)語(yǔ)音識(shí)別技術(shù)預(yù)處理預(yù)處理特征提取特征提取模式匹配模式匹配訓(xùn)練訓(xùn)練模式庫(kù)模式庫(kù)語(yǔ)音輸入語(yǔ)音輸入識(shí)別結(jié)果識(shí)別結(jié)果語(yǔ)音信息的采樣、反混疊帶語(yǔ)音信息的采樣、反混疊帶通濾波、去除個(gè)體發(fā)音差異通濾波、去除個(gè)體發(fā)音差異和去除設(shè)備環(huán)境引起的噪聲和去除設(shè)備環(huán)境引起的噪聲完成語(yǔ)音中反映本完成語(yǔ)音中反映本質(zhì)特征的聲學(xué)參數(shù)質(zhì)特征的聲學(xué)參數(shù)從原始語(yǔ)音樣本從原始語(yǔ)音樣本中去除冗余信息中去除冗余信息聚聚類類按照一定的規(guī)則按照一定的規(guī)則和專家知識(shí)計(jì)算和專家知識(shí)計(jì)
18、算輸入特征與庫(kù)存輸入特征與庫(kù)存模式之間的相似模式之間的相似程度,進(jìn)而判斷程度,進(jìn)而判斷輸入的語(yǔ)意信息輸入的語(yǔ)意信息多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 語(yǔ)音識(shí)別系統(tǒng)的分類語(yǔ)音識(shí)別系統(tǒng)的分類 按可識(shí)別詞匯量的多少:按可識(shí)別詞匯量的多少:100以下,以下,100-1000,1000以上以上 按語(yǔ)音的輸入方式:孤立詞、連接詞、連續(xù)詞按語(yǔ)音的輸入方式:孤立詞、連接詞、連續(xù)詞 按發(fā)音者類型:特定人、限定人、非特定人按發(fā)音者類型:特定人、限定人、非特定人 按發(fā)音者的聲紋:根據(jù)語(yǔ)音識(shí)別說(shuō)話人身份按發(fā)音者的聲紋:根據(jù)語(yǔ)音識(shí)別說(shuō)話人身份多媒體通信技術(shù):多媒體通信系
19、統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音識(shí)別過(guò)程語(yǔ)音識(shí)別過(guò)程 基于模式匹配方法的語(yǔ)音識(shí)別基本過(guò)程分為兩步:基于模式匹配方法的語(yǔ)音識(shí)別基本過(guò)程分為兩步: 第一步,第一步,建立標(biāo)準(zhǔn)語(yǔ)音庫(kù)建立標(biāo)準(zhǔn)語(yǔ)音庫(kù)(標(biāo)準(zhǔn)語(yǔ)音模板),系統(tǒng)(標(biāo)準(zhǔn)語(yǔ)音模板),系統(tǒng)首先建立有若干訓(xùn)練語(yǔ)句的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)庫(kù)供訓(xùn)練首先建立有若干訓(xùn)練語(yǔ)句的標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)庫(kù)供訓(xùn)練者使用,即訓(xùn)練;者使用,即訓(xùn)練; 第二步,將輸入的語(yǔ)音信號(hào)經(jīng)過(guò)處理后與標(biāo)準(zhǔn)語(yǔ)音第二步,將輸入的語(yǔ)音信號(hào)經(jīng)過(guò)處理后與標(biāo)準(zhǔn)語(yǔ)音模板相模板相匹配匹配,即識(shí)別,包括失真估計(jì)、識(shí)別決策和,即識(shí)別,包括失真估計(jì)、識(shí)別決策和專家知識(shí)運(yùn)用;專家知識(shí)運(yùn)用; 建立語(yǔ)音模板
20、的方法:根據(jù)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)要建立語(yǔ)音模板的方法:根據(jù)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)要求求選擇一種識(shí)別方法選擇一種識(shí)別方法;然后從輸入的語(yǔ)音信號(hào)中提;然后從輸入的語(yǔ)音信號(hào)中提取這種識(shí)別方法要求的取這種識(shí)別方法要求的語(yǔ)言特征參數(shù)語(yǔ)言特征參數(shù);將這些;將這些特征特征參數(shù)存儲(chǔ)參數(shù)存儲(chǔ)起來(lái)形成語(yǔ)音模板。起來(lái)形成語(yǔ)音模板。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音識(shí)別過(guò)程語(yǔ)音識(shí)別過(guò)程 常用的模板匹配方法是常用的模板匹配方法是概率統(tǒng)計(jì)概率統(tǒng)計(jì)方法。方法。 它將未知語(yǔ)音的它將未知語(yǔ)音的特征參數(shù)與模板一一比較特征參數(shù)與模板一一比較,根據(jù),根據(jù)失真測(cè)度最小的原則失真測(cè)度最小的
21、原則判斷匹配結(jié)果。判斷匹配結(jié)果。 當(dāng)決策失敗,可運(yùn)用專家知識(shí)做出判決。整個(gè)訓(xùn)當(dāng)決策失敗,可運(yùn)用專家知識(shí)做出判決。整個(gè)訓(xùn)練和識(shí)別過(guò)程如圖練和識(shí)別過(guò)程如圖語(yǔ)音信號(hào)輸入語(yǔ)音信號(hào)輸入預(yù)處理預(yù)處理特征分析特征分析與提取與提取模式匹配模式匹配識(shí)別決策識(shí)別決策識(shí)別輸出識(shí)別輸出標(biāo)準(zhǔn)模板標(biāo)準(zhǔn)模板專家知識(shí)專家知識(shí)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音識(shí)別過(guò)程語(yǔ)音識(shí)別過(guò)程 語(yǔ)音識(shí)別由三個(gè)技術(shù)模塊組成,即語(yǔ)音識(shí)別由三個(gè)技術(shù)模塊組成,即特征提特征提取、模式匹配和標(biāo)準(zhǔn)模板庫(kù)生成取、模式匹配和標(biāo)準(zhǔn)模板庫(kù)生成。 這三大技術(shù)模塊涉及的技術(shù)包括三個(gè)方面:這三大技術(shù)模塊涉及的技術(shù)包
22、括三個(gè)方面: 1、語(yǔ)音識(shí)別單元的選擇、語(yǔ)音識(shí)別單元的選擇 2、特征數(shù)據(jù)類型的選擇、特征數(shù)據(jù)類型的選擇 3、模式匹配方法與模型訓(xùn)練技術(shù)、模式匹配方法與模型訓(xùn)練技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì)語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì) 語(yǔ)音識(shí)別技術(shù)經(jīng)過(guò)全球半個(gè)多世紀(jì)的研究,語(yǔ)音識(shí)別技術(shù)經(jīng)過(guò)全球半個(gè)多世紀(jì)的研究,目前已經(jīng)發(fā)展到了接近實(shí)用的階段。在實(shí)目前已經(jīng)發(fā)展到了接近實(shí)用的階段。在實(shí)驗(yàn)室環(huán)境下,大詞匯驗(yàn)室環(huán)境下,大詞匯 量的朗讀式連續(xù)說(shuō)話量的朗讀式連續(xù)說(shuō)話的寬帶語(yǔ)音信號(hào)的平均識(shí)別率可以達(dá)到的寬帶語(yǔ)音信號(hào)的平均識(shí)別率可以達(dá)到 90%以上。以上。
23、 在這樣的水平基礎(chǔ)上,在這樣的水平基礎(chǔ)上, 語(yǔ)音識(shí)語(yǔ)音識(shí)別技別技 術(shù)開(kāi)始嘗試從實(shí)驗(yàn)室演示系統(tǒng)走向?qū)嵭g(shù)開(kāi)始嘗試從實(shí)驗(yàn)室演示系統(tǒng)走向?qū)嵱没唐?。但是語(yǔ)音識(shí)別技術(shù)要進(jìn)入成熟用化商品。但是語(yǔ)音識(shí)別技術(shù)要進(jìn)入成熟的商業(yè)運(yùn)用還有一段艱難的的商業(yè)運(yùn)用還有一段艱難的 路程,還必須路程,還必須在很多方面取得突破性進(jìn)展。在很多方面取得突破性進(jìn)展。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)突破性進(jìn)展表現(xiàn)為:突破性進(jìn)展表現(xiàn)為:1.提高可靠性提高可靠性2.增加詞匯量增加詞匯量3.應(yīng)用拓展應(yīng)用拓展4.降低成本減小體積降低成本減小體積多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體
24、通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 目前,全球語(yǔ)音技術(shù)市場(chǎng)規(guī)模超過(guò)目前,全球語(yǔ)音技術(shù)市場(chǎng)規(guī)模超過(guò)30億美元,近年來(lái)年億美元,近年來(lái)年增長(zhǎng)率保持在增長(zhǎng)率保持在25%以上,未來(lái)語(yǔ)音識(shí)別市場(chǎng)被看好,其中電以上,未來(lái)語(yǔ)音識(shí)別市場(chǎng)被看好,其中電信行業(yè)(信行業(yè)(Vo IP等),移動(dòng)應(yīng)用領(lǐng)域(手機(jī)、學(xué)習(xí)機(jī)、平板等),移動(dòng)應(yīng)用領(lǐng)域(手機(jī)、學(xué)習(xí)機(jī)、平板電腦、車載系統(tǒng)等移動(dòng)設(shè)備),都會(huì)呈現(xiàn)出爆發(fā)式增長(zhǎng)。下電腦、車載系統(tǒng)等移動(dòng)設(shè)備),都會(huì)呈現(xiàn)出爆發(fā)式增長(zhǎng)。下面列舉幾個(gè)電信及移動(dòng)應(yīng)用領(lǐng)域成功的語(yǔ)音產(chǎn)品面列舉幾個(gè)電信及移動(dòng)應(yīng)用領(lǐng)域成功的語(yǔ)音產(chǎn)品/軟件。軟件。1、電信行業(yè):電話銀行系統(tǒng)、電信行業(yè):電話銀行系統(tǒng)2、移動(dòng)應(yīng)
25、用領(lǐng)域:、移動(dòng)應(yīng)用領(lǐng)域:Siri3、生活領(lǐng)域:手機(jī)、生活領(lǐng)域:手機(jī)“導(dǎo)游導(dǎo)游”多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 21 世紀(jì)是信息和網(wǎng)絡(luò)的時(shí)代,世紀(jì)是信息和網(wǎng)絡(luò)的時(shí)代,Internet、寬帶、寬帶 IP 網(wǎng)、公用電話網(wǎng)、移動(dòng)電話網(wǎng)把全球各地連接起網(wǎng)、公用電話網(wǎng)、移動(dòng)電話網(wǎng)把全球各地連接起來(lái),巨來(lái),巨 大的信息資源能夠通過(guò)網(wǎng)絡(luò)在短暫時(shí)間內(nèi)迅大的信息資源能夠通過(guò)網(wǎng)絡(luò)在短暫時(shí)間內(nèi)迅速擴(kuò)散到全球范圍,幾乎所有人與機(jī)器進(jìn)行信息交速擴(kuò)散到全球范圍,幾乎所有人與機(jī)器進(jìn)行信息交互相關(guān)的需互相關(guān)的需 求和服務(wù),例如自然口語(yǔ)對(duì)話、信息索求和服務(wù),例如自然口語(yǔ)對(duì)話、
26、信息索取、電子商務(wù)、數(shù)字圖書(shū)館、遠(yuǎn)程教育、語(yǔ)音翻譯取、電子商務(wù)、數(shù)字圖書(shū)館、遠(yuǎn)程教育、語(yǔ)音翻譯等,都可能會(huì)在等,都可能會(huì)在 網(wǎng)絡(luò)上實(shí)現(xiàn)。網(wǎng)絡(luò)上實(shí)現(xiàn)。 語(yǔ)音識(shí)別技術(shù)研究和應(yīng)用的重要發(fā)展趨勢(shì)是,語(yǔ)音識(shí)別技術(shù)研究和應(yīng)用的重要發(fā)展趨勢(shì)是,讓人在任何地方,任何時(shí)間,對(duì)任何事都能夠讓人在任何地方,任何時(shí)間,對(duì)任何事都能夠 通過(guò)通過(guò)語(yǔ)音交互的方式,更加方便地享受到更多的社會(huì)信語(yǔ)音交互的方式,更加方便地享受到更多的社會(huì)信息資源和現(xiàn)代化服務(wù)。人類將越來(lái)越多地體驗(yàn)到語(yǔ)息資源和現(xiàn)代化服務(wù)。人類將越來(lái)越多地體驗(yàn)到語(yǔ) 音識(shí)別技術(shù)可能的便捷優(yōu)點(diǎn)。音識(shí)別技術(shù)可能的便捷優(yōu)點(diǎn)。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通
27、信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成語(yǔ)音合成 什么是語(yǔ)音合成?什么是語(yǔ)音合成? 語(yǔ)音合成語(yǔ)音合成就是讓計(jì)算機(jī)象人那樣講話。就是讓計(jì)算機(jī)象人那樣講話。 人們用語(yǔ)言進(jìn)行交流時(shí),用聲音來(lái)表達(dá)自己的意人們用語(yǔ)言進(jìn)行交流時(shí),用聲音來(lái)表達(dá)自己的意向、情感。例如:向、情感。例如:如某人問(wèn)你:你愿意和我一起去看電影嗎?如某人問(wèn)你:你愿意和我一起去看電影嗎?你的回答可能是:你的回答可能是:“是的,我很高興和你一起去看電影。是的,我很高興和你一起去看電影?!保隙?,高興)(肯定,高興)“抱歉,我不能和你一起去看電影,因?yàn)槲乙ラ_(kāi)會(huì)。抱歉,我不能和你一起去看電影,因?yàn)槲乙ラ_(kāi)會(huì)?!保o(wú)可奈何)(無(wú)可奈何)“不
28、去,還是你自己去看吧。不去,還是你自己去看吧?!保ǚ穸ǎǚ穸ǎ?這三句話表達(dá)了不同的意向和情感。這三句話表達(dá)了不同的意向和情感。計(jì)算機(jī)也應(yīng)計(jì)算機(jī)也應(yīng)該像人那樣來(lái)回答該像人那樣來(lái)回答。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 語(yǔ)音合成的研究目標(biāo)是:語(yǔ)音合成的研究目標(biāo)是: 可懂可懂 清晰清晰 自然自然 具有表現(xiàn)力具有表現(xiàn)力 研究意義研究意義 語(yǔ)音合成技術(shù)可以大大改善人機(jī)交互環(huán)境語(yǔ)音合成技術(shù)可以大大改善人機(jī)交互環(huán)境 計(jì)算機(jī)反饋信息的方式是屏幕顯示。這種單調(diào)的信息輸出計(jì)算機(jī)反饋信息的方式是屏幕顯示。這種單調(diào)的信息輸出方式給用戶帶來(lái)許多不便,特別是長(zhǎng)時(shí)間地注
29、視顯示屏使方式給用戶帶來(lái)許多不便,特別是長(zhǎng)時(shí)間地注視顯示屏使人疲勞,降低人獲取信息和理解信息的能力。人疲勞,降低人獲取信息和理解信息的能力。 網(wǎng)絡(luò)環(huán)境的輸出設(shè)備多種多樣:這種枯燥單一的交互方式網(wǎng)絡(luò)環(huán)境的輸出設(shè)備多種多樣:這種枯燥單一的交互方式影響了計(jì)算機(jī)的應(yīng)用。影響了計(jì)算機(jī)的應(yīng)用。 計(jì)算機(jī)語(yǔ)音輸出能提供聲文并茂的信息表示方式,可以改計(jì)算機(jī)語(yǔ)音輸出能提供聲文并茂的信息表示方式,可以改變?nèi)藱C(jī)交互變?nèi)藱C(jī)交互“默默無(wú)聞默默無(wú)聞”的狀況,為計(jì)算機(jī)的普及應(yīng)用創(chuàng)的狀況,為計(jì)算機(jī)的普及應(yīng)用創(chuàng)造更好的條件。造更好的條件。 將將“能看到能看到”、“看不到看不到”的信息變成的信息變成“可聽(tīng)可聽(tīng)”的的信息信息 將將“
30、非即時(shí)獲得的信息非即時(shí)獲得的信息”變成變成“即時(shí)可聽(tīng)即時(shí)可聽(tīng)”的信息的信息多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 語(yǔ)音合成是一門(mén)跨學(xué)科的前沿技術(shù),涉及語(yǔ)音合成是一門(mén)跨學(xué)科的前沿技術(shù),涉及到下列相關(guān)研究領(lǐng)域:到下列相關(guān)研究領(lǐng)域: 它將上述領(lǐng)域的研究成果結(jié)合在一起,使它將上述領(lǐng)域的研究成果結(jié)合在一起,使計(jì)算機(jī)具備說(shuō)話的能力。計(jì)算機(jī)具備說(shuō)話的能力。自然語(yǔ)言理自然語(yǔ)言理解解語(yǔ)言學(xué)語(yǔ)言學(xué)語(yǔ)音學(xué)語(yǔ)音學(xué)信號(hào)處理信號(hào)處理心理學(xué)心理學(xué)聲聲學(xué)學(xué) 多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成技術(shù)語(yǔ)音合成技術(shù) 實(shí)現(xiàn)的方式實(shí)現(xiàn)
31、的方式 錄音錄音/重放模式重放模式 利用數(shù)字信號(hào)處理技術(shù),采用參數(shù)合成的方式來(lái)實(shí)現(xiàn)語(yǔ)利用數(shù)字信號(hào)處理技術(shù),采用參數(shù)合成的方式來(lái)實(shí)現(xiàn)語(yǔ)音合成音合成 語(yǔ)音合成的三個(gè)層次語(yǔ)音合成的三個(gè)層次 從文本到語(yǔ)音從文本到語(yǔ)音 從概念到語(yǔ)音從概念到語(yǔ)音 從意向到語(yǔ)音從意向到語(yǔ)音多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 有限詞匯的計(jì)算機(jī)語(yǔ)音輸出有限詞匯的計(jì)算機(jī)語(yǔ)音輸出 語(yǔ)音報(bào)時(shí)、公共汽車報(bào)站、叫號(hào)系統(tǒng)語(yǔ)音報(bào)時(shí)、公共汽車報(bào)站、叫號(hào)系統(tǒng) 基于語(yǔ)音合成技術(shù)的文語(yǔ)轉(zhuǎn)化(基于語(yǔ)音合成技術(shù)的文語(yǔ)轉(zhuǎn)化(TTS) 除了完成文字到語(yǔ)音的映射外,還要完成對(duì)書(shū)面文除了完成文字到語(yǔ)音的映射外,
32、還要完成對(duì)書(shū)面文字的理解以及對(duì)語(yǔ)音韻律的處理字的理解以及對(duì)語(yǔ)音韻律的處理多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 文語(yǔ)轉(zhuǎn)換技術(shù)文語(yǔ)轉(zhuǎn)換技術(shù) 有聲電子文檔、信息電話查詢系統(tǒng)、基于計(jì)算機(jī)的有聲電子文檔、信息電話查詢系統(tǒng)、基于計(jì)算機(jī)的辦公教學(xué)娛樂(lè)多媒體軟件、嵌入式操作系統(tǒng)。辦公教學(xué)娛樂(lè)多媒體軟件、嵌入式操作系統(tǒng)。 包括文本分析、韻律生成、語(yǔ)音合成包括文本分析、韻律生成、語(yǔ)音合成 文本分析:使計(jì)算機(jī)認(rèn)識(shí)文字、如何發(fā)音、用什么發(fā)音文本分析:使計(jì)算機(jī)認(rèn)識(shí)文字、如何發(fā)音、用什么發(fā)音 韻律生成:生成發(fā)聲文本的韻律特征(聲調(diào)、停頓等)韻律生成:生成發(fā)聲文本的韻律特征(
33、聲調(diào)、停頓等) 語(yǔ)音合成:語(yǔ)音合成:多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 6.7 專用語(yǔ)音合成硬件專用語(yǔ)音合成硬件多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)一個(gè)合成系統(tǒng)一個(gè)合成系統(tǒng)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成有著廣闊的應(yīng)用前景語(yǔ)音合成有著廣闊的應(yīng)用前景 它可應(yīng)用于:它可應(yīng)用于: 盲人計(jì)算機(jī),電話信息查詢,文本校對(duì),專盲人計(jì)算機(jī),電話信息查詢,文本校對(duì),專家系統(tǒng)的有聲輸出、火車站、飛機(jī)場(chǎng)的航班信息家系統(tǒng)的有聲輸出、火車站、飛機(jī)場(chǎng)的航班信息報(bào)告等
34、領(lǐng)域。報(bào)告等領(lǐng)域。 有限詞匯語(yǔ)音合成的應(yīng)用有限詞匯語(yǔ)音合成的應(yīng)用語(yǔ)音手表(鬧鐘)、玩具、教具語(yǔ)音手表(鬧鐘)、玩具、教具儀器儀器/電器(打印機(jī)、微波爐)電器(打印機(jī)、微波爐) 有聲信息發(fā)布有聲信息發(fā)布車站列車、機(jī)場(chǎng)航班信息發(fā)布車站列車、機(jī)場(chǎng)航班信息發(fā)布114的電話號(hào)碼報(bào)出的電話號(hào)碼報(bào)出辦公系統(tǒng)中的有聲信息辦公系統(tǒng)中的有聲信息多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 6.8語(yǔ)音合成的應(yīng)用語(yǔ)音合成的應(yīng)用 基于基于PCPC的辦公、教學(xué)和娛樂(lè)等多媒體軟件的辦公、教學(xué)和娛樂(lè)等多媒體軟件 聲訊服務(wù)領(lǐng)域的智能電話查詢,包括:股市查詢、工商信聲訊服務(wù)領(lǐng)域的智能電話查
35、詢,包括:股市查詢、工商信息電話查詢、電話銀行等。息電話查詢、電話銀行等。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成技術(shù)的應(yīng)用語(yǔ)音合成技術(shù)的應(yīng)用 工商信息電話查詢系統(tǒng)本系統(tǒng)的功能是本系統(tǒng)的功能是讓用戶可以通過(guò)電話查詢到某一企業(yè)在工商局的讓用戶可以通過(guò)電話查詢到某一企業(yè)在工商局的注冊(cè)信息。用戶主要通過(guò)輸入注冊(cè)號(hào)、統(tǒng)一代碼或者企業(yè)電注冊(cè)信息。用戶主要通過(guò)輸入注冊(cè)號(hào)、統(tǒng)一代碼或者企業(yè)電話號(hào)碼等來(lái)查詢相應(yīng)的企業(yè)信息話號(hào)碼等來(lái)查詢相應(yīng)的企業(yè)信息??拼笥嶏w公司與。科大訊飛公司與IBMIBM公司合公司合作,采用電話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)語(yǔ)音選擇。用戶只需口述作,
36、采用電話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)語(yǔ)音選擇。用戶只需口述企業(yè)名稱(包括帶一定模糊概念的口述,如企業(yè)名稱(包括帶一定模糊概念的口述,如“科大訊飛科大訊飛”或或“訊飛訊飛”均可識(shí)別),即可直接得到該企業(yè)的一系列信息。均可識(shí)別),即可直接得到該企業(yè)的一系列信息。與過(guò)去的按鍵聽(tīng)取相比,不僅方便了用戶,還從很大程度上與過(guò)去的按鍵聽(tīng)取相比,不僅方便了用戶,還從很大程度上提高了查詢效率,節(jié)約了用戶的寶貴時(shí)間。另一方面,查詢提高了查詢效率,節(jié)約了用戶的寶貴時(shí)間。另一方面,查詢結(jié)果除了可以通過(guò)電話直接聽(tīng)取外,還可通過(guò)傳真機(jī)接收到結(jié)果除了可以通過(guò)電話直接聽(tīng)取外,還可通過(guò)傳真機(jī)接收到相關(guān)企業(yè)的詳細(xì)信息(包括圖像信息)。相關(guān)
37、企業(yè)的詳細(xì)信息(包括圖像信息)。 多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成技術(shù)的應(yīng)用語(yǔ)音合成技術(shù)的應(yīng)用 電話銀行系統(tǒng) 電話銀行是一種金融電話服務(wù),客戶只要撥通專線電話,即電話銀行是一種金融電話服務(wù),客戶只要撥通專線電話,即可在語(yǔ)音提示下,享用查詢、轉(zhuǎn)賬、掛失和更改密碼等多項(xiàng)服務(wù)可在語(yǔ)音提示下,享用查詢、轉(zhuǎn)賬、掛失和更改密碼等多項(xiàng)服務(wù)。目前,大多數(shù)電話銀行系統(tǒng)都存在兩大不足之處:目前,大多數(shù)電話銀行系統(tǒng)都存在兩大不足之處:(1)(1)各種金額各種金額數(shù)目的報(bào)讀不夠流利、自然;數(shù)目的報(bào)讀不夠流利、自然;(2)(2)菜單選擇通過(guò)按鍵完成,用戶菜單選
38、擇通過(guò)按鍵完成,用戶不便記憶,聽(tīng)語(yǔ)音提示較費(fèi)時(shí)。不便記憶,聽(tīng)語(yǔ)音提示較費(fèi)時(shí)。 中科大訊飛公司開(kāi)發(fā)的電話銀行系統(tǒng),通過(guò)采用與中國(guó)科大人機(jī)中科大訊飛公司開(kāi)發(fā)的電話銀行系統(tǒng),通過(guò)采用與中國(guó)科大人機(jī)語(yǔ)音通信實(shí)驗(yàn)室合作研究的語(yǔ)音合成技術(shù),有效地克服了上述第語(yǔ)音通信實(shí)驗(yàn)室合作研究的語(yǔ)音合成技術(shù),有效地克服了上述第一個(gè)缺點(diǎn),使金額數(shù)目的報(bào)讀聲音清晰、語(yǔ)流自然,避免了用戶一個(gè)缺點(diǎn),使金額數(shù)目的報(bào)讀聲音清晰、語(yǔ)流自然,避免了用戶聽(tīng)錯(cuò)數(shù)目的可能,提高了用戶的滿意度。該公司正在與聽(tīng)錯(cuò)數(shù)目的可能,提高了用戶的滿意度。該公司正在與IBMIBM合作,合作,計(jì)劃采用最新的電話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)菜單的語(yǔ)音選擇,使用計(jì)劃采用最
39、新的電話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)菜單的語(yǔ)音選擇,使用戶只要口述功能名(如戶只要口述功能名(如“轉(zhuǎn)賬轉(zhuǎn)賬”、“查詢余額查詢余額”等),即可直接等),即可直接進(jìn)入系統(tǒng)的服務(wù)流程,而不必層層聽(tīng)取語(yǔ)音提示再加按相應(yīng)的鍵。進(jìn)入系統(tǒng)的服務(wù)流程,而不必層層聽(tīng)取語(yǔ)音提示再加按相應(yīng)的鍵。這將極大地方便用戶的使用,提高用戶操作的準(zhǔn)確度,并節(jié)約用這將極大地方便用戶的使用,提高用戶操作的準(zhǔn)確度,并節(jié)約用戶寶貴的時(shí)間。戶寶貴的時(shí)間。 多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成技術(shù)的應(yīng)用語(yǔ)音合成技術(shù)的應(yīng)用 股市查詢系統(tǒng) 目前,股民了解股市行情,主要通過(guò)以下方式:目前,股民了解股
40、市行情,主要通過(guò)以下方式: 電臺(tái)、電視等媒體電臺(tái)、電視等媒體不夠?qū)崟r(shí)與方便;不夠?qū)崟r(shí)與方便; 股票機(jī)股票機(jī) 電腦等個(gè)人終端電腦等個(gè)人終端需要硬件投資且有地點(diǎn)限制;需要硬件投資且有地點(diǎn)限制; 股票交易所的大屏幕、查詢終端股票交易所的大屏幕、查詢終端要求用戶親臨現(xiàn)場(chǎng)。要求用戶親臨現(xiàn)場(chǎng)。 股市查詢系統(tǒng)使用戶只要通過(guò)普通雙音頻電話,即可隨時(shí)得股市查詢系統(tǒng)使用戶只要通過(guò)普通雙音頻電話,即可隨時(shí)得到最新的股市行情到最新的股市行情。用戶撥通查詢臺(tái),根據(jù)語(yǔ)音提示選擇相。用戶撥通查詢臺(tái),根據(jù)語(yǔ)音提示選擇相應(yīng)的功能,即可獲得所需的各種股市信息。同時(shí)應(yīng)的功能,即可獲得所需的各種股市信息。同時(shí), ,如果采用電如果采用
41、電話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)個(gè)股的語(yǔ)音選擇,用戶只要口述個(gè)股話語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)個(gè)股的語(yǔ)音選擇,用戶只要口述個(gè)股名稱,即可直接得到該股票的最新行情,而不必通過(guò)按鍵輸名稱,即可直接得到該股票的最新行情,而不必通過(guò)按鍵輸入代號(hào),從而方便用戶使用入代號(hào),從而方便用戶使用, ,并節(jié)約用戶的時(shí)間。并節(jié)約用戶的時(shí)間。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成技術(shù)的應(yīng)用語(yǔ)音合成技術(shù)的應(yīng)用 民航保單查詢系統(tǒng) 語(yǔ)音合成技術(shù)可以起到很好的防偽效果。語(yǔ)音合成技術(shù)可以起到很好的防偽效果。例如當(dāng)旅客拿到例如當(dāng)旅客拿到一張民航保單時(shí),如何確定它不是偽造的呢?他可以打電一張民航保
42、單時(shí),如何確定它不是偽造的呢?他可以打電話到民航系統(tǒng)向服務(wù)小姐詢問(wèn)。語(yǔ)音合成技術(shù)完全可以取話到民航系統(tǒng)向服務(wù)小姐詢問(wèn)。語(yǔ)音合成技術(shù)完全可以取代服務(wù)小姐的工作,并提供更加快捷、準(zhǔn)確的信息。旅客代服務(wù)小姐的工作,并提供更加快捷、準(zhǔn)確的信息。旅客可以撥通某一個(gè)電話號(hào)碼,在語(yǔ)音提示下,輸入保險(xiǎn)單號(hào),可以撥通某一個(gè)電話號(hào)碼,在語(yǔ)音提示下,輸入保險(xiǎn)單號(hào),則他就能聽(tīng)到用語(yǔ)音合成技術(shù)合成的該保單對(duì)應(yīng)的航班號(hào)、則他就能聽(tīng)到用語(yǔ)音合成技術(shù)合成的該保單對(duì)應(yīng)的航班號(hào)、被保險(xiǎn)人姓名、乘機(jī)日期等語(yǔ)音信息,以驗(yàn)證該民航保單被保險(xiǎn)人姓名、乘機(jī)日期等語(yǔ)音信息,以驗(yàn)證該民航保單的真實(shí)性。根據(jù)電話號(hào)碼的唯一性和語(yǔ)音合成技術(shù)的復(fù)雜的
43、真實(shí)性。根據(jù)電話號(hào)碼的唯一性和語(yǔ)音合成技術(shù)的復(fù)雜性來(lái)確保民性來(lái)確保民 航保單查詢的可靠性。航保單查詢的可靠性。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)語(yǔ)音合成的未來(lái)發(fā)展方向語(yǔ)音合成的未來(lái)發(fā)展方向(1)提高合成語(yǔ)音的自然度(2)豐富合成語(yǔ)音的表現(xiàn)力(3)降低語(yǔ)音合成技術(shù)的復(fù)雜度(4)多語(yǔ)種文語(yǔ)合成多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)1. 掃描儀掃描儀 圖形、圖像等信息的主要輸入設(shè)備圖形、圖像等信息的主要輸入設(shè)備 分類分類 手動(dòng)式、平板式、膠片式、滾筒式手動(dòng)式、平板式、膠片式、滾筒式 SCSI接口、接口、E
44、PP增強(qiáng)型并行接口、通用串行總線增強(qiáng)型并行接口、通用串行總線USB接口接口 基本組件:基本組件: 光源、光學(xué)透鏡光源、光學(xué)透鏡 感光元件:感光元件:CCD 模擬數(shù)字轉(zhuǎn)換電路模擬數(shù)字轉(zhuǎn)換電路5.1.4 其他輸入輸出技術(shù)其他輸入輸出技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 技術(shù)指標(biāo)技術(shù)指標(biāo)掃描精度:光學(xué)分辨率,掃描精度:光學(xué)分辨率,300*600DPI色彩深度:色彩精度,色彩深度:色彩精度,24bit/pixel,300DPI掃描速度:將一頁(yè)文稿掃入計(jì)算機(jī)并完成掃描速度:將一頁(yè)文稿掃入計(jì)算機(jī)并完成相應(yīng)處理總共需要的時(shí)間相應(yīng)處理總共需要的時(shí)間多媒體通信
45、技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)2. 觸摸屏觸摸屏 采用坐標(biāo)定位方式的輸入設(shè)備采用坐標(biāo)定位方式的輸入設(shè)備 使人可以基于自然的方式與計(jì)算機(jī)進(jìn)行交互使人可以基于自然的方式與計(jì)算機(jī)進(jìn)行交互而無(wú)需鍵盤(pán)而無(wú)需鍵盤(pán) 系統(tǒng)組成系統(tǒng)組成 觸摸檢測(cè)裝置:檢測(cè)用戶觸摸位置觸摸檢測(cè)裝置:檢測(cè)用戶觸摸位置 觸摸屏控制卡:接收檢測(cè)裝置傳來(lái)的信息并轉(zhuǎn)換觸摸屏控制卡:接收檢測(cè)裝置傳來(lái)的信息并轉(zhuǎn)換成觸點(diǎn)信息送給主機(jī)成觸點(diǎn)信息送給主機(jī) 驅(qū)動(dòng)程序驅(qū)動(dòng)程序多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 分類分類紅外線觸摸屏紅外線觸摸屏電阻觸摸屏電阻觸摸
46、屏電容式觸摸屏電容式觸摸屏表明聲波觸摸屏表明聲波觸摸屏近場(chǎng)成像觸摸屏近場(chǎng)成像觸摸屏多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.1.5 多媒體存儲(chǔ)技術(shù)多媒體存儲(chǔ)技術(shù)多媒體存儲(chǔ)技術(shù)主要是指光盤(pán)存儲(chǔ)技術(shù)。大多媒體存儲(chǔ)技術(shù)主要是指光盤(pán)存儲(chǔ)技術(shù)。大容量的媒體容量的媒體CD-ROM技術(shù)標(biāo)準(zhǔn)于技術(shù)標(biāo)準(zhǔn)于1985年發(fā)布。年發(fā)布。 單機(jī)多媒體存儲(chǔ)的最初形式是人們非常熟單機(jī)多媒體存儲(chǔ)的最初形式是人們非常熟悉的悉的VCD VCD標(biāo)準(zhǔn)是圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)。采用標(biāo)準(zhǔn)是圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)。采用MPEG-1壓縮技術(shù),可以將壓縮技術(shù),可以將74分鐘視頻音頻信息同時(shí)壓分鐘視頻音頻信息同時(shí)
47、壓縮記錄在軌道上。視頻質(zhì)量比家用錄像帶略高,縮記錄在軌道上。視頻質(zhì)量比家用錄像帶略高,音質(zhì)與音質(zhì)與CD相當(dāng)相當(dāng)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) DVD標(biāo)準(zhǔn)于標(biāo)準(zhǔn)于1995年出臺(tái),年出臺(tái), 專門(mén)用于存放以專門(mén)用于存放以MPEG-2方式壓縮的視頻和音方式壓縮的視頻和音頻信息。其畫(huà)質(zhì)和音質(zhì)均優(yōu)于頻信息。其畫(huà)質(zhì)和音質(zhì)均優(yōu)于VCD。 DVD光盤(pán)可以容納光盤(pán)可以容納133488分鐘的影片內(nèi)容,分鐘的影片內(nèi)容,可以保存可以保存4.710GB的多媒體數(shù)據(jù)。的多媒體數(shù)據(jù)。 隨著多媒體數(shù)據(jù)內(nèi)容的不斷增加隨著多媒體數(shù)據(jù)內(nèi)容的不斷增加,以單一,以單一盤(pán)片的形式存儲(chǔ)數(shù)
48、據(jù)遠(yuǎn)不能滿足用戶的需求,盤(pán)片的形式存儲(chǔ)數(shù)據(jù)遠(yuǎn)不能滿足用戶的需求,于是出現(xiàn)了光盤(pán)庫(kù)、冗余磁盤(pán)陣列和多媒體于是出現(xiàn)了光盤(pán)庫(kù)、冗余磁盤(pán)陣列和多媒體數(shù)據(jù)庫(kù)的存儲(chǔ)方式。數(shù)據(jù)庫(kù)的存儲(chǔ)方式。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體信息存儲(chǔ)的特點(diǎn)多媒體信息存儲(chǔ)的特點(diǎn) 多媒體信息存在和表現(xiàn)的形式多樣多媒體信息存在和表現(xiàn)的形式多樣 正文正文:包括文字和數(shù)據(jù)包括文字和數(shù)據(jù) 向量圖形向量圖形:圖元組成的圖形圖元組成的圖形 位圖圖象位圖圖象 數(shù)字化聲音和高保真音響數(shù)字化聲音和高保真音響 數(shù)字化視頻數(shù)字化視頻 多媒體信息量大多媒體信息量大多媒體通信技術(shù):多媒體通信系統(tǒng)中的
49、關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 為實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ),對(duì)不同的數(shù)據(jù)應(yīng)為實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ),對(duì)不同的數(shù)據(jù)應(yīng)采用不同的存儲(chǔ)策略。采用不同的存儲(chǔ)策略。 光盤(pán)庫(kù)是一種帶有自動(dòng)換盤(pán)裝置的光盤(pán)存光盤(pán)庫(kù)是一種帶有自動(dòng)換盤(pán)裝置的光盤(pán)存儲(chǔ)共享設(shè)備。一般由光盤(pán)架、自動(dòng)換盤(pán)裝儲(chǔ)共享設(shè)備。一般由光盤(pán)架、自動(dòng)換盤(pán)裝置、光盤(pán)驅(qū)動(dòng)器組成。置、光盤(pán)驅(qū)動(dòng)器組成。 一套光盤(pán)庫(kù)可有一套光盤(pán)庫(kù)可有1-121-12臺(tái)驅(qū)動(dòng)器,臺(tái)驅(qū)動(dòng)器,2-122-12個(gè)盤(pán)個(gè)盤(pán)倉(cāng),每個(gè)盤(pán)倉(cāng)可容倉(cāng),每個(gè)盤(pán)倉(cāng)可容50-60050-600片光盤(pán),總?cè)萘科獗P(pán),總?cè)萘靠蛇_(dá)幾百可達(dá)幾百GBGB甚至甚至TGBTGB。2. 光盤(pán)庫(kù)光盤(pán)庫(kù)多媒體通信技
50、術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 光盤(pán)庫(kù)通過(guò)光盤(pán)庫(kù)通過(guò)SCSISCSI接口與網(wǎng)絡(luò)服務(wù)器連接,接口與網(wǎng)絡(luò)服務(wù)器連接,通過(guò)自身接口與主機(jī)交換數(shù)據(jù)。通過(guò)自身接口與主機(jī)交換數(shù)據(jù)。 光盤(pán)庫(kù)的訪問(wèn)過(guò)程:光盤(pán)庫(kù)的訪問(wèn)過(guò)程:自動(dòng)換盤(pán)器將驅(qū)動(dòng)器中的光盤(pán)取出放至盤(pán)架自動(dòng)換盤(pán)器將驅(qū)動(dòng)器中的光盤(pán)取出放至盤(pán)架然后將需要的光盤(pán)送入驅(qū)動(dòng)器(秒級(jí)速度)然后將需要的光盤(pán)送入驅(qū)動(dòng)器(秒級(jí)速度)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) DVDDVD光盤(pán)庫(kù)主要特點(diǎn)光盤(pán)庫(kù)主要特點(diǎn)高容量高容量檢索速度快,支持跨盤(pán)存取檢索速度快,支持跨盤(pán)存取高可靠性,壽命
51、高可靠性,壽命100100年年與各系統(tǒng)無(wú)縫連接與各系統(tǒng)無(wú)縫連接安裝簡(jiǎn)便,易于管理安裝簡(jiǎn)便,易于管理 應(yīng)用應(yīng)用將將DVDDVD光盤(pán)庫(kù)作為在線存儲(chǔ)設(shè)備直接進(jìn)行存儲(chǔ)光盤(pán)庫(kù)作為在線存儲(chǔ)設(shè)備直接進(jìn)行存儲(chǔ)將光盤(pán)庫(kù)看作是數(shù)據(jù)歸檔的存儲(chǔ)設(shè)備(數(shù)據(jù)遷移軟件)將光盤(pán)庫(kù)看作是數(shù)據(jù)歸檔的存儲(chǔ)設(shè)備(數(shù)據(jù)遷移軟件)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)光盤(pán)庫(kù)的應(yīng)用光盤(pán)庫(kù)的應(yīng)用客戶客戶機(jī)機(jī)客戶客戶機(jī)機(jī)客戶客戶機(jī)機(jī)服務(wù)服務(wù)器器服務(wù)服務(wù)器器服務(wù)服務(wù)器器DVD光盤(pán)光盤(pán)庫(kù)庫(kù)主機(jī)存儲(chǔ)主機(jī)存儲(chǔ)系統(tǒng)系統(tǒng)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 通過(guò)
52、單獨(dú)的高速光纖網(wǎng)絡(luò)將存儲(chǔ)設(shè)備和局域通過(guò)單獨(dú)的高速光纖網(wǎng)絡(luò)將存儲(chǔ)設(shè)備和局域網(wǎng)上的服務(wù)器群連接起來(lái),數(shù)據(jù)的存取通過(guò)網(wǎng)上的服務(wù)器群連接起來(lái),數(shù)據(jù)的存取通過(guò)存儲(chǔ)區(qū)域網(wǎng)在服務(wù)器和海量存儲(chǔ)設(shè)備間進(jìn)行存儲(chǔ)區(qū)域網(wǎng)在服務(wù)器和海量存儲(chǔ)設(shè)備間進(jìn)行高速傳輸。高速傳輸。 SANSAN以光纖通道為基礎(chǔ)實(shí)現(xiàn)了存儲(chǔ)設(shè)備的共享;以光纖通道為基礎(chǔ)實(shí)現(xiàn)了存儲(chǔ)設(shè)備的共享;服務(wù)器通過(guò)存儲(chǔ)網(wǎng)絡(luò)直接與存儲(chǔ)設(shè)備交換數(shù)服務(wù)器通過(guò)存儲(chǔ)網(wǎng)絡(luò)直接與存儲(chǔ)設(shè)備交換數(shù)據(jù),釋放了寶貴的局域網(wǎng)資源。據(jù),釋放了寶貴的局域網(wǎng)資源。3. 存儲(chǔ)區(qū)域網(wǎng)絡(luò)存儲(chǔ)區(qū)域網(wǎng)絡(luò)SAN多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 網(wǎng)絡(luò)結(jié)構(gòu)網(wǎng)絡(luò)
53、結(jié)構(gòu):用戶終端用戶終端用戶終端用戶終端用戶終端用戶終端服務(wù)器服務(wù)器服務(wù)器服務(wù)器服務(wù)器服務(wù)器磁盤(pán)陣列磁盤(pán)陣列光盤(pán)庫(kù)光盤(pán)庫(kù)以太網(wǎng)以太網(wǎng)光纖通道網(wǎng)絡(luò)光纖通道網(wǎng)絡(luò)磁帶庫(kù)磁帶庫(kù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 實(shí)現(xiàn)大容量存儲(chǔ)設(shè)備的共享和高速數(shù)據(jù)傳輸實(shí)現(xiàn)大容量存儲(chǔ)設(shè)備的共享和高速數(shù)據(jù)傳輸 連接方便和遠(yuǎn)距離傳輸連接方便和遠(yuǎn)距離傳輸 實(shí)現(xiàn)主機(jī)與存儲(chǔ)設(shè)備分離實(shí)現(xiàn)主機(jī)與存儲(chǔ)設(shè)備分離 提供數(shù)據(jù)的安全性和可靠性提供數(shù)據(jù)的安全性和可靠性SAN的特點(diǎn)的特點(diǎn)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)4. 多媒體數(shù)據(jù)庫(kù)多媒體數(shù)據(jù)庫(kù)M
54、MDB 由若干個(gè)多媒體對(duì)象所構(gòu)成的集合,這些對(duì)象按某由若干個(gè)多媒體對(duì)象所構(gòu)成的集合,這些對(duì)象按某種特定的方式組織起來(lái)并為其他的具體應(yīng)用共享。種特定的方式組織起來(lái)并為其他的具體應(yīng)用共享。 多媒體數(shù)據(jù)管理系統(tǒng)多媒體數(shù)據(jù)管理系統(tǒng)MMDBMS(Multimedia Database MMDBMS(Multimedia Database Management System)Management System)是以多媒體數(shù)據(jù)庫(kù)是以多媒體數(shù)據(jù)庫(kù)MMDBMMDB為基礎(chǔ)為基礎(chǔ)的且能完成對(duì)多媒體數(shù)據(jù)庫(kù)的且能完成對(duì)多媒體數(shù)據(jù)庫(kù)MMDBMMDB的各種操作和管理的各種操作和管理功能的多媒體應(yīng)用系統(tǒng)。功能的多媒體應(yīng)用系統(tǒng)
55、。 由于多媒體數(shù)據(jù)自身的特點(diǎn),如由多種媒體構(gòu)成且由于多媒體數(shù)據(jù)自身的特點(diǎn),如由多種媒體構(gòu)成且數(shù)據(jù)量巨大、媒體數(shù)據(jù)間的不同約束關(guān)系、實(shí)時(shí)性數(shù)據(jù)量巨大、媒體數(shù)據(jù)間的不同約束關(guān)系、實(shí)時(shí)性的要求等,使得多媒體數(shù)據(jù)庫(kù)系統(tǒng)有別于傳統(tǒng)的數(shù)的要求等,使得多媒體數(shù)據(jù)庫(kù)系統(tǒng)有別于傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)。據(jù)庫(kù)系統(tǒng)。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 多媒體數(shù)據(jù)及其數(shù)據(jù)關(guān)系的復(fù)雜性,與傳統(tǒng)多媒體數(shù)據(jù)及其數(shù)據(jù)關(guān)系的復(fù)雜性,與傳統(tǒng)數(shù)據(jù)相比,多媒體數(shù)據(jù)對(duì)數(shù)據(jù)模型提出了更數(shù)據(jù)相比,多媒體數(shù)據(jù)對(duì)數(shù)據(jù)模型提出了更嚴(yán)格的要求。嚴(yán)格的要求。多媒體數(shù)據(jù)模型要能夠有效抽象及表示多媒體多媒體數(shù)據(jù)
56、模型要能夠有效抽象及表示多媒體數(shù)據(jù)庫(kù)的靜態(tài)和動(dòng)態(tài)特征,模型的表示要比較簡(jiǎn)數(shù)據(jù)庫(kù)的靜態(tài)和動(dòng)態(tài)特征,模型的表示要比較簡(jiǎn)潔靈活,要支持交互性,要能夠反映多媒體數(shù)據(jù)潔靈活,要支持交互性,要能夠反映多媒體數(shù)據(jù)庫(kù)的一致性約束條件。庫(kù)的一致性約束條件。層次數(shù)據(jù)庫(kù)管理系統(tǒng)和網(wǎng)狀數(shù)據(jù)庫(kù)管理系統(tǒng)層次數(shù)據(jù)庫(kù)管理系統(tǒng)和網(wǎng)狀數(shù)據(jù)庫(kù)管理系統(tǒng)的的共同缺點(diǎn)是不能支持?jǐn)?shù)據(jù)的獨(dú)立性。共同缺點(diǎn)是不能支持?jǐn)?shù)據(jù)的獨(dú)立性。不能不能用于多用于多媒體數(shù)據(jù)庫(kù)。媒體數(shù)據(jù)庫(kù)。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 關(guān)系模型是目前數(shù)據(jù)庫(kù)系統(tǒng)關(guān)系模型是目前數(shù)據(jù)庫(kù)系統(tǒng)中最常用的數(shù)據(jù)模型之中最常用的數(shù)據(jù)模型之
57、一。關(guān)系模型是建立在關(guān)系代數(shù)的基礎(chǔ)之上的,有一。關(guān)系模型是建立在關(guān)系代數(shù)的基礎(chǔ)之上的,有較為嚴(yán)密的理論基礎(chǔ),其數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)潔明了、直觀較為嚴(yán)密的理論基礎(chǔ),其數(shù)據(jù)結(jié)構(gòu)簡(jiǎn)潔明了、直觀清晰、易學(xué)易用。目前大多數(shù)數(shù)據(jù)庫(kù)管理系統(tǒng)產(chǎn)品清晰、易學(xué)易用。目前大多數(shù)數(shù)據(jù)庫(kù)管理系統(tǒng)產(chǎn)品均支持關(guān)系模型均支持關(guān)系模型. 關(guān)系模型要想存儲(chǔ)多媒體數(shù)據(jù),就關(guān)系模型要想存儲(chǔ)多媒體數(shù)據(jù),就需要進(jìn)行擴(kuò)充。需要進(jìn)行擴(kuò)充。 非第一范式非第一范式NF2(Non First Normal Form)數(shù)據(jù)模型數(shù)據(jù)模型通過(guò)對(duì)關(guān)系模型的擴(kuò)展來(lái)提高關(guān)系模型處理多媒體通過(guò)對(duì)關(guān)系模型的擴(kuò)展來(lái)提高關(guān)系模型處理多媒體數(shù)據(jù)的能力。數(shù)據(jù)的能力。 隨著近年來(lái)面
58、向?qū)ο窦夹g(shù)的興起,面向?qū)ο窦夹g(shù)在隨著近年來(lái)面向?qū)ο窦夹g(shù)的興起,面向?qū)ο窦夹g(shù)在數(shù)據(jù)庫(kù)中的應(yīng)用也日益顯現(xiàn)出其強(qiáng)大的生命力。這數(shù)據(jù)庫(kù)中的應(yīng)用也日益顯現(xiàn)出其強(qiáng)大的生命力。這主要是由于面向?qū)ο衲P湍軌蚝芎玫拿枋鰪?fù)雜的事主要是由于面向?qū)ο衲P湍軌蚝芎玫拿枋鰪?fù)雜的事物對(duì)像,更好的維護(hù)復(fù)雜對(duì)像的語(yǔ)義信息。物對(duì)像,更好的維護(hù)復(fù)雜對(duì)像的語(yǔ)義信息。多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體數(shù)據(jù)庫(kù)的體系結(jié)構(gòu)多媒體數(shù)據(jù)庫(kù)的體系結(jié)構(gòu) 多媒體數(shù)據(jù)庫(kù)管理系統(tǒng)多媒體數(shù)據(jù)庫(kù)管理系統(tǒng)MMDBMS的體系結(jié)構(gòu)分的體系結(jié)構(gòu)分為三層,即數(shù)據(jù)庫(kù)管理層、多媒體數(shù)據(jù)合成層和為三層,即數(shù)據(jù)庫(kù)管理層、
59、多媒體數(shù)據(jù)合成層和交互層。如下圖所示。交互層。如下圖所示。用用 戶戶 界界 面面超文本導(dǎo)航超文本導(dǎo)航多媒體查詢多媒體查詢媒體編輯媒體編輯數(shù)據(jù)結(jié)構(gòu)定義數(shù)據(jù)結(jié)構(gòu)定義多媒體數(shù)據(jù)的各種歸納關(guān)系多媒體數(shù)據(jù)的各種歸納關(guān)系多媒體對(duì)象的合成信息多媒體對(duì)象的合成信息成分?jǐn)?shù)據(jù)體得特征信息等成分?jǐn)?shù)據(jù)體得特征信息等文本文本DBMS圖像圖像DBMS音頻音頻DBMS視頻視頻DBMS文本記錄文本記錄圖像記錄圖像記錄音頻記錄音頻記錄視頻記錄視頻記錄多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)5.2 超媒體技術(shù)超媒體技術(shù)超文本的概念超文本的概念 文本文本 邏輯單位:字、詞、句子、段落、節(jié)
60、、章;邏輯單位:字、詞、句子、段落、節(jié)、章; 物理單位:字節(jié)、行、頁(yè)、冊(cè)、卷;物理單位:字節(jié)、行、頁(yè)、冊(cè)、卷; 線性結(jié)構(gòu):組織上是線性的、順序的線性結(jié)構(gòu):組織上是線性的、順序的多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù)多媒體通信技術(shù):多媒體通信系統(tǒng)中的關(guān)鍵技術(shù) 人腦的記憶機(jī)制人腦的記憶機(jī)制 聯(lián)想式的網(wǎng)狀結(jié)構(gòu);聯(lián)想式的網(wǎng)狀結(jié)構(gòu); 對(duì)聯(lián)想、記憶的探索形成了人類思維概念化的對(duì)聯(lián)想、記憶的探索形成了人類思維概念化的基礎(chǔ);基礎(chǔ); 冬天結(jié)冰河魚(yú)婚禮;冬天結(jié)冰河魚(yú)婚禮; 文本無(wú)法管理這種互聯(lián)的網(wǎng)狀信息結(jié)構(gòu);文本無(wú)法管理這種互聯(lián)的網(wǎng)狀信息結(jié)構(gòu); 需要探索新的信息存儲(chǔ)和檢索機(jī)制;需要探索新的信息存儲(chǔ)和檢索機(jī)制;
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 弱電設(shè)備出租合同范例
- 工程型材購(gòu)銷合同范例
- 大興機(jī)場(chǎng)商貿(mào)合同范例
- 小型裝修施工合同模板
- 工程竣工審計(jì)合同范例
- 儀器購(gòu)買培訓(xùn)合同范例
- 戀愛(ài)贈(zèng)與車子合同范例
- 2024年上??瓦\(yùn)從業(yè)資格證考試模擬
- 2024年??赾1客運(yùn)資格證模擬考試題
- 2024年長(zhǎng)治道路客運(yùn)從業(yè)資格證考試模擬試題
- 《麻雀》(全國(guó)一等獎(jiǎng))
- 初中音樂(lè)-《山東民歌》教學(xué)課件設(shè)計(jì)
- 豐田車系卡羅拉(雙擎)轎車用戶使用手冊(cè)【含書(shū)簽】
- 眾興實(shí)驗(yàn)小學(xué)教育教學(xué)視導(dǎo)工作匯報(bào)
- 潔凈區(qū)人員行為規(guī)范要求
- 2023年云南省7月普通高中學(xué)業(yè)水平考試物理試卷新版
- 2022屆高三語(yǔ)文一輪復(fù)習(xí)積累:現(xiàn)代漢語(yǔ)語(yǔ)法基礎(chǔ)知識(shí)
- GB/T 31953-2023企業(yè)信用評(píng)價(jià)報(bào)告編制指南
- 大學(xué)武術(shù)智慧樹(shù)知到答案章節(jié)測(cè)試2023年浙江大學(xué)
- 現(xiàn)代藥物制劑與新藥研發(fā)智慧樹(shù)知到答案章節(jié)測(cè)試2023年蘇州大學(xué)
- 市政工程排水工程 深基坑專項(xiàng)施工方案
評(píng)論
0/150
提交評(píng)論