信源編碼技術(shù)

上傳人：卓*** IP屬地：廣東上傳時間：2023-01-18 格式：PPT 頁數(shù)：53 大?。?.30MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩48頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

信源編碼技術(shù)第一頁，共五十三頁，2022年，8月28日2023/1/181信源編碼技術(shù)信源編碼：將模擬信源信號轉(zhuǎn)換為二進制數(shù)字信號，在接收端再將收到的數(shù)字信號還原為模擬信號的方法這是由模擬網(wǎng)數(shù)字網(wǎng)至關(guān)重要的一步類別語音編解碼圖像編解碼目前在移動通信系統(tǒng)中，語音信號還是主要業(yè)務(wù)，在今后多媒體移動系統(tǒng)中，圖像業(yè)務(wù)比重越來越大。第二頁，共五十三頁，2022年，8月28日2023/1/182語音編碼概念：把模擬語音信號變成數(shù)字語音信號，以便在信道中傳輸意義提高通話質(zhì)量(數(shù)字化＋糾錯碼)提高頻譜利用率(低碼率編碼)提高系統(tǒng)容量(低碼率＋話音激活技術(shù))移動通信對語音編碼要求碼率低、語音質(zhì)量高抗噪聲和抗干擾能力強編譯碼延時小，總延時在65ms以內(nèi)編譯碼復雜度低，便于大規(guī)模集成化功耗小，便于應(yīng)用于手持臺第三頁，共五十三頁，2022年，8月28日2023/1/183語音編碼分類第四頁，共五十三頁，2022年，8月28日2023/1/184語音編碼方法波形編碼：將時間域信號直接變換成數(shù)字代碼，目的是盡可能精確再現(xiàn)原始語音波形?；驹硎窃跁r間軸上對模擬語音按一定速率抽樣，然后將幅度樣本分層量化，并用代碼表示。參量編碼：又稱聲源編碼，是將信源信號在頻域或其它正交變換域提取特征參量，并轉(zhuǎn)換成數(shù)字代碼進行傳輸?；驹硎且园l(fā)音機制的模型為基礎(chǔ)，用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個模型，從模擬語音信號中提取這些特征參量并量化編碼混合編碼：將波形編碼和參量編碼結(jié)合起來第五頁，共五十三頁，2022年，8月28日2023/1/185幾種語音編碼優(yōu)缺點波形編碼優(yōu)點：對于比特速率較高的編碼信號(16~64kbits/s)，波形編碼技術(shù)能夠提供相當好的話音質(zhì)量缺點：對低速語音編碼(低于16kbits/s)，波形編碼的語音質(zhì)量顯著下降，所以不適合頻譜資源緊張的移動通信系統(tǒng)參量編碼優(yōu)點：可實現(xiàn)低速語音編碼，速率可達2~4.8kbits/s缺點：語音質(zhì)量只能達到中等混合編碼吸收了上述兩種編碼的優(yōu)點,是優(yōu)選方向第六頁，共五十三頁，2022年，8月28日2023/1/186語音編碼與壓縮技術(shù)要實現(xiàn)低速、高質(zhì)量的語音編碼，必須采用壓縮技術(shù)；波形技術(shù)處理：削減語音波形冗余度，包括線性預測分析、頻帶分割、正交變換和分析合成等；量化技術(shù)：優(yōu)化幅度量化，包括自適應(yīng)量化、自適應(yīng)比特分配和矢量量化第七頁，共五十三頁，2022年，8月28日2023/1/187語音評價客觀評定方法：用客觀測量的手段來評價語音編碼的質(zhì)量，常用信噪比、加權(quán)信噪比、平均分段信噪比等方法；特點有建立在度量均方誤差基礎(chǔ)上；計算簡單；對于低速語音編碼，不能完全反映人對語音質(zhì)量的感覺主觀評定方法：主觀評定等級或平均評定得分(MOS)－－由數(shù)十名試聽者在相同信道環(huán)境中試聽并給予評分，然后對評分進行統(tǒng)計處理，求出平均得分。要求試聽者人數(shù)足夠多；語音材料足夠豐富；試聽環(huán)境盡量相同MeanOpinionScore第八頁，共五十三頁，2022年，8月28日2023/1/188主觀評定等級試聽者對語音質(zhì)量的感覺往往是和注意力集中程度相聯(lián)系的，因此對于主觀評定等級，還有一個收聽注意力等級。第九頁，共五十三頁，2022年，8月28日2023/1/189MOS分與語音質(zhì)量MOS分在4.0~4.5分為高質(zhì)量語音編碼，達到長途電話網(wǎng)的質(zhì)量要求MOS分為3.5分左右稱作通信質(zhì)量，聽者能感覺到語音質(zhì)量有所下降，但不影響正常通話，可以滿足多數(shù)通信系統(tǒng)使用要求MOS分為3分以下常稱為合成語音質(zhì)量，只有足夠高的可懂度，但自然度較差，不容易識別講話者第十頁，共五十三頁，2022年，8月28日2023/1/1810語音編碼現(xiàn)狀標準制定情況第十一頁，共五十三頁，2022年，8月28日2023/1/1811第十二頁，共五十三頁，2022年，8月28日2023/1/1812語音質(zhì)量與比特速率第十三頁，共五十三頁，2022年，8月28日2023/1/1813語音波形編碼模擬語音信號數(shù)字語音信號：時間和幅度離散化，即抽樣與量化抽樣定理：采樣率大于或等于信號帶寬的2倍，離散信號可以無失真恢復成原始模擬信號幅度量化：用有限個幅值表示樣值幅度，從而離散化信號幅度的過程量化階距：相鄰兩量化值之差均勻量化：量化階距為常量－－小信號的“信號與量化噪聲比”小，因此對小信號不利非均勻量化：量化階距可變－－壓縮量化，即在均勻量化前，對大信號進行壓縮，對小信號進行放大第十四頁，共五十三頁，2022年，8月28日2023/1/1814壓縮量化壓縮量化：對輸入信號的對數(shù)進行量化，以使量化信噪比與量化電平無關(guān)律壓縮：A律壓縮：第十五頁，共五十三頁，2022年，8月28日2023/1/1815壓縮量化特性A與的物理意義：最大量化階距與最小量化階距之比第十六頁，共五十三頁，2022年，8月28日2023/1/1816PCM調(diào)制PCM(脈沖編碼調(diào)制)：直接將樣值編碼為信號，特點為64kbit/s：量化成128個正負各半的量值，用7位二進制數(shù)表示，再加上一位符號共8比特；采樣率8kHz采用A律或律壓縮第十七頁，共五十三頁，2022年，8月28日2023/1/1817參量編碼原理原理：模型化人類語音產(chǎn)生機制，提取模型參數(shù)，并且只傳送模型參數(shù)－－低碼率編碼，導致合成的語音波形失去了自然度和音質(zhì)語音信號的產(chǎn)生模型語音的產(chǎn)生：聲帶與聲道不同語音產(chǎn)生原因：聲音激勵源和聲道不同聲音分類：清音和濁音濁音：聲帶振動基音周期波形：三角形周期脈沖波，含豐富諧音清音：聲帶不振動，類似白噪聲發(fā)聲過程：口腔和鼻腔形成時變?yōu)V波器第十八頁，共五十三頁，2022年，8月28日2023/1/1818清音和濁音清濁音信號清濁音頻譜第十九頁，共五十三頁，2022年，8月28日2023/1/1819語音產(chǎn)生模型語音模型的建立：1、產(chǎn)生激勵；2、響應(yīng)模型參數(shù)：基音、共振峰頻率及強度、清濁音判決第二十頁，共五十三頁，2022年，8月28日2023/1/1820特征提取參數(shù)基于語音信號的短時準平穩(wěn)特性－10~20ms提取技術(shù)自相關(guān)函數(shù)法平均幅度差函數(shù)法線性預測短時波形分析短時處理技術(shù)加窗技術(shù)：方窗和哈明窗基音周期估計：基于短時自相關(guān)函數(shù)基于短時平均幅度差函數(shù)第二十一頁，共五十三頁，2022年，8月28日2023/1/1821線性預測編碼(LPC)線性預測：一個語音采樣的現(xiàn)在值可以用若干個語音采樣的過去值的加權(quán)線性組合來逼近。其中加權(quán)系數(shù)稱為預測器系數(shù)。線性預測語音編碼機理：語音信源是相關(guān)信源，即使經(jīng)過采樣與量化，相鄰樣點仍有很強相關(guān)性。線性預測編碼：把線性預測用于語音編碼。預測模型一般為一個全極點模型準則：最小均方誤差傳輸：預測系數(shù)、基音周期和增益、清濁音判決第二十二頁，共五十三頁，2022年，8月28日2023/1/1822LPC數(shù)學描述第二十三頁，共五十三頁，2022年，8月28日2023/1/1823LPC實現(xiàn)結(jié)構(gòu)(a)編碼器(b)譯碼器第二十四頁，共五十三頁，2022年，8月28日2023/1/1824LPC編碼器缺陷缺點：損失了語音的音質(zhì)抗噪聲能力差譜包絡(luò)估計可能產(chǎn)生較大失真原因：激勵信號在濁音段采用周期脈沖，在清音段采用白噪聲沒有將發(fā)端模型的誤差信號傳到收端第二十五頁，共五十三頁，2022年，8月28日2023/1/1825混合編碼為克服LPC的缺陷，采用混合編碼器，即在產(chǎn)生模型參數(shù)的同時，激勵信號從語音波形信號獲得方法一條路徑產(chǎn)生線性預測參數(shù)并傳送出去一條路徑濾出信號的低頻成分，并通過波形編碼傳送出去接收端的激勵信號特點不需要進行清濁音判決和基音周期提取編碼速率一般比LPC高音質(zhì)比LPC編碼器好第二十六頁，共五十三頁，2022年，8月28日2023/1/1826用于移動通信的語音編碼移動通信中實用的語音編碼均為混合編碼第二十七頁，共五十三頁，2022年，8月28日2023/1/1827混合編碼的共同特點先進行線性預測分析去掉語音的短時相關(guān)性；再分析出最佳激勵信號；對激勵信號和線性預測參數(shù)進行編碼傳送；第二十八頁，共五十三頁，2022年，8月28日2023/1/1828GSM的語音編碼算法名稱：(RPE-LTP)規(guī)則脈沖激勵長時預測編碼特點：是一種混合編碼技術(shù)采用間隔相等、相位和幅度優(yōu)化的規(guī)則脈沖作為激勵源結(jié)合長時預測，消除信號冗余度，碼率低語音檢測－－靜寂描述（SID）幀編碼率13kb/s計算簡單、計算量適中、易于硬件化語音質(zhì)量MOS達4.0RegularPulseExcitation-LongTimePrediction第二十九頁，共五十三頁，2022年，8月28日2023/1/1829RPE-LTP算法方案20ms為一幀，分成4個子幀，每個子幀含40個樣點(采樣率8kHz)每個子幀預測誤差信號的樣點按3:1等間隔抽取，得到13個樣點(共有4種序列)在4種序列中選擇一種對語音波形貢獻最大的序列找到序列中的最大非零點，用6比特編碼用最大非零點歸一化整個序列，用APCM編碼，每個樣值各用3個比特編碼第三十頁，共五十三頁，2022年，8月28日2023/1/1830GSM語音編碼框圖第三十一頁，共五十三頁，2022年，8月28日2023/1/1831GSM語音解碼框圖第三十二頁，共五十三頁，2022年，8月28日2023/1/1832IS-95語音編碼技術(shù)算法名稱：(QualcommCELP)Qualcomm公司碼激勵線性預測編碼特點：是一種混合編碼技術(shù)采用矢量量化技術(shù)采用CELP技術(shù)采用話音激活技術(shù)(VAD)，速率可變速率有四種：9.6kbps、4.8kbps、2.4kbps和1.2kbps第三十三頁，共五十三頁，2022年，8月28日2023/1/1833矢量量化技術(shù)矢量量化：將若干個標量數(shù)據(jù)組成一個矢量，然后在矢量空間中給以整體量化，從而壓縮了數(shù)據(jù)而不損失很多信息－－它是一種能接近率失真理論限的量化技術(shù);是一種延遲判決編碼技術(shù)，把一個矢量映射為一個碼本索引并傳輸?shù)浇邮斩?，而碼本是一個由有限個矢量組成的集合，并且這些矢量能組合得到所有可能的矢量第三十四頁，共五十三頁，2022年，8月28日2023/1/1834矢量量化技術(shù)示意第三十五頁，共五十三頁，2022年，8月28日2023/1/1835碼激勵線性預測技術(shù)(CELP)特點：基于線性預測編碼技術(shù)激勵源從碼本中搜索并乘上最佳增益，代替LP余量信號編碼過程：原始語音被分成幀，幀長約為10~30ms，對每幀進行LPC預測，求出LP參數(shù)在殘留信號中進行長時預測兩次預測結(jié)束后，得到激勵信號，并對激勵信號進行矢量量化第三十六頁，共五十三頁，2022年，8月28日2023/1/1836QCELP框圖共15個參數(shù)：濾波參數(shù)a1,a2,…,a12；音調(diào)參數(shù)L和b；增益參數(shù)G；碼表參數(shù)T第三十七頁，共五十三頁，2022年，8月28日2023/1/1837QCELP算法算法方案：把模擬語音按8kHz采樣按20ms一個語音幀，每幀160個樣本用這160個樣本產(chǎn)生3個參數(shù)子幀，這3個參數(shù)子幀不斷更新，并按一定幀結(jié)構(gòu)送至接收端濾波參數(shù)a1,a2,…,a12，對任何速率每20ms更新一次音調(diào)參數(shù)，不同速率更新頻率不同碼表參數(shù)，不同速率更新頻率不同第三十八頁，共五十三頁，2022年，8月28日2023/1/1838QCELP不同速率的參數(shù)變化注：1/8速率不是從碼表選擇，而是偽隨機激勵第三十九頁，共五十三頁，2022年，8月28日2023/1/1839QCELP速率選擇根據(jù)每一幀中的能量與3個門限值的比較3個門限值的選擇基于對背景噪聲的估計每一幀中的能量由自相關(guān)函數(shù)R(0)的值決定，與門限T1(Bi)、T2(Bi)和T3(Bi)(Bi為背景噪聲)的關(guān)系：若R(0)大于3個門限，則選擇速率‘1’若R(0)大于2個門限，則選擇速率‘1/2’若R(0)大于1個門限，則選擇速率‘1/4’若R(0)小于所有門限，則選擇速率‘1/8’每次只允許變化一級半速率時，門限‘1’實際為門限‘1/2’第四十頁，共五十三頁，2022年，8月28日2023/1/1840IS54語音編碼算法名稱：矢量和激勵線性預測編碼(VSELP)特點：采用CELP技術(shù)有三個碼本，一個為長時預測增益，另兩個為矢量碼本。每一激勵為3個碼本的信號組合在搜索最佳激勵矢量方面有簡化算法碼本為事先確定好的結(jié)構(gòu)，不用全搜索第四十一頁，共五十三頁，2022年，8月28日2023/1/1841WCDMA語音編碼算法名稱：(AMR)自適應(yīng)多速率編碼AMR概念：以更智能的方式解決信源編碼和信道編碼的速率匹配問題，實際的語音編碼速率將取決于信道條件原因：WCDMA支持多媒體業(yè)務(wù)，并支持分組交換與電路交換方式移動信道是隨機變化的，固定速率編碼不能使系統(tǒng)工作在最佳的信源編碼和信道編碼速率上信道質(zhì)量差時，信道編碼不足以糾正傳輸錯誤，此時應(yīng)改進信道編碼，減小信源編碼速率，提高語音質(zhì)量信道質(zhì)量好時，增加信源編碼速率，提高語音質(zhì)量第四十二頁，共五十三頁，2022年，8月28日2023/1/1842AMR語音編碼原理AMR是一種集成語音編碼器，有8種確定的信源速率模式，從4.75kbps~12.2kbps第四十三頁，共五十三頁，2022年，8月28日2023/1/1843AMR編碼框圖第四十四頁，共五十三頁，2022年，8月28日2023/1/1844AMR解碼框圖第四十五頁，共五十三頁，2022年，8月28日2023/1/1845圖像壓縮編碼圖像信息量大，處理技術(shù)復雜圖像信息量遠大于語音、文字、傳真，所占用的傳輸頻帶也更寬傳輸、處理、存儲圖像信息都比語音、文字等更復雜、更困難圖像包括：靜止圖像、可視電話、會議電視、廣播電視和高清晰度電視等不同等級為節(jié)約傳輸帶寬，根據(jù)圖像信息中有大量的冗余信息，需要且能夠?qū)D像信息進行壓縮編碼第四十六頁，共五十三頁，2022年，8月28日2023/1/1846圖像壓縮編碼原理根據(jù)各類圖像的客觀統(tǒng)計特性、以及接收者人眼的生理與心理特征，來制定綜合匹配的壓縮編碼方式通過圖像的幀間預測來消除圖像的時域相關(guān)性通過圖像的幀內(nèi)離散余弦變換(DCT)來消除圖像的空間域相關(guān)性利用人眼視覺生理與心理特征進行自適應(yīng)量化編碼通過熵編碼實現(xiàn)與信源的概率統(tǒng)計匹配采用緩沖存儲器實現(xiàn)輸入變長與輸出定長之間的匹配第四十七頁，共五十三頁，2022年，8月28日2023/1/1847圖像壓縮編碼標準第四十八頁，共五十三頁，2022年，8月28日2023/1/1848MPEG4綜述比前面的MPEGx更加全面

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

信源編碼技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

信源編碼技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔