信源編碼技術_第1頁
信源編碼技術_第2頁
信源編碼技術_第3頁
信源編碼技術_第4頁
信源編碼技術_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信源編碼技術第一頁,共五十三頁,2022年,8月28日2023/1/181信源編碼技術信源編碼:將模擬信源信號轉換為二進制數字信號,在接收端再將收到的數字信號還原為模擬信號的方法這是由模擬網數字網至關重要的一步類別語音編解碼圖像編解碼目前在移動通信系統中,語音信號還是主要業(yè)務,在今后多媒體移動系統中,圖像業(yè)務比重越來越大。第二頁,共五十三頁,2022年,8月28日2023/1/182語音編碼概念:把模擬語音信號變成數字語音信號,以便在信道中傳輸意義提高通話質量(數字化+糾錯碼)提高頻譜利用率(低碼率編碼)提高系統容量(低碼率+話音激活技術)移動通信對語音編碼要求碼率低、語音質量高抗噪聲和抗干擾能力強編譯碼延時小,總延時在65ms以內編譯碼復雜度低,便于大規(guī)模集成化功耗小,便于應用于手持臺第三頁,共五十三頁,2022年,8月28日2023/1/183語音編碼分類第四頁,共五十三頁,2022年,8月28日2023/1/184語音編碼方法波形編碼:將時間域信號直接變換成數字代碼,目的是盡可能精確再現原始語音波形?;驹硎窃跁r間軸上對模擬語音按一定速率抽樣,然后將幅度樣本分層量化,并用代碼表示。參量編碼:又稱聲源編碼,是將信源信號在頻域或其它正交變換域提取特征參量,并轉換成數字代碼進行傳輸?;驹硎且园l(fā)音機制的模型為基礎,用一套模擬聲帶頻譜特性的濾波器系數和若干聲源參數來描述這個模型,從模擬語音信號中提取這些特征參量并量化編碼混合編碼:將波形編碼和參量編碼結合起來第五頁,共五十三頁,2022年,8月28日2023/1/185幾種語音編碼優(yōu)缺點波形編碼優(yōu)點:對于比特速率較高的編碼信號(16~64kbits/s),波形編碼技術能夠提供相當好的話音質量缺點:對低速語音編碼(低于16kbits/s),波形編碼的語音質量顯著下降,所以不適合頻譜資源緊張的移動通信系統參量編碼優(yōu)點:可實現低速語音編碼,速率可達2~4.8kbits/s缺點:語音質量只能達到中等混合編碼吸收了上述兩種編碼的優(yōu)點,是優(yōu)選方向第六頁,共五十三頁,2022年,8月28日2023/1/186語音編碼與壓縮技術要實現低速、高質量的語音編碼,必須采用壓縮技術;波形技術處理:削減語音波形冗余度,包括線性預測分析、頻帶分割、正交變換和分析合成等;量化技術:優(yōu)化幅度量化,包括自適應量化、自適應比特分配和矢量量化第七頁,共五十三頁,2022年,8月28日2023/1/187語音評價客觀評定方法:用客觀測量的手段來評價語音編碼的質量,常用信噪比、加權信噪比、平均分段信噪比等方法;特點有建立在度量均方誤差基礎上;計算簡單;對于低速語音編碼,不能完全反映人對語音質量的感覺主觀評定方法:主觀評定等級或平均評定得分(MOS)--由數十名試聽者在相同信道環(huán)境中試聽并給予評分,然后對評分進行統計處理,求出平均得分。要求試聽者人數足夠多;語音材料足夠豐富;試聽環(huán)境盡量相同MeanOpinionScore第八頁,共五十三頁,2022年,8月28日2023/1/188主觀評定等級試聽者對語音質量的感覺往往是和注意力集中程度相聯系的,因此對于主觀評定等級,還有一個收聽注意力等級。第九頁,共五十三頁,2022年,8月28日2023/1/189MOS分與語音質量MOS分在4.0~4.5分為高質量語音編碼,達到長途電話網的質量要求MOS分為3.5分左右稱作通信質量,聽者能感覺到語音質量有所下降,但不影響正常通話,可以滿足多數通信系統使用要求MOS分為3分以下常稱為合成語音質量,只有足夠高的可懂度,但自然度較差,不容易識別講話者第十頁,共五十三頁,2022年,8月28日2023/1/1810語音編碼現狀標準制定情況第十一頁,共五十三頁,2022年,8月28日2023/1/1811第十二頁,共五十三頁,2022年,8月28日2023/1/1812語音質量與比特速率第十三頁,共五十三頁,2022年,8月28日2023/1/1813語音波形編碼模擬語音信號數字語音信號:時間和幅度離散化,即抽樣與量化抽樣定理:采樣率大于或等于信號帶寬的2倍,離散信號可以無失真恢復成原始模擬信號幅度量化:用有限個幅值表示樣值幅度,從而離散化信號幅度的過程量化階距:相鄰兩量化值之差均勻量化:量化階距為常量--小信號的“信號與量化噪聲比”小,因此對小信號不利非均勻量化:量化階距可變--壓縮量化,即在均勻量化前,對大信號進行壓縮,對小信號進行放大第十四頁,共五十三頁,2022年,8月28日2023/1/1814壓縮量化壓縮量化:對輸入信號的對數進行量化,以使量化信噪比與量化電平無關律壓縮:A律壓縮:第十五頁,共五十三頁,2022年,8月28日2023/1/1815壓縮量化特性A與的物理意義:最大量化階距與最小量化階距之比第十六頁,共五十三頁,2022年,8月28日2023/1/1816PCM調制PCM(脈沖編碼調制):直接將樣值編碼為信號,特點為64kbit/s:量化成128個正負各半的量值,用7位二進制數表示,再加上一位符號共8比特;采樣率8kHz采用A律或律壓縮第十七頁,共五十三頁,2022年,8月28日2023/1/1817參量編碼原理原理:模型化人類語音產生機制,提取模型參數,并且只傳送模型參數--低碼率編碼,導致合成的語音波形失去了自然度和音質語音信號的產生模型語音的產生:聲帶與聲道不同語音產生原因:聲音激勵源和聲道不同聲音分類:清音和濁音濁音:聲帶振動基音周期波形:三角形周期脈沖波,含豐富諧音清音:聲帶不振動,類似白噪聲發(fā)聲過程:口腔和鼻腔形成時變?yōu)V波器第十八頁,共五十三頁,2022年,8月28日2023/1/1818清音和濁音清濁音信號清濁音頻譜第十九頁,共五十三頁,2022年,8月28日2023/1/1819語音產生模型語音模型的建立:1、產生激勵;2、響應模型參數:基音、共振峰頻率及強度、清濁音判決第二十頁,共五十三頁,2022年,8月28日2023/1/1820特征提取參數基于語音信號的短時準平穩(wěn)特性-10~20ms提取技術自相關函數法平均幅度差函數法線性預測短時波形分析短時處理技術加窗技術:方窗和哈明窗基音周期估計:基于短時自相關函數基于短時平均幅度差函數第二十一頁,共五十三頁,2022年,8月28日2023/1/1821線性預測編碼(LPC)線性預測:一個語音采樣的現在值可以用若干個語音采樣的過去值的加權線性組合來逼近。其中加權系數稱為預測器系數。線性預測語音編碼機理:語音信源是相關信源,即使經過采樣與量化,相鄰樣點仍有很強相關性。線性預測編碼:把線性預測用于語音編碼。預測模型一般為一個全極點模型準則:最小均方誤差傳輸:預測系數、基音周期和增益、清濁音判決第二十二頁,共五十三頁,2022年,8月28日2023/1/1822LPC數學描述第二十三頁,共五十三頁,2022年,8月28日2023/1/1823LPC實現結構(a)編碼器(b)譯碼器第二十四頁,共五十三頁,2022年,8月28日2023/1/1824LPC編碼器缺陷缺點:損失了語音的音質抗噪聲能力差譜包絡估計可能產生較大失真原因:激勵信號在濁音段采用周期脈沖,在清音段采用白噪聲沒有將發(fā)端模型的誤差信號傳到收端第二十五頁,共五十三頁,2022年,8月28日2023/1/1825混合編碼為克服LPC的缺陷,采用混合編碼器,即在產生模型參數的同時,激勵信號從語音波形信號獲得方法一條路徑產生線性預測參數并傳送出去一條路徑濾出信號的低頻成分,并通過波形編碼傳送出去接收端的激勵信號特點不需要進行清濁音判決和基音周期提取編碼速率一般比LPC高音質比LPC編碼器好第二十六頁,共五十三頁,2022年,8月28日2023/1/1826用于移動通信的語音編碼移動通信中實用的語音編碼均為混合編碼第二十七頁,共五十三頁,2022年,8月28日2023/1/1827混合編碼的共同特點先進行線性預測分析去掉語音的短時相關性;再分析出最佳激勵信號;對激勵信號和線性預測參數進行編碼傳送;第二十八頁,共五十三頁,2022年,8月28日2023/1/1828GSM的語音編碼算法名稱:(RPE-LTP)規(guī)則脈沖激勵長時預測編碼特點:是一種混合編碼技術采用間隔相等、相位和幅度優(yōu)化的規(guī)則脈沖作為激勵源結合長時預測,消除信號冗余度,碼率低語音檢測--靜寂描述(SID)幀編碼率13kb/s計算簡單、計算量適中、易于硬件化語音質量MOS達4.0RegularPulseExcitation-LongTimePrediction第二十九頁,共五十三頁,2022年,8月28日2023/1/1829RPE-LTP算法方案20ms為一幀,分成4個子幀,每個子幀含40個樣點(采樣率8kHz)每個子幀預測誤差信號的樣點按3:1等間隔抽取,得到13個樣點(共有4種序列)在4種序列中選擇一種對語音波形貢獻最大的序列找到序列中的最大非零點,用6比特編碼用最大非零點歸一化整個序列,用APCM編碼,每個樣值各用3個比特編碼第三十頁,共五十三頁,2022年,8月28日2023/1/1830GSM語音編碼框圖第三十一頁,共五十三頁,2022年,8月28日2023/1/1831GSM語音解碼框圖第三十二頁,共五十三頁,2022年,8月28日2023/1/1832IS-95語音編碼技術算法名稱:(QualcommCELP)Qualcomm公司碼激勵線性預測編碼特點:是一種混合編碼技術采用矢量量化技術采用CELP技術采用話音激活技術(VAD),速率可變速率有四種:9.6kbps、4.8kbps、2.4kbps和1.2kbps第三十三頁,共五十三頁,2022年,8月28日2023/1/1833矢量量化技術矢量量化:將若干個標量數據組成一個矢量,然后在矢量空間中給以整體量化,從而壓縮了數據而不損失很多信息--它是一種能接近率失真理論限的量化技術;是一種延遲判決編碼技術,把一個矢量映射為一個碼本索引并傳輸到接收端,而碼本是一個由有限個矢量組成的集合,并且這些矢量能組合得到所有可能的矢量第三十四頁,共五十三頁,2022年,8月28日2023/1/1834矢量量化技術示意第三十五頁,共五十三頁,2022年,8月28日2023/1/1835碼激勵線性預測技術(CELP)特點:基于線性預測編碼技術激勵源從碼本中搜索并乘上最佳增益,代替LP余量信號編碼過程:原始語音被分成幀,幀長約為10~30ms,對每幀進行LPC預測,求出LP參數在殘留信號中進行長時預測兩次預測結束后,得到激勵信號,并對激勵信號進行矢量量化第三十六頁,共五十三頁,2022年,8月28日2023/1/1836QCELP框圖共15個參數:濾波參數a1,a2,…,a12;音調參數L和b;增益參數G;碼表參數T第三十七頁,共五十三頁,2022年,8月28日2023/1/1837QCELP算法算法方案:把模擬語音按8kHz采樣按20ms一個語音幀,每幀160個樣本用這160個樣本產生3個參數子幀,這3個參數子幀不斷更新,并按一定幀結構送至接收端濾波參數a1,a2,…,a12,對任何速率每20ms更新一次音調參數,不同速率更新頻率不同碼表參數,不同速率更新頻率不同第三十八頁,共五十三頁,2022年,8月28日2023/1/1838QCELP不同速率的參數變化注:1/8速率不是從碼表選擇,而是偽隨機激勵第三十九頁,共五十三頁,2022年,8月28日2023/1/1839QCELP速率選擇根據每一幀中的能量與3個門限值的比較3個門限值的選擇基于對背景噪聲的估計每一幀中的能量由自相關函數R(0)的值決定,與門限T1(Bi)、T2(Bi)和T3(Bi)(Bi為背景噪聲)的關系:若R(0)大于3個門限,則選擇速率‘1’若R(0)大于2個門限,則選擇速率‘1/2’若R(0)大于1個門限,則選擇速率‘1/4’若R(0)小于所有門限,則選擇速率‘1/8’每次只允許變化一級半速率時,門限‘1’實際為門限‘1/2’第四十頁,共五十三頁,2022年,8月28日2023/1/1840IS54語音編碼算法名稱:矢量和激勵線性預測編碼(VSELP)特點:采用CELP技術有三個碼本,一個為長時預測增益,另兩個為矢量碼本。每一激勵為3個碼本的信號組合在搜索最佳激勵矢量方面有簡化算法碼本為事先確定好的結構,不用全搜索第四十一頁,共五十三頁,2022年,8月28日2023/1/1841WCDMA語音編碼算法名稱:(AMR)自適應多速率編碼AMR概念:以更智能的方式解決信源編碼和信道編碼的速率匹配問題,實際的語音編碼速率將取決于信道條件原因:WCDMA支持多媒體業(yè)務,并支持分組交換與電路交換方式移動信道是隨機變化的,固定速率編碼不能使系統工作在最佳的信源編碼和信道編碼速率上信道質量差時,信道編碼不足以糾正傳輸錯誤,此時應改進信道編碼,減小信源編碼速率,提高語音質量信道質量好時,增加信源編碼速率,提高語音質量第四十二頁,共五十三頁,2022年,8月28日2023/1/1842AMR語音編碼原理AMR是一種集成語音編碼器,有8種確定的信源速率模式,從4.75kbps~12.2kbps第四十三頁,共五十三頁,2022年,8月28日2023/1/1843AMR編碼框圖第四十四頁,共五十三頁,2022年,8月28日2023/1/1844AMR解碼框圖第四十五頁,共五十三頁,2022年,8月28日2023/1/1845圖像壓縮編碼圖像信息量大,處理技術復雜圖像信息量遠大于語音、文字、傳真,所占用的傳輸頻帶也更寬傳輸、處理、存儲圖像信息都比語音、文字等更復雜、更困難圖像包括:靜止圖像、可視電話、會議電視、廣播電視和高清晰度電視等不同等級為節(jié)約傳輸帶寬,根據圖像信息中有大量的冗余信息,需要且能夠對圖像信息進行壓縮編碼第四十六頁,共五十三頁,2022年,8月28日2023/1/1846圖像壓縮編碼原理根據各類圖像的客觀統計特性、以及接收者人眼的生理與心理特征,來制定綜合匹配的壓縮編碼方式通過圖像的幀間預測來消除圖像的時域相關性通過圖像的幀內離散余弦變換(DCT)來消除圖像的空間域相關性利用人眼視覺生理與心理特征進行自適應量化編碼通過熵編碼實現與信源的概率統計匹配采用緩沖存儲器實現輸入變長與輸出定長之間的匹配第四十七頁,共五十三頁,2022年,8月28日2023/1/1847圖像壓縮編碼標準第四十八頁,共五十三頁,2022年,8月28日2023/1/1848MPEG4綜述比前面的MPEGx更加全面

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論