




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
南京郵電大學
通信與信息工程學院
第12章聲源定位雙耳聽覺定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.1雙耳聽覺定位原理及方法—人耳聽覺定位原理原理:主要是依靠頭部結構所引起的“雙耳效應”和耳朵結構的“耳郭效應”及復雜的神經系統(tǒng)實現(xiàn)人耳對于聲音信號的方位判斷。構造:由外耳、中耳和內耳組成。外耳包括耳翼和外耳道,負責在中頻段產生共鳴;中耳由鼓膜和聽小骨組成,起到阻抗變換器的作用,將聲波從低阻抗的空氣傳遞到高阻抗的淋巴液;內耳包括耳蝸,是聽覺系統(tǒng)的核心部分,其中基底膜上的毛狀神經末梢負責將聲音振動轉化為神經信號。特性:(1)耳蝸分頻特性:耳蝸能夠將不同頻率的聲音在基底膜上進行分頻處理,類似于頻譜分析儀,將聲音劃分為多個臨界頻帶。(2)人耳聽覺掩蔽效應:當兩個聲音同時存在時,一個聲音可能會因為另一個聲音的干擾而變得難以聽見。掩蔽效應分為頻域掩蔽和時域掩蔽。12.1雙耳聽覺定位原理及方法—人耳聲源定位線索(1)雙耳定位線索:人類利用雙耳感知聲音的強度、音調和音色,并判斷聲源的距離和方向;聲源定位主要依賴于聲音到達雙耳的時間差(ITD)、強度差(ILD)、雙耳相位差和雙耳音色差;在低中頻(f<1.5kHz)情況下,雙耳時間差是主要因素;在1.5~4.0kHz范圍內,聲級差和時間差共同作用;高頻(f>5.0kHz)時,雙耳聲級差成為主要因素。(2)“耳郭效應”定位線索:耳郭的形狀和結構對聲音的頻譜特性產生影響,類似于梳狀濾波器;不同方向的聲音在耳郭上產生不同的反射和直達聲,導致在鼓膜處形成與聲源方向有關的頻譜特性;耳郭效應主要影響高頻聲音,因為高頻波長短,容易產生干涉現(xiàn)象。12.1雙耳聽覺定位原理及方法—人耳聲源定位線索(3)頭相關傳輸函數(shù):HRTF描述了聲波從聲源到雙耳的傳輸過程,包括ITD、ILD和頻譜結構特性;HRTF是個體差異的,因為每個人的頭部和耳郭形狀不同;HRTF可以通過測量或計算得到,其中麻省理工學院的CIPIC數(shù)據庫提供了適合中國人生理構造的HRTF數(shù)據。12.1雙耳聽覺定位原理及方法—聲源估計方法聲源定位指標:水平方位角不同頻率下的定位作用:在中低頻(小于1.5kHz,最佳信號頻率為270~500Hz)時,ITD起主要作用;在中頻(1.6~4kHz)時,ITD和ILD共同作用;在中高頻(4~5kHz)時,ILD起主要作用;在高頻(5~6kHz以上)時,耳郭對聲波的散射起到梳狀濾波的作用,對定位垂面上的聲源方位有重要作用。水平極坐標模型:描述了聲音信號到達頭部坐標的示意圖,其中線路方向、左右耳傳感器和中心坐標點在同一平面。聲源到左右耳的距離差(Δd):參數(shù)化ITD模型:
模型反轉:當方位評估時信號的頻率與建模時不一致,可以使用參數(shù)模型反轉來得到水平角度θ,即雙耳聽覺定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.2傳聲器陣列模型—概述傳聲器陣列定義:傳聲器陣列是由多個傳聲器按照一定空間結構排列組成的,其中各個陣元的間距和具體位置對聲源定位起著決定性作用。傳聲器陣列的觀察空間由其拓撲結構決定,導向向量攜帶聲源位置的參數(shù)信息。傳聲器陣列模型:根據聲源與傳聲器陣列的距離,傳聲器陣列模型可分為近場和遠場,判斷公式為
。傳聲器陣列處理的信號考慮了近場和遠場模型下不同的拓撲結構,這些結構影響空間導向向量和攜帶的信息。近場模型攜帶距離、時延和聲源空間位置信息,而遠場模型僅攜帶聲源空間位置信息。此外,陣元間距也直接影響著聲源定位的結果,而陣元個數(shù)可以適當?shù)靥岣叨ㄎ痪取S纱丝梢?,傳聲器的拓撲結構對后續(xù)聲源定位起著至關重要的作用。12.2傳聲器陣列模型—均勻線陣定義:均勻線陣是一種簡單的陣列形式,由M個陣元等距離排列成一直線,陣元間距為d。時延和方向向量:以第一個陣元為參考,各陣元相對參考陣元的時延由公式
給出。方向向量由陣元的時延決定,并且與空間角θ有關,如下
陣列流形矩陣:若有D個信號源,其波達方向分別為θi(i=1,2,...,D),則陣列流形矩陣為
12.2傳聲器陣列模型—均勻線陣方向向量的唯一性:陣列結構要求方向向量a(θ)與空間角θ一一對應,以避免模糊現(xiàn)象。陣元間距的選擇:陣元間距d不能任意選定,需要精確校準。為了避免相位模糊,陣元間距應不大于半波長
,以保證陣列流形矩陣的列向量線性獨立。傳聲器陣列的輸出:12.2傳聲器陣列模型—均勻圓陣定義:均勻圓陣是一種平面陣列,能夠同時確定信號的方位角和仰角,由M個相同的各向同性陣元均勻分布在x-y平面的一個半徑為R的圓周上。采用球面坐標系表示入射平面波的波達方向,坐標系原點O位于陣列中心,即圓心。信源俯角θ是原點到信源的連線與z軸的夾角,方向角?是原點到信源的連線在x-y平面上的投影與x軸之間的夾角。陣元位置向量:第m個陣元與x軸之間的夾角為γm=2πm/M,該處的位置向量為
。信號的復包絡相位差:原點和第m個陣元接收到信號的復包絡間相位差為
。信號方向向量:UCA相對于波達方向為θ的信號方向向量為
。雙耳聽覺定位原理及方法傳聲器陣列模型基于傳聲器陣列的聲源定位12.3基于傳聲器陣列的聲源定位—概述基于傳聲器陣列的聲源定位算法大致可以分為以下三類:(1)基于最大輸出功率的可控波束形成算法,該方法對傳聲器陣列接收到的語音信號進行濾波、加權求和,然后直接控制傳聲器指向使波束有最大輸出功率的方向。(2)基于到達時間差的定位算法,該方法首先求出聲音到達不同位置傳聲器的時間差,再利用該時間差求得聲音到達不同位置傳聲器的距離差,最后用搜索或幾何知識確定聲源位置。(3)基于高分辨率譜估計的定向算法,該方法利用求解傳聲器信號間的相關矩陣來確定方向角,從而進一步確定聲源位置。12.3基于傳聲器陣列的聲源定位—基于最大輸出功率的可控波束形成算法基本原理:可控波束形成是一種早期的聲源定位算法,通過調節(jié)傳聲器陣列的接收方向來定位聲源。利用波束形成技術,在整個接收空間內掃描,尋找能量最大的方向作為聲源方位。通過濾波和加權求和處理接收到的聲源信號,形成波束,然后搜索聲源可能的方位。波束形成器分類:(1)延遲累加波束算法:運算量小,信號失真小,但抗噪性能較差,需要較多陣元;(2)自適應波束算法:添加自適應濾波環(huán)節(jié),運算量較大,可能產生失真,但適用于陣元數(shù)較少的情況。延遲-求和波束形成法:通過校正傳聲器信號并求和,以期望從不同空間位置得到源信號,同時削弱噪聲和混響影響,該方法定義為
。12.3基于傳聲器陣列的聲源定位—基于最大輸出功率的可控波束形成算法濾波-累加方法:在時間校正之前進行濾波,以產生濾波-累加方法。該方法頻域表達式為
。波束輸出功率:定義為
,通過搜索使波束輸出功率最大的點來確定聲源方位。
12.3基于傳聲器陣列的聲源定位—基于到達時間差的定位算法概述:基于到達時間差的定位算法是語音增強和聲源定位領域的關鍵技術,用于估計傳感器陣列中不同位置傳感器接收到的同源信號的時間差。步驟:第一步,進行時延估計,確定傳聲器陣列中不同傳聲器對同源語音信號的到達時間差(TDOA);第二步,根據TDOA和傳聲器的幾何位置,通過雙曲線方程確定聲源的方位和距離。二維和三維定位:在二維平面中,通過兩個傳聲器測定的時延和方位角可以確定聲源位置;在三維空間中,需要多個傳聲器來測定多個時延和方位角,以準確確定聲源位置。12.3基于傳聲器陣列的聲源定位—基于到達時間差的定位算法廣義互相關(GCC)法:最廣泛應用的時延估計方法,通過在頻域內對信號進行加權來抑制噪聲和反射的影響。自適應濾波法:可以處理時變信號,根據信號統(tǒng)計特性的變化自動調節(jié)濾波器系數(shù),具有更好的魯棒性。實際模型:通過多個時延估計值對應的雙曲線或雙曲面在空間上的交點確定聲源位置,可采用最小二乘擬合方法求出最優(yōu)解。12.3基于傳聲器陣列的聲源定位—基于到達時間差的定位算法實際應用中的挑戰(zhàn):(1)時延估計和定位分為兩個階段,導致定位結果可能不是最優(yōu);(2)TDE技術主要適用于單聲源定位,多聲源定位效果較差;(3)在噪聲和混響較強的環(huán)境中,時延估計的誤差較大,影響定位精度。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計的定位算法概述:由現(xiàn)代高分辨譜估計技術發(fā)展而來的聲源定位算法,稱為子空間技術。子空間技術是一種在陣列信號處理領域廣泛應用且基礎重要的技術,它通過將接收數(shù)據分解為信號子空間和噪聲子空間,并利用這兩個子空間的正交性來提高聲源定位的分辨力。該技術已成功應用于通信、雷達等領域,衍生出了如MUSIC和ESPRIT等算法,其中MUSIC算法通過噪聲子空間來估計信號的方向,而ESPRIT算法則利用信號子空間的旋轉不變特性來估計信號參數(shù),兩者都旨在提高定位精度并減少計算復雜度。MUSIC算法:利用信號子空間和噪聲子空間的正交性,通過構造空間譜函數(shù)并搜索譜峰來檢測信號的DOA,其步驟如下:
12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計的定位算法(1)收集信號樣本(n),n=0,1,...,K-1,其中P為采樣點數(shù),估計協(xié)方差函數(shù)為
;(2)對進行特征值分解,得
。式中為特征值對角陣,且從大到小順序排列
是對應的特征向量;(3)利用最小特征值的重數(shù)K,估計信號數(shù)
,并構造噪聲子空間
;(4)搜索MUSIC空間譜,找出
個峰值,得到DOA估計值。
其局限性有:在低信噪比環(huán)境下,MUSIC算法可能無法分辨接近的信號源;陣列流形誤差對MUSIC算法的性能有顯著影響。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計的定位算法ESPRIT算法:利用傳感器陣列的旋轉不變特性,通過分解成兩個子陣列并利用它們的平移不變性來估計信號參數(shù)。與MUSIC算法不同,ESPRIT算法不需要知道陣列的幾何結構,因此對陣列的校準要求較低。傳聲器陣列配置:一個由m個對偶極子組成的傳聲器陣列,分為兩個子陣列,對應元素具有相同的敏感度模式和位移偏移量d。信號模型:D個獨立的窄帶信號源入射到陣列,每個信號源具有中心頻率ω0,并且每個信號源的入射方向由θk表示,兩個子陣列第i組對應陣元的接收信號可以表示為12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計的定位算法向量表示:接收信號被表示為向量形式x(t)和u(t),其中包括陣列流形矩陣A(θ),旋轉因子矩陣Φ,以及噪聲向量nx(t)和nu(t)。陣列接收向量:定義了整個陣列的接收向量z(t),它是兩個子陣列接收向量的組合,并表示為自相關矩陣:計算了接收向量z(t)的自相關矩陣Rzz,可以表示為特征值分解:對自相關矩陣進行特征值分解,其中最小的2m-D個廣義特征值對應于噪聲,而最大的D個特征值對應于信號。12.3基于傳聲器陣列的聲源定位—基于高分辨率譜估計的定位算法旋轉不變結構特性:利用陣列的旋轉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年舞蹈教師資格證考試模擬試卷:舞蹈教育實習與教學反思考察題
- 2025年小學英語畢業(yè)考試模擬試卷-英語寫作教學資源2025年更新與應用
- 2025年成人高考《語文》模擬沖刺題庫:作文高分策略與審題技巧
- 2025年小學教師資格考試《綜合素質》歷年真題匯編與高分技巧試卷
- 2025年小學語文畢業(yè)升學考試全真模擬卷(古詩詞背誦默寫實戰(zhàn)演練)
- 2025年征信考試題庫:征信數(shù)據質量控制深度解析與模擬試題
- 成人高考《語文》2025年綜合運用題庫:詩詞歌賦賞析與理解
- 2025年調酒師職業(yè)技能大賽高級實踐操作試題試卷
- 2025年大學輔導員招聘考試:教育心理理論與實際應用試題集試卷
- 2025年安徽b2從業(yè)資格證模擬考試題目
- 廣東省茂名市電白區(qū)人民法院
- Q∕SY 1815-2015 排水采氣用起泡劑技術規(guī)范
- 礦山環(huán)境保護ppt課件(完整版)
- 《我不能失信》PPT【名師課件】
- CCEA GC 11-2019 工程造價咨詢企業(yè)服務清單
- DB11_T1630-2019 城市綜合管廊工程施工及質量驗收規(guī)范
- X-Y數(shù)控工作臺機電系統(tǒng)設計說明書
- 輪胎式裝載機檢測報告
- 部編版四年級語文下冊《親愛的漢修先生》整本書導讀課件(共38張PPT)
- 世界地理之歐洲西部
- 民辦教師人員花名冊
評論
0/150
提交評論