數(shù)字語音處理基礎(chǔ)_第1頁
數(shù)字語音處理基礎(chǔ)_第2頁
數(shù)字語音處理基礎(chǔ)_第3頁
數(shù)字語音處理基礎(chǔ)_第4頁
數(shù)字語音處理基礎(chǔ)_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)字語音處理基礎(chǔ)第2章數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理2.1發(fā)音的生理器官與過程2.4語音學基礎(chǔ)及漢語語音學2.3語音和語言2.5語音信號的特性分析第2頁,共87頁,星期六,2024年,5月第2章數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程語音:由人體發(fā)音器官在大腦控制下的生理運動產(chǎn)生。發(fā)音器官:由肺和氣管、喉(包括聲帶)、聲道(咽腔、鼻腔和口腔)三部分組成。

◆肺和氣管:整個語音系統(tǒng)的能源提供者

◆喉:主要的聲音生成機構(gòu)

◆聲道:則對生成的聲音進行調(diào)制肺:胸腔內(nèi)有彈性的海綿狀物質(zhì),可存儲空氣。肺的功能:

◆呼吸功能,進行氣體交換

◆提供能量,將壓縮空氣供給發(fā)音器官氣管:連接肺和喉,是肺與聲道聯(lián)系的通道第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-3-趙曉群

教授第3頁,共87頁,星期六,2024年,5月發(fā)音的生理器官即:呼吸系統(tǒng)呼吸系統(tǒng):呼吸道和肺呼吸道包括:上呼吸道(鼻,咽和喉)下呼吸道(氣管和主支氣管)第4頁,共87頁,星期六,2024年,5月第2章

數(shù)字語音處理基礎(chǔ)2.1

發(fā)音的生理器官與過程同濟大學電子與信息工程學院-5-趙曉群

教授呼吸:

◆不說話時,通常是規(guī)則的、平穩(wěn)的、節(jié)律性的

◆說話時,為保持語言的連續(xù)性,有短暫停頓呼吸特點:吸氣短、呼氣長,受句子結(jié)構(gòu)控制,無固定規(guī)則氣流的形成:①

空氣由肺部排入喉部,

經(jīng)過聲帶進入聲道,

③由嘴(或鼻)輻射出聲波,形成了語音圖2.1:喉的構(gòu)造。前聲帶聲門裂甲狀軟骨環(huán)形軟骨杓形軟骨

(a)發(fā)音階(b)呼吸圖2.1喉的構(gòu)造第5頁,共87頁,星期六,2024年,5月第6頁,共87頁,星期六,2024年,5月第7頁,共87頁,星期六,2024年,5月第8頁,共87頁,星期六,2024年,5月喉位置:第4~6頸椎段甲狀軟骨1環(huán)狀軟骨1會厭軟骨1杓狀軟骨2環(huán)杓關(guān)節(jié)環(huán)甲關(guān)節(jié)喉關(guān)節(jié)喉的結(jié)構(gòu)

喉的軟骨第9頁,共87頁,星期六,2024年,5月喉(標本)第10頁,共87頁,星期六,2024年,5月第11頁,共87頁,星期六,2024年,5月第12頁,共87頁,星期六,2024年,5月喉肌

第13頁,共87頁,星期六,2024年,5月喉腔喉腔側(cè)壁的粘膜有上、下兩對矢狀位的粘膜皺襞突入腔內(nèi),形成前庭襞和聲襞。出現(xiàn)聲門。第14頁,共87頁,星期六,2024年,5月名稱起止作用環(huán)甲肌甲杓?。晭Ъ。┉h(huán)杓后肌環(huán)杓側(cè)肌杓橫肌杓斜肌甲會厭肌甲狀軟骨前緣后面,杓狀軟骨外面及聲帶突環(huán)狀軟骨弓外面,甲狀軟骨下緣聲帶緊張聲帶松弛環(huán)狀軟骨板后面杓狀軟骨突聲門開大環(huán)狀軟骨弓上緣外杓狀軟骨肌突聲門縮小橫行連于兩側(cè)杓狀軟骨后面聲門縮小杓狀軟骨肌突另一側(cè)杓狀軟骨骨尖喉口縮小甲狀軟骨前角內(nèi)面會厭軟骨后緣喉口開大第15頁,共87頁,星期六,2024年,5月四、氣管和支氣管第16頁,共87頁,星期六,2024年,5月喉:由軟骨和肌肉組成的復雜系統(tǒng),含聲帶(發(fā)音器官)聲帶:

◆是閥門,又是振動部件

◆聲帶緊繃在喉頭的前后壁上,有折疊

◆聲帶的長度約10~14mm聲門:兩片聲帶之間的空間聲帶的前端由甲狀軟骨支撐,后端由杓狀軟骨支撐杓狀軟骨與環(huán)狀軟骨的上部相連軟骨由一組肌肉控制,可使開啟或閉合聲帶聲帶啟開時,是正常呼吸狀態(tài)聲帶閉合時,肺部密封成密室聲帶的生物學功能:

◆封閉氣管,保護肺道

◆在胸腔和腹腔建立一定的氣壓聲帶的聲學功能:為語音提供主要的激勵源第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-17-趙曉群

教授第17頁,共87頁,星期六,2024年,5月空氣作用:使聲帶開啟/閉合,形成脈動氣流(聲門脈沖串)基音周期(振動周期):聲帶每開啟/閉合一次的時間基音頻率(基頻):基音周期的倒數(shù)典型的脈動氣流:基頻隨人性別、年齡而不同基頻:通常為50~450Hz

◆男性一般為50~250Hz

◆女性一般為200~450Hz老年男性偏低,小孩和青年女性偏高基頻高則音調(diào)高,基頻低則音調(diào)低基頻與聲帶的大小、厚薄、松緊程度以及聲門上下之間的氣壓差等有關(guān)第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-18-趙曉群

教授圖2.2聲帶開啟的面積與時間的關(guān)系曲線8642時間/ms50%35%15%125Hz0246810121416面積/mm2第18頁,共87頁,星期六,2024年,5月聲道:從聲門至口唇的所有發(fā)音器官包括咽腔、口腔和鼻腔成男聲道:長17cm/面積20cm2聲道可看成非均勻截面的聲管,是時間函數(shù)??谇唬汉舷麓?、齒、齒齦、腭、舌和小舌等部分。上腭:分硬腭和軟腭舌:分舌尖、舌面和舌根鼻腔:在口腔上面,靠軟腭和小舌將其與口腔隔開

◆小舌下垂時,鼻腔與口腔便耦合起來

◆小舌上抬時,口腔與鼻腔不相通發(fā)音時,口腔和鼻腔都起共鳴作用。第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-19-趙曉群

教授圖2.3聲道縱剖面圖鼻鼻腔齒齦上唇牙齒下唇下腭骨舌骨甲狀軟骨氣管鼻咽軟腭口腔小舌舌根會咽喉管聲帶環(huán)形軟骨食道第19頁,共87頁,星期六,2024年,5月第20頁,共87頁,星期六,2024年,5月第21頁,共87頁,星期六,2024年,5月第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-22-趙曉群

教授口腔各器官協(xié)同動作,空氣流通過時形成不同阻礙,并產(chǎn)生振顫,發(fā)出不同聲音。咽腔:連接喉和食管與鼻腔和口腔的一段管子講話時,咽腔的形狀變化(如圖)

eiueaw咽腔與口腔使聲道的形狀變化增多,能發(fā)出較多的聲音。鼻腔:從咽腔一直沿伸到鼻孔,約10cm長。發(fā)鼻化語音時軟腭下垂。口腔是聲道最重要的部分,其大小和形狀可以通過調(diào)整舌、唇、齒和腭來改變。舌是最活躍的調(diào)整發(fā)音器官第22頁,共87頁,星期六,2024年,5月在發(fā)音過程中,肺部與相連的肌肉相當于聲道系統(tǒng)的激勵源濁音:聲帶處于收緊狀態(tài)時,氣流使聲帶振動產(chǎn)生的聲音清音:聲帶處于放松狀態(tài)時,不伴有聲帶振動產(chǎn)生的音兩種清音:摩擦音,爆破音摩擦音:舌在聲道的某處形成狹窄部位(收緊點)氣流經(jīng)過時產(chǎn)生湍流形成噪聲型的聲音爆破音:松懈聲帶,用舌和嘴唇關(guān)閉聲道,暫時阻止氣流。氣壓升高,突然放開舌與嘴唇,氣流釋放產(chǎn)生短暫沖音

◆不同的聲道收緊點和聲道形狀,形成不同的摩擦音

◆不同的聲道閉緊點和聲道形狀,形成不同的爆破音第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-23-趙曉群

教授肺肌力聲帶鼻腔鼻音口腔口音軟上腭和小舌咽腔聲門圖2.5語音產(chǎn)生的機理圖第23頁,共87頁,星期六,2024年,5月調(diào)音:發(fā)聲時,需要調(diào)整聲道的形狀調(diào)音運動:聲道各部位的運動調(diào)音器官:調(diào)音涉及聲道的各部分器官,包括舌、腭、唇和嘴等可以自由活動的部分。調(diào)音點:因調(diào)音產(chǎn)生的聲道固定部位的狹窄位置不同聲道形狀有不同聲道傳遞特性,產(chǎn)生不同音色語音共鳴用使能量隨頻率變化,產(chǎn)生各種差異語音聲道是對發(fā)音起著決定性作用的器官X光照相可以顯示出發(fā)音時聲道的形狀X光視頻1

X光視頻2聲學觀點:聲道可拉直而不影響其聲學特性,用聲管(模型)分析聲道的物理學機理第2章

數(shù)字語音處理基礎(chǔ)2.1發(fā)音的生理器官與過程同濟大學電子與信息工程學院-24-趙曉群

教授第24頁,共87頁,星期六,2024年,5月第2章數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理2.2.1聽覺系統(tǒng)1.耳的結(jié)構(gòu)圖2.6:人的聽覺系統(tǒng)?!艚M成:外耳、中耳和內(nèi)耳?!敉舛椭卸袑б舻淖饔?,合稱為導音系;◆內(nèi)耳有感音作用,稱感音器。其感音作用起始于蝸神經(jīng)的終端(螺旋器),故內(nèi)耳的淋巴系統(tǒng)也屬于導音系。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-25-趙曉群

教授圖2.6人的聽覺系統(tǒng)砧骨錘骨鼓膜外耳道耳翼聽神經(jīng)耳蝸內(nèi)耳中耳咽鼓管鐙骨半規(guī)管第25頁,共87頁,星期六,2024年,5月外耳:由耳翼、外耳道和鼓膜組成。◆耳翼:有保護耳孔和定向作用?!敉舛溃菏且粭l耳管,聲音沿其傳至鼓膜。有許多共振頻率,封閉時最低共振頻率約為3060

Hz。共振效應會使聲音得到10dB左右的放大?!舫赡耆说耐舛篱L約2.7cm,直徑約0.7cm?!艄哪ぃ何挥谕舛纼?nèi)端的韌性錐形結(jié)構(gòu),聲音的振動通過鼓膜傳到內(nèi)耳。日常談話中,鼓膜位移約為10?8cm。外耳的作用:有對聲源定位和聲放大。頭部的衍射效應也會增大鼓膜處的聲壓,系統(tǒng)總放大:20dB左右。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-26-趙曉群

教授第26頁,共87頁,星期六,2024年,5月圖2.7:中耳的結(jié)構(gòu)。中耳:為充氣腔體,由鼓膜將其與外耳隔離,通過圓形窗和前庭窗兩個小孔與內(nèi)耳相通。通過咽鼓管與外界相連,以平衡氣壓,保護鼓膜。聽骨鏈:由錘骨、砧骨和鐙骨三塊聽小骨組成,由韌帶懸掛在中耳的腔體內(nèi)(見圖2.7)。◆錘骨一端固定地附著在鼓膜上,◆鐙骨腳端覆蓋內(nèi)耳入口的前庭窗,◆砧骨將它們連接起來?!袈牴擎湆⒄駝觽鞯絻?nèi)耳并放大,起到杠桿的作用?!舴糯?0倍左右。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-27-趙曉群

教授圖2.7中耳的結(jié)構(gòu)韌帶錘骨鼓膜外耳道半規(guī)管砧骨鐙骨前庭窗膜中耳咽鼓管第27頁,共87頁,星期六,2024年,5月外耳包括:中耳包括:內(nèi)耳包括:耳廓、外耳道鼓膜、鼓室、聽小骨、咽鼓管半規(guī)管、前庭、耳蝸認識耳朵的結(jié)構(gòu)第28頁,共87頁,星期六,2024年,5月耳朵各個部分的功能耳廓:外耳道:鼓膜:聽小骨:咽鼓管:半規(guī)管:前庭:耳蝸:收集聲波外界聲波傳入中耳通道聲波作用下,能產(chǎn)生振動運動將振動傳到內(nèi)耳(把聲音放大)調(diào)節(jié)鼓室內(nèi)氣壓,從而維護正常聽力的作用旋轉(zhuǎn)感覺位置、速度感覺有聽覺感受器有感覺頭部位置變動的位覺感受器聽覺形成動畫第29頁,共87頁,星期六,2024年,5月一、耳朵的結(jié)構(gòu)耳廓耳蝸咽鼓管鼓室鼓膜外耳道前庭半規(guī)管聽小骨耳的結(jié)構(gòu)第30頁,共87頁,星期六,2024年,5月一、耳朵的結(jié)構(gòu)耳的結(jié)構(gòu)聽小骨(三塊)半規(guī)管前庭耳蝸咽鼓管鼓室鼓膜外耳道耳廓第31頁,共87頁,星期六,2024年,5月2、聽覺的形成聲波耳廓(收集空氣中的聲波)外耳道鼓膜(振動)鼓室內(nèi)聽小骨(把振動的聲音放大)耳蝸(內(nèi)有聽覺感受器)聽神經(jīng)大腦形成聽覺第32頁,共87頁,星期六,2024年,5月聽小骨在不同聲強范圍內(nèi)實現(xiàn)聲音的線性或非線性傳遞。中耳的作用:通過聽小骨進行聲阻抗變換,放大聲壓;

保護內(nèi)耳。

內(nèi)耳(迷路):在顱骨腔內(nèi),由半規(guī)管、前庭窗和耳蝸組成。半規(guī)管和前庭窗屬于本體感受器,與機體的平衡機能有關(guān)?!舭胍?guī)管內(nèi)的感受器能感受旋轉(zhuǎn)變速運動的刺激,◆前庭窗內(nèi)的感受器能感受靜止的位置和直線變速運動。耳蝸:是聽覺接受器,把聲音經(jīng)機械變換產(chǎn)生神經(jīng)發(fā)放信號?!舳伕呒s2cm,寬約1.5cm,呈螺旋狀盤旋2.5~2.75圈,拉直后約3~3.2cm長。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-33-趙曉群

教授第33頁,共87頁,星期六,2024年,5月耳蝸:由鼓階、中階和前庭階三個分隔的部分組成。圖2.8:耳蝸示意圖?!羟巴ルA和鼓階在耳蝸的尖端部位相通?!糁须A內(nèi)充滿高粘度的膠狀內(nèi)淋巴液,◆前庭階和鼓階內(nèi)則充滿粘度為水兩倍的淋巴液。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-34-趙曉群

教授前庭階中階鼓階前庭階中階鼓階骨螺旋板蝸孔覆膜中階基底膜耳蝸神經(jīng)骨質(zhì)層前庭階鼓階(a)耳蝸(通過蝸軸的剖面)(b)耳蝸橫截面圖2.8耳蝸示意圖第34頁,共87頁,星期六,2024年,5月◆中階的底膜稱為基底膜,◆基底膜之上是柯蒂氏器官,由耳蝸覆膜、外毛細胞(共3列,約20000個)以及內(nèi)毛細胞(共1列,約3500個)構(gòu)成。圖2.9:柯蒂氏器官示意圖?!艨碌偈掀鞴伲菏且粋€傳感裝置?!裘毎喜康奈⒔q毛感受耳蝸內(nèi)流體速度的變化,從而引起毛細胞膜兩邊電位的變化,可造成聽覺神經(jīng)的發(fā)放或抑制。內(nèi)耳的作用:感受聲音。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-35-趙曉群

教授圖2.9柯蒂氏器官示意圖外毛細胞內(nèi)毛細胞血管纖毛覆膜基底膜神經(jīng)纖維第35頁,共87頁,星期六,2024年,5月2.聽覺的形成聽覺系統(tǒng)的兩個重要特性:◆聽覺掩蔽效應;◆

耳蝸對于聲信號的時頻分析特性(見圖2.10)。耳蝸的時頻分析特性:◆聲音使鐙骨運動,使耳蝸內(nèi)流體壓強變化,引起行波沿基底膜的傳播?!袈曨l不同,產(chǎn)生的行波不同,峰值出現(xiàn)在基底膜的位置不同。為對數(shù)型分布?!纛l率低,峰值出現(xiàn)在基底膜的頂附近;◆頻率高,峰值出現(xiàn)在基底膜的底附近?!粽駝訌姸仍黾?,基底膜運動幅度加大,耳蝸:有頻譜分析作用。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-36-趙曉群

教授圖2.10基底膜的頻率響應分布圖1943頂部7291051431872382973654455366437669081073126414851741203723802777323737704386510059271915816774144691247810759927479916883基部第36頁,共87頁,星期六,2024年,5月基底膜上的絨毛細胞的特性:◆振動使基底膜和耳蝸覆膜之間的毛細胞上的絨毛發(fā)生彎曲。

絨毛彎向一邊,引起毛細胞的去極化,加強傳入神經(jīng)的作用;絨毛彎向另一邊,引起毛細胞的超極化,導致抑制效應?!艋啄ど喜煌课坏拿毎哂胁煌碾妼W和力學特性。在基部,基底膜窄而勁度強,毛細胞及其絨毛短而有勁度;在頂部,基底膜寬而柔和,毛細胞及其絨毛較長而柔和?!暨@種差異是基底膜有頻率選擇性和對數(shù)分布性的重要因素。人的聽覺范圍:20Hz~20kHz,0~130dB的聲音信號。◆聽覺范圍外的信號分量可忽略掉,以節(jié)省處理成本。◆人耳的感覺不是絕對的,隨著信號特性的不同而不同。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-37-趙曉群

教授第37頁,共87頁,星期六,2024年,5月發(fā)音和聽音及理解聲音都牽涉到人的神經(jīng)活動?!舭l(fā)音時,將觀念轉(zhuǎn)換成單詞和句子并發(fā)出指令,控制發(fā)音器官使其作適當運動;◆聽音時,柯蒂氏器官發(fā)出脈沖,經(jīng)神經(jīng)系統(tǒng)處理,使大腦感知這些編碼的神經(jīng)信號,轉(zhuǎn)換成詞匯并得到理解。

神經(jīng)系統(tǒng)的基元是神經(jīng)元。神經(jīng)元是一種專職細胞;有細胞體和細胞核。細胞體上伸展出的樹形支,稱軸突或神經(jīng)纖維。最小的分支的末端稱為神經(jīng)末梢。由突觸實現(xiàn)神經(jīng)元間的聯(lián)系??碌偈掀鞴偕系睦w毛細胞是一種感受細胞,將接受的感覺信息轉(zhuǎn)成電化學脈沖(見圖2.11),傳達給神經(jīng)元的突觸,并由神經(jīng)系統(tǒng)處理。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-38-趙曉群

教授圖2.11神經(jīng)系統(tǒng)的電化學脈沖的波形圖U/mV1000t/ms1ms第38頁,共87頁,星期六,2024年,5月神經(jīng)受激反應的規(guī)律:

(1)

刺激的強弱。超過門限值的刺激才產(chǎn)生脈沖。脈沖波形并不攜帶有刺激的強度信息。(2)

刺激的時間。存在“絕對不應期”和“相對不應期”?!艚^對不應期:約1~2ms,此期間的刺激不產(chǎn)生反應脈沖。◆相對不應期:約10

ms,此期間需要強刺激才產(chǎn)生反應脈沖。(3)刺激的強度反應在脈沖的個數(shù)上,但也有限制?!舸碳こ^門限值并持續(xù)10

ms以上,神經(jīng)元將不斷產(chǎn)生脈沖?!糇罡弋a(chǎn)生1000個脈沖/s左右,再增大刺激強度不起作用;(4)脈沖沿神經(jīng)纖維傳輸?shù)乃俣热Q于纖維的粗細?!糁睆皆酱螅瑐鬏斔俣仍娇??!粢部衫美曙w節(jié),跳躍傳輸。此時速度可高達100m/s左右?!衾曙w節(jié)是大的神經(jīng)纖維上的脂肪節(jié)。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-39-趙曉群

教授第39頁,共87頁,星期六,2024年,5月(5)神經(jīng)元之間的傳輸機制主要是化學的?!羰且粋€脈沖刺激另一個神經(jīng)元的電化學反應,并產(chǎn)生脈沖,然后在該神經(jīng)元軸突內(nèi)按上述方法傳輸。(6)神經(jīng)纖維有興奮和抑制兩種狀態(tài)?!粼谂d奮狀態(tài)時,神經(jīng)元之間的傳送是無阻的;◆抑制狀態(tài)時,受到抑制而不能傳送脈沖?!羧裟撤N神經(jīng)元同時受到好幾個興奮狀態(tài)的和抑制狀態(tài)的聯(lián)合刺激,則由其綜合效應來決定該神經(jīng)元的反應。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-40-趙曉群

教授第40頁,共87頁,星期六,2024年,5月語音的產(chǎn)生和理解:與神經(jīng)系統(tǒng)和大腦有關(guān),是高級活動。搞清大腦產(chǎn)生和理解語音的機理,對語音技術(shù)有極重要意義。特別是對語音合成與語音識別兩個分支。例,語音合成:◆目前,按規(guī)則合成只能從尋找各種語言的規(guī)則入手,盡可能得出較好的人工語言?!羧绻l(fā)音時大腦智能活動的機理之迷揭開,就可以獲得高度自然的語音合成。例,語音識別:◆目前,只能從語音信號出發(fā),用“隱過程”(如隱馬爾可夫模型)來模擬神經(jīng)系統(tǒng)的聽覺過程,不是按人的聽覺過程建立處理模型。不能達到理想的識別和理解效果?!暨@種方法與大腦用的方法并不一致。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-41-趙曉群

教授第41頁,共87頁,星期六,2024年,5月2.2.2語音的聽覺心理聽覺系統(tǒng)極靈敏。能感覺到接近空氣分子熱運動產(chǎn)生的聲壓。兩耳的傳遞速度不同。聲音從右耳傳至左大腦的速度比較快;聲音從左耳傳至右大腦的速度比較慢。兩耳辨音性能有所不同。◆辨聽元音的能力大體一致;◆辨聽輔音或音調(diào),右耳比左耳強一些。正常人聽覺范圍:20Hz~16kHz;年輕人可以聽到20kHz;老年人可聽頻率降到10kHz左右。聽覺器官對音高、音強、聲波的動態(tài)頻譜有分析感知能力。人耳對聲音的強度和主觀感覺是從響度和音調(diào)體現(xiàn)出來的

第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-42-趙曉群

教授第42頁,共87頁,星期六,2024年,5月1.人耳的聽閾和響度在物理上,客觀測量聲音強弱的單位:

dyn/cm2(聲壓),或W/cm2(聲強)。在心理上,主觀測量聲音強弱的單位:

方(phon)(響度級),或宋(sone)(響度)??陀^和主觀兩種聲音強弱的計量單位是完全不同的兩種概念,它們之間又有一定關(guān)系。國際協(xié)議規(guī)定,

0dB聲強級的1kHz純音的響度級定義為0方,

ndB聲強級的1kHz純音的響度級定義為n方。語音是復合音,含豐富諧波成分。人耳對不同純音,有不同的聽辨靈敏度。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-43-趙曉群

教授第43頁,共87頁,星期六,2024年,5月聽閾:當聲音的強度小到人耳剛剛可聽見時的聲強?!?kHz純音,聽閾為10?16W/cm2聲強(0dB聲強度級);◆0dB聲強級是非常小的單位,僅使鼓膜移動約10?9cm。痛閾:當聲音的強度大到人耳感到疼痛時的聲強?!?kHz純音,痛閾約為10?4W/cm2聲強(120dB聲強度級);◆120dB使鼓膜的位移約為10?3cm?!簟奥犻?頻率”和“痛閾?頻率”曲線表征其變化特性(見圖2.12)兩曲線間為聽覺范圍。聽覺范圍相當寬,達1012量級以上。例:1kHz,10dB聲強級的聲音,響度級為10方;與200Hz,30dB聲強級的聲音,感覺響度相同。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-44-趙曉群

教授圖2.12等響度曲線與聲強/聲強級的關(guān)系聲強/W·cm2

10-410-610-810-1010-1210-1410-16聲強級/dB12010080604020020

50

100

200

5001k2k5k

10k

頻率/Hz120方1101009080706050403020100方第44頁,共87頁,星期六,2024年,5月響度級不是響度。響度級是心理學家用來表示“漸強”的標度。單位是方)◆例:響度級為50方比40方的聲音響一些,

響度級為40方比20方的聲音響一些,響多少倍未知。響度是數(shù)量的表示(單位是宋)。◆例:2宋的響度使人感到比

1宋的響度響了2倍。◆規(guī)定:1宋響度為1kHz純音在其響度級為40dB(聲強10?12W/cm2)時的響度。圖2.13:“響度-響度級”曲線?!袈犛X的響度與響度級不是線性的。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-45-趙曉群

教授圖2.13“響度-響度級”曲線圖1201008060402000.010.1

1

10100響度/宋響度級/方第45頁,共87頁,星期六,2024年,5月2.

音調(diào)音調(diào):是聽覺分辨聲音高低時用于描述這種感覺的一種特性?!艨陀^上,用頻率表示聲音的音調(diào),其單位是Hz,◆主觀上,感覺音調(diào)的單位采用美(mel)標度?!暨@是兩個概念上的不同、既有聯(lián)系的計量單位感音范圍:20Hz~20kHz,約1000倍頻程,9~10個八度音。規(guī)定:音調(diào)的測量以40dB聲強為基準,由主觀感覺定標,且1kHz純音的音調(diào)定為1000美?!衾鹤屄犝呗爟蓚€40dB聲強級的純音,一純音頻率固定,

調(diào)節(jié)另一個純音的頻率使其感覺音調(diào)高1倍,

標定這兩個同聲強聲音的音調(diào)差為1倍。實驗表明:音調(diào)與頻率是非線性的,與聲強及波形有關(guān)?!衾?kHz、1000美純音的倍音調(diào)是2000美(頻率4kHz);其半音調(diào)為500美(頻率400Hz)。

第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-46-趙曉群

教授第46頁,共87頁,星期六,2024年,5月圖2.14:“音調(diào)-頻率”曲線。音調(diào)和頻率f的關(guān)系可以近似地表示為人耳可分辨音調(diào)約1400個,可分辨響度約280個。若聲強和頻率皆變化,人可分辨純音達30~40萬個。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-47-趙曉群

教授圖2.14“音調(diào)-頻率”曲線30002500200015001000500020501002005001k2k5k10k頻率/Hz主觀感覺的音調(diào)/美第47頁,共87頁,星期六,2024年,5月2.2.3掩蔽效應聽覺特性涉及到心理聲學和生理聲學方面的問題。聽覺特性的研究多在心理聲學和語言聲學領(lǐng)域。人的主觀感覺(聽覺)和客觀實際(聲波)不完全一致。聽覺機構(gòu)是極靈敏的聲音接收器,無物理儀器與之媲美。◆具有選擇性,起到分析器的作用。◆具有判斷響度、音調(diào)和音色的本領(lǐng)。現(xiàn)今科學未能完全揭示聽覺系統(tǒng)的復雜結(jié)構(gòu)和信息處理過程。掩蔽現(xiàn)象:較強聲音附近的相對較弱聲音將不被人耳覺察,即被強音所掩蔽。◆較強的音稱做掩蔽者,較弱的音稱做被掩蔽者。◆掩蔽效應:分同時掩蔽、異時掩蔽。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-48-趙曉群

教授第48頁,共87頁,星期六,2024年,5月1.同時掩蔽和異時掩蔽同時掩蔽:指掩蔽現(xiàn)象發(fā)生在掩蔽者和被掩蔽者同時存在時,也稱為頻域掩蔽。人耳對聲音響應隨頻率變化,最敏感的頻率段是2~4kHz。在這個頻率段以外,人耳的聽覺靈敏度逐漸降低。聽閾:人耳剛好可聽到的最小聲強級,是聲音頻率的函數(shù)。圖2.15中的虛線是人耳在安靜時的聽閾曲線。在掩蔽者頻率的鄰域內(nèi),聽力閾值被提高。◆掩蔽閾值:不可聞的被掩蔽者的最大聲強級。圖2.15:掩蔽閾值曲線。掩蔽閾值是時間、

頻率和聲強級的函數(shù)。

第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-49-趙曉群

教授圖2.151kHz頻率且60dB聲強級的音調(diào)信號掩蔽閾值曲線

80604020020501002005001k2k5k10k頻率/Hz聲強級/dB掩蔽聲被掩蔽聲掩蔽閾值安靜聽閾值第49頁,共87頁,星期六,2024年,5月◆低于掩蔽者的掩蔽閾值時,目標信號被掩蔽?!衾醚诒翁匦?,可降低編碼速率;◆對量化噪聲譜整形,使量化噪聲低于掩蔽閾值曲線,既降低量化碼率,又提高音頻編碼的主觀質(zhì)量。異時掩蔽:指掩蔽效應發(fā)生在掩蔽者和被掩蔽者不同時存在時,也稱為時域掩蔽。分前掩蔽、后掩蔽兩種。◆前掩蔽:掩蔽效應發(fā)生在掩蔽者開始之前的某段時間;◆后掩蔽:掩蔽效應發(fā)生在掩蔽者結(jié)束之后的某段時間。圖2.16:同時掩蔽和異時掩蔽現(xiàn)象,◆同時掩蔽在掩蔽者持續(xù)的時間內(nèi)有效,是一種較強的效應;◆異時掩蔽隨時間的推移很快衰減?!艉笱诒?00ms,前掩蔽20ms。利用前掩蔽,對抑制因時間分辨率不夠而造成的預回聲起著重要作用。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-50-趙曉群

教授圖2.163種掩蔽現(xiàn)象的強度及持續(xù)時間掩蔽者–100–50050100150050100150200時間/ms前掩蔽同時掩蔽后掩蔽6040200聲強級/dB第50頁,共87頁,星期六,2024年,5月2.各種不同的掩蔽效果掩蔽者有純音調(diào)、寬帶噪聲和窄帶噪聲共3種類型。不同的掩蔽者和被掩蔽者的組合有不同的掩蔽結(jié)果。(1)

純音調(diào)間的掩蔽。純音調(diào)間的掩蔽:指掩蔽者和被掩蔽者都是純音調(diào)聲音,(這種掩蔽效應比較簡單)。圖2.17:純音調(diào)對純音調(diào)產(chǎn)生的掩蔽曲線。◆掩蔽閾值曲線的低頻段陡峭,高頻段比較平坦。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-51-趙曉群

教授圖2.171kHz的不同聲強級的純音調(diào)對純音調(diào)的掩蔽閾值曲線806040200測試音聲強級/dB20

50

100

200

5001k2k5k

10k測試音頻率/HzLM=90dB7020安靜聽閾第51頁,共87頁,星期六,2024年,5月(2)

寬帶噪聲對純音調(diào)的掩蔽。寬帶噪聲對純音調(diào)的掩蔽:指掩蔽者是寬帶噪聲,

被掩蔽者是純音調(diào)聲音。白噪聲功率譜平坦,所產(chǎn)生的掩蔽閾值只在低頻段保持水平。在低頻段,掩蔽閾值一般高于噪聲功率密度17dB。當頻率大于約500Hz時,掩蔽閾值隨著頻率的增大而提高,每10

倍頻程約提高10dB。圖2.18:寬帶噪聲對純音調(diào)的掩蔽曲線。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-52-趙曉群

教授圖2.18寬帶噪聲對純音調(diào)的掩蔽閾值曲線80604020020501002005001k2k5k10k測試音頻率/Hz測試音聲強級/dBLMN=50dB403020100-10安靜聽閾第52頁,共87頁,星期六,2024年,5月圖2.19中心頻率為1kHz且聲強級不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線10080604020020501002005001k2k5k10k測試音頻率/Hz測試音聲強級/dBLCB=100dB80604020安靜聽閾(3)

窄帶噪聲對純音調(diào)的掩蔽。窄帶噪聲對純音調(diào)的掩蔽:指掩蔽者是窄帶噪聲,

被掩蔽者是純音調(diào)信號。該掩蔽效應較復雜,掩蔽閾值隨聲強級、中心頻率變化。圖2.19:1kHz中心頻率,聲強級不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線?!羟€的峰值出現(xiàn)在掩蔽者的中心頻率處,◆聲強級>80dB,掩蔽閾值在高頻段出現(xiàn)嚴重的非線性特性,有谷點出現(xiàn)。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-53-趙曉群

教授第53頁,共87頁,星期六,2024年,5月中心頻率不同的窄帶噪聲產(chǎn)生的掩蔽閾值曲線形狀是不同的。圖2.20:聲強級相同、中心頻率不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線?!艨梢姡诒伍撝登€是不等寬的,在低頻段曲線比較窄;隨著頻率的增高曲線逐漸變寬。

第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-54-趙曉群

教授圖2.20聲強級相同但中心頻率不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線測試音聲強級/dB8060402000246810121416測試音頻率/kHz250Hz1kHz4kHz8kHz安靜聽閾第54頁,共87頁,星期六,2024年,5月3.

臨界帶寬引入臨界帶寬,可方便描述窄帶噪聲對純音調(diào)的掩蔽效應。臨界帶寬的定義:一個純音調(diào)可以被以它為中心頻率,且具有一定帶寬的連續(xù)噪聲所掩蔽。若在這一頻帶內(nèi)噪聲功率等于該純音調(diào)的功率,且該純音調(diào)處于剛好能被聽到的臨界狀態(tài),稱這一帶寬為~。臨界帶寬有許多近似表示。◆一般在低于500

Hz的頻帶內(nèi),臨界帶寬約為100Hz;

◆高于500

Hz的頻帶上,臨界帶寬約為中心頻率的20%;◆最高可達到4

kHz。由定義知,臨界帶寬的位置可以是音頻范圍內(nèi)的任意位置。第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-55-趙曉群

教授第55頁,共87頁,星期六,2024年,5月第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-56-趙曉群

教授表2.1臨界帶寬表編號(Bark)中心頻率/Hz臨界帶寬/Hz相對帶寬/dB頻率范圍/Hz編號(Bark)中心頻率/Hz臨界帶寬/Hz相對帶寬/dB頻率范圍/Hz150801920~100131850280251720~2000215010020100~200142150320252000~2320325010020200~300152500380262320~2700435010020300~400162900450272700~3150545011020400~510173400550273150~3700657012021510~630184000700283700~4400770014021630~770194800900294400~5300884015022770~9202058001100305300~64009100016022920~10802170001300326400~7700101170190231080~12702285001800327700~9500111370210231270~148023105002500349500~12000121600240241480~1720241350035003512000~15500表2.1:24個臨界帶寬的編號、中心頻率及其帶寬的數(shù)據(jù)。◆工程上,在20Hz~16kHz內(nèi)劃分為24個頻率群表示,或者說劃分為24Bark域,這是為了紀念Bark

hauseu而命名的。第56頁,共87頁,星期六,2024年,5月第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-57-趙曉群

教授以臨界帶寬描述掩蔽效應可從聽覺生理上找到科學依據(jù)?!羧硕幕啄ぞ哂信c頻譜分析儀相似的作用?!纛l率群的劃分相應地將基底膜分成許多小的部分,每一部分對應一個頻率群?!粞诒涡谶@些頻率群內(nèi)發(fā)生:同一頻率群的聲音作用于基底膜的相同部分,對大腦的刺激似乎是疊加在一起來評價的。若同時發(fā)聲,可互相掩蔽。第57頁,共87頁,星期六,2024年,5月第2章

數(shù)字語音處理基礎(chǔ)2.2聽覺的生理器官與心理同濟大學電子與信息工程學院-58-趙曉群

教授Bark域與基底膜的長度呈線性關(guān)系,與聲頻呈對數(shù)關(guān)系。Bark

頻帶

l與頻率

f的關(guān)系為:圖2.21:Bark域上聲強級相同中心頻率不同窄帶信號對純音調(diào)的掩蔽閾值曲線。◆可見,掩蔽閾值曲線在Bark尺度上是等寬的。圖2.21聲強級相同但中心頻率不同的窄帶噪聲對純音調(diào)的掩蔽閾值曲線250Hz500Hz1kHz2kHz4kHz8kHz8060402000510

152025臨界頻帶/Bark測試音聲強級/dB安靜聽閾第58頁,共87頁,星期六,2024年,5月第2章數(shù)字語音處理基礎(chǔ)2.3語音和語言語言是從言語歷史中概括總結(jié)出來的規(guī)律性的符號系統(tǒng)語言是進行思維、交際的形式語音是聲音、語言和意義的結(jié)合體聲音是語音的物質(zhì)形式;語音是語言的物質(zhì)外殼、信息載體但是,聲音和意義間無必然聯(lián)系,其意義是約定俗成的語音由一串音組成語言的聲音,音間過渡代表信息的符號,音(符號)的排列由語音規(guī)則約束。語音的研究:包括語言學、語音學語言學:語音中各個音的排列規(guī)則及其含意的研究語音學:語音中各個音的物理特征和分類的研究第2章

數(shù)字語音處理基礎(chǔ)2.3語音和語言同濟大學電子與信息工程學院-59-趙曉群

教授第59頁,共87頁,星期六,2024年,5月說話過程可分五個階段:想說階段、說出階段、傳送階段、接收階段、理解階段1、想說階段:(與大腦中樞的活動有關(guān))

◆大腦決策產(chǎn)生說話動機◆講話神經(jīng)中樞選單詞、短語,按規(guī)則組合表達內(nèi)容和情感2、說出階段:(與發(fā)音器官的活動有關(guān))

◆大腦中樞決策,向發(fā)音器官發(fā)指令,使舌、唇、顎、聲帶、肺等協(xié)調(diào)動作,發(fā)出聲音

◆大腦也發(fā)指令給其它器官,產(chǎn)生各種動作來配合

◆根據(jù)聽覺系統(tǒng)接收的反饋語音信息,來幫助修改語音。3、傳送階段:(傳送聲波信息的物理過程)

◆聲波以空氣為媒介傳送到聽者的耳中第2章

數(shù)字語音處理基礎(chǔ)2.3語音和語言同濟大學電子與信息工程學院-60-趙曉群

教授第60頁,共87頁,星期六,2024年,5月4、接收階段:(與聽覺系統(tǒng)活動有關(guān))

◆外耳收集聲波信息,經(jīng)中耳放大,傳到內(nèi)耳◆

經(jīng)內(nèi)耳基底膜振動,激發(fā)柯蒂氏器官內(nèi)的神經(jīng)元產(chǎn)生脈沖◆將信息以脈沖的形式傳送給大腦5、理解階段:(至今尚未完全了解,機理不很清楚)◆聽覺神經(jīng)中樞收到脈沖信息,辨認話者及所說信息說話過程相當復雜,有心理、生理、物理及個人和社會因素個人因素:話者口音、用詞造句特色聽者的聽力、理解力。社會因素:話者、聽者的社會基礎(chǔ)、環(huán)境等語言要素:分語言的語素、詞、短語和句子等不同層次及詞法、句法、文脈等語法和語義內(nèi)容等。句法的最小單位是單詞,詞法的最小單位是音節(jié)。不同語言有不同語言規(guī)則第2章

數(shù)字語音處理基礎(chǔ)2.3語音和語言同濟大學電子與信息工程學院-61-趙曉群

教授第61頁,共87頁,星期六,2024年,5月語音學研究語音產(chǎn)生、語音感知等,音的特征和分類等問題語音學與語音信號處理學科有緊密聯(lián)系。說話交流過程分為“發(fā)音→傳遞→感知”三個階段現(xiàn)代語音學分支:發(fā)音語音學、聲學語音學、聽覺語音學發(fā)音語音學:從生理的角度研究語音(已相當成熟)直接觀察發(fā)音器官的動作或借助儀器來研究聲學語音學:研究語音傳遞的聲學特性◆用聲學和非平穩(wěn)信號分析理論解釋各種語音現(xiàn)象◆語音的聲學物理性質(zhì)及與發(fā)音器官之間的關(guān)系?!舢a(chǎn)生聲音模擬、語音合成和語音識別等研究方向。聽覺語音學和心理語言學:(較新學科,處于探索階段)◆探索大腦如何進行語音的發(fā)出和接收,◆語言信息以什么形式在大腦的什么部位存儲等第2章

數(shù)字語音處理基礎(chǔ)2.3語音和語言同濟大學電子與信息工程學院-62-趙曉群

教授第62頁,共87頁,星期六,2024年,5月第2章數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學

2.4.1聲波的物理描述聲波從聲源向四面八方傳播聲波的頻率:單位時間內(nèi)聲波的周期數(shù)聲波的波長:聲波中兩個波峰之間相隔的空間距離

波長=傳播速度/頻率頻率高波長短;頻率低波長長聲波有頻度和振幅兩個特點。聲頻與音調(diào)有關(guān),振幅與響度有關(guān)。聲頻高,聲音就高(音調(diào)高);聲頻低,聲音就低(音調(diào)低)第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-63-趙曉群

教授第63頁,共87頁,星期六,2024年,5月聲音分:復合音、純音純音:僅有基音,沒有倍音倍音:頻率是基音頻率的整倍數(shù)的聲音成分復合音:除純音外的聲音一般的聲音是包含了復合聲波的聲音人類發(fā)出的元音是復合音大部分聲音并非只有一個基頻通常,基頻的能量最高,力度最強,其它倍音的能量逐漸減低,力度逐漸減弱不同聲音的區(qū)別是和弦不同(不同樂器的音色因和弦不同)聲音的基音與倍音共同組成這個聲音的和弦頻率最低的和弦是第一和弦,其它和弦依次是第二和弦、第三和弦等等第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-64-趙曉群

教授第64頁,共87頁,星期六,2024年,5月聲音的物理屬性:音色、音調(diào)、音強、音長音色:也稱作音質(zhì),一種聲音區(qū)別于其它聲音的基本特征

◆發(fā)音體(音帶)振動與不振動,發(fā)音的音色不同◆用相同發(fā)音器官,送氣與不送氣方式,發(fā)音的音色不同◆聲道的形狀和尺寸不同,發(fā)的音的音色不同音調(diào):聲音的高低,漢語語音學中稱為音高,取決于聲頻

◆聲頻與發(fā)音體的長短、厚薄、松緊程度有關(guān)

◆語音的聲調(diào)由語音的基頻決定音強:聲音的強弱,由聲波的振幅(聲功率)決定音長:聲音的長短,取決于發(fā)音的持續(xù)時間的長短第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-65-趙曉群

教授第65頁,共87頁,星期六,2024年,5月2.4.2語音的聲學特性音節(jié):一次發(fā)出,有一個響亮中心,被明顯感覺的語音片段

音節(jié)由一個音素或幾個音素構(gòu)成音素:是語音的最小單位,分元音、輔音,兩種音素元音:聲帶振動的氣流經(jīng)聲道輻射,不受阻礙發(fā)出的樂音輔音:呼出的氣流,由聲道的部分封閉或受阻,產(chǎn)生的聲音◆清輔音(清音):聲帶不振動發(fā)出的輔音◆濁輔音(濁音):聲帶振動發(fā)出的輔音◆濁音是樂音和清音的混合音◆形成阻礙的發(fā)音部位和發(fā)音方法不同,發(fā)出的輔音不同半元音:發(fā)音時聲道基本暢通,某處比較狹窄,引起輕微的摩擦發(fā)出的聲音元音:音節(jié)的主體,時長和能量在音節(jié)中占主要部分輔音:在音節(jié)的前端或后端或前后兩端,時長和能量很小第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-66-趙曉群

教授第66頁,共87頁,星期六,2024年,5月元音音色:主要由舌的形狀、舌位、口形等決定舌位高度、前后位置與音素關(guān)系見圖2.22◆舌位高度:分高、中、低◆舌位前后:分前、中、后◆有9種基本組合,加上口唇開放程度、咽寬度,可發(fā)十多個不同的單元音第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-67-趙曉群

教授第67頁,共87頁,星期六,2024年,5月聲道的模擬:非均勻截面的聲管,發(fā)音時起共鳴器作用共振峰:元音激勵聲道時,引起共振,產(chǎn)生的一組共振頻率稱為共振峰頻率(共振峰)◆共振峰是區(qū)別元音的重要參數(shù),包括其位置和頻帶寬度精確描述語音,應該用盡可能多的共振峰工程中,常用前三個共振峰參數(shù)

◆第一共振峰F1、第二共振峰F2、第三共振峰F3元音的共振峰特性與發(fā)音機制有關(guān)F1與舌位高低有關(guān),舌位高F1低;舌位低F1高舌位越低,嘴張得越大(開口度大);舌位越高開口度越小F2與舌位前后密切相關(guān),舌位靠前F2高,舌位靠后F2低◆前元音[i]的舌位靠前,F(xiàn)2達2000Hz◆后元音[u]的舌位靠后,F(xiàn)2只有500Hz第2章

數(shù)字語音處理基礎(chǔ)2.4語音學基礎(chǔ)及漢語語音學同濟大學電子與信息工程學院-68-趙曉群

教授第68頁,共87頁,星期六,2024年,5月F1和F2和嘴唇的圓展程度也有關(guān)系,◆如圓唇可使F2降低等。F3與舌位有關(guān),并不密切,◆但受舌尖活動的影響,舌尖抬高卷起時,F(xiàn)3就明顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論