




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1第二章第二章 多媒體音頻技術(shù)多媒體音頻技術(shù) 2.1 數(shù)字音頻基礎(chǔ)2.2 數(shù)字音頻壓縮標(biāo)準(zhǔn)2.3 聲卡和音箱2.4 MIDI與音樂合成2.5 語音識(shí)別技術(shù)22.1 數(shù)字音頻基礎(chǔ)2.1.1 聲音的基本概念2.1.2 聲音的數(shù)字化2.1.3 數(shù)字音頻的文件格式32.1.1 聲音的基本概念 日常生活中的音頻信號(hào)分為三類:自然聲、音樂和語音。其中,自然聲和音樂不具有復(fù)雜的語義和語法信息,信息量低、識(shí)別簡單。語音是語言的物質(zhì)載體,包含了豐富的語言內(nèi)涵,是人類進(jìn)行信息交流所特有的形式。4音頻信號(hào) 分類分類 注釋注釋視聽效果視聽效果不規(guī)則聲音不規(guī)則聲音一般指不攜帶信息的噪音一般指不攜帶信息的噪音 語音語音是
2、指具有語言內(nèi)涵和人類約是指具有語言內(nèi)涵和人類約定俗成的特殊媒體定俗成的特殊媒體規(guī)則聲音規(guī)則聲音 音樂音樂規(guī)范的符號(hào)化了的聲音規(guī)范的符號(hào)化了的聲音 音效音效指人類熟悉的其它聲音,指人類熟悉的其它聲音,如動(dòng)物發(fā)聲、機(jī)器產(chǎn)生的聲如動(dòng)物發(fā)聲、機(jī)器產(chǎn)生的聲音、自然界的風(fēng)雨雷電等。音、自然界的風(fēng)雨雷電等。音頻信號(hào)的分類音頻信號(hào)的分類5 我們之所以能聽到日常生活中的各種聲音,實(shí)質(zhì)是不同頻率的聲波通過空氣產(chǎn)生震動(dòng),刺激人耳的結(jié)果。 聲音是粒子運(yùn)動(dòng)的結(jié)果,是通過一定介質(zhì)傳播的連續(xù)的波,在物理學(xué)上可用一條連續(xù)的曲線來表示,稱為聲波曲線。聲音6 下圖是用聲音錄制軟件記錄的英文單詞“Hello”的語音實(shí)際波形。 無論
3、聲波曲線多復(fù)雜,都可分解成一系列正弦波的線性疊加。7 聲波是時(shí)間和幅度上都連續(xù)變化的模擬量,單一頻率的聲波可用一條正弦波曲線表示(如圖),聲波有三個(gè)重要的參數(shù):振幅、周期和頻率。周期t振幅聲波8振幅:通常是指音量,是聲波波形的高低幅度,表示聲音信號(hào)的強(qiáng)弱程度,用分貝(dB)表示。周期:是指兩個(gè)相鄰聲波之間的時(shí)間長度,即重復(fù)出現(xiàn)的時(shí)間間隔,以秒(s)為單位。周期t振幅9頻率:是指每秒鐘波峰出現(xiàn)的次數(shù),即周期的倒數(shù),以赫茲(Hz)為單位。表示聲音音調(diào)的高低,頻率越高聲音越細(xì)尖。周期t振幅10振幅和頻率不變的聲音信號(hào),稱為單音。單音一般只能由專用電子設(shè)備產(chǎn)生。在日常生活中,我們聽到的自然界的聲音一般
4、都屬于復(fù)音,其聲音信號(hào)由不同的振幅與頻率合成而得到。復(fù)音中的最低頻率稱為復(fù)音的基頻(基音),是決定聲調(diào)的基本要素,它通常是個(gè)常數(shù)。復(fù)音中還存在一些其它頻率,是復(fù)音中的次要成分,通常稱為諧音。基頻和諧音合成復(fù)音,決定了特定的聲音音質(zhì)和音色。11頻率:是指每秒鐘波峰出現(xiàn)的次數(shù),即周期的倒數(shù),以赫茲(Hz)為單位。表示聲音音調(diào)的高低,頻率越高聲音越細(xì)尖。聲波按頻率分為三類:次聲波、可聽聲波和超聲波。人說話的語音頻率:300Hz-3kHz。次聲波可聽聲波超聲波20Hz20000Hzf(Hz)12 所謂聲音的質(zhì)量,簡稱音質(zhì)。是指經(jīng)傳輸、處理后音頻信號(hào)的保真度。聲音的質(zhì)量用聲音信號(hào)的頻率范圍(頻帶)來表示
5、,不同種類的聲源其頻帶也不同。一般而言,聲源的頻帶越寬,表現(xiàn)力越好,層次越豐富,聲音的效果越好。聲音質(zhì)量分為四級(jí):聲音的質(zhì)量10 20 50 200 3.4k 7k 15k 20kCD-DACD-DA(激光唱盤)(激光唱盤)FMFM廣播廣播AMAM廣播廣播電話電話f(Hz)頻帶13音頻測試儀(AUDIO TEST) 音頻測試儀(AUDIO TEST)14聲音處理技術(shù)的回顧 語言、音樂和各種自然聲是以聲波為載體傳遞信息的基本形式。人類很早就開始研究聲音,并利用當(dāng)時(shí)已掌握了的聲音的某些規(guī)律來制造樂器、進(jìn)行傳聲裝置設(shè)計(jì),使發(fā)出的聲音傳得更遠(yuǎn)??墒菐浊陙恚祟愔荒軕{耳朵來辨別聲音的高低、強(qiáng)弱,而不能
6、把聲音記錄和儲(chǔ)存起來。所以與其他研究領(lǐng)域相比,對聲音的研究相對滯后。15 1857年,法國發(fā)明家斯科特(Scott)發(fā)明了聲波振記器,這是最早的原始錄音機(jī),是留聲機(jī)的鼻祖。 1877年,愛迪生發(fā)明了一種錄音裝置,可以將聲波變換成金屬針的震動(dòng),然后將波形刻錄在圓筒形臘管的錫箔上。當(dāng)針沿著刻錄的軌跡行進(jìn)時(shí),便可以重新發(fā)出留下的聲音。這個(gè)裝置錄下了愛迪生朗讀的瑪麗有只小羊的歌詞:“瑪麗抱著羊羔,羊羔的毛象雪一樣白”,共8秒鐘的聲音成為世界錄音史的第一聲。16 1878年,愛迪生成立制造留聲機(jī)的公司,生產(chǎn)商業(yè)性的錫箔唱筒。這是世界第一代聲音載體和第一臺(tái)商品留聲機(jī)(gramophone) 。之后,其他錄
7、音形式的留聲機(jī)相繼出現(xiàn)。到1912年,圓筒式錄音被淘汰。 1924年,貝爾實(shí)驗(yàn)室成功進(jìn)行了電氣錄音,錄音技術(shù)得到很大提高。1925年,世界上第一臺(tái)電唱機(jī)誕生。 1935年,德國柏林的通用電氣公司研制成功了使用塑料磁帶的磁帶錄音機(jī)。1963年,荷蘭生產(chǎn)了音頻盒式磁帶,唱片的黃金年代漸漸流逝。17手提手搖式留聲機(jī)膠木留聲機(jī)18文革時(shí)期留聲機(jī)大喇叭留聲機(jī)19電唱機(jī)20 留聲機(jī)是采用機(jī)械的方法把各種聲音記錄在唱片上??墒锹曇?、機(jī)械振動(dòng)不容易傳遞,也不容易放大,機(jī)械方法很不方便。隨著電學(xué)、電子學(xué)的發(fā)展,人們開始嘗試用電來記錄下這些真實(shí)的聲音,利用把聲的振動(dòng)轉(zhuǎn)換成電信號(hào)的原理,使聲音的記錄成為可能。最終電
8、聲技術(shù)獲得了迅速發(fā)展。 電聲技術(shù)是研究可聽聲波頻率范圍內(nèi)聲音的產(chǎn)生、傳播、存儲(chǔ)、重放和接收的技術(shù)。21 顧名思義,電聲技術(shù)是依靠“電”來記錄并播放聲音的,基本原理是通過電壓產(chǎn)生模擬聲波變化的電流信號(hào),并記錄下來,這種電流信號(hào)便被稱之為“模擬信號(hào)”。傳統(tǒng)的聲音記錄方式就是將模擬信號(hào)直接記錄下來,例如磁帶和唱片,磁帶上磁極的變化和唱片音槽內(nèi)的紋路起伏變化都是與聲音信號(hào)的變化相對應(yīng)、成正比的。唱片、盒式磁帶等是記錄儲(chǔ)存這種模擬聲音信號(hào)的載體,而能夠播放和記錄這些載體的信號(hào)處理設(shè)備,諸如電唱機(jī)、磁帶錄音機(jī)等,則稱為模擬音響設(shè)備。22 電聲技術(shù)把聲信號(hào)轉(zhuǎn)換成電信號(hào),經(jīng)擴(kuò)音系統(tǒng)直接進(jìn)行擴(kuò)音;或者將其信號(hào)利
9、用磁帶、CD或其他存儲(chǔ)形式,使聲音可超越時(shí)間和空間,通過重放系統(tǒng)將信號(hào)放大,由揚(yáng)聲器或耳機(jī)轉(zhuǎn)換成聲信號(hào),進(jìn)入最后的終端-人耳,以實(shí)現(xiàn)任何時(shí)間和地點(diǎn)的聲音重現(xiàn)。 電聲轉(zhuǎn)換、音頻信號(hào)的存儲(chǔ)、重放技術(shù)、加工處理技術(shù)以及數(shù)字化音頻信號(hào)的編碼、壓縮、傳輸、存取、糾錯(cuò)等技術(shù),是音頻技術(shù)的主要研究對象。23 隨著計(jì)算機(jī)技術(shù)的發(fā)展,海量存儲(chǔ)設(shè)備和大容量內(nèi)存的出現(xiàn),聲音的數(shù)字化處理成為可能。數(shù)字化處理的核心是對音頻信息的采樣,通過對采集到的樣本進(jìn)行加工,生成各種效果。 音頻信息在多媒體中的應(yīng)用極為廣泛,當(dāng)計(jì)算機(jī)配有聲卡和音箱后,就能發(fā)出各種悅耳的聲音;圖像配以解說和背景音樂,可使圖像充滿生氣;立體聲音樂可增加空
10、間感,使人身臨其境;此外,多媒體通信、語音電子郵件、可視電話、電視會(huì)議等環(huán)境都離不開數(shù)字化音頻處理技術(shù)。24數(shù)字化聲音數(shù)字化聲音 聲音采樣、量化和編碼聲音采樣、量化和編碼 聲音數(shù)字化聲音數(shù)字化 ( (模模/ /數(shù)轉(zhuǎn)換數(shù)轉(zhuǎn)換) )聲音采樣聲音采樣11011100 1100110111011100 11001101把聲音把聲音( (模擬量模擬量) )按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列 聲音重放聲音重放 聲音模擬化聲音模擬化 ( (數(shù)數(shù)/ /模轉(zhuǎn)換模轉(zhuǎn)換) )聲音重放聲音重放1101110011011100把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過音
11、響單元重放出來把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過音響單元重放出來 設(shè)備和軟件設(shè)備和軟件(1) (1) 聲音適配器聲音適配器 ( (聲卡聲卡) 8bit) 8bit、16bit16bit、 128bit 128bit ¥ 80.0080.003800.003800.00(2) (2) 聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件252.1.2 聲音的數(shù)字化 為使計(jì)算機(jī)能處理音頻,必須把模擬聲音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字聲音信號(hào),這個(gè)過程稱為聲音的數(shù)字化。音頻信號(hào)數(shù)字化后,就變?yōu)橛?、1代碼組成的bit信號(hào), 就可以在計(jì)算機(jī)上存儲(chǔ)、編輯和處理了。采樣和量化影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù)數(shù)字音頻文件
12、的存儲(chǔ)量26模擬信號(hào)數(shù)字信號(hào)A/D轉(zhuǎn)換器D/A轉(zhuǎn)換器借助于A/D或D/A轉(zhuǎn)換器,模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換 8 位可編程 A/D 轉(zhuǎn)換芯片 27 模擬音頻信號(hào)的數(shù)字化過程是通過對音頻信號(hào)的采樣、量化和編碼來實(shí)現(xiàn)的,如下圖所示: 100101100011101 采樣和量化28聲音數(shù)字化過程示意圖連續(xù)的模擬聲音信號(hào)連續(xù)的模擬聲音信號(hào)聲音信號(hào)的采樣聲音信號(hào)的采樣離散的音頻信號(hào)離散的音頻信號(hào)29 何謂采樣? 對模擬音頻信號(hào)的連續(xù)波形進(jìn)行分割使之變成離散數(shù)字信號(hào)的方法,稱為采樣。 采樣的過程是每隔一個(gè)時(shí)間間隔在模擬音頻的波形上取一個(gè)幅度值,把時(shí)間上連續(xù)的模擬信號(hào)變成時(shí)間上離散的數(shù)字信號(hào)。該時(shí)間間隔稱
13、為采樣周期,其倒數(shù)為采樣頻率。(b) 音頻信號(hào)的采樣(a) 模擬音頻信號(hào)30 采樣頻率越高,即采樣的間隔時(shí)間越短,在單位時(shí)間內(nèi)得到的聲音樣本數(shù)據(jù)就越多,經(jīng)過離散數(shù)字化的聲波越接近于起源時(shí)的波形,也就意味著聲音的保真度越高,聲音的質(zhì)量越好。(b) 音頻信號(hào)的采樣(a) 模擬音頻信號(hào)31 采樣只是在時(shí)間坐標(biāo)軸上把音頻波形信號(hào)分成若干個(gè)等分的數(shù)字化過程,但是每一等分的長方形的高是多少呢? 即需要用某種數(shù)字化的方法來反映某一瞬間聲波幅度的電壓值的大小。該值的大小影響音量的高低。 為什么要進(jìn)行量化? 采樣信號(hào)的量化 音頻信號(hào)的采樣32 何謂量化?對聲波波形幅度的數(shù)字化表示稱為量化。 量化過程:將采樣后的
14、信號(hào)按整個(gè)聲波的幅度劃分成有限個(gè)位段的集合,把落入某個(gè)位段內(nèi)的樣值歸為一類,并賦于相同的量化值。 采樣信號(hào)的量化 音頻信號(hào)的采樣33 量化方法:采取二進(jìn)制的方式,以位或16位的方式來劃分縱軸。若以8位來劃分,縱軸將被分為28 (256)個(gè)量化等級(jí),即每個(gè)采樣值可以用256個(gè)不同的量化值之一來表示;若以16位為量化位數(shù),縱軸將被分為216 (65536)個(gè)量化等級(jí)。 采樣信號(hào)的量化 音頻信號(hào)的采樣34 在相同的采樣頻率下,量化位數(shù)越高,聲音還原的層次越豐富,表現(xiàn)力越強(qiáng),聲音效果越好,但數(shù)據(jù)量也越大。 35 對圖1中的原始模擬波形(紅線)進(jìn)行采樣和量化。采樣頻率:1000次/秒,量化位數(shù):0-9共
15、10個(gè)量化等級(jí),并將采樣的幅度值用最接近0-9中的一個(gè)數(shù)來表示,采樣效果如圖所示,圖中每個(gè)長方形表示一次采樣。 采樣與量化過程示例圖136 當(dāng)以圖1中得到的數(shù)值重構(gòu)原來信號(hào)時(shí),得到圖2中藍(lán)色直線段所示的波形。從圖中可以看出,藍(lán)色線與紅色線(原波形)相比,波形的細(xì)節(jié)部分丟失了很多。這意味著重構(gòu)后的信號(hào)波形有較大的失真。圖237 失真在采樣過程中是不可避免的,如何減少失真呢?從圖1中不難看出,如果采用更高的采樣頻率,即把圖1中的波形劃分成更為細(xì)小的區(qū)間,同時(shí),選取更高的量化等級(jí),即增加量化精度,就可以減少失真的程度。38 從圖中的輪廓線可以看出,信號(hào)的失真明顯減少,信號(hào)質(zhì)量得到了提高。采樣率:40
16、00次/秒量化等級(jí):40采樣率:2000次/秒量化等級(jí):20圖3圖439影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù) 影響模擬音頻數(shù)字化質(zhì)量的主要參數(shù)有:采樣頻率、量化位數(shù)和聲道數(shù) 采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本。采樣頻率通常采用三種:11.025KHz(語音效果)、22.05KHz(音樂效果)、44.1KHz(高保真效果)。常見的CD唱盤的采樣頻率即為44.1KHz。40 量化位數(shù)也稱“量化等級(jí)”,是描述每個(gè)采樣點(diǎn)樣值的二進(jìn)制位數(shù)。經(jīng)常采用的有8位、12位和16位。量化位數(shù)越高,聲音質(zhì)量越好。影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù):量化位數(shù)41 聲道數(shù)是指聲音通道的個(gè)數(shù),即一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。若
17、每次生成一個(gè)聲波數(shù)據(jù),稱為單聲道;每次生成兩個(gè)聲波數(shù)據(jù),稱為雙聲道(立體聲)。很顯然,立體聲要比單音效果好,但所占用的存儲(chǔ)空間也成倍增加。影響數(shù)字音頻質(zhì)量的技術(shù)參數(shù):聲道數(shù)42數(shù)字音頻文件的存儲(chǔ)量 通過對影響聲音數(shù)字化質(zhì)量的三個(gè)因素的分析,可以得出模擬聲音數(shù)字化后音頻文件的存儲(chǔ)量(假定未經(jīng)壓縮)為: 例如,數(shù)字激光唱盤的標(biāo)準(zhǔn)采樣頻率為44.1 kHz,量化位數(shù)為16位,立體聲,錄制一分鐘所需的存儲(chǔ)量為 44.1k162608 = 10335 KB存儲(chǔ)量=采樣頻率量化位數(shù)聲道數(shù)采樣時(shí)間/8聲音數(shù)字化計(jì)算公式數(shù)據(jù)量采樣頻率(Hz)量化位數(shù)(b)聲道數(shù)/8(字節(jié)/秒) 采樣頻率、量化位數(shù)、聲道數(shù)、與
18、聲音數(shù)據(jù)量的關(guān)系采樣頻率(kHz)量化位數(shù)(bit)數(shù)據(jù)量(KB/s)單聲道立體聲11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.2744聲音的應(yīng)用和頻率國際互聯(lián)網(wǎng) (語音、簡單樂曲)要求11,025 Hz8 bit22,050 Hz8 bit11,025 Hz8 bit11,025 Hz8 bit22,050 Hz8 bit44,100 Hz16 bit采樣頻率數(shù)據(jù)長度游戲 (效果音、效果音樂)多媒體自學(xué)讀物 (提示音)電子教案 (語音、效果音)多媒體寶典、大全 (樂曲、語音
19、)多媒體音樂鑒賞 (音樂、解說)應(yīng)用場合 應(yīng)根據(jù)使用場合和要求轉(zhuǎn)換適當(dāng)?shù)穆曇舨蓸宇l率 采樣頻率的轉(zhuǎn)換須使用相應(yīng)的軟件進(jìn)行452.1.3 數(shù)字音頻的文件格式5. RM 文件 1. WAVE 文件 3. WMA 文件 2. MP3 文件 4. MIDI 文件 46WAVE 文件Windows 所用的標(biāo)準(zhǔn)數(shù)字音頻文件,稱為波形文件,擴(kuò)展名是wav,它記錄了對實(shí)際聲音進(jìn)行采樣的數(shù)據(jù),由于沒有采用壓縮算法,因此無論進(jìn)行多少次修改和剪輯都不會(huì)失真,而且處理速度也相對較快。 特點(diǎn):聲音層次豐富,還原音質(zhì)好表現(xiàn)力強(qiáng),但產(chǎn)生的文件數(shù)據(jù)量很大。47MP3 文件 MP3文件指的是MPEG音頻層(MPEG Audio
20、 Layer 3),是一種有損壓縮,具有高達(dá)11 11:1 1的壓縮率,也就是說一分鐘CD音質(zhì)的音樂,未經(jīng)壓縮需要10MB存儲(chǔ)空間,而經(jīng)過MP3壓縮編碼后只有1MB左右,同時(shí)其音質(zhì)基本保持不失真。MP3憑借其優(yōu)美的音質(zhì)和高壓縮比成為網(wǎng)上最為流行的音樂格式。48MP3是Internet上流行的音樂格式MP3播放器Winamp49WMA 文件WMA文件是Windows Media Audio的縮寫,是Windows Media音頻文件,它可以保證在只有MP3文件一半大小的前提下,保持相同的音質(zhì)。現(xiàn)在大多數(shù)MP3播放器都支持WMA文件。50MIDI 文件MIDI文件的擴(kuò)展名為MID,它與波形文件不同
21、,記錄的不是聲音本身,而是將每個(gè)音符記錄為一個(gè)數(shù)字,因此是所有音頻格式中最小的。 MIDI音樂的音色比較單調(diào),層次感稍差,表現(xiàn)力不夠,因此適用于手機(jī)鈴聲等對音質(zhì)要求不高且對存儲(chǔ)空間有嚴(yán)格限制的場合。51RM/ RA/RAM 文件 RealAudio文件是RealNetworks公司開發(fā)的一種新型流式音頻文件格式;它包含在RealNetworks所制定的音頻/視頻壓縮規(guī)范RealMedia中,主要在低速率的廣域網(wǎng)上實(shí)時(shí)傳輸音頻信息;網(wǎng)絡(luò)連接速率不同,客戶端所獲得的聲音質(zhì)量也不同:對于28.8kb/s的連接,可以達(dá)到廣播級(jí)的聲音質(zhì)量;如果擁有ISDN或更快連接,可獲得CD音質(zhì)的聲音。 52CD-D
22、A 文件大家都很熟悉CD 這種音樂格式了,擴(kuò)展名CDA,其取樣頻率為44.1kHz,16 位量化位數(shù),跟WAV一樣,但CD 存儲(chǔ)采用了音軌的形式,又叫“紅皮書”格式,記錄的是波形流,是一種近似無損的格式。53獲取聲音獲取聲音 Easy CD-DA Extractor軟件(2) 硬件環(huán)境 CPU:Pentium/ 500MHz 內(nèi)存:128MB CDROM:40 x (或以上)(3) 軟件環(huán)境:Windows98 / Me / 2000/XP采樣軟件簡介采樣軟件簡介 軟件簡介(1) 作用:CD音樂 wav格式的波形音頻文件或mp3壓縮音頻文件雙擊 Easy CD-DA Extractor 10.
23、0.2.1.exe文件 安裝54(2) 插入CD音樂盤,隨后自動(dòng)列出CD音軌清單功能菜單CD音軌清單工具按鈕音量調(diào)節(jié)播放進(jìn)度調(diào)節(jié)啟動(dòng)與界面(1) 雙擊快捷圖標(biāo)啟動(dòng)55(1) 在CD音軌清單中 單擊某個(gè)音軌(2) 單擊播放按鈕 聆聽該音軌音樂 說明 (1) 聆聽結(jié)束后,不要改變光標(biāo)條的位置,以便為轉(zhuǎn)換做準(zhǔn)備 (2) 聆聽過程中,可調(diào)整播放的進(jìn)度和音量(3) 確認(rèn)音樂后,單擊 按鈕, 停止播放選擇音軌 操作步驟56(1) 單擊 按鈕(2) 選擇音頻模式(5) 顯示轉(zhuǎn)換過程(4) 單擊 按鈕轉(zhuǎn)換數(shù)字音頻 操作步驟(6) 稍候片刻轉(zhuǎn)換結(jié)束, 單擊 OK按鈕返回。(3) 指定路徑和文件名 說明 如果轉(zhuǎn)換
24、過程即刻結(jié)束, 表明內(nèi)存不夠,轉(zhuǎn)換失敗57 設(shè)備間的信號(hào)連接SPEAKERMICLINE IN1mV500mV聲卡機(jī)箱后背插頭: 3.5mm/stereo錄音錄音 使用“錄音機(jī)”獲取聲音(1) 選擇“程序附件娛樂 錄音機(jī)”菜單,啟動(dòng)錄音機(jī)(2) 單擊 錄音按鈕,開始錄音 (錄音時(shí)間為60秒)58(1) 鼠標(biāo)左鍵雙擊任務(wù)欄右側(cè) 圖標(biāo)(2) 檢查“波形”是否 被選擇 (4) 選擇“錄音”選項(xiàng)(5) 檢查: 錄音控制 線路輸入 麥克風(fēng)應(yīng)有 (3) 選擇“選項(xiàng)屬性”(6) 單擊 確定按鈕錄音失敗的處理 操作步驟59(2) 選擇“文件打開”(1) 選擇“程序附件娛樂錄音機(jī)”(3) 選擇需轉(zhuǎn)換的音頻文件(
25、4) 單擊 打開按鈕(6) 單擊 開始轉(zhuǎn)換按鈕(7) 選擇屬性(采樣頻率)(10) 選擇“文件另存為”菜單,保存文件(5) 選擇“文件屬性”(8) 單擊 確定按鈕轉(zhuǎn)換采樣頻率 操作步驟(9) 如不滿意,可從步驟(2)重 新開始602.2 數(shù)字音頻壓縮標(biāo)準(zhǔn)2.2.1 音頻壓縮方法概述2.2.2 音頻壓縮技術(shù)標(biāo)準(zhǔn)2.2.3 音頻壓縮工具612.2.1 音頻壓縮方法概述 在多媒體音頻信號(hào)處理中,一般需要對數(shù)字化后的聲音信號(hào)進(jìn)行壓縮編碼,使其成為具有一定字長的二進(jìn)制數(shù)字序列,并以這種形式在計(jì)算機(jī)內(nèi)傳輸和存儲(chǔ)。在播放時(shí),需要經(jīng)解碼器將二進(jìn)制編碼恢復(fù)成原來的聲音信號(hào)播放。 62 壓縮編碼技術(shù)是指用某種方法
26、使數(shù)字化信息的編碼率降低的技術(shù)。 音頻信號(hào)壓縮依據(jù):一是聲音信號(hào)存在著數(shù)據(jù)冗余,通過識(shí)別和去除這些冗余,達(dá)到壓縮的目的;二是人的聽覺對不同頻段的聲音的敏感性是不同的,具有一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音現(xiàn)象,這樣就可以抑制與信號(hào)同時(shí)存在的量化噪聲。 63 常用的音頻信號(hào)的壓縮編碼分為無損壓縮和有損壓縮。 無損壓縮:用無損壓縮方法壓縮的數(shù)據(jù),其解碼數(shù)據(jù)和原始數(shù)據(jù)嚴(yán)格相同,即壓縮是沒有任何損失和無失真的。其原理是在壓縮時(shí)去除或減少冗余值,而在解壓縮時(shí)重新將這些值插入到數(shù)據(jù)中,恢復(fù)原始數(shù)據(jù)。也叫做冗余壓縮法或熵編碼。 典型的無損壓縮方法有:哈夫曼編碼、算術(shù)編碼、行程編碼、LZW等。無損壓縮和有損壓縮
27、64無損壓縮的優(yōu)點(diǎn):1、100的保存、沒有任何信號(hào)丟失2、音質(zhì)高,不受信號(hào)源的影響 3、轉(zhuǎn)換方便 無損壓縮的不足:1、占用空間大,壓縮比不高,一般在2:15:1,主要用于文本和數(shù)據(jù)的壓縮2、缺乏硬件支持65 有損壓縮:用有損壓縮方法壓縮的數(shù)據(jù),其解碼數(shù)據(jù)和原始數(shù)據(jù)有一定的誤差,即壓縮是有損失和失真的。信息論中稱為熵壓縮(熵定義為平均信息量),由于壓縮了熵,減少的信息是不能再恢復(fù)的。熵壓縮法由于允許一定程度的失真,壓縮比很高,能達(dá)到10:120:1,甚至是40:1,多用于對圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮。 典型的有損壓縮方法有:預(yù)測編碼、變換編碼、PCM、子帶編碼等。66 音頻信號(hào)的壓縮編碼方
28、法很多,常用的有損壓縮編碼:波形編碼、參數(shù)編碼和同時(shí)利用這兩種技術(shù)的混合編碼。 波形編碼的編碼信息是聲音的波形,要求重構(gòu)的聲音信號(hào)的各個(gè)樣本盡可能地接近原始聲音的采樣值。波形編碼技術(shù)有(脈沖編碼調(diào)制)PCM、 (差分脈沖編碼調(diào)制) DPCM、(自適應(yīng)變換編碼)ATC和(自適應(yīng)差分脈沖編碼)ADPCM等。這些編碼算法簡單,易于實(shí)現(xiàn),適應(yīng)性強(qiáng),可以獲得較高的語音質(zhì)量,在較高碼率的條件下可以獲得高質(zhì)量的音頻信號(hào),主要缺點(diǎn)是壓縮比不大。67 參數(shù)編碼是對語音參數(shù)進(jìn)行分析合成的方法。如能得到基音周期、共振峰、語音譜、聲強(qiáng)等基本參數(shù),就可以不對語音波形編碼,而只要記錄和傳輸這些參數(shù)就能實(shí)現(xiàn)聲音數(shù)據(jù)的壓縮。
29、參數(shù)編碼算法復(fù)雜,計(jì)算量大,壓縮率高,但還原聲音的質(zhì)量不高,適合于語音信號(hào)的編碼。 混合編碼是把波形編碼的高質(zhì)量和參數(shù)編碼的低數(shù)據(jù)率結(jié)合在一起,一般壓縮比比較高,音質(zhì)質(zhì)量不是很好,但比參數(shù)編碼要好。682.2.2 音頻壓縮技術(shù)標(biāo)準(zhǔn) 針對不同的聲音質(zhì)量,數(shù)字音頻壓縮技術(shù)標(biāo)準(zhǔn)分為電話語音壓縮、調(diào)幅廣播語音壓縮和高保真立體聲音頻壓縮3種。 一、電話質(zhì)量的音頻壓縮標(biāo)準(zhǔn) 電話質(zhì)量語音信號(hào)的頻率范圍是200Hz3.4kHz,采用PCM,當(dāng)采樣頻率為8kHz,量化位數(shù)為8b時(shí),對應(yīng)的比特率為64Kbps。為了壓縮音頻數(shù)據(jù),國際上從ITU最初的G.711標(biāo)準(zhǔn)開始,制定了一系列的語音壓縮編碼的標(biāo)準(zhǔn),主要用于公用
30、數(shù)字電話網(wǎng)中。69標(biāo)準(zhǔn)說明G.711采樣8kHz,量化8bit,比特率64kbpsG.721采用ADPCM編碼,比特率32kbpsG.723采用ADPCM有損壓縮,比特率24kbpsG.728采用LD-CELP壓縮技術(shù),比特率16kbps比特率:是指記錄音頻數(shù)據(jù)每秒鐘所需要的平均比特值(比特是電腦中最小的數(shù)據(jù)單位,指一個(gè)0或者1),通常我們使用Kbps(即每秒鐘1000比特)作為單位。CD中的數(shù)字音樂比特率為1411.2Kbps(也就是記錄1秒鐘的CD音樂,需要1411.21000比特的數(shù)據(jù)),近乎于CD音質(zhì)的MP3數(shù)字音樂需要的比特率大約是192Kbps320Kbps。70 二、調(diào)幅廣播質(zhì)量
31、的音頻壓縮標(biāo)準(zhǔn) 調(diào)幅廣播質(zhì)量語音信號(hào)的頻率范圍是50Hz7kHz,當(dāng)采樣頻率為16kHz,量化位數(shù)為14b時(shí),對應(yīng)的比特率為224Kbps。1988年,ITU為調(diào)幅廣播制定了G.722標(biāo)準(zhǔn),采用基于子帶的ADPCM,可以將比特率壓縮為64Kbps,主要用于多媒體音頻會(huì)議和視頻會(huì)議等。71 三、高保真立體聲音頻壓縮標(biāo)準(zhǔn) 高保真立體聲音頻信號(hào)的頻率范圍50Hz20kHz,當(dāng)采樣頻率為44.1kHz,量化位數(shù)為16b時(shí),單聲道對應(yīng)的比特率為705Kbps。目前國際上比較成熟的高保真立體聲音頻壓縮標(biāo)準(zhǔn)為MPEG音頻壓縮算法。MPEG音頻分為MP1(4:1)、MP2(6:18:1)、MP3(10:112
32、:1)三個(gè)獨(dú)立的壓縮層,用于CD、VCD、DVD、HDTV和電影配音等。72MP3壓縮技術(shù) MP3是MPEG Audio Layer3音頻文件的縮寫,是一種超級(jí)聲音文件的壓縮方法,具有文件小、音質(zhì)佳的特點(diǎn)。MP3具有最高的壓縮比(12:1),即采用MP3壓縮,數(shù)據(jù)可以縮小到原來的1/12,音質(zhì)卻沒有損失。 在MPEG音頻編碼標(biāo)準(zhǔn)中,MP3功能最強(qiáng)大。在同樣的音質(zhì)條件下,MP3需要的數(shù)據(jù)量最??;同樣的數(shù)據(jù)量條件下,MP3音質(zhì)最好。MP3采用有損壓縮方法,以極小的失真率換來較高的壓縮比。MP3現(xiàn)已成為因特網(wǎng)上的事實(shí)標(biāo)準(zhǔn),具有越來越廣泛的應(yīng)用。 MP3壓縮工具(豪杰超級(jí)解霸3000)2.2.3 音頻
33、壓縮工具742.3 聲卡與音箱2.3.1 聲卡2.3.2 音箱752.3.1 聲卡 聲卡是裝在計(jì)算機(jī)內(nèi)部,能讓計(jì)算機(jī)發(fā)出音樂、音效和各種聲響的硬件板卡。聲卡是多媒體計(jì)算機(jī)必備的部件之一,用來處理各種類型數(shù)字化聲音信息。 聲卡的主要功能 聲卡的性能指標(biāo) 聲卡的外部接口 聲卡的組成原理 76 ADLIB-最早的聲卡 雖然PC聲卡是在90年代才得以普及,但它的問世卻早在1984年。英國的ADLIB公司是目前公認(rèn)的“聲卡之父”,雖然他們最初開發(fā)的產(chǎn)品只能提供簡單的音樂效果,并且無法處理音頻信號(hào),但在當(dāng)時(shí)無疑已經(jīng)是一個(gè)很大的突破。由于技術(shù)不夠成熟、成本又非常高昂,因此這類帶有試驗(yàn)品性質(zhì)的早期ADLIB音
34、樂卡,當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算速度也不足以應(yīng)付大規(guī)模的多媒體處理,所以并未能普及。 聲卡發(fā)展的歷史77 把聲卡真正帶入個(gè)人電腦領(lǐng)域的,是CREATIVE-創(chuàng)新公司。創(chuàng)新科技有限公司是世界上規(guī)模最大的多媒體硬件生產(chǎn)商和制造商之一,其“聲霸卡”和“視霸卡”系列產(chǎn)品在全球占有很高的市場份額。自1989年,Creative在美國Comdex展覽會(huì)上首次推出自己研制開發(fā)的適用于PC機(jī)的Sound Blaster而引起轟動(dòng)至今,使SB聲霸卡產(chǎn)品形成系列而風(fēng)靡全球。 第一代Sound Blaster聲卡基于ISA總線,具有一個(gè)8位的D/A轉(zhuǎn)換器,只支持單聲道錄放音模式。它一次為電腦同時(shí)加上了音樂處理和音頻信號(hào)處理的
35、功能。此后推出的Sound Blaster Pro加入了對立體聲信號(hào)的支持。第一個(gè)多媒體電腦技術(shù)標(biāo)準(zhǔn)MPC1,就把Sound Blaster Pro作為聲卡設(shè)備的標(biāo)準(zhǔn)配置。Creative 聲卡系列78 Creative在成功推出第一塊適用于機(jī)的聲音卡 Sound Blaster Pro 后,又推出了具有 16bit、44KHz采樣率并支持立體聲的Sound Blaster 16系列。它的推出使多媒體聲卡的錄音和放音第一次在技術(shù)規(guī)格上達(dá)到了CD唱片的品質(zhì)。在20世紀(jì)90年代中期,16bit、44KHz、立體聲D/A轉(zhuǎn)換代表了聲卡的最高技術(shù)水平。 Creative在1995年的推出了具有波表合成
36、功能的Sound Blaster Awe 32聲卡。SB Awe 32具有一個(gè)32復(fù)音的波表引擎,并集成了1MB容量的音色庫,使其MIDI合成效果大大超越了以前所有的產(chǎn)品(其以前的產(chǎn)品在MIDI“電子合成器”方面采用都是YAMAHA公司研發(fā)的FM合成技術(shù))。 Creative 聲卡系列79 在Sound Blaster 32的基礎(chǔ)上,Sound Blaster AWE64在技術(shù)上取得了巨大的飛躍。這里的32和64不再表示數(shù)字音頻的位數(shù),而是表示32和64種復(fù)音的波表合成技術(shù),它們?nèi)允?6位聲卡。SB AWE64采用著名音源公司E-mu的專業(yè)級(jí)的波表,采用了多點(diǎn)插值算法專利技術(shù)的Wave Eff
37、ect合成器,提供平滑的音頻復(fù)制和最小的失真,可升級(jí)到28MB音色采樣子系統(tǒng)能更好地支持Sound Font 音色庫。它提供了高質(zhì)真實(shí)樂器感的64復(fù)音的MIDI合成器,使得游戲和多媒體應(yīng)用程序的音響效果比以前更為逼真。3D增強(qiáng)定位音響(3D Positional Audio)技術(shù)和空間響應(yīng),使每一種聲音變得比以前更加令人陶醉。高級(jí)的音色庫定制和編輯,使用戶可以在計(jì)算機(jī)上制作音樂,進(jìn)行作曲Creative 聲卡系列80聲卡的主要功能 聲卡是負(fù)責(zé)錄音、播音和聲音合成的多媒體板卡。 錄制、編輯和回放數(shù)字音頻文件 控制和混合各聲源的音量 記錄和回放音頻時(shí)進(jìn)行壓縮和解壓縮 文語轉(zhuǎn)換與語音識(shí)別 具有MID
38、I接口(樂器數(shù)字接口)和音樂合成81 聲卡采用大規(guī)模集成電路,將音頻技術(shù)范圍的各類電路以專用芯片的形式集成在聲卡上,基本部件如圖:混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線聲卡的組成原理82總總線接口芯片:在聲卡的各部分和系統(tǒng)之間傳送命令和數(shù)據(jù),同時(shí)它也是命令和數(shù)據(jù)的緩沖器?;煲羝髟捦草斎刖€性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線83混混音器:對不同聲源的聲音信號(hào)進(jìn)行混合,并可以控制音量的調(diào)整?;煲羝髟捦草斎刖€性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)
39、字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線84Sound Blaster PCI64聲卡的混音器設(shè)置界面85A/D和D/A轉(zhuǎn)換器:完成聲音信號(hào)從模擬到數(shù)字和從數(shù)字到模擬的相互轉(zhuǎn)換。音樂合成器:將MIDI消息合成為聲音。混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線86數(shù)字音頻處理芯片:完成各種聲音信號(hào)的記錄和播放任務(wù)、特殊音效過濾與處理、語音識(shí)別、實(shí)時(shí)音頻壓縮、解釋MIDI指令或符號(hào)以及控制和協(xié)調(diào)直接存儲(chǔ)器(DMA)訪問工作混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音
40、樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線87工作原理 錄音時(shí),聲音信號(hào)通過話筒或者Line in通道進(jìn)入,經(jīng)過混音器采樣、A/D轉(zhuǎn)換、混合等過程,隨后通過數(shù)字音頻處理芯片處理,錄制成相關(guān)的波形文件。混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線88工作原理 放音時(shí),數(shù)字波形聲音信號(hào)首先由數(shù)字音頻處理芯片進(jìn)行處理和運(yùn)算,隨后進(jìn)行D/A轉(zhuǎn)換,模擬信號(hào)再經(jīng)過放大器的放大,通過多媒體音箱輸出。混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線89
41、工作原理 播放MIDI時(shí),根據(jù)所指示的樂器到波形查詢表中查詢該樂器的資料,經(jīng)過D/A轉(zhuǎn)換為模擬聲音方式,可以達(dá)到令人滿意的音樂效果.混音器話筒輸入線性輸入線性輸出揚(yáng)聲器輸出A/D和D/A數(shù)字音頻處理芯片音樂合成器總線接口芯片MIDI接口CD接口計(jì)算機(jī)總線90聲卡的性能指標(biāo) 采樣和量化能力:這是衡量音響器材音質(zhì)好壞的性能指標(biāo)。 采樣頻率:11.025kHz (語音效果) 22.05 kHz (音樂效果) 44.1 kHz (高保真效果) 量化等級(jí): 8位/256級(jí) (語音質(zhì)量) 16位/65536級(jí)(高保真質(zhì)量)91芯片類型:是決定聲卡性能高低的主要因素。CODEC芯片(依賴CPU,價(jià)格便宜),
42、數(shù)字信號(hào)處理器DSP(不依賴CPU,性能好,價(jià)格高)??偩€類型:根據(jù)聲卡與計(jì)算機(jī)連接方式的不同,分為ISA、PCI、USB三類總線。輸出聲道數(shù):決定了聲卡的基本功能,多通道聲卡能夠營造逼真的音效環(huán)境,常用的有2聲道(立體聲)、2.1、4.1、5.1、7.1等。92 ISA(Industry Standard Architecture,工業(yè)標(biāo)準(zhǔn)架構(gòu))總線接口是早期使用的一種總線接口,傳輸速率低,對CPU資源占用大,目前在市面上基本上看不到ISA總線類型的板卡。 PCI(Peripheral Component Interconnect,即外部設(shè)備互聯(lián))總線是1993年推出的PC局部總線標(biāo)準(zhǔn),傳輸
43、速度高,可實(shí)現(xiàn)66M的工作頻率,是通常ISA總線的300倍,滿足了大吞吐量外設(shè)的需求。一般的計(jì)算機(jī)中都提供了好幾個(gè)PCI總線插槽,基本上可以滿足常見PCI適配器(包括顯示卡、聲卡、網(wǎng)卡等)的安裝。93 USB(Universal Serial Bus,通用串行總線) 1994年,Intel、康柏、IBM、微軟、NEC等七家公司成立了USB論壇,1995年11月正式制定出USB 0.9通用串行總線規(guī)范,并在1997年開始有真正符合USB技術(shù)標(biāo)準(zhǔn)的外設(shè)出現(xiàn)。USB 1.1是目前推出的在支持USB的計(jì)算機(jī)與外設(shè)上普遍采用的標(biāo)準(zhǔn),傳輸速率的理論值是12Mbps 。1999年初康柏、Intel、微軟、N
44、EC、Hp、朗訊和飛利浦7家公司給出了USB 2.0規(guī)范,傳輸速率可以高達(dá)480Mbps。目前USB接口已經(jīng)被廣泛應(yīng)用于鼠標(biāo)、鍵盤、打印機(jī)、掃描儀、Modem、音箱等各種設(shè)備,它具有不占用計(jì)算機(jī)擴(kuò)展槽和熱插拔的優(yōu)點(diǎn),因而安裝更為方便。94聲卡的外部接口LINE INLINE OUTSPK OUTMIDI/Joystick錄音機(jī)、CD唱機(jī)等線性輸入話筒輸入揚(yáng)聲器輸出線性輸出、立體聲放大器MIDI接口/游戲桿MIC IN95話筒輸入接口(MIC IN):連接話筒,實(shí)現(xiàn)聲音輸入、外部錄音功能。線性輸入接口(LINE IN):連接各種外部音頻設(shè)備的模擬輸出,實(shí)現(xiàn)相關(guān)設(shè)備的音源輸入。線性輸出接口(LIN
45、E OUT):連接多媒體有源音箱,實(shí)現(xiàn)聲音輸出。揚(yáng)聲器輸出接口(SPK OUT):通過聲卡功放輸出的放大信號(hào),用于連接無源音箱 MIDI設(shè)備接口/游戲手柄接口(MIDI/Joystick):連接MIDI音源、電子琴或者游戲控制設(shè)備。96聲卡的常用接口數(shù)字信號(hào)處理器DSP聲卡的主芯片 返回97 返回98(1). 硬件安裝步驟1 關(guān)閉計(jì)算機(jī)電源,拔下供電電源和所有外接線插頭。步驟2 打開機(jī)箱外殼,選擇一個(gè)空閑的16位擴(kuò)展槽并將聲卡插入擴(kuò)展槽。 步驟3 連接來自CD-ROM驅(qū)動(dòng)器的音頻輸出線到聲卡的CD IN針形輸入線上;步驟4 蓋上機(jī)箱外殼,并將電源插頭插回。步驟5 聲卡與其它外設(shè)的連接,按下頁圖
46、進(jìn)行。聲卡的安裝99(2). 軟件安裝對不同的聲卡,軟件的安裝方法不完全相同,需要按照說明書安裝。1). 安裝驅(qū)動(dòng)程序聲卡的驅(qū)動(dòng)程序是控制聲卡工作的必要程序,不同的聲卡驅(qū)動(dòng)程序是不同的。2). 安裝應(yīng)用程序安裝聲卡的應(yīng)用程序,例如混音器、錄音師和MIDI編輯軟件等。聲卡的安裝100聲卡安裝完成后,即可對聲卡進(jìn)行測試,以檢查聲卡能否正常工作,可以使用Windows 98的“媒體播放機(jī)”進(jìn)行測試。如果測試時(shí),沒有聲音播出,可能有兩種情況:一是插孔接觸不良,請檢測揚(yáng)聲器插孔、音量開關(guān)等;二是配置產(chǎn)生沖突,進(jìn)入控制面板的“系統(tǒng)”設(shè)置查看是否有沖突。聲卡的安裝測試1012.3.2 音箱 音箱是一種電聲轉(zhuǎn)
47、換的發(fā)音設(shè)備,它由箱體、揚(yáng)聲器、電源和信號(hào)放大器等組成。分類:2.0雙聲道立體聲 2.1/4.1/5.1/7.1 5.1五聲道超重低音聲道杜比環(huán)繞立體聲技術(shù)103音箱工作原理工作原理數(shù)字音頻數(shù)據(jù)轉(zhuǎn)換成模擬方式的電子脈沖,并將它傳給功率放大器放大電路將電子脈沖放大為強(qiáng)度足夠驅(qū)動(dòng)音箱發(fā)聲的電壓信號(hào),同時(shí)向音箱送出電流送出的電流經(jīng)過音箱中纏繞的金屬線圈而產(chǎn)生磁場帶著磁性的金屬線圈與音箱中的永久磁鐵隨著電壓的變化產(chǎn)生強(qiáng)弱和方向不同的吸引或排斥作用,導(dǎo)致線圈及與之相連的簿膜振動(dòng),隨即在空氣中產(chǎn)生聲波。104音箱v 分類箱體材質(zhì) :塑料、金屬和木質(zhì)功率放大器的內(nèi)外置 :有源音箱(放大器內(nèi)置)和無源音箱(放
48、大器外置或無功放)接口 :有普通聲卡接口、數(shù)字接口、USB接口和IEEE1394接口 聲道數(shù): 2.0式:雙聲道立體聲 2.1式:雙聲道超重低音聲道 4.1式:四聲道超重低音聲道 5.1式:五聲道超重低音聲道(杜比) 7.1式:七聲道超重低音聲道105音箱v 性能指標(biāo)(1)輸出功率 (一般來講,功率越大越好):額定功率最大峰值功率 頻率范圍與頻率響應(yīng) : 頻率范圍:最高最低回放頻率之間的范圍,單位為赫茲 頻率響應(yīng):音箱連接一個(gè)恒定電壓的音頻信號(hào)后,產(chǎn)生的聲壓和相位隨頻率變化關(guān)系。頻率響應(yīng)曲線越平坦,失真越小,性能越高。信噪比:音箱回放的有效信號(hào)與噪聲信號(hào)的比值,單位為分貝( dB).信噪比越高
49、越好!106音箱v 性能指標(biāo)(2)失真度:諧波失真:增加了高次諧波導(dǎo)致互調(diào)失真:導(dǎo)致音調(diào)的變化瞬態(tài)失真:揚(yáng)聲器的慣性導(dǎo)致,震動(dòng)無法跟上電信號(hào)變化,影響音質(zhì)音色的還原程度。數(shù)值越小失真度越小,品質(zhì)越好!靈敏度 : 全功率輸出時(shí)的輸入信號(hào),輸入信號(hào)越低,靈敏度越高,全功率輸出時(shí)的輸入信號(hào),輸入信號(hào)越低,靈敏度越高,信能越好。信能越好。84dB84dB低靈敏度低靈敏度,87,87種靈敏度種靈敏度 9090高靈敏度。高靈敏度。阻抗: 揚(yáng)聲器輸入信號(hào)的電壓與電流的比值。音箱的標(biāo)準(zhǔn)阻抗為8歐姆。 高阻抗:16歐姆 ; 低阻抗:語音板”命令,這時(shí)會(huì)出現(xiàn)一個(gè)類似Windows寫字板的程序,不過從它的界面上可以
50、看出功能要多的多。144文檔的語音輸入文檔的語音輸入2、在保證語音板為當(dāng)前活動(dòng)程序的基礎(chǔ)上直接通過麥克風(fēng)進(jìn)行語音輸入,這時(shí)ViaVioce就會(huì)直接把你所說的話語“寫”到語音板中。145文檔的語音輸入文檔的語音輸入3、對文章進(jìn)行糾錯(cuò)處理。先用鼠標(biāo)選中需要糾錯(cuò)的字詞,然后點(diǎn)擊語音板上部的“糾錯(cuò)”按鍵可以激活糾錯(cuò)窗口,此時(shí)單擊詞語左邊的小箭頭,可以看見正確字詞出現(xiàn)在候選詞列表中,選擇相應(yīng)的需要即可糾正被選中的詞,然后對下一個(gè)誤識(shí)詞進(jìn)行相同操作146文檔的語音輸入文檔的語音輸入4、糾錯(cuò)完畢之后,我們可以直接將其保存為TXT或者是DOC格式的文件,這樣一篇文章的語音輸入就完成了。1475 文本-語音轉(zhuǎn)換
51、技術(shù) 文本-語音轉(zhuǎn)換(Text-to-Speech)是指將文本信息轉(zhuǎn)換成自然語音,最終目標(biāo)是使計(jì)算機(jī)能夠以清晰自然的聲音和各種語言,甚至是各種表情來朗讀任意的文本。也就是說,要使計(jì)算機(jī)具有象人一樣、甚至比人更強(qiáng)的說話能力。因而它是一個(gè)十分復(fù)雜的問題,涉及到語言學(xué)、韻律學(xué)、語音學(xué)、自然語言處理、信號(hào)處理、人工智能等諸多的學(xué)科。1485 文本-語音轉(zhuǎn)換技術(shù) TTS分為綜合的和連貫的兩種類型。綜合的語音就是通過分析單詞,由計(jì)算機(jī)確認(rèn)單詞的發(fā)音,然后這些音素就被輸入到一個(gè)復(fù)雜的模仿人聲音并發(fā)聲的算法,這樣就可以讀文本了。通過這種方式,TTS就能讀出任何單詞,甚至自造的詞,但是它發(fā)出的聲音不帶任何感情,
52、帶有明顯的機(jī)器語音味道。 連貫語音系統(tǒng)分析文本并從預(yù)先錄好的文庫里抽出單詞和詞組的錄音。數(shù)字化錄音是連貫的,因?yàn)槁曇羰鞘孪蠕浿频恼Z音,聽起來很舒服。遺憾的是,如果文本包含沒有錄的詞和短語,TTS就讀不出來了。連貫TTS可以被看成是一種聲音壓縮形式,因?yàn)閱卧~和常用的短語只能錄一次。連貫TTS會(huì)節(jié)省開發(fā)時(shí)間并減少錯(cuò)誤,使軟件增加相應(yīng)的功能。因?yàn)檫B貫TTS只播放一個(gè)WAV文件,所以它只用很少的處理能力。 1492.4 數(shù)字音頻處理軟件 Windows下常見的音頻處理軟件有: 錄音機(jī)、錄音大師(Wave Studio) Cool Edit Cakewalk一、Cool Edit概述 Cool Edit
53、 2000是一種集錄音、編輯、音效于一體的多軌數(shù)字音頻處理軟件。 1.Cool Edit的啟動(dòng)和退出 開始/程序Cool Edit 20001502.4.1 Cool Edit概述 2.Cool Edit的窗口組成標(biāo)題欄菜單欄工具欄狀態(tài)欄顯示范圍條波形顯示區(qū)聲音播放工具水平縮放工具時(shí)間顯示區(qū)垂直縮放工具CD播放欄VU電平監(jiān)控1512.4.2 音頻的基本操作二、音頻的基本操作 1.音頻的錄制 Options/Windows Mixer音量/錄音控制 從麥克風(fēng)中輸入 File/NewNew Waveform對話框 語音:11025Hz、Mono、8-bit 音樂:44100Hz、Stereo、16
54、-bit 從CD唱機(jī)中輸入 CD唱機(jī)、波形輸出混音1522.4.2 (音頻的編輯) 2.音頻的編輯 選擇 刪除(選區(qū)、非選區(qū)) 復(fù)制 粘貼 混合粘貼1532.4.2 (音頻文件的管理) 3.音頻文件的管理 新建文件 打開文件 保存文件 另存為(其它格式) 保存選擇區(qū)1542.4.3 改變音量的大小三、改變音量的大小 1.調(diào)整音量 Transform/Amplitude/Amplify菜單 Amplify對話框 Constant Amplification選項(xiàng)卡 2.顯示振幅邊界線(90%) View/Show Boundaries 3.靜音(選擇區(qū)域) Transform/Silence155四、改變音速與音調(diào) Transform/Time-Pitch/Stretch菜單 Stretch對話框 音速與音調(diào)的伸展方式 2.4.4 改變音速及音調(diào)Time Stretch音速改變、音調(diào)不變Pitch Shift音調(diào)改變、音速不變Resample音速、音調(diào)皆改變音調(diào)變化的方法音調(diào)變化的方法:# #表示增高半音表示增高半音(Transpose(Transpose框框) b) b表示降低半音表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育在線培訓(xùn)服務(wù)協(xié)議
- 建筑項(xiàng)目設(shè)計(jì)及施工合作協(xié)議
- 大灣區(qū)新興產(chǎn)業(yè)發(fā)展項(xiàng)目合作框架協(xié)議
- 環(huán)??萍柬?xiàng)目研發(fā)與推廣合同
- 總包單位簽訂分包合同
- 買賣手房反擔(dān)保合同
- 承包合同養(yǎng)殖合同
- 私人拖拉機(jī)買賣合同書
- 手房地產(chǎn)轉(zhuǎn)讓居間合同
- 游戲項(xiàng)目開發(fā)授權(quán)及運(yùn)營協(xié)議
- (高清版)DB15∕T 3585-2024 高標(biāo)準(zhǔn)農(nóng)田施工質(zhì)量評定規(guī)程
- 試油(氣)HSE作業(yè)指導(dǎo)書
- 重癥監(jiān)護(hù)-ICU的設(shè)置、管理與常用監(jiān)測技術(shù)
- 法律顧問服務(wù)投標(biāo)方案(完整技術(shù)標(biāo))
- 中醫(yī)藥三方合作協(xié)議書范本
- 2024年《動(dòng)漫藝術(shù)概論》自考復(fù)習(xí)題庫(附答案)
- 2024年職業(yè)技能“大數(shù)據(jù)考試”專業(yè)技術(shù)人員繼續(xù)教育考試題庫與答案
- 慢病報(bào)卡系統(tǒng)使用流程圖
- 2024年遼寧軌道交通職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫含答案
- 小升初數(shù)學(xué)總復(fù)習(xí)專題訓(xùn)練:平行四邊形的面積與梯形的面積
- 物業(yè)安全開工第一課課件
評論
0/150
提交評論