版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
蘇州大學計算機科學與技術學院第7章多媒體及應用
目錄(1)*多媒體技術概述文本與文本處理圖像與圖形數(shù)字化音頻及應用數(shù)字化視頻及應用12345目錄(2)*多媒體制作開發(fā)工具簡介65*7.1多媒體技術概述1.媒體
媒體在計算機領域中主要有兩種含義:一是指用以存儲信息的實體,如磁帶、磁盤、光盤等;二是指用以承載信息的載體,如數(shù)字、文字、聲音、圖形、圖像、視頻等。2.多媒體和多媒體技術多媒體(Multimedia)是數(shù)字、文字、聲音、圖形、圖像、動畫和視頻等多種媒體信息的集合。
多媒體技術是指以數(shù)字化技術為基礎,利用計算機綜合處理多媒體信息,使多種媒體信息之間建立邏輯關系,并連同多媒體設備一起集成為一個具有交互性能的應用系統(tǒng)的技術。7.1.1多媒體概念7.1.2多媒體技術的特點1.集成性集成性是指將多種媒體信息有機地組織在一起,共同表達一個完整的多媒體信息,使這些媒體成為密切聯(lián)系的一體化系統(tǒng)。
2.交互性用戶可以通過鍵盤、鼠標、觸摸屏等輸入設備來控制媒體的播放,實現(xiàn)了從“你播放我接收”的單向傳輸?shù)健拔尹c播你播放”的交互方式的改變。
3.實時性實時性是指多媒體系統(tǒng)中多種媒體間無論在時間上還是空間上都存在密切的關系,是具有同步性和協(xié)調性的群體。7.1.3多媒體系統(tǒng)的組成多媒體系統(tǒng)是指能夠提供交互式處理文本、聲音、圖像、視頻等多種媒體信息的計算機系統(tǒng),主要由四個部分組成。1.多媒體硬件系統(tǒng)2.多媒體操作系統(tǒng)3.媒體系統(tǒng)處理工具4.用戶應用軟件返回目錄7.2文本與文本處理7.2.1西文字符的編碼1.標準ASCII編碼全稱為“AmericanStandardCodeforInformationInterchange(美國信息交換標準代碼)”。標準ASCII碼采用一個字節(jié)表示一個字符,但只使用其中的低7位,共表示128個字符,每個字節(jié)的最高位在計算機內部通常保持為“0”。已被國際標準化組織(ISO)批準為國際標準,稱為ISO-646標準。7.2.1西文字符的編碼1.標準ASCII編碼【例7-1】下列特殊字符的編碼,其相互關系一般需要記住。字符’A’的編碼為1000001,對應的十六進制編碼為41H,對應的十進制編碼為65。字符’a’的編碼為1100001,對應的十六進制編碼為61H,對應的十進制碼為97。*2.擴充ASCII編碼使用8位二進制數(shù)來表示字符的擴充字符集??梢允褂?56種數(shù)字代碼表示更多的字符。在這些字符集中,從0~127的代碼與ASCII保持兼容,從128~255用于其它的字符和符號。擴充出來的128個編碼稱為擴展ASCII編碼,對應的字符稱為擴展ASCII字符。國際標準化組織的ISO8859標準得到了廣泛的使用。7.2.2漢字的編碼1.GB2312漢字編碼1980年發(fā)布的國家標準,共收錄了6763個漢字和682個圖形符號,總計7445個字符。GB2312規(guī)定“對任意一個圖形字符都采用兩個字節(jié)表示,每個字節(jié)均采用七位編碼表示?!盙B2312將編碼表分為94個區(qū),對應第一字節(jié),每個區(qū)94個位,對應第二字節(jié)。由區(qū)號和位號共同構成區(qū)位碼。為了避免信息通訊中漢字區(qū)位碼與通訊控制碼的沖突,每個漢字的區(qū)號和位號必須分別加上32(即二進制的00100000,十六進制的20H),經(jīng)過這樣處理的代碼稱為漢字的國標交換碼(簡稱國標碼)。
為了區(qū)分漢字編碼和ASCII碼,將國標碼的每個字節(jié)的最高位由0變?yōu)?,變換后的國標碼稱為漢字機內碼(簡稱機內碼)。
漢字機內碼、國標碼、區(qū)位碼之間的關系為:國標碼=區(qū)位碼+2020H機內碼=國標碼+8080H=區(qū)位碼+A0A0H
例如:“新”的區(qū)號為48,位號為34,其區(qū)位碼為4834,其二進制表示為0011000000100010,其十六進制為3022H?!靶隆钡膰鴺舜a為8066(5042H)。“新”的機內碼為D0C2H。7.2.2漢字的編碼2.GBK漢字編碼1995年發(fā)布了另一個漢字編碼標準,其全稱為《漢字內碼擴展規(guī)范》,簡稱GBK。GBK也采用雙字節(jié)表示,GBK向下與GB2312完全兼容,向上支持ISO10646國際標準。在GBK中共收錄了21003個漢字和883個圖形符號,除了GB2312的全部漢字和符號外,還收錄了繁體字和生僻字。微軟公司的Windows簡體中文版操作系統(tǒng)XP就支持GBK編碼方案。
3.UCS/Unicode與GB18030漢字編碼國際標準化組織制定了一個能夠覆蓋幾乎任何語言的編碼表,稱為UCS(對應的工業(yè)標準為Unicode),它的具體實現(xiàn)(如UTF-8和UTF-16)已在Windows、Unix、Linux操作系統(tǒng)中及許多Internet應用中廣泛使用。
GB18030是我國政府于2000年發(fā)布了新的漢字編碼國家標準該標準收錄了27484個漢字,同時還收錄了藏文、蒙文、維吾爾文等少數(shù)名族文字,它向下兼容GB2312和GBK,并擴充了UCS/Unicode中的字符,目前已在許多計算機系統(tǒng)和軟件中使用。4.BIG5漢字編碼GB2312、GBK和GB18030標準主要在我國大陸使用,中國臺灣、香港等地區(qū)還在使用繁體中文,他們制定了一套表示繁體中文的字符編碼,稱為“BIG5漢字編碼標準”(簡稱“大五碼”),采用雙字節(jié),但不兼容GB2312和GBK。7.2.3文本信息的輸入與輸出1.文本信息的輸入(1)人工輸入人工輸入又分為鍵盤輸入、手寫筆和語音輸入。人工鍵盤輸入是指用手工擊鍵方式按照一定的規(guī)律把漢字輸入到計算機。漢字輸入碼就是利用鍵盤輸入漢字時所用的編碼。目前常用的漢字輸入碼主要分為以下兩類。①音碼類②形碼類7.2.3文本信息的輸入與輸出1.文本信息的輸入(2)自動識別輸入文字的自動識別分為印刷體識別和手寫體識別兩大類:①印刷體識別利用光電掃描儀將印刷體的文本掃描成圖像,再通過專用的光學字符識別(OpticalCharacterRecognition,簡稱OCR)系統(tǒng)進行文字識別,將漢字的圖像轉換成文本的形式,最后用“文件發(fā)送”或“導出”功能輸出到其他文檔編輯軟件中。這種輸入方法只能用于印刷體文字的輸入。受識別系統(tǒng)能力的限制,后期要做一些編輯修改工作。OCR軟件種類很多,常用的有清華紫光OCR、漢王OCR、蒙恬OCR等。②手寫體識別脫機手寫體漢字的識別難度很大,目前還不能達到實用階段。7.2.3文本信息的輸入與輸出*2.文本信息的輸出文本的輸出主要是顯示和打印可以把字符的形狀看成是一種圖形。漢字有很多字體,如宋體、楷體、黑體、隸書等,同一個漢字的字體不同,字的形狀也不同,為了輸出這些不同的漢字,以及同一個漢字的不同字體,要求把每一個漢字字形碼(又稱漢字字模)信息預先存放在計算機中。這些一定數(shù)量的字符形狀描述信息的集合稱為字形信息庫,簡稱字庫。要顯示或打印某個字符時,計算機根據(jù)該字符的機內碼找到其在字庫中的位置,再取出其字形碼(字模)信息作為字形在屏幕上顯示或在打印機上輸出。漢字字形碼通常有兩種表示方式:點陣和矢量表示方式。7.2.4文本的常見格式1.簡單文本(純文本)簡單文本幾乎不包含任何格式信息和結構信息。這種文本通常稱為純文本或ASCII文本,文件后綴名是TXT。2.豐富格式文本豐富文本格式文件也稱富文本格式(RichTextFormat,簡稱RTF)是由微軟公司開發(fā)的跨平臺文檔格式,以純文本描述內容,能夠保存各種格式信息。
3.超文本超文本也稱為非線性文本,文本的組織結構是網(wǎng)狀結構,即包含鏈接信息的豐富格式文本。
4.超媒體超媒體=超文本+多媒體。
7.2.5文本編輯、排版與處理1.文本編輯與排版文本編輯與排版功能,一般包括:(1)對字、詞、句、段落進行添加、刪除、修改等操作;(2)文字的格式處理:設置字體、字號、字的排列方向、間距、顏色、效果等;(3)段落的格式處理:設置行距、段間距、段縮進、對齊方式等;(4)表格制作和繪圖;(5)定義超鏈。(6)頁面布局。7.2.5文本編輯、排版與處理2.文本處理常用文本處理的有關內容:(1)字數(shù)統(tǒng)計,字頻統(tǒng)計、簡/繁體相互轉換、漢字/拼音相互轉換;(2)詞語排序,詞語錯誤檢測、文句語法檢查;(3)自動分詞,詞頻統(tǒng)計、詞性標注、詞義辨識、大陸/臺灣術語轉換;(4)文本壓縮,文本加密、文本著作權保護;(5)關鍵詞提取,文摘自動生成、文本分類;(6)文本檢索(關鍵詞檢索、全文檢索)、文本過濾;(7)文語轉換(語音合成)、文種轉換(機器翻譯);(8)篇章理解,自動問答、自動寫作等。7.2.5文本編輯、排版與處理3.常用文本處理軟件(1)面向通信的文本處理軟件
如微軟公司的OutlookExpress(2)面向辦公的文本處理軟件
微軟公司Office套件中的Word和我國自行開發(fā)的WPS(3)面向出版的文本處理軟件(4)面向網(wǎng)絡信息發(fā)布和電子出版的文本處理軟件
7.3圖像與圖形7.3圖像與圖形能夠被計算機處理的圖像為數(shù)字圖像。數(shù)字圖像按生成方式大致分為兩類:位圖圖像和矢量圖形。位圖圖像是指由掃描儀和數(shù)碼相機等輸入設備捕捉實際的畫面產(chǎn)生的數(shù)字圖像。也稱為取樣圖像或點陣圖像,常簡稱為圖像。矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過計算機繪圖軟件生成的矢量圖形。矢量圖形文件存儲的是描述生成圖形的指令,因此不必對圖形中每一點進行數(shù)字化處理。7.3.1圖像的獲取與數(shù)字化1.數(shù)字圖像獲取設備數(shù)字圖像獲取設備的功能是將現(xiàn)實的景物輸入到計算機內并以取樣圖像的形式表示。2D圖像獲取設備(如掃描儀、數(shù)碼相機等)只能對圖片或景物的2D投影進行數(shù)字化,3D掃描儀則能獲取包括深度信息在內的3D景物的信息。7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化圖像獲取的過程實質上是模擬信號的數(shù)字化過程,具體的處理步驟大致分為以下四步:7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化(1)掃描將畫面劃分成M×N個網(wǎng)格,每個網(wǎng)格即一個取樣點,又稱像素。這樣,一幅模擬圖像就轉換為M×N個取樣點組成的矩陣。(2)分色將彩色圖像取樣點的顏色通過一種特殊的棱鏡分解成三個基色,如紅,綠,藍三種顏色。如果不是彩色圖像,則不必進行分色。(3)取樣通過圖像傳感元件將每個取樣點(像素)的每個分量(基色)的亮度值轉換成與其成比例的電壓值(灰度值)。(4)量化將取樣得到的每個分量的電壓值進行模數(shù)轉換,即把模擬量的電壓值使用數(shù)字量(一般為8~12位正整數(shù))來表示。
7.3.2圖像的基本參數(shù)1.顏色模型在對圖像進行數(shù)字化時,首先將圖像離散成若干行和若干列的像素點,然后將每個點用二進制的顏色編碼表示。圖像中的顏色編碼可以使用不同的顏色模型,顏色模型又稱為顏色空間,是指彩色圖像所使用的顏色描述方法。常用的顏色模型有:RGB(紅、綠、藍)、CMYK(青藍、洋紅、黃、黑)、YUV(亮度、色度)等。從理論上講這些顏色模型都可以互相轉換。
7.3.2圖像的基本參數(shù)2.圖像分辨率一個圖像取樣后得到的像素數(shù)目稱為圖像分辨率,是用于表示圖像大小的一個參數(shù),一般表示為“水平分辨率×垂直分辨率”的形式,其中水平分辨率表示圖像在水平方向的像素數(shù),垂直分辨率表示圖像在垂直方向的像素數(shù),如800×600,1024×768等。對于一個相同尺寸的圖像,組成該圖的像素數(shù)量越多,說明圖像的分辨率越高,看起來就越逼真,相應地,圖像文件占用的存儲空間也越大;相反,像素數(shù)量越少,圖像文件占用的存儲空間少了,但圖像顯得越粗糙。7.3.2圖像的基本參數(shù)3.位平面數(shù)目即矩陣的數(shù)目,也就是彩色分量的數(shù)目,如RGB的位平面數(shù)是3,而CMYK的位平面數(shù)是4。4.像素深度即像素的所有顏色分量的二進制位數(shù)之和,它決定了不同顏色或亮度的最大數(shù)目。例如24位真彩色,每種顏色分別用8位二進制數(shù)表示,其像素深度是8+8+8=24,它可以表示224,即16777216(約1600萬)種不同的顏色。7.3.3圖像的壓縮一幅圖像的數(shù)據(jù)量的計算公式是:圖像數(shù)據(jù)量=水平分辨率×垂直分辨率×像素深度/8(單位為字節(jié))以表7-2中1024×768的圖像為例,未經(jīng)壓縮的24位(真彩色)圖像的數(shù)據(jù)量計算方法如下:圖像數(shù)據(jù)量=1024×768×24/8B=2.25MB7.3.3圖像的壓縮如果對圖像進行壓縮,則一幅圖像的數(shù)據(jù)量為:圖像數(shù)據(jù)量=未壓縮前的圖像數(shù)據(jù)量/圖像壓縮的倍數(shù)【例7-2】一架數(shù)碼相機,其Flash存儲器容量為20MB,它一次可以連續(xù)拍攝像素深度16位(65536色)的1024×1024的彩色相片40張,計算其圖像數(shù)據(jù)的壓縮倍數(shù)。(1024×1024×16×40)/(20×1024×1024×8)=4圖像壓縮分為兩種類型,一種是無損壓縮,另一種是有損壓縮。7.3.4常用圖像格式1.BMP格式BMP(Bitmap,位圖)是微軟公司在Windows環(huán)境下的一種標準圖像文件格式,是一種通用的圖像格式,文件的擴展名為“.bmp”。BMP可以有多種彩色模式,如4位、16位、24位真彩色,最新版本的BMP格式允許32位真彩色。由于BMP文件占用存儲空間較大,所以一般在單機上比較流行,而在Internet上使用得較少。2.GIF格式GIF格式的特點是壓縮比高,磁盤空間占用較少,但不能存儲超過256色的圖像,是Internet上常用的文件格式之一。由于GIF圖像文件短小、下載速度快、可用許多具有同樣大小的圖像文件組成動畫。
7.3.4常用圖像格式3.JPEG格式JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家組)的縮寫,文件后輟名為.jpg或.jpeg,是最常用的圖像文件格式。目前各類瀏覽器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快,是網(wǎng)絡上最受歡迎的圖像格式之一。4.TIFFTIFF(TagImageFileFormat)是Mac中廣泛使用的圖像格式,它由Aldus和微軟聯(lián)合開發(fā),文件的擴展名為“.tif”。它的特點是圖像格式復雜、存貯信息多。非常有利于原稿的復制。5.PNG格式PNG(Portable
NetworfGraphics)的原名為“可移植性網(wǎng)絡圖像”,是網(wǎng)上接受的最新圖像文件格式。7.3.5圖像處理與應用1.數(shù)字圖像處理數(shù)字圖像處理是指利用計算機技術對圖像進行降噪、增強、復原、分割、提取特征、壓縮、存儲、管理、檢索等操作。2.圖像處理軟件Windows操作系統(tǒng)附件中的畫圖軟件(paint)和映像軟件(Imageforwindows)Office中的MicrosoftPhotoEditor和PictureManager軟件還有Adobe公司的Photoshop、IllustratorUlead公司的Paintshop、PhotoImpactAcdSystem公司的ACDSee軟件
7.3.5圖像處理與應用3.數(shù)字圖像的應用數(shù)字圖像處理在通信、遙感、電視、出版、廣告、工業(yè)生產(chǎn)、醫(yī)療診斷、電子商務等領域得到了廣泛的應用,例如:(1)圖像通信,包括傳真、電視電話、電視會議等。(2)遙感。對航空遙感或衛(wèi)星遙感圖像進行處理加工,用于礦藏勘探、地理資源調查、自然災害預測,環(huán)境污染檢測,氣象預報等。(3)醫(yī)療診斷。例如,利用X射線、超聲、計算機斷層掃描(CT)、核磁共振等技術形成成圖像,進行病理分析和疾病診斷。(4)工業(yè)生產(chǎn)應用。如產(chǎn)品質量檢測,生產(chǎn)過程自動控制等。(5)機器人視覺。(6)軍事、公安、檔案管理等方面的應用。7.3.6計算機圖形與應用1.計算機圖形矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過計算機繪圖軟件生成的矢量圖形。圖形通常是由計算機模擬產(chǎn)生的,可以是各種具體實在的物體,如家俱,房屋,機械零件等,也可以是假想的事物,如天氣形勢,人口分布,經(jīng)濟增長趨勢等。計算機圖形學研究的是用計算機模型來生成真實或想象中物體的圖像。在計算機中為物體建模的方法很多,它與物體的類型有密切關系。7.3.6計算機圖形與應用1.計算機圖形以普通工業(yè)產(chǎn)品為例,它們可使用基本的幾何元素(如點、線、面、體等)及表面材料的性質等進行描述,所建立的模型稱為幾何模型,這在工業(yè)品的計算機輔助設計/制造(CAD/CAM)中有著重要的應用。在現(xiàn)實世界中,有許多景物是很難使用幾何模型來描述的,例如山脈、云彩、海浪、煙火、樹木等。對于這些景物,需要找出它們的生成規(guī)律,使用相應的算法來描述其規(guī)律,這種模型稱為過程模型或景物模型。7.3.6計算機圖形與應用2.計算機圖形學的應用計算機圖形的主要應用領域有:(1)圖形用戶界面(2)計算機輔助設計與制造(CAD/CAM)(3)事務和商務數(shù)據(jù)的圖形展示(4)地形地貌和自然資源的圖形顯示(5)過程控制及系統(tǒng)環(huán)境模擬(6)電子出版及辦公室自動化7.3.6計算機圖形與應用3.常用計算機繪圖軟件AutoCAD、MAPInfo、ARCInfo等專用領域的繪圖軟件通用的辦公事務處理、平面設計、桌面出版所涉及的二維繪圖軟件,如Corel公司的CorelDraw,Adobe公司的Illustrator,Macromedia公司的FreeHand,微軟公司的MicrosoftViso等。7.4數(shù)字化音頻及應用7.4.1聲音的數(shù)字化1.基本概念聲音是一種波,它由許多不同頻率的諧波組成。按頻率可分為次聲(頻率低于20Hz)、超聲(頻率高于20kHz)和可聽聲(頻率在20Hz~20kHz),次聲和超聲是人耳無法聽到的。多媒體技術處理的聲音主要是人耳可聽到的20Hz~20kHz的音頻信號,稱為全頻帶聲音。人說話的聲音的頻率大致在300Hz~3000Hz之間,稱為語音;其他聲音,如音樂,即各種樂器產(chǎn)生的聲音;大自然物理現(xiàn)象產(chǎn)生的聲音,如刮風、下雨、打雷等;還有人工產(chǎn)生的爆破聲以及機器運轉發(fā)出的聲音、各種動物的叫聲等等。7.4.1聲音的數(shù)字化2.聲音信號的數(shù)字化聲音是模擬信號,為了使用計算機進行處理,必須將它轉換為二進制數(shù)字編碼的形式,這個過程稱為聲音信號的數(shù)字化。波形編碼是最常用的一種聲音信號數(shù)字化的處理方式,它直接對音頻信號的時域或頻域進行取樣量化編碼,處理過程如圖7-9所示。7.4.1聲音的數(shù)字化(1)取樣所謂取樣就是每隔一定時間間隔在聲音波形上取一個幅度值,把時間上連續(xù)的信號變?yōu)闀r間上離散的信號。該時間間隔稱為取樣周期。取樣周期的倒數(shù)稱取樣頻率,即每秒鐘的取樣次數(shù)。如44.1khz表示將1秒鐘的聲音用44100個取樣點數(shù)據(jù)表示,取樣頻率越高,數(shù)字化音頻的質量越高,但數(shù)據(jù)量也越大。(2)量化量化是將每個取樣點的幅度值以數(shù)字存儲。聲音信號的量化位數(shù)一般取8位,12位或16位,量化位數(shù)越高,聲音的保真度越好。量化位數(shù)是另一個影響聲音質量的重要指標,它決定了表示聲音振幅的精度。(3)編碼編碼是將取樣和量化后的數(shù)字數(shù)據(jù)以一定的格式記錄下來。編碼的方式很多,常用的編碼方式是脈沖編碼調制(PulseCodeModulation,簡稱PCM),其主要優(yōu)點是抗干擾能力強,失真小、傳輸特性穩(wěn)定,但編碼的數(shù)據(jù)量比較大。7.4.2聲音的獲取設備與播放1.聲音的獲取設備聲音的獲取設備包括話筒(麥克風)和聲卡。話筒的作用是將聲波信號轉換為電信號,然后由聲卡進行數(shù)字化。聲卡是多媒體技術中最基本的組成部分,是實現(xiàn)聲波/數(shù)字信號相互轉換的硬件。聲卡既參與聲音的獲取,也負責聲音的重建,它控制并完成聲音的輸入與輸出。2.聲音的播放計算機輸出聲音的過程稱為聲音的播放,一般分為兩步:先把聲音從數(shù)字信號形式轉換為模擬信號形式,這個過程稱為聲音的重建;然后再將模擬信號經(jīng)過處理和放大后送到揚聲器發(fā)出聲音。聲音的重建也由聲卡完成。7.4.3聲音的技術指標和壓縮標準1.聲音的技術指標數(shù)字化的波形聲音的質量技術指標有:取樣頻率、量化位數(shù)、聲道數(shù)、使用的壓縮編碼方法以及比特率。聲道數(shù)指聲音通道的個數(shù)。單聲道只記錄和產(chǎn)生一個波形;雙聲道產(chǎn)生兩個波形,也即立體聲,存儲空間是單聲道的兩倍。比特率也稱為碼率,它指的是每秒鐘的數(shù)據(jù)量。7.4.3聲音的技術指標和壓縮標準1.聲音的技術指標波形聲音未壓縮前,波形聲音的碼率計算公式為:波形聲音的碼率=取樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)壓縮編碼后的碼率則為壓縮前的碼率除以壓縮倍數(shù)?!纠?-3】用44.1kHz的取樣頻率,量化位數(shù)為16,錄制1秒鐘的立體聲(雙聲道)節(jié)目,其聲音文件的數(shù)據(jù)量為:44.1×1000×16×2b/s=1411200b/s=1411.2kb/s=1411.2/8kB/s=176.4kB/s7.4.3聲音的技術指標和壓縮標準2.聲音的壓縮標準波形聲音經(jīng)過數(shù)字化之后數(shù)據(jù)量很大,以CD盤片上所存儲的立體聲高保真的全頻帶數(shù)字音樂為例,1小時的數(shù)據(jù)量大約是635MB。為了降低存儲成本和提高通信效率(降低傳輸帶寬),對數(shù)字波形聲音進行數(shù)據(jù)壓縮是十分必要的。波形聲音的數(shù)據(jù)壓縮也是完全可能的。其依據(jù)是聲音信號中包含大量的冗余信息,再加上人具有聽覺感知特性,因此,產(chǎn)生了許多壓縮算法。7.4.4聲音文件的常見格式1.WAV(.wav)文件WAV是微軟公司開發(fā)的一種聲音文件存儲格式,是PC機上最為流行的聲音文件格式。2.MPEG(.mp1/.mp2/.mp3)文件采用MPEG-1
Audio
Layer
3標準壓縮的聲音文件稱為mp3格式文件
mp3文件具有尺寸小,音質相對較好,制作簡單、便于交換等優(yōu)點,非常適合在網(wǎng)上傳播,是目前使用最多的音頻格式文件。3.WMA(.wma)文件WMA的全稱是WindowsMediaAudio,是微軟力推的一種音頻格式。4.RealAudio文件(.ra、.rm、ram)5.MIDI(.mid)文件7.4.5計算機合成聲音1.計算機合成音樂計算機合成音樂是指計算機自動演奏樂曲。計算機的聲卡一般都帶有音源,音源也稱為“音樂合成器”,相當于樂器,可以模仿幾十種樂器的聲音。樂譜在計算機中既不用簡譜也不用五線譜表示,而是用一種叫MIDI的音樂描述語言來表示。計算機中支持MIDI音樂播放的軟件就相當于演奏人員,例如WindowsMediaPlayer、RealPlayer等。7.4.5計算機合成聲音2.計算機合成語音計算機合成語音就是利用計算機模仿人把一段文字朗讀出來,這個過程稱為文語轉換(TTS)。計算機合成語音有很多方面的應用。例如,股票交易、航班動態(tài)查詢、電話報稅等;又如有聲E-mail服務;CAI課件或游戲解說詞的自動配音;文稿校對、語言學習、語音秘書、自動報警、殘疾人服務等。7.5數(shù)字化視頻及應用7.5.1視頻基礎1.基本概念視頻分為數(shù)字視頻和模擬視頻。數(shù)字視頻簡稱DV(Digitalvideo),是指以數(shù)字化方式表示連續(xù)變化的圖像信息。現(xiàn)在出現(xiàn)的VCD、DVD和數(shù)字便攜攝像機都是數(shù)字視頻。模擬視頻是指信號在時間和幅度上連續(xù)的信號,早期的電視、錄像機、攝像機中采用的就是模擬視頻。模擬電視制式是國際上通用的電視顯示標準,世界上主要使用的電視廣播制式有PAL、NTSC和SECAM三種。7.5.1視頻基礎2.數(shù)字視頻計算機處理的對象是數(shù)字視頻。數(shù)字視頻與模擬視頻相比有很多優(yōu)點。例如,復制和傳輸時不會造成質量下降、容易編輯修改、有利于傳輸、可節(jié)省頻率資源等。視頻信號的數(shù)字化過程比聲音要復雜。PC機中用于視頻信號數(shù)字化的插卡是視頻采集卡,簡稱視頻卡。它能將模擬視頻信號及其伴音信號進行數(shù)字化然后存儲在硬盤中。在數(shù)字化的同時,視頻圖像經(jīng)過彩色空間轉換(由YUV轉換為RGB)與計算機圖形顯示卡產(chǎn)生的圖像疊加,用戶就可以在顯示器上觀看到視頻內容。7.5.1視頻基礎2.數(shù)字視頻數(shù)字攝像頭是一種在線獲取數(shù)字視頻的設備。數(shù)字攝像頭通過光學鏡頭和CCD器件采集圖像,然后直接將圖像轉換成數(shù)字信號并輸入到計算機,不再需要使用專門的視頻采集卡。數(shù)字攝像頭有分辨率、鏡頭視角、幀率等主要技術參數(shù)。大多數(shù)數(shù)字攝像頭采用CCD傳感器,有些產(chǎn)品采用CMOS類型的光傳感器,雖然分辨率不高,但功耗低、速度快。數(shù)字攝像頭的接口大多采用USB接口,有些采用高速的IEEE1394接口。7.5.1視頻基礎2.數(shù)字視頻數(shù)字攝像機是一種離線的數(shù)字視頻獲取設備。它通過將CCD轉換光信號得到的視頻信號進行A/D轉換,得到數(shù)字視頻信號,然后經(jīng)過數(shù)字信號處理、數(shù)據(jù)壓縮,最終可輸出壓縮的數(shù)字視頻信號。數(shù)字攝像機輸出的圖像質量較好,高清晰度的數(shù)字攝像機可達720線,是高清晰度數(shù)字電視(HDTV)標準中最高級的一種。7.5.2視頻壓縮編碼1.MPEG-1MPEG-1主要適用于VCD、數(shù)碼相機和數(shù)字攝像機等,也可用于數(shù)字電話網(wǎng)絡上的視頻傳輸,如視頻點播(VOD)等。2.MPEG-2MPEG-2主要針對數(shù)字電視(DTV)的應用要求,碼率為1.5Mb/s~60Mb/s甚至更高。MPEG-2最顯著的特點是通用性,它保持了與MPEG-1向下兼容。7.5.2視頻壓縮編碼3.MPEG-4與MPEG-1和MPEG-2相比,MPEG-4的特點是更注重多媒體系統(tǒng)的交互性和靈活性。
MPEG-4主要應用于可視電話、可視電子郵件以及遠程監(jiān)視和控制等。4.MPEG-7和MPEG-21MPEG-7并不是一種壓縮編碼方法,而是一種多媒體內容描述接口,它不針對某個具體的應用。MPEG-7可應用于數(shù)字圖書館、多媒體查詢服務、廣播媒體選擇和多媒體編輯等。MPEG-21的正式名稱是“多媒體框架”或“數(shù)字視聽框架”,其目的是為所有使用多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境,使用戶能以各種方式使用分布在全球不同設備上的各種各樣的多媒體信息。7.5.3數(shù)字視頻的常見格式1.AVI格式Windows視頻標準格式文件。AVI兼容性好、使用方便、圖像質量好,但文件體積太大。
2.MOV格式MOV文件是美國Apple公司開發(fā)的一種視頻格式。其最大的特點是跨平臺性,即不僅支持Mac操作系統(tǒng),同樣也能支持Windows操作系統(tǒng)。一般認為MOV格式文件的圖像質量好于AVI格式。3.MPEG格式MPEG文件是按照MPEG標準壓縮的全屏視頻的標準文件。目前很多視頻處理軟件都支持這種格式的文件。7.5.2視頻壓縮編碼4.DAT格式DAT文件是一種為VCD及卡拉OKCD專用的視頻文件格式,采用MPEG壓縮、解壓縮。計算機配備視頻卡或安裝解壓縮程序就可以進行播放。5.RM格式RM(Rea
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年小學學校工作總結參考模板(三篇)
- 2024年少先隊輔導員工作總結參考(二篇)
- 2024年年度銷售工作計劃模版(二篇)
- 2024年小學教師個人教學工作總結范本(四篇)
- 2024年學校消毒通風制度樣本(二篇)
- 2024年衛(wèi)生室管理制度樣本(五篇)
- 2024年員工個人年終工作總結范例(二篇)
- 2024年工商部門工作計劃范本(五篇)
- 【《N公司員工培訓問題與完善策略(含問卷)》9500字(論文)】
- 整合品牌設計與傳播(PPT 56頁)
- 完整版佛教葬禮儀式
- 《吸引力法則》PPT課件.ppt
- 食品的商業(yè)殺菌與商業(yè)無菌PPT課件
- 境外工程項目匯率風險管理
- 淺談化工行業(yè)建筑施工質量管理
- 江西省普通高中學業(yè)水平考試物理試題
- A4橫格打印版(共2頁)
- 晨會交底表空白
- 少先隊檢查表
- 《黑白裝飾畫》PPT課件(152頁)
評論
0/150
提交評論