版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、基于ARM的MPEG4視頻解碼器摘 要 詳細闡述了針對ARM平臺的MPEG4視頻解碼算法的優(yōu)化方法。實驗數(shù)據(jù)表明,優(yōu)化后的解碼器性能得到了全面提升。還結(jié)合ARM7TDMI的Easy ARM2200開發(fā)平臺,給出了嵌入式MPEG-4視頻解碼的實時實現(xiàn)。 關(guān)鍵詞 ARM,MPEG4,嵌入系統(tǒng),視頻解碼器1 引 言 本文旨在研究基于ARM微處理器的MPEG-4視頻解碼技術(shù),主要應用在手持移動設備中。利用嵌入式系統(tǒng)實現(xiàn)MPEG-4視頻解碼,處理器的選擇是關(guān)鍵。在嵌入式系統(tǒng)中常用的RISC處理器是ARM核,主要是因為它具有體積小,功耗低,成本低,性價比高的特點,這對于移動應用領(lǐng)域非常重要。ARM7系列微
2、處理器為低功耗的32位RISC處理器,最適合于對價位和功耗要求較高的消費類應用。本解碼器定位于低分辨率和低幀率的應用場合,因此選擇在ARM7TDMI核上實現(xiàn)解碼功能。要實現(xiàn)更高幀率和分辨率的解碼,可將軟件直接應用在更高端的處理器上。2 MPEG-4視頻解碼算法的優(yōu)化與實現(xiàn) MPEG-4標準可以劃分為一套子標準,標準的每一部分都有各自最適合的應用場合。MPEG-4 SVP就是一種特殊的、簡單的MPEG-4實現(xiàn),SVP代表Simple Visual Profile。這部分是專門針對手持式產(chǎn)品中無線視頻傳輸應用場合而制定的。由于本解碼器應用在手持移動設備視頻解碼的場合,因此選用MPEG-4 SVP作
3、為解碼算法。 本文選用ARM7TDMI作為核心處理器進行MPEG-4視頻解碼器的開發(fā)。在實際開發(fā)過程中,針對ARM7TDMI的結(jié)構(gòu)和MPEG-4的算法特點,做了大量優(yōu)化工作,保證了解碼的精度,大幅度提高了解碼的速度。解碼器的具體功能如表1所列。表1 基于ARM7TDMI的MPEG-4視頻解碼器功能表功能系統(tǒng)實現(xiàn)壓縮標準MPEG-4 SVP輸入圖像分辨率QCIF(176144,如果選用更高端處理器,則可支持更高分辨率)解碼幀率15fps(如果選用更高端處理器,則可支持更高幀率)VOP類型IVOP+PVOPDC/AC逆預測支持Inter4V模式支持逆量化方法H.263(MPEG可選)逆掃描方式Zi
4、gzag掃描+水平交替掃描+垂直交替掃描輸出圖像格式420 YUV2.1 解碼器算法 解碼過程實際上就是從視頻編碼碼流中恢復出VOP數(shù)據(jù)的過程。圖1描述了一個視頻解碼過程。解碼器主要包含兩部分: 運動解碼和紋理解碼。I幀中只含有紋理信息,因此只須解碼紋理信息即可恢復I幀。而P幀中不僅包含紋理信息,還包含運動信息,所以須解碼運動信息,獲得運動矢量并進行運動補償。另外,還須進行紋理解碼獲得殘差值,將這兩部分組合起來才能重建P幀。圖1 MPEG4 SVP的解碼過程 解碼器的實現(xiàn)主要是提供一個簡單的接口函數(shù),供解碼時調(diào)用。該接口函數(shù)根據(jù)解碼的不同需要和不同階段提供了5個入口。5個接口函數(shù)中: 4個供初
5、始化、預處理及后續(xù)處理時調(diào)用;剩余1個是幀解碼的實現(xiàn)函數(shù)。圖2為幀解碼主程序的流程圖。圖2 幀解碼主程序的流程圖。 解碼過程的計算主要集中在如下幾個模塊:IDCT、運動補償MC、逆量化、逆掃描、逆預測以及變長解碼VLD。表2給出了優(yōu)化前解碼過程的特征信息。 從表2中可以看出,上述運算模塊在解碼過程中占有很大比例。對以上各模塊進行優(yōu)化的效果將直接反映在解碼器的實時效率上。表2 優(yōu)化前解碼過程的特征信息各單元名稱各單元所占時間比例/%IDCT40逆量化,逆掃描和逆預測24數(shù)據(jù)分析和變長解碼142.2 ARM平臺下算法的優(yōu)化 ARM結(jié)構(gòu)是基于RISC原理的,指令集和相關(guān)的解碼機制都比CISC要簡單得
6、多。它能高效地輸出指令,快速送出實時中斷響應;它還進行了管道設置,處理和存儲系統(tǒng)的所有部分可以持續(xù)地運轉(zhuǎn)。在典型的情況下,當一條指令被執(zhí)行時,其后續(xù)指令正在被解碼;而第三條指令便從存儲器中取出。ARM7TDMI并不具有指令或數(shù)據(jù)的高速緩存,主要被用于控制核心,而非數(shù)據(jù)處理。但通過對其特性的靈活運用,可以使其非常容易地應用于視頻解碼過程。對MPEG4視頻解碼器的算法優(yōu)化主要從以下幾方面入手: (1) 算法的優(yōu)化 這里是指高級C語言轉(zhuǎn)化算法以簡化計算量, 用最佳算法實現(xiàn)解碼中的各模塊。 IDCT算法的選擇 IDCT運行次數(shù)多,運算量很大,其變換的快慢直接影響解碼的速度。本文采用一種稱為AAN的快速
7、算法。其一維8點的DCT變換通過16點DFT來實現(xiàn),而16點DFT又可通過FFT實現(xiàn);二維88的DCT運算僅需80次乘法和464次加法操作,大大減小了這部分的運算量。用AAN算法實現(xiàn)IDCT運算時,實際上是用IDFT取代IDCT,所以首先要得到DFT系數(shù)。方法是逆量化后直接將DCT系數(shù)分別乘以尺度因子,也就是說將尺度變換與逆量化結(jié)合。 除法運算的消除 一個除法操作須花費60120個周期進行處理,而一個乘法操作最多需要4個周期。在除法可以被乘法代替而不喪失準確性的計算中,這樣做是非常有好處的。在反向DC系數(shù)預測過程中,DC系數(shù)重構(gòu)后,立即對其進行逆量化,從而消除除法運算。 存儲訪問的減少 在任何
8、實現(xiàn)中盡可能減少存儲訪問都是非常有價值的。由于ARM7TDMI內(nèi)沒有緩存,每次訪問都是對外部存儲器進行的,所以這樣做尤為重要。通過在任何可能的地方結(jié)合解碼過程,訪問的次數(shù)即可減少。I幀中反向DC系數(shù)預測與DC系數(shù)逆量化的結(jié)合、逆掃描與變長解碼的結(jié)合,以及逆量化與IDCT的結(jié)合,P幀中變長解碼、逆掃描與反量化的結(jié)合,對于每個非零系數(shù)只需一次讀入和一次存儲。同時,像素重建也在IDCT之后立即進行。這樣對每個系數(shù)來說,又減少了一次讀入和存儲。 (2) 根據(jù)ARM7TDMI芯片結(jié)構(gòu)的優(yōu)化 這里的優(yōu)化主要體現(xiàn)在節(jié)約寄存器資源。任何一種芯片的寄存器資源都是有限的,ARM7TDMI的通用寄存器總數(shù)為31個,
9、對于小規(guī)模應用程序是足夠了,但在MPEG4解碼過程中往往會用到較多的寄存器,所以仍須節(jié)儉。方法如下: 其一,在可能的情況下盡量少用寄存器,比如可對一個寄存器多次使用。其二,根據(jù)具體情況選擇最優(yōu)的變量類型,在局部變量中,使用int類型效率最高;而對于全局變量,使用short類型,則可減小Flash的使用量。 (3) 匯編/結(jié)構(gòu)層的優(yōu)化 盡管編譯器可以產(chǎn)生匯編代碼,但為了使代碼效率更高,根據(jù)ARM7TDMI的特性對模塊IDCT、IQ、VLD、DC/AC預測和MC進行手工匯編編碼。下面詳細闡述不同的優(yōu)化方法及其所使用的模塊。 內(nèi)部循環(huán)的解開 循環(huán)的解開其實也是為了增強程序中的并行處理能力。對于解循環(huán)
10、,不能在解開的循環(huán)中保留線性過程,即指令在執(zhí)行過程中的結(jié)果不能作為后續(xù)指令的輸入數(shù)據(jù);否則也就失去了并行處理能力,解循環(huán)也就失去了意義。 乘法和除法盡量用移位運算來完成 對于2的冪次乘法或除法使用移位將會提高不少效率,一條除法指令使用的周期數(shù)遠遠多于移位指令。 盡可能將循環(huán)內(nèi)部的負荷放到循環(huán)外面 這點很重要,因為許多循環(huán)內(nèi)部包括一條或幾條運算語句,這些語句將被重復運算,因此如果事先設定一個變量,然后賦上那幾條運算語句的值,并替換到循環(huán)外部,則會極大地節(jié)省芯片資源,特別是對于循環(huán)中含有除法運算的情況。在逆量化循環(huán)運算中,存在著大量冗余計算,原因在于逆量化運算中參數(shù)的重復計算,而對于每幀解碼VOP
11、,這些參數(shù)是唯一的。因此,可將這些參數(shù)的計算放到逆量化循環(huán)外面,則每幀只須計算一次。這樣即可節(jié)約大量的指令周期。 功能參數(shù)的優(yōu)化數(shù)量 在ARM編譯的過程中,子程序的參數(shù)是通過寄存器R0R3來傳遞的。如果所傳遞的參數(shù)多于4個,那么超出的參數(shù)將被壓入棧內(nèi);當它們在函數(shù)中被第一次訪問時,便會從棧中彈出。通過把參數(shù)的數(shù)量減少到4個或者少于4個,則可直接使用,而無需任何的調(diào)入,因為這些值都可從寄存器中獲得。 利用LDM和STM減少存儲器的訪問 批量加載/存儲指令可以實現(xiàn)在一組寄存器和一塊連續(xù)的內(nèi)存單元之間傳輸數(shù)據(jù)。LDM為加載多個寄存器;STM為存儲多個寄存器。這種特性非常有用,因為與單字加載/存儲相比
12、,它在執(zhí)行周期上花費更少。因此它在IDCT中得到了有效的利用,用于同一時刻取出一行的所有系數(shù)。同樣在運動補償過程中,一組數(shù)據(jù)字在指令的一次執(zhí)行中獲得,并且暫時存儲在多個寄存器中以便日后使用。 指令的有條件執(zhí)行 有條件執(zhí)行的特性被ARM7TDMI的所有算法和數(shù)據(jù)移位指令支持。這是一項可選的特性。它在指令被執(zhí)行時設置標記。有條件執(zhí)行通常用于循環(huán)退出條件和飽和條件,可以節(jié)省退出循環(huán)中的一個指令CMP。對于循環(huán)次數(shù)很多的情況,即使是一個指令的減少也有很大的好處。在變長解碼中就很好地利用了這種特性。 一種用于運動補償?shù)挠行?yōu)化方法 解碼過程中處理的像素是8位。如果運動補償是在字節(jié)或像素的基礎(chǔ)上執(zhí)行,那么
13、字節(jié)加載和存儲將被使用,它是存儲器訪問中代價最高的操作。因為ARM7TDMI是32位微處理器,存儲器可以按字讀取數(shù)據(jù),因此設計出一種有效的運動補償方法,即在字數(shù)據(jù)的基礎(chǔ)上進行操作。利用這種方法,便可以用一種非常有效的方式同時對4像素進行運動補償。 下面以水平方向的半像素補償為例,講述補償?shù)倪^程。補償?shù)脑砣鐖D3所示。 首先讀入一個字到寄存器中,從低到高的數(shù)據(jù)依次對應的是像素0、像素1、像素2和像素3;然后將讀碼流指針增加1字節(jié),再讀取下一個字到另一寄存器中,從低到高的數(shù)據(jù)依次對應的為像素1、像素2、像素3和像素4。示意圖如圖4所示。圖3 半像素內(nèi)插示意圖 圖4 4像素補償原理示意圖 半像素補償
14、可由x=(A+B+1-rounding_control)/2來實現(xiàn)。式中: A和B為參考幀中兩個相鄰的像素數(shù)據(jù);rounding_control可取0或1。 按照補償公式對上述兩個寄存器進行相加移位操作,但是對應像素兩兩相加時可能會產(chǎn)生進位。為了解決這個問題,須設置保護位,具體方法如下:將上述兩個寄存器中的任意一個(如寄存器1)與0 xFEFEFEFF相“與”,則寄存器1中像素1、2、3的最低位被清0,即將后一字節(jié)的最低位設置為前一字節(jié)的保護位。而對于第3字節(jié),因為寄存器本身帶有進位狀態(tài)標志,所以無需另外設置。 如果rounding_control為0,則將寄存器2與0 x01010101相加
15、,然后再和0 xFEFEFEFF相“與”,設置進位保護位;如果rounding_control為1,則直接將寄存器2和0 xFEFEFEFF相“與”。 將以上兩步的結(jié)果相加,判斷進位狀態(tài)標志。若有進位,則將相加結(jié)果的最高位,即寄存器的第31位置1,最后右移1位。所得結(jié)果即補償后的4個像素值。 在同時對4像素進行補償?shù)倪^程中,只有當相鄰兩像素的最高位都為1時,才會有進位產(chǎn)生。使用這種補償方法其實犧牲了部分精度,但這里只是使所影響的像素值增加了1,所以影響并不大,而且可以使補償速度大大提升。同時對4像素進行補償?shù)倪^程中,寄存器加載需要3個周期,存儲需要2個周期,共有兩次加載和一次存儲操作,中間的加
16、法和移位操作需要6個指令周期,共需14個周期。如果對上面4個像素分別進行補償,則需5次加載操作和4次存儲操作,共23個周期,另外中間計算還需12個周期,所以共需35個周期??梢?,犧牲部分精度換取補償速度是很值得的。 對于垂直方向和水平垂直方向的半像素補償,其原理與水平方向相同。3 實驗結(jié)果與數(shù)據(jù)分析 通過優(yōu)化,MPEG4的解碼性能有了較大的提升。在ADS1.2環(huán)境下分別對各模塊進行C算法優(yōu)化和ARM代碼優(yōu)化,結(jié)果如表3所列。按調(diào)用一次模塊函數(shù)所需周期數(shù)進行統(tǒng)計。表3 仿真器上各模塊單獨統(tǒng)計(使用QCIF格式圖像news)所優(yōu)化模塊名稱C優(yōu)化(cycles)/個ARM優(yōu)化(cycles)/個優(yōu)化
17、率/DC/AC預測70353424.04逆掃描/VLD1 7301 11835.38逆量化/IDCT6 0322 56257.53運動補償17 1438 47150.59 這些模塊是解碼過程中經(jīng)常會調(diào)用的函數(shù),因此,這些函數(shù)的優(yōu)化將使解碼速度有明顯的提高。 表4比較了不同序列的15幀QCIF格式視頻解碼優(yōu)化前后所需的帶寬。這些圖像具有不同的復雜度,因而結(jié)果也不一樣。表4 對不同序列的優(yōu)化結(jié)果(15fps QCIF格式)視頻序列優(yōu)化前所需帶寬/MHz優(yōu)化后所需帶寬/MHznews27.2416.86foreman64.8348.78miss_am27.7115.95carphone52.5434
18、.52salesman28.0616.56trevor52.5634.24注: 為標準視頻測試序列。 解碼速度基本取決于圖像畫面的運動情況和顏色是否豐富。從上面的數(shù)據(jù)可以看出對于不同的序列,其解碼速度也不同。news、salesman和miss_am之所以很快,是因為圖像背景靜止,只有肩部和頭部有運動,所以P幀的編碼數(shù)據(jù)量較少,解碼速度較高。另外,如果圖像很簡單(單調(diào)),其能量集中到DC系數(shù)(直流分量)上,交流系數(shù)會出現(xiàn)多個零,因此變長解碼速度就會較高,從而節(jié)約了解碼時間。 從仿真速度分析,通過本文所總結(jié)的ARM7TDMI上視頻解碼的優(yōu)化方法,可以使MPEG4視頻解碼節(jié)約大量的數(shù)據(jù)處理時間。由
19、實驗結(jié)果可見,本視頻解碼器能較好地滿足低分辨率、低幀率場合實時解碼的要求。4 MPEG4視頻解碼的嵌入式系統(tǒng)實現(xiàn) 實現(xiàn)本解碼器的主要硬件平臺是Easy ARM2200,如圖5所示。它是一款功能強大的32位ARM單片機開發(fā)板,采用了Philips公司的ARM7TDMIS核,以及總線開放的單片機LPC2210,具有JTAG調(diào)試功能。圖5 Easy ARM2200開發(fā)板 開發(fā)板上除了提供鍵盤、LED和RS232等一些常用功能部件外,還具有4Mb SRAM、16Mb FLASH、IDE硬盤接口、CF存儲卡接口、以太網(wǎng)接口和Modem接口等。 本文選擇在Clinux操作系統(tǒng)上調(diào)試MPEG4解碼程序。調(diào)試
20、過程分為以下幾個步驟:建立Clinux開發(fā)環(huán)境; 在Clinux下開發(fā)應用程序; 添加應用程序到目標系統(tǒng)并調(diào)試。 圖6 為一個基于Clinux的嵌入式系統(tǒng)典型框架結(jié)構(gòu)圖。圖6 基于Clinux嵌入式系統(tǒng)框圖 (1) 建立Clinux開發(fā)環(huán)境 為了實現(xiàn)基于Clinux的應用系統(tǒng)的開發(fā),建立或擁有一個完備的Clinux開發(fā)環(huán)境是十分必要的。建立Clinux開發(fā)環(huán)境主要包括以下3個步驟:建立交叉編譯器; 編譯Clinux內(nèi)核; 加載內(nèi)核。 在完成上述所有工作后,一個嵌入式應用開發(fā)平臺就已經(jīng)搭建好了。在這個平臺之上,可以根據(jù)不同需要開發(fā)嵌入式應用。 (2) 在Clinux下開發(fā)應用程序 基于Clinu
21、x系統(tǒng)的應用程序的開發(fā),通常是在標準Linux平臺上用交叉編譯工具armelfgcc來完成的。ADS和armelfgcc都是ARM公司提供的軟件開發(fā)工具,它們都支持ARM指令集,但部分偽指令集不同。因此為了將在ADS1.2環(huán)境下優(yōu)化好的源代碼移植到armelfgcc環(huán)境下,就需要對源代碼的偽指令作修改, 然后用armelfgcc編譯源文件,以生成可在目標板上運行的可執(zhí)行程序。 (3) 添加應用程序到目標系統(tǒng)并調(diào)試 要在硬件板上調(diào)試,就必須首先把應用軟件的可執(zhí)行程序添加到目標系統(tǒng)中。有多種途徑可以達到這一目的。本文使用的是網(wǎng)絡方法,通過以太網(wǎng)接口從網(wǎng)絡添加用戶程序到目標系統(tǒng)中運行。 完成上述工作
22、后,MPEG4解碼程序就可以在Clinux系統(tǒng)上運行了,解碼結(jié)果數(shù)據(jù)流通過以太網(wǎng)動態(tài)傳輸?shù)絇C機上。對幾個典型QCIF格式圖像解碼的幀率如表5所列。表5 在Clinux操作系統(tǒng)中MPEG4視頻解碼的幀率視頻序列解碼的實際幀率/幀/snews35foreman16miss_am37carphone17salesman36trevor17 觀察發(fā)現(xiàn)與前面的軟件仿真結(jié)果是一致的。對于序列news、miss_am和salesman這些運動動作不太大的圖像,解碼幀率明顯較高;而對于foreman、carphone和trevor這些運動動作較大的圖像,解碼幀率就較低。 實驗結(jié)果表明,本系統(tǒng)可以實現(xiàn)低幀率、
23、低分辨率的嵌入式MPEG4視頻實時解碼。5 結(jié)束語 本文重點研究了基于ARM開發(fā)平臺對MPEG4實時解碼的算法優(yōu)化及其硬件實現(xiàn)。主要完成了以下幾方面工作: 針對ARM7TDMI的體系結(jié)構(gòu),對解碼的關(guān)鍵部分進行了算法優(yōu)化和代碼優(yōu)化,從而極大地提高了解碼速度;針對具體的硬件平臺基于ARM7TDMI的Eeay ARM2200開發(fā)板,建立了Clinux開發(fā)環(huán)境,在其上開發(fā)應用程序,添加到目標系統(tǒng)中并調(diào)試,最后完成了15fps的MPEG4視頻解碼嵌入式系統(tǒng)的實時實現(xiàn)。 隨著人們對視覺媒體的要求越來越高,基于嵌入式系統(tǒng)視頻解碼技術(shù)將具有越來越廣闊的前景。附錄資料:不需要的可以自行刪除ARM經(jīng)典40問答第1
24、問:Q:請問在初始化CPU堆棧的時候一開始在執(zhí)行mov r0, LR這句指令時處理器是什么模式A:復位后的模式,即管理模式。第2問: Q:請教:MOV中的8位圖立即數(shù),是怎么一回事 0 xF0000001是怎么來的 A:是循環(huán)右移,就是一個0255 之間的數(shù)左移或右移偶數(shù)位的來的,也就是這個數(shù)除以4一直除, 直到在0-255的范圍內(nèi)它是整數(shù)就說明是可以的! A:8位數(shù)(0-255)循環(huán)左移或循環(huán)右移偶數(shù)位得到的,F(xiàn)0000001既是0 x1F循環(huán)右移4位,符合規(guī)范,所以是正確的。這樣做是因為指令長度的限制,不可能把32位立即數(shù)放在32位的指令中。移位偶數(shù)也是這個原因??梢钥匆豢?HYPERLI
25、NK t _blank arm體系結(jié)構(gòu)(ADS自帶的英文文檔)的相關(guān)部分。第3問: Q:請教: HYPERLINK t _blank arm微控制器基礎(chǔ)與實戰(zhàn)2.2.1節(jié)關(guān)于第2個操作數(shù)的描述中有這么一段:#inmed_8r常數(shù)表達式。該常數(shù)必須對應8位位圖,即常熟是由一個8位的常數(shù)循環(huán)移位偶數(shù)位得到。 合法常量:0 x3FC,0,0 xF0000000,200,0 xF0000001. 非法常量:0 x1FE,511,0 xFFFF,0 x1010,0 xF0000010. 常數(shù)表達式應用舉例: LDR R0,R1,#-4 ;讀取 R1 地址上的 HYPERLINK / t _blank 存
26、儲器單元內(nèi)容,且 R1 = R1-4 針對這一段,我的疑問: 1. 即常數(shù)是由一個8位的常數(shù)循環(huán)移位偶數(shù)位得到,這句話如何理解 2. 該常數(shù)必須對應8位位圖,既然是8位位圖,那么取值為0-255,怎么0 x3FC這種超出255的數(shù)是合法常量呢 3. 所舉例子中,合法常量和非法常量是怎么區(qū)分的 如0 x3FC合法,而0 x1FE卻非法0 xF0000000,0 xF0000001都合法,而0 xF0000010又變成了非法 4. 對于匯編語句 LDR R0,R1,#-4,是先將R1的值減4結(jié)果存入R1,然后讀取R1所指單元的 值到R0,還是先讀取R1到R0,然后再將R1減4結(jié)果存入R1 A:提示
27、,任何常數(shù)都可用底數(shù)*2的n次冪 來表示。 1. HYPERLINK t _blank arm結(jié)構(gòu)中,只有8bits用來表示底數(shù),因此底數(shù)必須是8位位圖。 2. 8位位圖循環(huán)之后得到常數(shù),并非只能是8位。 3. 0 xF0000010底數(shù)是9位,不能表示。 4. LDR R0, R1, #-4 是后索引,即先讀,再減。 可以看一看 HYPERLINK t _blank arm體系結(jié)構(gòu)對相關(guān)尋址方式的說明。第4問: Q:在程序移植的過程中,什么代碼段處于什么樣的模式,這可真是一個困擾人的大難題,有沒有一種標志或辦法能夠識別代碼段處于什么樣的模式 A:讀取 CPSR ,任何時候都是可以讀。第5問:
28、 Q:為什么保護現(xiàn)場時,總是保護 R0-R3,R12,為什么不保護R4-R11A:請看一看 HYPERLINK t _blank arm-thumb過程調(diào)用標準這個文檔。第6問: Q:請問 mov R1,#0 x00003DD0 錯誤: out of the range of operation是怎么回事情 我就是想IODIR=0 x00003dd0,匯編就是 LDR R0,=IODIR MOV R1,#0 x00003dd0 STR R1,R0 編譯時候說是超出操作范圍 A:使用ldr,mov的操作數(shù)為8位位圖數(shù)。第7問: Q:在 HYPERLINK t _blank arm7TDMI(-S
29、)處理器內(nèi)部有37個用戶可見的寄存器: 問題:用戶可見應該怎樣理解 這37個寄存器是否是37個不同的物理寄存器, 例如R8與R8_fiq應該是兩個不同的物理寄存器吧 A:用戶可見是指用戶可以通過程序操作的。R8與R8_fiq是兩個不同的寄存器。第8問: Q: USR模式,SVC模式,IRQ模式分別有哪些限制 A:對于外設操作限制與芯片設計有關(guān)。USR模式不能設置CPSR寄存器。 用戶模式下無SPSR寄存器,代碼可以為 HYPERLINK t _blank arm,Thumb.第9問: Q:請問在初始化堆棧時就決定了工作模式是什么意思 如何決定工作模式的 A:設置CPSR寄存器。第10問: Q:
30、請問: HYPERLINK t _blank arm匯編程序設計中所謂的文字池作何理解 A:可以理解為常量數(shù)組,文字池中保存的是常量,這些常量可以是正常的常量,也可以是地址。第11問: Q:為什么在中斷向量表中不直接LDR PC,異常地址.而是使用一個標號,然有再在后面使用DCD定義這個標號 A:因為LDR指令只能跳到當前PC 4kB范圍內(nèi),而B指令能跳轉(zhuǎn)到32MB范圍,而現(xiàn)在這樣在LDR PC, xxxx這條指令不遠處用xxxxDCD定義一個字,而這個字里面存放最終異常服務程序的地址,這樣可以實現(xiàn)4GB全范圍跳轉(zhuǎn)。 Q: LDR 不是可以全空間跳轉(zhuǎn)的嗎 HYPERLINK t _blank
31、arm微控制器基礎(chǔ)與實戰(zhàn)程序清單5.3. A: LDR偽指令通過設置指令緩沖池才能實現(xiàn)全范圍跳轉(zhuǎn),而LDR指令則只能實現(xiàn)4KB范圍跳轉(zhuǎn)。第12問: Q: ARM7TDMI-S和 HYPERLINK t _blank arm7TDMI有何區(qū)別 A: ARM7TDMI-S是ARM7TDMI的可綜合(synthesizable)版本(軟核)。 對應用工程師來說,除非芯片生產(chǎn)廠商對ARM7TDMI-S進行了裁減,否則ARM7TDMI-S與ARM7TDMI沒有太大的區(qū)別,其編程模型與 HYPERLINK t _blank arm7TDMI一致。第13問: Q: DCD偽指令的疑惑。 StackUsr D
32、CD UsrStackSpace + (USR_STACK_LEGTH - 1) * 4 這句話是什么意思 DCD后面的程序標號或數(shù)字表達式是何意 A:它的內(nèi)容是初始化遞減堆棧的最高地址,看 HYPERLINK t _blank arm微控制器基礎(chǔ)與實戰(zhàn)2.3.2節(jié)。 第2章 編譯器與語言第14問: Q:00254: Unimplemented RDI message是什么錯誤提示 我的設置連接都正常,是不是芯片燒了 A:是JTAG的問題??梢韵仁褂肐SP操作試試就知道了,如果能ISP,說明LPC2104沒有損壞,還能正常運行程序。第15問: Q:請教:我在調(diào)試程序的時候在AXD中出現(xiàn)這樣的提
33、示信息: RDI Warning 00159:could not open specified device port. 我是根據(jù)配套教程的步驟設置的。 A:請按照光盤easy HYPERLINK t _blank arm_drivereadme.txt安裝驅(qū)動程序。第16問: Q:我用實驗程序運行經(jīng)常出現(xiàn)下列信息! 程序不能 HYPERLINK / t _blank 下載到目標板。 Warnning! interrupt vectors data is not correct! Program you downloaded can not run freely! A:1.仿真器配置一定要正確
34、,即Easy HYPERLINK t _blank arm Configuration設置窗口中的FLASH項中選擇Erase Flash when need; 2.向量表累加和要為0; 3.可以先在RAM調(diào)試一個程序(運行),然后STOP,再使用File-Load Image加載要 HYPERLINK / t _blank 下載到FLASH的調(diào)試文件。第17問: Q:在ADS中是否可以進行軟件調(diào)試基于UCOS-II的程序 A:ADS軟件調(diào)試只能調(diào)試 HYPERLINK t _blank arm的內(nèi)核,不能調(diào)試外設。但是取消 PLL 鎖定檢測后,可以調(diào)試任務切換,最終到空閑任務上。開始移植時軟
35、件仿真是最好的工具。第18問: Q: HYPERLINK t _blank armulate軟件是干什么的 2104不是用EasyJTAG.dll來仿真嗎 A:軟件仿真只能仿真 HYPERLINK t _blank arm 核。第19問: Q:有關(guān)LPC2106.INC的問題。我無法在project引用lpc2106.inc文件,只能引用lpc2106.h文件, 這是什么原因 且當我的主程序用匯編編寫時,不能引用lpc2106.h,用lpc2106.inc則無法加入project,請問匯編器應如何設置 A:不用加2106.inc只要該文件在你的工程文件夾中,就可以直接在匯編程序的開始處加 in
36、clude 2106.inc. 注意:該文件是匯編文件定義的頭文件,定義內(nèi)部寄存器。第20問: Q:入口點是什么意思 我在使用LPC2106上移植UCOS-II,每次MAKE時總是提示我 Image does not have an entry point,可是我是把光盤的vetctors.s 復制過來的,而且仔細看了看,已經(jīng)聲明了ENTERY,這是怎么回事A:需要在ADS中設置入口。第21問: Q:請教:如何定義不被初始化變量 A:讓編譯器不知道有這個內(nèi)存地址即可。 A:如用分散加載文件分配RAM故意預留一部分RAM不分配,用它來存您不需要初始化的東西?;蛘卟徽{(diào)用編譯器提供的啟動代碼,不過這
37、樣可能編程會麻煩一些。第22問: Q:我直接通過JTAG口 HYPERLINK / t _blank 下載EasyArm板帶的Ext1_test程序到 HYPERLINK t _blank arm中,出現(xiàn)中斷向量的告警: interrupt vector is not correct HYPERLINK t _blank arm is not running freely. 果然復位后芯片不能運行。但是我用串口 HYPERLINK / t _blank 下載后芯片能正常工作,中斷也行的。 并且我用JTAG仿真的話,芯片能正常工作,中斷也行的,唯獨JTAG口 HYPERLINK / t _bla
38、nk 下載不行。 不知道是什么原因 A:仿真器配置中要設置Erase Flash when need.也可以這樣試試: 1.可以先打開一個工程在RAM中調(diào)試運行; 2.stop程序; 3.使用File-Load Image重新加載Ext1_test生成的*.axf文件。 Q:仿真器配置中我是設置了Erase Flash when need,但照你說的話,那不是在RAM下調(diào)試嗎 在RAM下調(diào)試我是可以的,但是下載后出現(xiàn)interrupt vector data is not correct. 我又看了幾篇文章,是不是跟中斷向量表的累加和不為零有關(guān)系啊 A:是的,是向量表的累加和不為零。 因為如果
39、用ISP下載能運行,說明向量表的累加和已為零,而用JTAG下載不能運行的情況可能是 沒有正常下載代碼。先在RAM中調(diào)試,目的是為了后面正確下載程序到FLASH.第23問: Q:用Scatter怎樣將某個函數(shù)或文件定位在Flash的某個位置 第24問: Q:我在仿真時遇到這樣的提示: Error, Flash is protected by user configation! 怎么寫到flash里面呢 A:看配套 HYPERLINK t _blank arm微控制器基礎(chǔ)與實戰(zhàn)附錄一。第25問: Q:我在移植實驗中想到了兩個問題,如下: 1.Debug和Release以及DebugRel有什么不同
40、,為什么在作2104移植實驗時,要用Release 2.在Release中為什么要將RW Base設置為0 x40000040 我將其設置為0 x40003000, 為什么不能工作 A:都只是一個問題,內(nèi)存空間的使用,因為跑OS要比較大的內(nèi)存空間,所以要騰出點地方。第26問: Q:請問沒有MMU的 HYPERLINK t _blank arm芯片是否支持使用malloc()函數(shù)動態(tài)分配內(nèi)存 A:是否支持malloc()函數(shù)與芯片沒有多大關(guān)系,主要與編譯器有關(guān)。 Q:再問:如果沒有操作系統(tǒng)支持呢 A:也支持。第27問: Q:在I2C實驗程序中,我想查看數(shù)據(jù)緩沖區(qū)DataBuf的值,怎么查看 A:
41、watch窗口或鼠標停留在要查看的變量名上。 Q:我查詢的是寫入DataBuf緩沖區(qū)的值,鼠標在上面根本就不會出現(xiàn)他的值,即使在watch中加入, 結(jié)果也是name not found. A:變量被優(yōu)化,調(diào)試時可以把該變量定義為全局變量查看。第28問: Q:仿真軟件和2104開發(fā)板連接不上 DBE Warning 00041: !An unspecified Debug Toolbox call failed 電源和開發(fā)板都連好,錯誤和沒接開發(fā)板一樣,驅(qū)動也安裝了,安裝時按確定鍵時,軟件很長時間才有如上反應,請幫忙 A:1.并口是否正常 2.在其它操作系統(tǒng)(如98)下或其它臺式PC下試試。第2
42、9問: Q:如何生成32位hex文件 我在Release Setting- HYPERLINK t _blank arm fromELF-Output Format中設置為Intel 32bit HEX,可是好像沒有生成hex文件 A:試試這種方法: Target-Target Setting- ost Link中選擇 HYPERLINK t _blank arm fromELF加上你上面設的應該不成問題。第30問: Q:請問關(guān)于settings中r0 base rw base的意思 A:ro:read only,rw:read and write.第31問: Q:編譯成功后的信息第一行,co
43、de,R0 data,RW data,ZI data,debug分別代表什么 A:R0 只讀段,即程序代碼空間; RW 可讀/寫段,即數(shù)據(jù)變量空間; ZI 清零變量段,即需要清零初始化的數(shù)據(jù)變量空間。第32問: Q:如何在ADS里面看任務執(zhí)行的一些情況 比如堆棧。 A:多任務環(huán)境下的堆棧,內(nèi)存等信息需要調(diào)試軟件的支持才可以實現(xiàn)。 ucos下有一個統(tǒng)計功能的模塊可以間接實現(xiàn)部分功能。第33問: Q:請問向flash燒數(shù)據(jù)時出現(xiàn):exceeds flash limitation 請予賜教! A:要寫入的flash地址超過了范圍。如果不是代碼太大的問題,可以檢查scf文件是否正確。第34問: Q:在
44、LPC2214之類的芯片中如何實現(xiàn)數(shù)組的絕對地址定位,比如51的_at_的用法。 A:*(char*)0 x40000300)類似訪問 Q:謝謝,但這樣做就無須定義數(shù)組變量,訪問也不便,還有高招嗎 A:可以使用分散加載。第35問: Q:請問 ADS編譯錯誤L6221E:Execution region ER_RO overlays with Execution region ER_ZI 該如何解決 A:請用我們網(wǎng)站上的工程模板試一試,最大的可能是因為你的RELEASE或者DEBUG選項里面沒有正確設置,按照參考 HYPERLINK t _blank arm微控制器基礎(chǔ)與實戰(zhàn)上面的設置,是不會有這個問題的。第36問: Q:請教一下:將程序?qū)懭雈lash,再用從JTAG方式調(diào)試寫入
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度高標準溫室大棚施工合作協(xié)議范本2篇
- 建設合同范本(2篇)
- 二零二五版白酒品牌代理商白酒回購合作協(xié)議3篇
- 二零二五年度城市棚戶區(qū)改造民房征收補償合同4篇
- 二零二五年度新型節(jié)能門窗研發(fā)生產(chǎn)合同4篇
- 部編版八年級語文上冊《白楊禮贊》教學設計(共2課時)
- 銀行課程設計報告范文
- pvc管道施工方案
- 2024年學校防溺水教案
- 2025年度個人公共安全設施承包合同模板4篇
- 春節(jié)聯(lián)歡晚會節(jié)目單課件模板
- 糖尿病眼病患者血糖管理
- 抖音音樂推廣代運營合同樣本
- 教育促進會會長總結(jié)發(fā)言稿
- 心理調(diào)適教案調(diào)整心態(tài)積極應對挑戰(zhàn)
- 噴漆外包服務合同范本
- 2024年電信綜合部辦公室主任年度述職報告(四篇合集)
- 微機原理與接口技術(shù)考試試題及答案(綜合-必看)
- 濕瘡的中醫(yī)護理常規(guī)課件
- NUDD新獨難異 失效模式預防檢查表
- 內(nèi)蒙古匯能煤電集團有限公司長灘露天煤礦礦山地質(zhì)環(huán)境保護與土地復墾方案
評論
0/150
提交評論