緒論:寫作既是個人情感的抒發(fā),也是對學(xué)術(shù)真理的探索,歡迎閱讀由發(fā)表云整理的11篇解碼技術(shù)論文范文,希望它們能為您的寫作提供參考和啟發(fā)。

總體結(jié)構(gòu)
系統(tǒng)硬件分為:高清圖像采集板、NiosII核心板、單片機接口板三部分。軟件由NiosII和單片機軟件組成。考慮到程序的標準化、可移植性,NiosII程序和單片機程序都使用標準C編寫。
高清圖像采集
方案一用工業(yè)用高清鏡頭采集影像,再對模擬視頻解碼,得到高清視頻數(shù)據(jù)。解碼芯片可選AD的ADV7181C,10位集成多格式標清高清視頻解碼器,四個10位ADC采樣速率最高110MHz,支持720p/1080i高清分量,最高對1024x768、70Hz(XGA)RGB圖形進行數(shù)字化處理。科技論文。或TI TVP5150AM1,超低功耗優(yōu)化架構(gòu),工作狀態(tài)下功耗僅為113mW,只需一個晶振就能支持所有標準,可通過I2C對亮度、對比度、飽和度、色調(diào)、銳度等控制,功能強大使用方便。或飛利浦SAA7114H,該芯片最多允許6個復(fù)合視頻輸入,顯示比例調(diào)整分辨率調(diào)整,解碼精度高支持視頻窗口縮放。科技論文。此方案成本高體積大。
方案二用高清圖像傳感器采集,直接輸出高清圖像數(shù)據(jù)。從芯片的性能指標、價格供貨、技術(shù)支持、開發(fā)難易程度等方面考慮,Omni公司的OV9712芯片較為合適。該傳感器為1/4”標清高清CMOS圖像傳感器,像素尺寸3.0um,內(nèi)置OmniPixel3-HS技術(shù),可提供WXGA(1280X800)分辨率、640x480、HD720p三種格式圖像,10bit彩色rawRGB并行圖像數(shù)據(jù)輸出,PLL鎖相環(huán),高信噪比圖像質(zhì)量,鏡頭校正,畫面缺陷補償。該方案成本百元左右,硬件簡單性能穩(wěn)定,符合實際要求。
設(shè)計OV9712采集電路時,要使用獨立電源,電路板上盡量減小信號線長度及避免上下層平行布線,電源芯片放在板子外側(cè)。外圍器件盡量以O(shè)V9712要求參數(shù)一致,電路中模擬地與數(shù)字地分開走線最后匯集一點。OV9712有效圖像傳感區(qū)域不在芯片中間位置,而是偏右偏上,為了使目標圖像能處于畫面中心,繪制電路板時要注意調(diào)整芯片位置,具體尺寸參見OV9712器件手冊。
Nios核心板
FPGA芯片選型比較如下:
1 MIMO技術(shù)的發(fā)展
多輸入多輸出技術(shù)的核心在于空間復(fù)用編碼,空間復(fù)用系統(tǒng)中獨立的數(shù)據(jù)流是由不同的天線在同一時間發(fā)送,信道容量直接因為發(fā)送天線的增加而線性增加。本論文主要討論空間復(fù)用編碼及其相關(guān)檢波技術(shù),具體比較了線性檢測、非線性檢測和樹查找三種檢波算法。
2 系統(tǒng)模型
通常的MIMO系統(tǒng)2×2、2×4或4×4的天線系統(tǒng),一般設(shè)定Nr大于或等于Ns。這樣做的目的是第i個數(shù)據(jù)流xi在第i根天線上發(fā)送時,接收到的信號向量r=Hx+n,這樣Ns×1的發(fā)送數(shù)據(jù)流列向量右乘Nr×NS的信道傳輸矩陣H,加上Ns×1的信道噪音列向量。設(shè)定傳送的數(shù)據(jù)系列x服從(0,σ2)的高斯分布,為了簡化系統(tǒng)仿真中直接在接收端導(dǎo)入信道傳輸矩陣H,噪音為高斯白噪。
3 空間復(fù)用和檢波技術(shù)
OFDM系統(tǒng)發(fā)展到今天,加入時空編碼成為在不增加現(xiàn)有帶寬基礎(chǔ)上穩(wěn)定提高傳輸速率的最好手段。包括線性遞推法和樹查找法的接收器檢波技術(shù)實踐中用來移除信道的干擾,恢復(fù)被頻選信道干擾的信號的正交性等,但是其計算太繁瑣。因此陸續(xù)的出現(xiàn)球形譯碼算法和QRD-M算法既繼承了最大相似性算法的優(yōu)勢又減少了計算量,節(jié)約了處理芯片功耗。
3.1 ZF接收器
ZERO-FORCING接收器在接收天線數(shù)大于或等于發(fā)送天線數(shù)的條件下,使信號傳輸方程:
成立的向量解并不唯一,因此需要找最小方差的發(fā)送信號向量,利用微分找到最小方差值為:
從上面公式可以看出,在信號的解調(diào)基本是信道傳輸函數(shù)的線性運算,因此ZF接收器在信道情況良好的情況下就會非常方便和快捷,利用線性矩陣運算可以很簡單地建立運算函數(shù),如圖1所示。
3.2 V-BLAST譯碼
雖然線性的接收器非常容易實現(xiàn),但是因為增加了信道傳輸函數(shù)階數(shù)且需要的信道良好條件在實際高樓密集的城市中很難實現(xiàn),貝爾實驗室在1996年提出了一種無線通信中多天線的空間結(jié)構(gòu),稱為D-BLAST,進而在1998年,P. Wolniansky聯(lián)合Goschini和 Golden在D-BLAST的時空編碼中實現(xiàn)高傳輸率的垂直-BLAST,即V-BLAST,V-BLAST在信元調(diào)制中使其時空編碼先正交,這樣每次減少一個發(fā)送的信元的同時減少信道傳輸函數(shù)的階數(shù),即將最初的r×t,依次減少到r×1,也就是SIC算法。利用ZF或是MMSE矩陣來調(diào)制信元xi,從而使得接收信號在接收端通過ZF或是MMSE相同的矩陣運算后只留下xi的信號成分,從而提取出發(fā)送的信元xi,再將提取出的成分反饋回接收器線性元素之后,再重復(fù)步驟提取xi+1。
3.3 利用QR分解法分解信道矩陣
利用QR分解法將r×t的信道傳輸函數(shù)矩陣H分解為與轉(zhuǎn)秩相逆的矩陣Q和上對角矩陣R,即QTQ=E,接收到的信號為:
基本所有的多輸入多輸出正交頻分多路復(fù)用都會在檢測算法中或多或少使用到QR分解法,當QR分解之后的信道響應(yīng)不僅能保證信號的正交而且還能夠簡化信號的解調(diào)處理。因為信道的傳輸函數(shù)H分解為了上三角矩陣R,各信號分量矩陣間的相互關(guān)聯(lián)也被簡化為上三角矩陣中各信號單獨的向量調(diào)制,從而簡化接收端同步檢測器的設(shè)計復(fù)雜度,如圖2所示。
3.4 樹搜索同步技術(shù)
最大似然法利用已知的模型來推導(dǎo)未知的參數(shù),在MIMO-OFDM系統(tǒng)中使用的最大似然法利用樹搜索,每一個搜索樹節(jié)點作為信元的可能解碼。下面將對兩類常用的搜索樹的優(yōu)缺點繼續(xù)比對
3.4.1 球形解碼
MIMO接收端天線數(shù)量的增加會使算法的復(fù)雜度成指數(shù)增加,很難在大陣列和高調(diào)制數(shù)的情況下物理實現(xiàn)解碼器。球形解碼算法利用合理的譯碼半徑R從而判定接收好譯碼的路徑d,約束搜索半徑R的公式一般寫為:
球型解碼器由前端運算部件和后面的樹搜索部件構(gòu)成。
5 結(jié)論
該論文中討論了多輸入多輸出信道模型下的多個解碼算法,通過MATLAB仿真軟件討論各算法下不同的信噪比和算法復(fù)雜度。通過MATLAB所生成的圖形,我們可以明顯看到因為零點逼近算法采用的放大濾波器在放大有效信號的同時也相應(yīng)地放大了噪音信號,因此其在信噪比一定的情況下比其他算法所產(chǎn)生的誤碼率高。采用遞推算法的垂直-BLAST解碼算法對比零點逼近算法來說其誤碼率有所改進,但是其改進的地方在于采用了QR算法來分解信道矩陣,因此其對于零點逼近算法的改進基本取決于QR分解算法的階數(shù)。最接近于最大近似算法的誤碼率,且比最大近似算法更為簡單的球型算法作為現(xiàn)代MIMO-OFDM信道解碼的主流算法存在很高的可操作性和理想的低誤碼率。
參考文獻
[1]Bohnke,R.,D.Wubben,“BLAST結(jié)構(gòu)的時空編碼”,IEEE Tran.Vol.50,2003.
[2]G.Foschini,“多天線衰減環(huán)境下無線通信的時空結(jié)構(gòu)層結(jié)構(gòu)”,Bell Labs, Technical Journal 2,1996.
[3]P.Wolniansky,G.J.Foschini,G “V-BLAST”,URSI Inter-national Symposium on Signals,Systems and Electronics,1998.
[4]Gentle,J.E.,“QR分子”,1998.
[5]Vikalo,H.,B.Hassibi,“球型約束下頻選信道的最大似然檢波器”,IEEE vol.54 2006.
作者簡介
中圖分類號:TP311 文獻標識碼:A文章編號:1007-9599 (2011) 20-0000-02
Mp3 Player Design Based on SOPC
Xie Huicheng1,Guo Li2
(1.School of Electronic Engineering,Jiujiang University,Jiujiang332005,China;2.Jiujiang University,Information Science and Technology College,Jiujiang332005,China)
Abstract:This paper mainly from the audio playback and the intersection of SOPC technology,this paper proposes the use of technology in Altera's SOPC CyelonII EP2C35 FPGA mp3 player built on the design.The use of IP design reuse,collaboration software and hardware,hardware acceleration and other methods,combined with the experimental characteristics of platform resources to build a soft-core processor based on NiosII mp3 player system. Achieve MPEGⅠ layerⅢ smooth playback audio decoding.The system has a small size,design flexibility,short development cycle and so on.
Keywords:Embedded system;SOPC;MP3 player
一、引言
目前,嵌入式系統(tǒng)進入全面應(yīng)用的階段,己經(jīng)成為通信和消費類產(chǎn)品的共同發(fā)展方向。在硬件方面,市場上不僅有各大公司生產(chǎn)的各種微處理器芯片,還有用于學(xué)習(xí)和進行研發(fā)的各種配套的軟件開發(fā)包和開發(fā)工具。SOPC具有系統(tǒng)集成度高、體積小、功耗低、結(jié)構(gòu)簡潔、可靠性高、開發(fā)快速等特點,很好的滿足了的嵌入式系統(tǒng)在硬件上的需求。SOPC技術(shù)的目標是試圖將盡可能大而完整的電子系統(tǒng),包括嵌入式處理器系統(tǒng)、接口系統(tǒng)、硬件協(xié)處理器或加速器系統(tǒng)、存儲電路、DSP系統(tǒng)、數(shù)字通信系統(tǒng)、以及普通數(shù)字系統(tǒng)等,在單一FPGA中實現(xiàn),使得所設(shè)計的電路系統(tǒng)在其規(guī)模、可靠性、體積、功耗、功能、性能指標、上市周期、開發(fā)成本、產(chǎn)品維護及其硬件升級等多方面實現(xiàn)最優(yōu)化。
二、系統(tǒng)總體設(shè)計
設(shè)計一個具有基本功能的MP3播放器需要有時鐘電路、CPU、RAM及RAM控制器、Flash及Flash控制器、SD卡及SD卡控制電路、液晶及液晶顯示器驅(qū)動電路、DMA控制器、音頻驅(qū)動及音頻控制電路、定時器等模塊,如圖1所示。
圖1:MP3播放器系統(tǒng)結(jié)構(gòu)圖
除顯示驅(qū)動模塊、音頻控制模塊和SD卡控制模塊外其他模塊都可以從SOPC Builder中添加IP核構(gòu)建。
其中顯示驅(qū)動模塊可以在altera提供的VGA控制器的基礎(chǔ)上添加CLK和BLANK信號完成;SD卡控制模塊只需要定義幾個GPIO端口就可以了,不需要單獨設(shè)計。
三、音頻播放模塊
采用的MagicSOPC實驗開發(fā)平臺配有AC97音頻解碼模塊,主控制芯片為UCB1400(帶有觸摸屏功能的立體聲音頻編解碼器),它支持可編程抽樣率、輸入/輸出增益和數(shù)字音響處理,包括音量、靜音、低音和高音控制。
音頻控制模塊是CPU與UCB1400間的接口電路,功能為將緩存中的音頻數(shù)據(jù)通過AC-Link總線發(fā)送到UCB1400的DAC輸入端口實現(xiàn)音樂的播放,以及由AC-Link總線接收UCB1400采集的音頻編碼數(shù)據(jù)。本設(shè)計采用verilog語言來設(shè)計如下各個功能模塊。
(一)UCB1400寄存器訪問控制
音頻播放時主控制器(CPU)需要經(jīng)常讀/寫UCB1400中相關(guān)的寄存器,因為采用AC-Link串行總線傳輸數(shù)據(jù),時序變得非常重要,所以定義了訪問控制模塊。要訪問UCB1400時,該模塊向UCB1400發(fā)送請求信號;當一次讀取完成,數(shù)據(jù)準備好時,該模塊向CPU發(fā)送反饋信號。
(二)UCB1400掉電模式控制
UCB1400可以將暫時不用的模塊關(guān)閉以節(jié)約功率,向UCB1400的Power-down Control/status Register(0x26)寫入相應(yīng)的數(shù)值可以控制UCB1400中各個模塊的開啟和關(guān)閉。所以設(shè)計掉電模式控制模塊,該模塊負責監(jiān)視UCB1400各模塊的狀態(tài)并將此信息反饋給主控制器。
(三)串行輸入/輸出寄存器
FPGA內(nèi)部數(shù)據(jù)為并行傳輸,而與UCB1400間則功過AC_Link總線串行傳輸,所以應(yīng)設(shè)計串并轉(zhuǎn)換模塊。
(四)輸入/輸出FIFO
為保證音樂播放的流暢,應(yīng)為每個聲道配置一定容量的FIFO用來保存已接收到和即將傳輸?shù)臄?shù)據(jù)。
設(shè)計完成后的AC97_Controller結(jié)構(gòu)框圖如圖2所示:
圖2:AC97_Controller結(jié)構(gòu)圖
具有如下功能:
可變比特率支持、雙聲道立體聲輸出支持、雙聲道立體聲輸入支持、單聲道麥克風輸入支持、DMA傳送方式支持。
四、系統(tǒng)軟件設(shè)計
將基于NiosⅡ的SOPC系統(tǒng)進行編譯并下載到FPGA中生成硬件系統(tǒng)的同時,SOPC Builder幫助用戶生成相應(yīng)的SOF文件。在此基礎(chǔ)上,可開始系統(tǒng)軟件的設(shè)計。可使用匯編、C、C++來進行嵌入式程序設(shè)計,使用IDE工具進行程序的編譯連接以及調(diào)試。MP3播放器的軟件系統(tǒng)結(jié)構(gòu)如圖3所示:
圖3MP3播放器軟件系統(tǒng)結(jié)構(gòu)
五、結(jié)語
本系統(tǒng)采用SOPC技術(shù)在一片F(xiàn)PGA和少數(shù)外設(shè)上實現(xiàn)了MP3播放器的基本功能。在50MHz的系統(tǒng)時鐘下實現(xiàn)了MPEG-Ⅰ layer-Ⅲ解碼,流暢播放MP3格式的音頻文件。
SOPC方案的優(yōu)勢在于系統(tǒng)功能改進的靈活性,在不改變硬件平臺的情況下,可以方便對系統(tǒng)進行增刪和優(yōu)化,這是傳統(tǒng)ARM方案無法達到的。
參考文獻:
論文摘要:醫(yī)療器械的發(fā)展經(jīng)歷了從最早的僅僅滿足使用需求到現(xiàn)在需要滿足使用者內(nèi)心感受的巨大變革,同時對于醫(yī)療器械設(shè)計理念在不同時代也給予了不同的定義,當今社會所追求的物質(zhì)與精神的統(tǒng)一決定了醫(yī)療器械設(shè)計也必須從外觀設(shè)計轉(zhuǎn)向涉及使用者內(nèi)心感受的交互式設(shè)計階段,這是科技與人,歷史與發(fā)展結(jié)合的必然產(chǎn)物。交互式設(shè)計在醫(yī)療器械中的作用,旨在思考機器與人,人與機器的和諧發(fā)展。
二十世紀二、三十年代包豪斯提出的“功能主義”在工業(yè)設(shè)計中影響很大,醫(yī)療器械的設(shè)計有相當長一段時間以“理性主義”思潮為主流,遵循“形式追隨功能”原則,其“技術(shù)至上”的傾向?qū)е铝水a(chǎn)品與人的情感、與環(huán)境的疏遠。這種高估 “物”的技術(shù)作用,而忽視“物”的人文價值的作法,是不符合當今時代要求的。
我國醫(yī)療器械產(chǎn)品技術(shù)除在超聲聚焦等少數(shù)領(lǐng)域處于國際領(lǐng)先水平外,多數(shù)關(guān)鍵技術(shù)被發(fā)達國家大公司所壟斷,國產(chǎn)高端醫(yī)療器械產(chǎn)品技術(shù)性能和質(zhì)量水準落后于國際先進水平10年左右。與此同時,將產(chǎn)品的“設(shè)計”行為視為或從事為“裝飾”行為,仍是我國企業(yè)中醫(yī)療器械設(shè)計的主流。這種認識和行為上的膚淺化、歪曲化,正使相當多的企業(yè)遭受嚴重的短期損失(如產(chǎn)品積壓)和長遠損失(如失去市場)。
一、設(shè)計對話——作品與受眾的信息交流
醫(yī)療器械的交互式設(shè)計在于有效地傳遞產(chǎn)品與服務(wù)的信息,樹立良好的品牌形象與企業(yè)形象,刺激消費者的購買欲望,并從精神上給人以美的享受,最后達到推動經(jīng)濟發(fā)展的目的。這就要求設(shè)計師在設(shè)計創(chuàng)新的時候需要考慮到產(chǎn)品與消費者之間的這種對話,以保證產(chǎn)品生產(chǎn)投入市場之后可以獲得較好的市場認同度。從而也在一定程度上促進設(shè)計的發(fā)展。
設(shè)計師根據(jù)市場競爭態(tài)勢與消費者需求趨向等信息來確定設(shè)計作品的開發(fā)與傳播,同樣,消費者作為設(shè)計信息終端部位的信宿,是設(shè)計信息的接受者,他在接受信息時必須經(jīng)過解碼過程。對于設(shè)計師而言,就需要在設(shè)計創(chuàng)新的過程中進行思考,來規(guī)劃這一個解碼的過程。
對于設(shè)計受眾來說,信息的解碼過程大體可分為注意、識碼、分析、記憶、行動幾個階段。當設(shè)計作品引發(fā)他們關(guān)注時,才能產(chǎn)生審美注意,設(shè)計信息引起注意是信宿接受信息,解碼過程的開始,當解讀相關(guān)信息后,也就獲得了某種設(shè)計信息。了解了產(chǎn)品的性能、特點,感受到它的造型、質(zhì)量。聯(lián)想到對提高自己生活品質(zhì)的利益和好處,從而在心理上縮短了與產(chǎn)品的距離,萌生一種擁有的欲望。識碼、分析是設(shè)計信息解碼過程的主體,是信息的接受與處理。設(shè)計信息作用的實現(xiàn)就從這里開始,因此也是很重要的。記憶,行動是設(shè)計信宿解碼過程的完成,于是設(shè)計活動與設(shè)計對話就在這種雙向信息交流中開始與終結(jié)。在設(shè)計的創(chuàng)新階段,設(shè)計師可以針對不同的產(chǎn)品進行相應(yīng)有效的注意、識碼、分析、記憶、行動的針對性預(yù)設(shè)計,從而為這個結(jié)果的實現(xiàn)提供前提。
二、多維思考
醫(yī)療器械的交互式設(shè)計在明確命題之后,具體實踐的過程則要求進行多維思考。所以在設(shè)計創(chuàng)新和開發(fā)階段,設(shè)計師從多維角度考慮出發(fā),在避免重復(fù)傳統(tǒng)的無序思維發(fā)散的基礎(chǔ)上,為達到醫(yī)療器械交互設(shè)計在設(shè)計開發(fā)之后能準確的與市場消費需求相吻合而充分的實現(xiàn)附加值的最大化,定位情感消費與設(shè)計開發(fā)相結(jié)合方法,還需要提出一些基于命題和市場的概念描述:
1.輔助物:現(xiàn)階段對醫(yī)療器械的交互式設(shè)計需求注重的是情感上的共鳴,輔助物是一個玩具亦或一個玩伴甚者一種友誼,一種美好的心情。
2.適用人群確立:有想法、充滿了想象力、勇于嘗試和創(chuàng)新,對現(xiàn)行交互式設(shè)計文化耳濡目染,關(guān)心自己,關(guān)心他人,重視生活,物質(zhì)和精神的雙重需求。
3.共性與個性:或許是某個按鍵、表面、質(zhì)感、顏色與使用者產(chǎn)生共鳴。
有了這樣的概念性描述之后,基本上明確了醫(yī)療器械的交互式設(shè)計導(dǎo)向,也就為下一步工作做好了充分的準備。
三、設(shè)計效用性
由于現(xiàn)代設(shè)計信息創(chuàng)意水平的提高,企業(yè)整體營銷戰(zhàn)略的加強,一般有遠見卓識的企業(yè)傳播的設(shè)計信息都具有長期效果,對受眾起著舉一反三的作用,并使其獲得經(jīng)濟,藝術(shù)與審美的多種效應(yīng)。而在創(chuàng)意上這種長期的有效性就表現(xiàn)為對設(shè)計產(chǎn)品創(chuàng)意程度的應(yīng)用。產(chǎn)品的周期決定了產(chǎn)品的壽命,創(chuàng)意是這一產(chǎn)品在市場上的賣點。可以通過對效用性的研究,來分析特定產(chǎn)品在特定情況下的設(shè)計過程和實現(xiàn)的方法。
中圖分類號:TP331文獻標識碼:A文章編號:1009-3044(2009)25-7245-02
A SoC Architecture Design of Hardware Decoder of AVS
XU Xiao-ni, YAN Xiang-hong
(College of Information Science and Engineering, SDUST, Qingdao 266510, China)
Abstract: According to the algorithm of AVS audio and video decoding standard, this paper proposes a proposal of AVS decoding based on SoC method. This method can reduce the complexity of AVS decoder effectively. Using the hardware and software co-design ideas can reduce the difficulty of designing a decoder while improving the flexibility of decoding.
Key words: AVS; SoC; hardware and software co-design; decoding
AVS(Audio Video coding Standard)[1]是由中國信息產(chǎn)業(yè)部成立的“數(shù)字音視頻編解碼技術(shù)標準工作組”提出的我國自主制定的數(shù)字音視頻編解碼技術(shù)標準,是為了適應(yīng)數(shù)字電視廣播、數(shù)字存儲媒體、網(wǎng)絡(luò)流媒體、多媒體通信等應(yīng)用中對運動圖像壓縮技術(shù)的需要而制定的。AVS標準中的解碼后的視頻質(zhì)量介于MPEG2和H.264之間,但AVS標準的編碼復(fù)雜度和效率要好于H.264標準,而且相對H.264較高的專利許可費用,AVS采用了非常低的專利許可費。2006年初,國家信息產(chǎn)業(yè)部正式批準AVS標準成為中國音視頻領(lǐng)域的國家標準,從而為國內(nèi)企業(yè)每年節(jié)省大量的專利許可費用。
目前在嵌入式設(shè)備上,音視頻的硬件編解碼器都采用ASIC的設(shè)計方案,即全部采用硬件實現(xiàn)音視頻標準的所有部分。這種方案的設(shè)計優(yōu)點是解碼速度快,但同樣缺點也是明顯的,即它的研發(fā)時間長、成本高、靈活性低,而且編解碼格式固定,無法進行升級。而SoC(System on chip)[2]的設(shè)計方案能夠滿足音視頻領(lǐng)域要求的編解碼速度,同時還能夠加快研發(fā)速度、降低成本,而且靈活性高,可升級(設(shè)計部分只針對軟件方面),因此相對ASIC的設(shè)計方案,采用SoC的設(shè)計方法有很大的優(yōu)勢。
1 SoC設(shè)計方法介紹
SoC(System on chip)[2]簡稱片上系統(tǒng),是一個有專用目標的集成電路,其中包含完整系統(tǒng)并有嵌入軟件的全部內(nèi)容,包括CPU、程序存儲器、IP(intellectual property)功能復(fù)用模塊、片外總線接口模塊。同時它又是一種技術(shù),用以實現(xiàn)從確定系統(tǒng)功能開始,到軟/硬件劃分,并完成設(shè)計的整個過程。SoC設(shè)計的關(guān)鍵技術(shù)主要包括總線架構(gòu)、IP核可復(fù)用、軟硬件協(xié)同設(shè)計等技術(shù)。
音視頻硬件編解碼的Soc設(shè)計方案主要采用軟硬件協(xié)同設(shè)計的思想,將音視頻標準中的各部分分而治之:標準當中邏輯復(fù)雜但計算量小的部分采用軟件實現(xiàn),以增加編解碼器的靈活性,同時可以進行升級;標準當中邏輯簡單但計算量大計算復(fù)雜的部分以IP核的形式采用硬件實現(xiàn),以增加編解碼器的速度,還可以實現(xiàn)IP核在其他設(shè)計上的復(fù)用。從目前個人計算機上利用GPU(顯卡)中硬件解碼功能進行加速解碼的高清視頻播放的方法中就可以看到SoC設(shè)計方法的影子。個人計算機上的視頻播放程序通過GPU的驅(qū)動程序,調(diào)用GPU內(nèi)置的硬件解碼功能實現(xiàn)實時加速播放,從而大大降低CPU的工作量,降低對CPU計算能力的要求。
SoC方法的設(shè)計流程如圖一,通過下圖可以看出,SoC設(shè)計方法中一旦軟硬件功能模塊劃分清楚后就可以同時開發(fā)設(shè)計,大大加快設(shè)計的速度。最后軟硬件協(xié)同測試完成開發(fā)。
2 基于SoC方法的AVS硬件解碼器設(shè)計方案
在嵌入式設(shè)備的音視頻解碼方案中,硬件解碼器作為一個外設(shè)模塊存在,它與攝像頭之類的外設(shè)處于同一級別。根據(jù)上述SoC方案的設(shè)計思想,按照AVS音視頻標準P2(先進音視頻編碼第2部分:視頻)[1]部分,對AVS視頻的解碼過程中計算量大計算復(fù)雜的過程分為以下幾個模塊:
1) 熵解碼模塊:熵解碼是針對AVS視頻編碼過程采用的熵編碼的反過程。熵編碼采用的預(yù)計統(tǒng)計科學(xué)的一種編碼方法,它能夠有效的降低編碼碼長。AVS視頻流中所有的碼流都是經(jīng)過熵編碼的數(shù)據(jù),因此熵解碼的過程計算量大,計算過程也比較復(fù)雜,因此需要硬件解碼來實現(xiàn)。
2) 幀內(nèi)預(yù)測模塊:AVS視頻標準中,幀內(nèi)預(yù)測用于解碼采用幀內(nèi)編碼方法的幀,幀內(nèi)預(yù)測是采用幀內(nèi)圖像的空間相關(guān)性進行編碼的一種方法。幀內(nèi)預(yù)測分為求參考樣本、求預(yù)測模式、計算三步。預(yù)測模式又分為5種預(yù)測模式,每種預(yù)測模式是針對幀圖像中的像素來計算的,而且每種預(yù)測模式的計算方法計算復(fù)雜。考慮AVS標清視頻720p的每幀圖像720x576的分辨率,就可以清楚的知道計算量的大小。
3) 幀間預(yù)測模塊:相對于幀內(nèi)預(yù)測,幀間預(yù)測是采用前后相鄰幀之間的時間相關(guān)性來進行編碼的,它的計算量更大,復(fù)雜性更高,這是任何一個音視頻硬件解碼器中必須實現(xiàn)的一個模塊。
4) IDCT變換模塊:AVS中IDCT變換,即整數(shù)離弦變換,定義如下:
先對變換系數(shù)矩陣進行如下水變換
H'= CoeffMatrix ×T8T
T8是8×8反變換矩陣,T8T是T8的轉(zhuǎn)置矩陣,H'表示水變換后的中間結(jié)果,T8定義參加AVS標準。矩陣H''的元素h''ij計算如下:
h''ij = (Clip3(-215, 215-1, (h'ij+4))) >> 3 i,j = 0~7
再對矩陣H'進行如下垂直反變換:
H = T8×H''
其中,H表示反變換后的8×8矩陣。最后,殘差樣值矩陣ResidueMatrix的元素rij計算:
rij = (Clip3(-215, 215-1, (hij + 26))) >> 7i,j = 0~7 hij是H矩陣的元素。
對于8×8的殘差樣本矩陣,IDCT變換需要2次矩陣乘法,矩陣相乘需要512次乘法448次加法,總共需要1024次乘法896次加法,對于這樣的計算量,顯然在嵌入式設(shè)備上用軟件實現(xiàn)是無法滿足實時解碼的,因此需要硬件實現(xiàn)。
5) 濾波模塊:由于AVS編碼過程中是按照8x8的模塊進行預(yù)測編碼的,因此在模塊之間的邊緣會出現(xiàn)變化明顯的邊界,因此需要對解碼后的模塊進行濾波。AVS解碼過程濾波主要分為求邊界濾波強度和計算兩步,這兩步的運算也是針對像素級別的運算,因此也需要大量的計算,也需要硬件來實現(xiàn)。
6) AVS硬件解碼器的總體架構(gòu):根據(jù)以上的分析,設(shè)計出如圖2的硬件解碼器的方案。
SoC是一個完整的系統(tǒng),因此也包含了CPU,主要用于軟件部分的運行。其中程序存儲模塊包括程序存儲器(ROM實現(xiàn))和程序運行內(nèi)存(RAM),通過該部分可以對硬件解碼器進行升級,因此增加了解碼器的靈活性。片外接口用于嵌入式系統(tǒng)與硬件解碼器的通信,由于嵌入式的多樣性,因此該模塊不能通用,需要針對特定的嵌入式系統(tǒng)進行開發(fā)。
圖2中的各個模塊通過片內(nèi)總線連接在一起,形成了一個完整的系統(tǒng)。片內(nèi)總線目前主要有ARM公司開發(fā)的AMBA總線,Altera公司開發(fā)的Avalon總線以及開源的Wishbone總線,前兩個總線是專有的,因此使用這個總線是需要繳納專利費用的,而后者是開源的免費總線。具體的總線的實現(xiàn)可以按照不同的場合自由選擇。
3 總結(jié)
本論文開展了一種面向嵌入式設(shè)備的SoC架構(gòu)的AVS硬件解碼器設(shè)計方案的研究。該設(shè)計方案能夠有效的加快AVS解碼器的設(shè)計實現(xiàn),而且靈活性高,可擴展性強,IP核能夠重復(fù)應(yīng)用在各種不同的AVS解碼器架構(gòu)上,有效的利用現(xiàn)有資源進行開發(fā)。
參考文獻
[1] 國家數(shù)字音視頻解碼技術(shù)標準工作組.AVS視頻AVS-P2視頻標準[S].
中圖分類號:TN949.199文獻標識碼:B
The Design of a Kind of Sending Card for LED Display
DING Tie-fu1,2, YAN Fei2, WANG Rui-guang1,2, ZHENG Xi-feng1,2
(1. Changchun xida Electronic Technology Co., Ltd., Changchun Jilin 130103, China;
2. Institute of Optics, Fine Mechanics and Physics, Changchun, CAS, Changchun Jilin 130033, China)
Abstract: This article discusses a no-storage sending card for full-color LED display system. The system has real-time transmission and cost advantages. The entire real-time lossless video images, such as the formats of 1,024×768@60Hz and 1,280×1024@60Hz, can be transmitted by two-way Gigabit Ethernet port.
Keywords: full-color LED display; sending card; memory device; real-time transmission
引言
隨著全彩LED顯示屏的應(yīng)用越來越廣泛,人們對LED顯示屏控制系統(tǒng)的要求越來越高,這也促使LED顯示屏控制系統(tǒng)的不斷升級和改造,主要體現(xiàn)在提高性能和節(jié)約成本上。LED顯示屏控制系統(tǒng)的組成一般有如下幾個部分[1-3]:視頻發(fā)送裝置、視頻接收分配裝置、LED面板。顯然,作為前端的視頻發(fā)送裝置在整個環(huán)節(jié)中起著舉足輕重的作用。
1LED顯示屏發(fā)送卡的現(xiàn)狀
LED顯示屏發(fā)送卡一般由DVI模塊、FPGA控制器、外存儲體模塊和網(wǎng)絡(luò)輸出模塊構(gòu)成[4],FPGA將輸入的圖像數(shù)據(jù)交替寫入外存儲體,同時也從外存儲體中交替讀出圖像數(shù)據(jù),再通過網(wǎng)絡(luò)格式依次將數(shù)據(jù)輸出,原理框圖如圖1所示。
通常,控制LED顯示屏的計算機的分辨率設(shè)置為1,024×768@60Hz或者1,280×1,024@60Hz。對于1,280×1,024@60Hz的實時視頻源,總的數(shù)據(jù)量為:
1,280×1,024×60×24=1,887,436,800 bit;
其中一幀的數(shù)據(jù)量為:1,280×1,024×24=31,457,280 bit。
考慮到分辨率為1,280×1,024@60Hz時的像素時鐘為108MHz,并且整個實現(xiàn)過程需要2倍的存儲空間進行乒乓操作,故通常采用兩片32位寬的SDRAM作為外接存儲體。
帶有外接存儲體的發(fā)送卡具有緩存一幀數(shù)據(jù)的能力,并將輸出與輸入隔離開,有利于從全屏的數(shù)據(jù)中按照不同需求截取所需數(shù)據(jù)進行處理。
但同時,滯后一幀數(shù)據(jù)也是實時傳輸中的一個缺點,尤其是在需要嚴格實時傳輸?shù)膱龊稀A硗?增加兩片SDRAM也給設(shè)計增加了成本。
2無外接存儲體發(fā)送卡的實現(xiàn)
2.1基本框圖
在現(xiàn)有LED顯示屏發(fā)送卡的基礎(chǔ)上,這里設(shè)計了一種無外接存儲體的LED顯示屏發(fā)送卡,如圖2所示,該發(fā)送卡由DVI模塊、FPGA控制器、兩路千兆網(wǎng)輸出模塊構(gòu)成。DVI解碼芯片將解碼得到的數(shù)據(jù)和控制信號傳給FPGA控制器,FPGA通過內(nèi)部的RAM進行緩存,并做了更換時鐘域和位寬變換的操作,然后將處理后的數(shù)據(jù)通過千兆網(wǎng)輸出。
對1,280×1,024@60Hz的實時視頻源,這里采用垂直分區(qū)的方法,即將滿屏數(shù)據(jù)平均分成兩路千兆網(wǎng)輸出,每一路千兆傳輸640×1,024,如圖3所示。
2.2實現(xiàn)方法
由圖2的基本框圖看出,該發(fā)送卡的設(shè)計除了搭建好硬件平臺外,最重要的是FPGA控制器內(nèi)部程序的設(shè)計。無外接存儲體發(fā)送卡的FPGA控制器內(nèi)部原理框圖如圖4所示。
FPGA控制器的內(nèi)部邏輯包括數(shù)據(jù)輸入模塊、雙口RAM及其控制模塊、24bit轉(zhuǎn)8bit模塊、千兆網(wǎng)輸出模塊。數(shù)據(jù)輸入模塊將輸入的DVI信號(包括數(shù)據(jù)、時鐘、使能、行場同步信號)分配給后端的RAM和RAM控制模塊,并控制著整個系統(tǒng)的同步;RAM控制模塊控制RAM的讀寫操作,尤其是對開始寫、寫停、開始讀、讀停這4個狀態(tài)的控制;從RAM輸出的數(shù)據(jù)經(jīng)過并串轉(zhuǎn)換后傳輸給千兆網(wǎng)輸出模塊,千兆網(wǎng)輸出模塊則按照一定的網(wǎng)絡(luò)格式將接收到的數(shù)據(jù)進行打包輸出[5-7]。
圖3提到的將數(shù)據(jù)分區(qū)發(fā)送,該方法能夠?qū)M屏數(shù)據(jù)平均分成兩路千兆網(wǎng)輸出。以下就以垂直分區(qū)的方法分析其數(shù)據(jù)流向、時鐘變化和傳輸時間差。
對于一路千兆網(wǎng)數(shù)據(jù)而言,采用1個雙口RAM設(shè)計,RAM的深度設(shè)置為640,輸入和輸出字長均設(shè)置為24bit,讀寫時鐘和使能分別獨立,如圖5所示。
其中,數(shù)據(jù)輸入和寫時鐘分別為DVI解碼芯片解碼后的24bit圖像數(shù)據(jù)DVI_DATA[23:0]和時鐘WRAM_CLK,讀RAM的時鐘為千兆網(wǎng)時鐘RMII_CLK(125M)三分頻后得到的時鐘RRAM_CLK(41.66MHz),這樣,后端再通過一個24bit轉(zhuǎn)8bit模塊即可將數(shù)據(jù)進行實時傳輸。
如圖6所示,通過RRAM_CLK(41.66MHz)時鐘從RAM中讀出一個像素的數(shù)據(jù),然后再通過3個RMII_CLK(125M)傳輸給千兆網(wǎng),即做了一個實時的并串轉(zhuǎn)化。如此流水操作下去,當從RAM中讀完640個像素時,千兆網(wǎng)控制模塊將停止讀RAM操作,等待下一行數(shù)據(jù)的到來。當DVI解碼后的下一行數(shù)據(jù)一旦往RAM中存儲的時候(至少已經(jīng)往其中存儲了1個像素),千兆網(wǎng)控制模塊又開始從RAM中讀取數(shù)據(jù),如此循環(huán),直到第1,024行數(shù)據(jù)的640個像素數(shù)據(jù)被傳輸完。
在這里,實時傳輸具有如下特點:(1)往RAM中存數(shù)據(jù)和從RAM中取數(shù)據(jù)同時進行;(2)存RAM的速度快,讀RAM的速度慢;(3)對寫RAM操作,先把規(guī)定的數(shù)據(jù)存完,用時為t1,然后進入等待階段t2(t = t1 + t2為行周期);對讀RAM操作,把存好數(shù)通過t3的時間傳輸出去,必須滿足t3 < t。
標準的1,280×1,024@60Hz的行時鐘為64KHz,周期為t=15.625μs;而從RAM中讀完半行像素(640個)數(shù)據(jù)的時間是:t3=(1/41.66MHz)×640=15.36μs。
顯然,在一個行周期里,只往外傳出半行的數(shù)據(jù),傳輸時間差t-t3=265ns>0,且該時間差滿足千兆網(wǎng)傳輸所必需數(shù)據(jù)包間隔。
由于寫RAM的時鐘(108MHz)比讀RAM的時鐘(41.66MHz)快得多,所以在寫RAM的同時可以對RAM進行讀操作(至少已經(jīng)往RAM存儲了1個像素),邊寫邊讀,實現(xiàn)了視頻數(shù)據(jù)的實時傳輸。
同理,另外一路的千兆網(wǎng)設(shè)計與此雷同。
3 結(jié)論
本文簡單分析了LED顯示屏發(fā)送卡的現(xiàn)狀,著重討論了無外接存儲體發(fā)送卡的系統(tǒng)構(gòu)成及實現(xiàn)方法。該系統(tǒng)具有實時傳輸、節(jié)約成本的優(yōu)勢,能夠在常用的視頻格式下,比如1,024×768@60Hz、1,280×1,024@60Hz,通過兩路千兆網(wǎng)口將整個視頻圖像實時無損的傳輸出去。
參考文獻:
[1] 武 斌. LED全彩屏的系統(tǒng)設(shè)計[D]. 碩士學(xué)位論文. 北京:北京航空航天大學(xué),2002.
[2] 李 晟. 基于FPGA的LED顯示屏同步控制系統(tǒng)的設(shè)計[D]. 碩士學(xué)位論文. 南京:東南大學(xué)電子工程系,2004.
[3] 蔡江洪. 全彩色LED顯示屏控制系統(tǒng)的設(shè)計與實現(xiàn)[D]. 碩士學(xué)位論文. 南京:東南大學(xué)電子工程系,2005.
[4] 蘇晶國. 基于FPGA的對象存儲控制器原型的硬件設(shè)計與實現(xiàn)[D]. 中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫,2008(05).
[5] 柳利軍,熊良芳. 基于FPGA的千兆以太網(wǎng)交換芯片的設(shè)計[J]. 微電子學(xué)與計算機,2006(03).
森林火災(zāi)是一種突發(fā)性強、破壞性大、救助困難的自然災(zāi)害。做好森林防火工作,有效預(yù)防和撲救森林火災(zāi),是確保人民生命財產(chǎn)安全的迫切需要.當森林發(fā)生火災(zāi)時,只有做到早發(fā)現(xiàn)、早解決,才能把損失降到最小。針對我國森林防火的實際需要,專門設(shè)計了一整套森林防火的解決方案。
1 系統(tǒng)設(shè)計
系統(tǒng)設(shè)計圖,如圖1所示。
1.1 圖像傳輸設(shè)備的選擇及技術(shù)參數(shù)
模擬圖像傳輸系統(tǒng)采用調(diào)頻體制,信號帶寬27MHz。為了保證信號之間互不干擾,兩路信號中心頻率間隔應(yīng)大于38MHz。目前國產(chǎn)模擬圖像傳輸系統(tǒng)主要有L波段、S波段、Ku波段幾種,頻率范圍分別為:L波段:950~1750MHz;S波段:2200~2700MHz;Ku波段:11~13GHz。
如果以38MHz頻率間隔計算,各頻段可同時傳輸?shù)淖疃嗦窋?shù)分別為:L波段:21路;S波段:13路;Ku波段:50路。
本系統(tǒng)共需同時傳輸15路圖像信號,L波段利用頻率復(fù)用技術(shù)可以做到30路圖像傳輸,從系統(tǒng)要求整體設(shè)備性能及造價來考慮,選擇L波段。微波傳輸需滿足視距傳輸條件,即監(jiān)控點至控制中心傳輸路徑上無遮擋(收發(fā)天線間可視)。
該系統(tǒng)方便安裝,傳輸圖像鮮明,主要是利用微波頻段傳輸,包括報警信號、伴音和視頻。
微波圖像傳輸系統(tǒng):主要技術(shù)指標:頻段:L波段950~1750MHz、KU波段11~13GHz;功率:10~40dBm;
微波工程接收機技術(shù)指標:輸入頻率: 950-2050MHz;輸入阻抗:75Ω;輸入電平:-65-- -35dBm;中頻帶寬:27MHz;噪聲門限:6dB典型值;視頻制式:PAL;去加重:CCIR405-1 625行;視頻輸出:1V峰-峰值;頻率響應(yīng):+1- -2dB(10KHz-5MHz);工作電壓: AC150V-AC270V;功耗:15W;LNA電源:18V/100mA。
1.2 無線指令遙控系統(tǒng)
無線遙控是指實現(xiàn)對被控目標的非接觸遙遠控制,在工業(yè)控制、航空航天、家電領(lǐng)域應(yīng)用廣泛。我們設(shè)計的系統(tǒng)提供的數(shù)據(jù)接口,以適應(yīng)各種協(xié)儀。由發(fā)射和接收部分組成,可以控制云臺、鏡頭。
2 原理設(shè)計
如圖2所示。
2.1 功能簡述
在森林內(nèi)多個地點放攝像機,通過無線發(fā)射C(帶煙傳感接收)發(fā)射各種信號,接收機能夠看到森林中各個監(jiān)控點的實時狀況。
前端指令機能接收到監(jiān)控點發(fā)出的指令,解碼器來執(zhí)行中心的指令,控制云平臺左右上下的轉(zhuǎn)動,以及對鏡頭進行長焦、短焦的改變等。
2.2 控制原理
2.2.1 無線圖像傳輸?shù)倪^程
無線圖像傳輸頻率復(fù)用采用分割方式,圖像通道采用微波點對點的方式。攝像機通過采集的視頻信號輸送給發(fā)射機,然后輸出給天線,以微波的無線形式傳送給監(jiān)控設(shè)備的天線,接收設(shè)備接收到信號了以后,再經(jīng)過解調(diào)還原視頻信號,這樣就可以有確盤錄像機中顯示圖像了。
在實際使用的微波通信線路中,總是使用方向性非常強的天線,并把收、發(fā)天線對準,以使接收端收到較強的直射波。但是,由于受天線的方向性所限,總會有一部分電磁波透射到地表面,經(jīng)地表面反射后到達收信端的天線,或散射進入太空;其次,由于大氣層中存在不均勻的氣體,也會造成電磁波的折射和吸收,損失掉一部分能量;另外,由于微波無法穿過傳輸線路上的固體物,所以,在傳輸路線上的固體物,特別是高大的建筑物,就會使微波造成繞射和電平損耗。因此,微波通信既有直線傳輸特性,又有多徑傳輸特性,在無遮擋的情況下,傳輸距離可達70公里。廣泛用于公安、武警、消防、交通、金融、油田、廠礦等領(lǐng)域的遠距離無線監(jiān)控系統(tǒng)。
2.2.2 無線指令控制的過程
控制通道采用碼分多址、一對多點方式。指令信號通過主機輸入指令參數(shù),再通過發(fā)射天線發(fā)射到森林中的各個監(jiān)控點中,監(jiān)控點接收到主機發(fā)射過來的信號,先通過校驗,再通過無線指令接收機解調(diào)出控制數(shù)據(jù)給解碼器,解碼器再根據(jù)地址碼來判斷是否解碼,同時具備雙向語音功能,可以適時對話。
3 結(jié)束語
實驗證明:通過采用硬盤錄像系統(tǒng),進行實時錄象,上級領(lǐng)導(dǎo)可以通過聯(lián)網(wǎng)的計算機進行遠程監(jiān)控并查詢錄像資料,能真實記錄火災(zāi)發(fā)生及救火的過程,提供有效真實的資料,其性能可靠;高清晰、高畫質(zhì),成為技術(shù)先驅(qū)。
參考文獻
[1]杜建華,張認成.火災(zāi)探測器的研究現(xiàn)狀與發(fā)展趨勢[J].消防技術(shù),2004(07):10-15.
[2]徐春燕.火災(zāi)探測技術(shù)的發(fā)展及其應(yīng)用[J].鞍鋼技術(shù),2000(09):60-62.
[3]花鐵森.消防報警產(chǎn)品和系統(tǒng)的技術(shù)現(xiàn)狀與市場[J].安防科技,2003(06):4-12.
[4]祁勇.火災(zāi)自動探測技術(shù)的發(fā)展和今后的方向[J].消防技術(shù)與產(chǎn)品信息,2002(04):3-4.
[5]謝磊.基于ZigBee的倉庫數(shù)據(jù)采集傳輸管理系統(tǒng)研究[D].西安:西安工業(yè)大學(xué)[碩士學(xué)位論文],2011.
[6]李志華.基于無線傳感器網(wǎng)絡(luò)的火災(zāi)預(yù)警系統(tǒng)設(shè)計[D].汕頭:汕頭大學(xué)[碩士學(xué)位論文],2009.
[7]顏學(xué)義.基于ZigBee的智能火災(zāi)報警系統(tǒng)[D].長沙:國防科學(xué)技術(shù)大學(xué)[碩士學(xué)位論文],2008.
[8]吳起,蔣軍成.基于BP神經(jīng)網(wǎng)絡(luò)技術(shù)的實驗數(shù)據(jù)分析處理[J].中國安全科學(xué)報,2006,16(01):39-43.
[9]田亞.基于ZigBee無線傳感器網(wǎng)絡(luò)系統(tǒng)設(shè)計和實現(xiàn)[D].上海:同濟大學(xué)[碩士學(xué)位論文],2007.
作者簡介
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當?shù)馁M時,現(xiàn)今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實際上,其理論仍有相當大的發(fā)展空間,而其實際運用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學(xué)公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J.Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統(tǒng)合了此三項技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經(jīng)由取舍資料而達到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉(zhuǎn)換&n
bsp;DCT轉(zhuǎn)換量化器編碼器編碼結(jié)束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二)其轉(zhuǎn)換的系數(shù)是可以量化的。
(三)其量化的系數(shù)是可以用函數(shù)編碼的。
四、現(xiàn)有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五)ArithmeticCoder(數(shù)學(xué)公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎(chǔ)上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發(fā)展趨勢
一、在其結(jié)構(gòu)上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應(yīng)用於實務(wù)上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數(shù)位化。
2.如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3.如何控制解碼影像的品質(zhì)。
4.如何選擇適當?shù)木幋a法。
5.人的視覺系統(tǒng)對影像的反應(yīng)機制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。
陸、在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優(yōu)點,JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當?shù)赜∷⒌目赡苄栽龈撸瑴p少運費,減少開支,提高時效性,創(chuàng)造新的商機。
柒、結(jié)論
WAVELET的理論并不是相當完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當時間。不過對於網(wǎng)路出版仍是有相當大的契機,國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機工程學(xué)系碩士學(xué)位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學(xué)物理學(xué)系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數(shù)位訊號處理技術(shù)(語音、影像處理實務(wù)),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉(zhuǎn)換、階層式嵌入式零元樹小波轉(zhuǎn)換、階層式影像傳送及漸進式影像傳送
目前網(wǎng)路最常用的靜態(tài)影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現(xiàn)象最常發(fā)生在利用網(wǎng)路連結(jié)WWW網(wǎng)站時,我們常常都是先接收到文字後,其網(wǎng)頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網(wǎng)路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網(wǎng)路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉(zhuǎn)換(EZW)來完成。
階層式影像傳送系統(tǒng)的主要功能為允許不同規(guī)格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設(shè)計不同的編碼器配合利用之,進而增加了其應(yīng)用的范圍,及減低了所架設(shè)系統(tǒng)的復(fù)雜度,也可以節(jié)省更多的設(shè)備費用。利用Shapiro所提出的嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)來設(shè)計階層式影像傳送系統(tǒng)時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術(shù)所設(shè)計的編碼器是根據(jù)影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術(shù)來加以克服之,但是該技術(shù)對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復(fù)的編碼與傳送,而產(chǎn)生了相當高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)加以修改之,完成了一個新式的階層式影像傳送系統(tǒng)。該技術(shù)為階層式嵌入的零元樹小波轉(zhuǎn)換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術(shù)。這個技術(shù)使我們所設(shè)計出來的階層式影像傳送系統(tǒng),可以在編碼傳送前預(yù)先指定圖層數(shù)目、每層影像的解析度與碼率。
LEZW技術(shù)是將EZW技術(shù)中的連續(xù)近似量化(SAQ)加以延伸應(yīng)用之,而EZW傳統(tǒng)的做法是將SAQ應(yīng)用於全部的小波轉(zhuǎn)換系數(shù)上。然而在LEZW技術(shù)中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結(jié)果應(yīng)用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設(shè)計階層式影像傳送系統(tǒng)。
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當?shù)馁M時,現(xiàn)今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實際上,其理論仍有相當大的發(fā)展空間,而其實際運用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學(xué)公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J.Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統(tǒng)合了此三項技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經(jīng)由取舍資料而達到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉(zhuǎn)換&n
bsp;DCT轉(zhuǎn)換量化器編碼器編碼結(jié)束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二)其轉(zhuǎn)換的系數(shù)是可以量化的。
(三)其量化的系數(shù)是可以用函數(shù)編碼的。
四、現(xiàn)有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五)ArithmeticCoder(數(shù)學(xué)公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎(chǔ)上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發(fā)展趨勢
一、在其結(jié)構(gòu)上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應(yīng)用於實務(wù)上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數(shù)位化。
2.如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3.如何控制解碼影像的品質(zhì)。
4.如何選擇適當?shù)木幋a法。
5.人的視覺系統(tǒng)對影像的反應(yīng)機制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。
陸、在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優(yōu)點,JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當?shù)赜∷⒌目赡苄栽龈撸瑴p少運費,減少開支,提高時效性,創(chuàng)造新的商機。
柒、結(jié)論
WAVELET的理論并不是相當完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當時間。不過對於網(wǎng)路出版仍是有相當大的契機,國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.Geoff&nb
sp;Davis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機工程學(xué)系碩士學(xué)位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學(xué)物理學(xué)系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數(shù)位訊號處理技術(shù)(語音、影像處理實務(wù)),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉(zhuǎn)換、階層式嵌入式零元樹小波轉(zhuǎn)換、階層式影像傳送及漸進式影像傳送
目前網(wǎng)路最常用的靜態(tài)影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現(xiàn)象最常發(fā)生在利用網(wǎng)路連結(jié)WWW網(wǎng)站時,我們常常都是先接收到文字後,其網(wǎng)頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網(wǎng)路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網(wǎng)路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉(zhuǎn)換(EZW)來完成。
階層式影像傳送系統(tǒng)的主要功能為允許不同規(guī)格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設(shè)計不同的編碼器配合利用之,進而增加了其應(yīng)用的范圍,及減低了所架設(shè)系統(tǒng)的復(fù)雜度,也可以節(jié)省更多的設(shè)備費用。利用Shapiro所提出的嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)來設(shè)計階層式影像傳送系統(tǒng)時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術(shù)所設(shè)計的編碼器是根據(jù)影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術(shù)來加以克服之,但是該技術(shù)對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(LowpassSubband)被重復(fù)的編碼與傳送,而產(chǎn)生了相當高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)加以修改之,完成了一個新式的階層式影像傳送系統(tǒng)。該技術(shù)為階層式嵌入的零元樹小波轉(zhuǎn)換(LayeredEmbeddedZerotreeWavelet,簡稱LEZW技術(shù)。這個技術(shù)使我們所設(shè)計出來的階層式影像傳送系統(tǒng),可以在編碼傳送前預(yù)先指定圖層數(shù)目、每層影像的解析度與碼率。
LEZW技術(shù)是將EZW技術(shù)中的連續(xù)近似量化(SAQ)加以延伸應(yīng)用之,而EZW傳統(tǒng)的做法是將SAQ應(yīng)用於全部的小波轉(zhuǎn)換系數(shù)上。然而在LEZW技術(shù)中,從基層(BaseLayer)開始SAQ一次僅用於一個圖層(Layer)的編碼,直到最高階析度的圖層為止。當編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結(jié)果應(yīng)用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設(shè)計階層式影像傳送系統(tǒng)。
引言
智能家居控制系統(tǒng)以家居電器及家電設(shè)備為主要控制對象,利用綜合布線技術(shù)、網(wǎng)絡(luò)通信技術(shù)、安全防范技術(shù)、自動控制技術(shù)、音視頻技術(shù)將家居生活有關(guān)的設(shè)施進行高效集成,構(gòu)建高效的住宅設(shè)施與家庭日程事務(wù)的控制管理系統(tǒng),提升家居智能、安全、便利、舒適,并實現(xiàn)環(huán)保控制系統(tǒng)平臺。其中家居電器控制采用弱電控制強電方式,既安全又智能,可以用遙控、定時等多種智能控制方式實現(xiàn)對在家里飲水機、插座、空調(diào)、地暖、投影機、音像設(shè)備以及新風系統(tǒng)等進行智能控制,用以避免飲水機在夜晚反復(fù)加熱影響水質(zhì),在外出時斷開插排通電,避免電器發(fā)熱引發(fā)安全隱患等等。本系統(tǒng)設(shè)計正是在這樣的背景下產(chǎn)生,并以家居音頻設(shè)備為控制對象。整個系統(tǒng)的設(shè)計是通過隨身攜帶的智能手機利用無線網(wǎng)絡(luò)和家庭無線路由對嵌入式ARM為核心的音樂播放器進行遠程操控。下文是對整個系統(tǒng)的設(shè)計原理和設(shè)計過程的詳細論述。
一、總體方案設(shè)計
整個系統(tǒng)由智能手機、路由器、開發(fā)板三個部分組成。智能手機通過連接無線信號實現(xiàn)與開發(fā)板的通信,這里由于所使用的mini2440開發(fā)板缺少無線網(wǎng)卡的支持,所以路由器充當了無線網(wǎng)卡的作用,負責發(fā)射無線信號:
1.1 硬件方案
硬件平臺選用友善之臂提供的mini2440開發(fā)板,處理器采用基于ARM9內(nèi)核的Samsung S3C2440。由于S3C2440內(nèi)部配有64M SDRAM,256M NandFlash,所以完全可以勝任內(nèi)部的音頻解碼任務(wù)。另外,為了保證系統(tǒng)運行時的穩(wěn)定性,采用了專業(yè)的CPU內(nèi)核電源芯片和復(fù)位芯片。相對來說,手機的選擇比較自由,只要是安卓系統(tǒng)的智能手機都可以,在APP測試時,要求手機的安卓操作系統(tǒng)是Android2.3版本或以上。
1.2軟件方案
要將硬件設(shè)備連接并且工作,關(guān)鍵是軟件的開發(fā),因此軟件開發(fā)環(huán)境的選擇很重要。整個系統(tǒng)的軟件開發(fā)主要包括操作系統(tǒng)的裁剪和移植、音頻播放程序的開發(fā)、Android應(yīng)用的開發(fā)三個部分。音頻解碼采用軟件解碼。主要是利用CPU進行音頻數(shù)據(jù)的解碼,這需要在Linux操作系統(tǒng)下移植一個開源音頻解碼庫--madplay。采用軟件解碼雖然增加了CPU的開銷,但大大縮短了開發(fā)時間,而且不需要考慮解碼芯片的選擇和驅(qū)動問題。
智能手機選用了安卓的操作系統(tǒng),主要考慮到安卓系統(tǒng)是一種基于Linux的自由及開放源代碼的操作系統(tǒng),且市場占有量較高,2011年第一季度,Android在全球的市場份額首次超過塞班系統(tǒng),躍居全球第一。 2013年的第四季度,Android平臺手機的全球市場份額已經(jīng)達到78.1%,全世界采用這款系統(tǒng)的設(shè)備數(shù)量已經(jīng)達到10億臺,2014年第一季度Android平臺已占所有移動廣告流量來源的42.8%,首度超越iOS(運營收入不及iOS)。
二、軟件開發(fā)
2.1 操作系統(tǒng)裁剪
操作系統(tǒng)的裁剪是系統(tǒng)設(shè)計的重點,一個精簡的操作系統(tǒng)不僅可以加快系統(tǒng)的開機時間,還能減小CPU的開銷,使系統(tǒng)運行的更加流暢。操作系統(tǒng)由uboot、內(nèi)核、文件系統(tǒng)組成,需要裁剪的部分包括內(nèi)核(去掉不必要的配置)以及文件系統(tǒng)
2.2 音頻解碼數(shù)據(jù)庫的移植
madplay是linux下的開源音樂播放器,利用開源解碼庫libmad實現(xiàn)音頻的編解碼,目前該播放器除了不支持網(wǎng)絡(luò)歌曲的播放外,其余功能都支持,如快進、暫停、繼續(xù)等。開發(fā)人員需要自己開發(fā)一個自己的可視化界面或者播放器的管理程序,這樣使用起來才方便、快捷。系統(tǒng)設(shè)計時需要在開發(fā)板的ARM內(nèi)核上運行madplay可執(zhí)行文件,所以移植madplay也是本次設(shè)計的重要環(huán)節(jié)。
2.3 音樂播放器設(shè)計
播放器的核心代碼就是音樂的播放程序,在整個行程序運行時的內(nèi)部主控流程:
父進程負責接收按鍵信息或者socket信息。監(jiān)聽部分由select()函數(shù)完成,當按鍵或者socket文件描述符發(fā)生變化的時候,父進程首先判斷按鍵或者socket信息,根據(jù)不同的信息向子進程或者孫進程發(fā)送不同的信號。如,父進程收到的按鍵信息是“暫停”,調(diào)用kill()函數(shù)向子進程和孫進程發(fā)送SIGSTOP信號就可以暫停音樂的播放。
2.4 Android應(yīng)用程序設(shè)計
Android操作系統(tǒng)下設(shè)計控制軟件可簡可繁,這里的界面的設(shè)計由于缺少專業(yè)UI的支持,所以設(shè)計的比較簡單。用到的控件主要有Button、TextView、ScrollView、ListView、TabHost,其中前面4個采用常規(guī)控制,調(diào)用簡單,只需在activity_main.xml文件中調(diào)用并設(shè)置相應(yīng)的屬性(如長、寬、在頁面中的位置等)即可。TabHost用起來有點麻煩,這里需要注意兩點:
在開發(fā)自己的app過程中,主要難點在于新的線程接收服務(wù)器返回的信息,其主要的代碼如下:
Android部分的設(shè)計邏輯明了,算法簡單。作為客戶端或者命令發(fā)送端,只需向服務(wù)器發(fā)送自己的指令即可。
三、性能測試
系統(tǒng)的運行需要開發(fā)板、路由器以及APP三者的配合,路由器和開發(fā)板之間通過網(wǎng)線連接。需要設(shè)置路由器和開發(fā)板在同一個網(wǎng)段。測試中,路由器IP為192.168.1.10,開發(fā)板IP為192.168.1.22。經(jīng)測試,播放器可以通過按鍵或者APP實現(xiàn)歌曲切換、音量調(diào)節(jié)、歌曲信息顯示、播放模式的切換。并且經(jīng)過裁剪的操作系統(tǒng)啟動速度快,從系統(tǒng)上電到程序運行僅需要20秒。
本系統(tǒng)設(shè)計關(guān)鍵在于操作系統(tǒng)的裁剪移植以及加入了手機APP的控制。省去了QT以及內(nèi)核中不必要的模塊,使播放器的開機速度更加快,同時也減小了CPU的資源消耗;加入手機APP的控制,符合目前智能家居的發(fā)展趨勢,使得播放器使用起來更加的方便、人性化。
系統(tǒng)還存在一個問題未能很好解決。歌曲播放完畢并且切換到下一首后,手機APP測并不能實現(xiàn)播放曲目的更新。
目前,APP上顯示的歌曲信息只有三種情況會更新:點擊上一首或者下一首、暫停后繼續(xù)、點擊開始播放。試著修改代碼,子進程在實現(xiàn)共享內(nèi)存更新后將歌曲信息發(fā)送給APP,但是問題來了,APP和開發(fā)板的通信是基于UDP協(xié)議,即無連接,通俗的說,每次通信過程,只有當APP發(fā)送數(shù)據(jù)給開發(fā)板,開發(fā)板收到數(shù)據(jù)后同時記下了客戶端(APP)地址信息,通過地址信息將數(shù)據(jù)返回給APP。所以如果系統(tǒng)上電后APP并未接入網(wǎng)絡(luò),開發(fā)板發(fā)送數(shù)據(jù)時將會報錯。感興趣的讀者可以在APP發(fā)送數(shù)據(jù)給開發(fā)板后設(shè)定一個標志位,然后根據(jù)這個標志位判斷播放下一首歌曲的時候是否要將歌曲信息發(fā)送給APP。
參 考 文 獻
[1] Matt Welsh & Lar Kaufman,linux權(quán)威指南[M] 中國電力出版社 2000 年3月
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當?shù)馁M時,現(xiàn)今個人擁有True Color的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480 True Color圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實際上,其理論仍有相當大的發(fā)展空間,而其實際運用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機便由此而生。
貳、 WAVELET的歷史起源
WAVELET源起於Joseph Fourier的熱力學(xué)公式。傅利葉方程式在十九世紀初期由Joseph Fourier (1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J. Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y. Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進制伸縮與平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(Compactly Supported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、 WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、 WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramid coding)、濾波器組理論(filter bank theory)、以及次旁帶編碼(subband coding),可以說wavelet transform統(tǒng)合了此三項技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經(jīng)由取舍資料而達到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。 將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、 影像壓縮過程
原始圖形資料 色彩模式轉(zhuǎn)換 DCT轉(zhuǎn)換 量化器 編碼器 編碼結(jié)束
三、 編碼的基本要素有三點
(一) 一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二) 其轉(zhuǎn)換的系數(shù)是可以量化的。
(三) 其量化的系數(shù)是可以用函數(shù)編碼的。
四、 現(xiàn)有WAVELET影像壓縮工具主要的部份
(一) Wavelet Transform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二) Filters(濾鏡):這部份包含Wavelet Transform,和一些著名的壓縮方法。
(三) Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四) Entropy Coding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五) Arithmetic Coder(數(shù)學(xué)公式):這是建立在Alistair Moffat's linear time coding histogram的基礎(chǔ)上。
(六) Bit Allocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、 WAVELET影像壓縮未來的發(fā)展趨勢
一、 在其結(jié)構(gòu)上加強完備性。
二、 修改程式,使其可以處理不同模式比率的影像。
三、 支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、 加強運算的能力,使其可支援更多的影像格式。
五、 使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、 增加多種的WAVELET。如:離散、零元樹等。
七、 修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、 增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、 增加8X8格的DCT模式,使其能重疊。
十、 增加trellis coding。
十一、 增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應(yīng)用於實務(wù)上的日子指日可待。
伍、 影像壓縮研究的方向
1. 輸入裝置如何捕捉真實的影像而將其數(shù)位化。
2. 如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3. 如何控制解碼影像的品質(zhì)。
4. 如何選擇適當?shù)木幋a法。
5. 人的視覺系統(tǒng)對影像的反應(yīng)機制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。
陸、 在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優(yōu)點,JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當?shù)赜∷⒌目赡苄栽龈撸瑴p少運費,減少開支,提高時效性,創(chuàng)造新的商機。
柒、 結(jié)論
WAVELET的理論并不是相當完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當時間。不過對於網(wǎng)路出版仍是有相當大的契機,國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上), 峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下), 峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標出版有限公司。