《數(shù)字圖像處理》習(xí)題參考答案
《《數(shù)字圖像處理》習(xí)題參考答案》由會員分享,可在線閱讀,更多相關(guān)《《數(shù)字圖像處理》習(xí)題參考答案(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
《數(shù)字圖像處理》習(xí)題參考答案 第 1 章 概述 1.1 連續(xù)圖像和數(shù)字圖像如何相互轉(zhuǎn)換? 答:數(shù)字圖像將圖像看成是許多大小相同、形狀一致的像素組成。這樣,數(shù)字圖像可以 用二維矩陣表示。將自然界的圖像通過光學(xué)系統(tǒng)成像并由電子器件或系統(tǒng)轉(zhuǎn)化為模擬圖像 (連續(xù)圖像)信號,再由模擬/數(shù)字轉(zhuǎn)化器(ADC)得到原始的數(shù)字圖像信號。圖像的數(shù)字 化包括離散和量化兩個主要步驟。在空間將連續(xù)坐標(biāo)過程稱為離散化,而進(jìn)一步將圖像的幅 度值(可能是灰度或色彩)整數(shù)化的過程稱為量化。 1.2 采用數(shù)字圖像處理有何優(yōu)點(diǎn)? 答:數(shù)字圖像處理與光學(xué)等模擬方式相比具有以下鮮明的特點(diǎn): 1.具有數(shù)字信號處理技術(shù)共有的特點(diǎn)。(1)處理精度高。(2)重現(xiàn)性能好。(3)靈活 性高。 2.?dāng)?shù)字圖像處理后的圖像是供人觀察和評價的,也可能作為機(jī)器視覺的預(yù)處理結(jié)果。 3.?dāng)?shù)字圖像處理技術(shù)適用面寬。 4.?dāng)?shù)字圖像處理技術(shù)綜合性強(qiáng)。 1.3 數(shù)字圖像處理主要包括哪些研究內(nèi)容? 答:圖像處理的任務(wù)是將客觀世界的景象進(jìn)行獲取并轉(zhuǎn)化為數(shù)字圖像、進(jìn)行增強(qiáng)、變換、 編碼、恢復(fù)、重建、編碼和壓縮、分割等處理,它將一幅圖像轉(zhuǎn)化為另一幅具有新的意義的 圖像。 1.4 討論數(shù)字圖像處理系統(tǒng)的組成。列舉你熟悉的圖像處理系統(tǒng)并分析它們的組成和功能。 答:如圖 1.8,數(shù)字圖像處理系統(tǒng)是應(yīng)用計算機(jī)或?qū)S脭?shù)字設(shè)備對圖像信息進(jìn)行處理的 信息系統(tǒng)。圖像處理系統(tǒng)包括圖像處理硬件和圖像處理軟件。圖像處理硬件主要由圖像輸入 設(shè)備、圖像運(yùn)算處理設(shè)備(微計算機(jī))、圖像存儲器、圖像輸出設(shè)備等組成。軟件系統(tǒng)包括 操作系統(tǒng)、控制軟件及應(yīng)用軟件等。 圖 1.8 數(shù)字圖像處理系統(tǒng)結(jié)構(gòu)圖 1 1.5 常見的數(shù)字圖像處理開發(fā)工具有哪些?各有什么特點(diǎn)? 答.目前圖像處理系統(tǒng)開發(fā)的主流工具為 Visual C++(面向?qū)ο罂梢暬晒ぞ撸┖?MATLAB 的圖像處理工具箱(Image Processing Tool box)。兩種開發(fā)工具各有所長且有相互 間的軟件接口。 Microsoft 公司的 VC++是一種具有高度綜合性能的面向?qū)ο罂梢暬晒ぞ?,用它開發(fā) 出來的 Win 32 程序有著運(yùn)行速度快、可移植能力強(qiáng)等優(yōu)點(diǎn)。VC++所提供的 Microsoft 基礎(chǔ) 類庫 MFC 對大部分與用戶設(shè)計有關(guān)的 Win 32 應(yīng)用程序接口 API 進(jìn)行了封裝,提高了代碼 的可重用性,大大縮短了應(yīng)用程序開發(fā)周期,降低了開發(fā)成本。由于圖像格式多且復(fù)雜,為 了減輕程序員將主要精力放在特定問題的圖像處理算法上,VC++ 6.0 提供的動態(tài)鏈接庫 ImageLoad.dll 支持 BMP、JPG、TIF 等常用 6 種格式的讀寫功能。 MATLAB 的圖像處理工具箱 MATLAB 是由 MathWorks 公司推出的用于數(shù)值計算的有 力工具,是一種第四代計算機(jī)語言,它具有相當(dāng)強(qiáng)大的矩陣運(yùn)算和操作功能,力求使人們擺 脫繁雜的程序代碼。MATLAB 圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運(yùn)用這些 函數(shù)可以完成大部分圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時間,避免程序設(shè)計 中的重復(fù)勞動。MATLAB 圖像處理工具箱涵蓋了在工程實(shí)踐中經(jīng)常遇到的圖像處理手段和 算法,如圖形句柄、圖像的表示、圖像變換、二維濾波器、圖像增強(qiáng)、四叉樹分解域邊緣檢 測、二值圖像處理、小波分析、分形幾何、圖形用戶界面等。但是,MATLAB 也存在不足 之處限制了其在圖像處理軟件中實(shí)際應(yīng)用。首先,強(qiáng)大的功能只能在安裝有 MATLAB 系統(tǒng) 的機(jī)器上使用圖像處理工具箱中的函數(shù)或自編的 m 文件來實(shí)現(xiàn)。其次,MATLAB 使用行解 釋方式執(zhí)行代碼,執(zhí)行速度很慢。第三,MATLAB 擅長矩陣運(yùn)算,但對于循環(huán)處理和圖形 界面的處理不及 C++等語言。為此,通應(yīng)用程序接口 API 和編譯器與其他高級語言(如 C、 C++、Java 等)混合編程將會發(fā)揮各種程序設(shè)計語言之長協(xié)同完成圖像處理任務(wù)。API 支持 MATLAB 與外部數(shù)據(jù)與程序的交互。編譯器產(chǎn)生獨(dú)立于 MATLAB 環(huán)境的程序,從而使其他 語言的應(yīng)用程序使用 MATLAB。 1.6 常見的數(shù)字圖像應(yīng)用軟件有哪些?各有什么特點(diǎn)? 答:圖像應(yīng)用軟件是可直接供用戶使用的商品化軟件。用戶從使用功能出發(fā),只要了解 軟件的操作方法就可以完成圖像處理的任務(wù)。對大部分用戶來說,商品化的圖像應(yīng)用軟件無 需用戶進(jìn)行編程,操作方便,功能齊全,已經(jīng)能滿足一般需求,因而得到廣泛應(yīng)用。常用圖 像處理應(yīng)用軟件有以下幾種: 1.PHOTOSHOP:當(dāng)今世界上一流的圖像設(shè)計與制作工具,其優(yōu)越性能令其產(chǎn)品望塵 莫及。PHOTOSHOP 已成為出版界中圖像處理的專業(yè)標(biāo)準(zhǔn)。高版本的 PHOTOSHOP 支持多 達(dá) 20 多種圖像格式和 TWAIN 接口,接受一般掃描儀、數(shù)碼相機(jī)等圖像輸入設(shè)備采集的圖 像。PHOTOSHOP 支持多圖層的工作方式,只是 PHOTOSHOP 的最大特色。使用圖層功能 可以很方便地編輯和修改圖像,使平面設(shè)計充滿創(chuàng)意。利用 PHOTOSHOP 還可以方便地對 圖像進(jìn)行各種平面處理、繪制簡單的幾何圖形、對文字進(jìn)行藝術(shù)加工、進(jìn)行圖像格式和顏色 模式的轉(zhuǎn)換、改變圖像的尺寸和分辨率、制作網(wǎng)頁圖像等。 2.CorelDRAW:一種基于矢量繪圖、功能強(qiáng)大的圖形圖像制作與設(shè)計軟件。位圖式圖像 是由象素組成的,與其相對,矢量式圖像以幾何、色彩參數(shù)描述圖像,其內(nèi)容以線條和色塊 為主??梢?,采用不同的技術(shù)手段可以滿足用戶的設(shè)計要求。位圖式圖像善于表現(xiàn)連續(xù)、豐 富色調(diào)的自然景物,數(shù)據(jù)量較大;而矢量式圖像強(qiáng)于表現(xiàn)線條、色塊的圖案,數(shù)據(jù)量較小。 合理的利用兩種不同類型的圖像表現(xiàn)方式,往往會收到意想不到的藝術(shù)效果。CorelDraw是 2 當(dāng)今流行的圖像處理軟件中為數(shù)不多的特點(diǎn)明顯、功能強(qiáng)大的基于矢量繪圖的軟件包。利用 它,可以方便地制作精美的名片、賀卡、書簽、圖書封面、廣告、宣傳畫等作品。 3.ACDSee:快速、高性能的看圖程序,是目前最享盛名的圖片瀏覽器。它能廣泛應(yīng) 用于圖片的獲取、管理、瀏覽和優(yōu)化,支持 BMP、GIF、JPG、TGA、TIF 等超過 50 種常見 的圖形文件格式,圖片打開速度極快,可以直接查看動畫 GIF,處理如 Mpeg 之類常用的視 頻文件,還可以為每一個目錄建立一個相冊。ACDSee 可以從數(shù)碼相機(jī)和掃描儀高效獲取圖 片,并進(jìn)行便捷的查找、組織和預(yù)覽。ACDSee 還是得心應(yīng)手的圖片編輯工具,輕松處理數(shù) 碼影像,擁有去紅眼、剪切圖像、銳化、浮雕特效、曝光調(diào)整、旋轉(zhuǎn)、鏡像等功能,還能進(jìn) 行批量處理。 1.7 討論數(shù)字圖像處理的主要應(yīng)用。進(jìn)一步查找資料,寫一篇關(guān)于你感興趣的應(yīng)用方面 的短文。 答:圖像處理的應(yīng)用幾乎滲透科學(xué)研究、工程技術(shù)和人類社會生活的各個領(lǐng)域。教師可 以分組對學(xué)生布置以下 6 個方面的課題,通過閱讀參考文獻(xiàn)、網(wǎng)絡(luò)資源等手段寫數(shù)字圖像處 理的主要應(yīng)用的短文,并安排交流機(jī)會。 1.航天和航空技術(shù)方面的應(yīng)用 2.生物醫(yī)學(xué)工程方面的應(yīng)用 3.通信工程方面的應(yīng)用 4.工業(yè)自動化和機(jī)器人視覺方面的應(yīng)用 5.軍事和公安方面的應(yīng)用 6.生活和娛樂方面的應(yīng)用 第2章 圖像的數(shù)字化與顯示 2.1 設(shè)圖像的大小為 3232 的圖標(biāo),每個像素有 16 種顏色,共有多少種不同的圖標(biāo)? 如果每 100 萬個可能的圖標(biāo)中有一個有意義,識別一個有意義的圖標(biāo)需要 1 秒鐘,則選出所 有有意義的圖標(biāo)需要多長時間? 解:163232/106 = 161024/106=1.044101227 s 可見隨機(jī)圖像的復(fù)雜度是非常高的。 2.2 掃描儀的光學(xué)分辨率是 6001200 線,一個具有 5000 個感光單元的 CCD 器件,用 于 A4 幅面掃描儀,A4 幅面的紙張寬度是 8.3 英寸,該掃描儀的光學(xué)分辨率是多少 dpi? 解:(1)6001200 線,其中前一個數(shù)字代表掃描儀的橫向分辨率,后一數(shù)字則代表縱 向分辨率。 (2)dpi 是指單位面積內(nèi)像素的多少,也就是掃描精度 ,目前國際上都是計算一英寸 面積內(nèi)像素的多少。光學(xué)分辨率是掃描儀的光學(xué)部件在每平方英寸面積內(nèi)所能捕捉到的實(shí)際 的光點(diǎn)數(shù),是指掃描儀 CCD 的物理分辨率,也是掃描儀的真實(shí)分辨率,它的數(shù)值是由 CCD 的像素點(diǎn)除以掃描儀水平最大可掃尺寸得到的數(shù)值。 每一個感光單元對應(yīng)一個像素。由于 CCD 感光單元個數(shù)為 5000, 5000/8.3=602 (dpi) 3 第3章 圖像變換 3.1 二維傅里葉變換的分離性有什么實(shí)際意義? 解:該性質(zhì)表明,一個二維傅里葉變換可由連續(xù)兩次一維傅里葉變換來實(shí)現(xiàn)。實(shí)現(xiàn)的方 法如下圖所示: 3.2 圖像處理中正交變換的目的是什么?圖像變換主要用于那些方面? 解:正交變換可以使得圖像能量主要集中分布在低頻率成分上,邊緣和線信息反映在高 頻率成分上。因此正交變換廣泛應(yīng)用在圖像增強(qiáng)、圖像恢復(fù)、特征提取、圖像編碼壓縮和形 狀分析等方面。 3.3 在 MATLAB 環(huán)境中,實(shí)現(xiàn)一幅圖像的傅里葉變換。 解:MATLAB 程序如下: A=imread(rice.tif); imshow(A); A2=fft2(A); A2=fftshift(A2); figure,imshow(log(abs(A2)+1),[0 10]); 3.4 利用 MATLAB 對一幅 512512 的圖像進(jìn)行 DCT 變換,并保留 256256 個 DCT 變換系數(shù)進(jìn)行重構(gòu)圖像,比較重建圖像與原始圖像的差異。 解:MATLAB程序如下: RGB = imread(pout512.bmp); I = rgb2gray(RGB); J = dct2(I); J(1:512,256:512) = 0; J(256:512,1:256)=0; K = idct2(J); imshow(I), figure, imshow(K,[0 255]) 3.5 離散的沃爾什變換與哈達(dá)瑪變換之間有那些異同? 解:哈達(dá)瑪(Hadamard)變換和沃爾什(Walsh)變換的變換核都是由 1,-1 組成的正交 方陣。它們不同的地方在于變換矩陣的行列排列次序不同。哈達(dá)瑪變換每行的列率排列是沒 有規(guī)則的,沃爾什變換的列率是由小到大。 4 3.6 求 N=4 對應(yīng)的沃爾什變換核矩陣。 ?1 1 1 1 ? ? ? 解: H = ?1 1 ?1 ?1? ?1 ?1 ?1 1 ? ? ? ?1 ?1 1 ?1? 3.7 什么是小波?小波基函數(shù)和傅里葉變換基函數(shù)有何區(qū)別? 解:小波信號的非零點(diǎn)是有限的。它與傅里葉變換的基函數(shù)(三角函數(shù)、指數(shù)信號)是 不同的,傅里葉變換的基函數(shù)從負(fù)無窮到正無窮都是等幅振蕩的。 3.8 為何稱小波變換為信號的“電子顯微鏡”,如何實(shí)現(xiàn)該功能? 解:小波變換的伸縮因子的變化,使得可以在不同尺度上觀察信號,所以又稱電子顯微 鏡。實(shí)現(xiàn)小波變換可以應(yīng)用 Mallat 的快速算法。 3.9 應(yīng)用 MATLAB 設(shè)計小波變換程序,該程序能夠讀入一幅 BMP 格式的圖像,顯示 該圖像和小波變換系數(shù)。 解:由讀者思考。 3.10 傅里葉變換、加窗傅里葉變換和小波變換的時間-頻率特性有什么不同? 解:傅里葉變換使得時間信號變成了頻域信號,加窗傅里葉變換使得時間信號變成了時 頻信號,但是窗口是固定的,小波變換同樣變成了視頻信號,但是時頻的窗口是變化的。 3.11 利用 MATLAB 進(jìn)行圖像的小波變換,觀察小波系數(shù)特點(diǎn)。 解:MATLAB 程序如下: X=imread(rice.tif); [cA1,cH1,cV1,cD1] = dwt2(X,bior3.7); subplot(2,2,1); imshow( cA1,[0 900]); title(Approximation A1) subplot(2,2,2); imshow(cH1); title(Horizontal Detail H1) subplot(2,2,3); imshow(cV1); title(Vertical Detail V1) subplot(2,2,4); imshow(cD1); 第4章 圖像增強(qiáng) 4.1 圖像增強(qiáng)的目的是什么,它包含那些內(nèi)容? 解:圖像增強(qiáng)是指對圖像的某些特征,如邊緣、輪廓、對比度等進(jìn)行強(qiáng)調(diào)或銳化,以 便于顯示、觀察或進(jìn)一步分析與處理。圖像增強(qiáng)所包含的主要內(nèi)容如書圖 4.1。 4.2 已知灰度圖像 f(x,y)為如下矩陣所示,求經(jīng)過反轉(zhuǎn)變換后圖像 g(x,y)。反轉(zhuǎn) 變換 g=G(f)如圖 a 所示。 5 ?1 ? 解: ?1 ??1 圖 a 0 1? ? 1 1? 0 1?? 4.3 直方圖均衡,若一個 6464 的離散圖像,灰度分成 8 層,其灰度rk的值和分布情況 如下:請繪制該圖像的直方圖,并求經(jīng)過直方圖均衡后的圖像的直方圖。 k 0 1 2 3 4 5 6 7 rk 0 1 7 2 7 3 7 4 7 5 7 6 7 1 nk 560 920 1046 705 356 267 170 72 解: k 0 1 2 3 4 5 6 7 rk 0 1 7 2 7 3 7 4 7 5 7 6 7 1 nk 560 920 1046 705 356 267 170 72 pr (rk ) 0.14 0.22 0.26 0.17 0.09 0.07 0.04 0.02 ′ S k 0.14 0.36 0.62 0.79 0.88 0.95 0.99 1 ″ S k 1 7 3 7 4 7 6 7 6 7 1 1 1 S k 1 7 3 7 4 7 6 7 1 nsk 560 920 1046 1061 509 pr (sk ) 0.14 0.22 0.26 0.26 0.13 4.4 分析說明為什么對數(shù)字圖像進(jìn)行直方圖均衡化后,通常并不能產(chǎn)生完全平坦的直 方圖。 解:直方圖均衡中: s = T ( r ) r = ∫0 p r ( r ) d r 對于上式積分來講 s=1,但是在實(shí)際中, pr (r) 不是連續(xù)的,所以直方圖均衡并不會 產(chǎn)生完全平坦的直方圖。 6 4.5 設(shè)對一幅圖像進(jìn)行了均衡化處理,試證明第二次采用直方圖均衡化處理的結(jié)果與 k 第一次的結(jié)果相同。 解:設(shè)第二次直方圖均衡后灰度用 wk 表示, Wk = T (S k k n ) = ∑ si i =0 n = ∑ ni i =0 n 所以第二次的結(jié)果和第一次結(jié)果相同。 4.6 什么是圖像平滑?試述均值濾波的基本原理。 解:為了去除或減弱圖像中的噪聲,可以對圖像進(jìn)行平滑處理,稱為圖像平滑。大部分 的噪聲都可以看作是隨機(jī)信號,它們對圖像的影響可以看作是孤立的。對于某一像素而言, 如果它與周圍像素點(diǎn)相比,有明顯的不同,我們就認(rèn)為該點(diǎn)被噪聲感染了?;谶@樣的分析, 我們可以用求均值的方法,來判斷每一點(diǎn)是否含有噪聲,并用適當(dāng)?shù)姆椒ㄏl(fā)現(xiàn)的噪聲。 4.7 設(shè)圖像如下表 a 所示,分別求經(jīng)過鄰域平滑和高通算子銳化的結(jié)果。其中邊緣點(diǎn) 保持不變,鄰域平滑掩碼取 33 矩陣,即 ?1 H = =1 ?1 8 ? ??1 1 1? ? 0 1? ,高通算子取 33 矩陣,即: 1 1?? 表 a ??1 ? H = ??1 ???1 ?1 ?1? ? 8 ?1? ?1 ?1?? 解:鄰域平滑的結(jié)果: 1 1 3 4 5 2 21/8 26/8 35/8 5 2 22/8 25/8 32/8 5 3 29/8 27/8 25/8 2 4 5 4 1 1 1 1 3 4 5 2 -13 6 5 5 2 2 15 0 5 3 -13 -4 -1 2 4 5 4 1 1 7 4.8 什么是中值濾波,有何特點(diǎn)? 解:中值濾波是非線性的處理方法,在去噪的同時可以兼顧到邊界信息的保留。 中值濾波首先選一個含有奇數(shù)點(diǎn)的窗口 W,將這個窗口在圖像上掃描,把該窗口中所含的 像素點(diǎn)按灰度級的升(或降)序排列,取位于中間的灰度值,來代替該點(diǎn)的灰度值。 4.9 設(shè)原圖像為:2 4 7 4 3 5 4 6 4 4 4,求經(jīng)過中值濾波后的值,中值 濾波取一維的模板如下圖 b 所示,待處理像素的灰度取這個模板中的灰度的中值。邊界點(diǎn)保 持不變。 解:2 4 4 4 4 4 4 4 4 4 4.10 試分析中值濾波及各種差分算子濾波的計算量、優(yōu)缺點(diǎn)和適用范圍。 解:由讀者思考。 4.11 應(yīng)用 MATLAB 設(shè)計 bmp 文件格式的圖像讀取、顯示和直方圖統(tǒng)計程序。 解:由讀者思考。 4.12 應(yīng)用 MATLAB 設(shè)計圖像銳化的程序。 解:由讀者思考。 4.13 在 MATLAB 環(huán)境中,完成圖像的增亮、變暗處理。 解:MATLAB 程序如下: A=imread(pout.tif); %讀入圖像 imshow(A); %顯示圖像 figure,imhist(A); %顯示圖像的直方圖 J1=imadjust(A,[0.3 0.7],[]); %將圖像在 0.3255~0.7255 灰度之間的值通過線性變換映射到 0~255 之間 figure,imshow(J1); %輸出圖像效果圖 figure,imhist(J1) %輸出圖像的直方圖 J2=imadjust(A,[],[0 0.7]); %使用此函數(shù),將圖像灰度通過線性變換映射到 0~2550.7 之間 figure,imshow(J2); %輸出圖像效果圖 figure,imhist(J2) %輸出圖像的直方圖 4.14 在 MATLAB 環(huán)境中,對圖像進(jìn)行去噪處理。 解:參見例 4.4 4.15 在 MATLAB 環(huán)境中,對圖像進(jìn)行直方圖均衡處理,分析結(jié)果。 解:參見例 4.3 8 第5章 圖像編碼與壓縮 5.1 從哪些方面說明數(shù)據(jù)壓縮的必要性? 答:采用數(shù)字技術(shù)會使信號處理的性能大為提高,但其數(shù)據(jù)量的增加也是十分驚人的。 圖像數(shù)據(jù)更是多媒體、網(wǎng)絡(luò)通信等技術(shù)重點(diǎn)研究的壓縮對象。不加壓縮的圖像數(shù)據(jù)是計算機(jī) 的處理速度、通信信道的容量等所無法承受的。 這樣的數(shù)據(jù)率是與當(dāng)前信息存儲介質(zhì)的容量、計算機(jī)的總線速度以及網(wǎng)絡(luò)的傳輸率不相 匹配的。盡管人們在存儲介質(zhì)、總線結(jié)構(gòu)和網(wǎng)絡(luò)性能等方面不斷有新的突破,但數(shù)據(jù)量的增 長速度遠(yuǎn)超過硬件設(shè)施的提高水平,以上的矛盾仍然無法緩解。 如果將上述圖像信號壓縮幾倍、十幾倍,甚至上百倍,將十分有利于圖像的傳輸和存儲。 可見,在現(xiàn)有硬件設(shè)施條件下,對圖像信號本身進(jìn)行壓縮是解決上述矛盾的主要出路。 5.2 討論圖像壓縮方法的分類及其各自的特點(diǎn)。 答:一般數(shù)據(jù)壓縮按信息損失的程度來分類。見教材圖 5.2:常見數(shù)據(jù)壓縮技術(shù)的分類。 無損壓縮:Huffman 編碼和 Shannon 編碼根據(jù)概率分布特性確定碼長;游程編碼根據(jù)連 續(xù)灰度的游程來確定編碼;算術(shù)編碼隨信源數(shù)據(jù)不斷縮小的實(shí)數(shù)區(qū)間,然后用一個與實(shí)數(shù)對 應(yīng)的二進(jìn)制碼代表被編碼的信息;輪廓編碼根據(jù)相同灰度的區(qū)域邊界線進(jìn)行編碼。 有損壓縮:預(yù)測編碼根據(jù)相鄰像素相關(guān)性來確定后繼像素的預(yù)測值,若用差值進(jìn)行編碼 則可以壓縮數(shù)據(jù)量;變換編碼對原始圖像進(jìn)行正交變換,在變換域進(jìn)行抽樣達(dá)到壓縮的目的; 混合編碼將兩種編碼方法結(jié)合起來,如將預(yù)測編碼與變換編碼相結(jié)合,以取得更好的效果。 在現(xiàn)代壓縮編碼方法中,分形編碼利用宏觀與微觀的相似性來壓縮數(shù)據(jù)量,可以獲得極 大的壓縮比。該方法壓縮過程的計算量較大,但解壓縮很快,適用于圖像數(shù)據(jù)的存儲和重現(xiàn)。 模型基編碼:一種新型壓縮方法。該方法在發(fā)送端利用已知且變化慢的場景得到數(shù)據(jù)量 不大的模型參數(shù),在接收端利用綜合模型參數(shù)恢復(fù)原始圖像。這一編碼方法對于實(shí)時實(shí)現(xiàn)電 視會議等具有顯著意義。 圖 5.2 常見數(shù)據(jù)壓縮技術(shù)的分類 9 5.3 數(shù)據(jù)沒有冗余度能否壓縮?為什么? 答:圖像數(shù)據(jù)量大,同時冗余數(shù)據(jù)也是客觀存在的。一般圖像中存在著以下數(shù)據(jù)冗余因 素:(1)編碼冗余;(2)像素間的相關(guān)性形成的冗余;(3)視覺特性和顯示設(shè)備引起的冗余。 理論上,數(shù)據(jù)沒有冗余度是不壓縮的,否則無法解碼出原始數(shù)據(jù)。但在大部分應(yīng)用場合 下采用有損壓縮,數(shù)據(jù)沒有冗余度也可以進(jìn)行壓縮。 5.4 如何衡量圖像編碼壓縮方法的性能? 答:一般地,圖像壓縮應(yīng)能做到壓縮比大、算法簡單、易于用硬件和軟件實(shí)現(xiàn)、壓縮和 解壓縮實(shí)時性好、解壓縮恢復(fù)的圖像失真小等。但這些指標(biāo)對同一壓縮方法很難統(tǒng)一,在實(shí) 際系統(tǒng)中往往需要抓住主要矛盾,全面權(quán)衡。常用的圖像壓縮技術(shù)指標(biāo)有:(1)圖像熵與平 均碼長;(2)圖像冗余度與編碼效率;(3)壓縮比;(4)客觀評價 SNR;(5)主觀評價。圖 像的主客觀兩種評價之間存在著密切的聯(lián)系。但一般來說,客觀評價高的主觀評價也高,因 此在圖像編碼的質(zhì)量評價時,首先作客觀評價,以主觀評價為參考。 5.5 一圖像大小為 640480,256 色。用軟件工具 SEA(version 1.3)將其分別轉(zhuǎn)成 24 位色 BMP,24 位色 JPEG,GIF(只能轉(zhuǎn)成 256 色)壓縮格式,24 位色 TIFF 壓縮格式,24 位色 TGA 壓縮格式,得到的文件大小分別為:921,654 字節(jié);17,707 字節(jié);177,152 字節(jié); 923,044 字節(jié);768,136 字節(jié)。分別計算每種壓縮圖像的壓縮比。 解:不計算較小的文件頭和彩色查找表(LTU)的數(shù)據(jù)量,原始圖像的數(shù)據(jù)量為: 6404801 byte=307,200 byte。 經(jīng)轉(zhuǎn)換后各種格式的壓縮比如下: 24 位色 BMP 格式: 307,200/921,654=0.333(增加了冗余度) 24 位色 JPEG 格式: 307,200/17,707=17.35 GIF 壓縮格式: 307,200/177,152=1.73 24 位色 TIFF 壓縮格式: 307,200/923,044=0.333(增加了冗余度) 24 位色 TGA 壓縮格式: 307,200/768,136=0.400(增加了冗余度) 5.6 大部分視頻壓縮方法是有損壓縮還是無損壓縮?為什么? 答:視頻比靜態(tài)圖像數(shù)據(jù)量更大,同時可壓縮的冗余信息更多。大部分視頻壓縮方法是 以人眼感覺無明顯失真為依據(jù)的,因此采用有損壓縮。事實(shí)上,視頻可以看成是一幅幅不同 但相關(guān)的靜態(tài)圖像的時間序列。因此,靜態(tài)圖像的壓縮技術(shù)和標(biāo)準(zhǔn)可以直接應(yīng)用于視頻的單 幀圖像。另外,利用視頻幀間信息的冗余可以大大提高視頻的壓縮比。 5.7 若圖像上任意兩像素點(diǎn)的亮度電平值相等或者任意兩時刻同一位置上的像素的亮 度電平值相等,能夠說明上述兩種情況下像素相關(guān)嗎?為什么? 答:不能。像素的空間相關(guān)性和時間相關(guān)性是以空間和時間的相鄰性為基礎(chǔ)的。因此, 圖像上任意兩像素點(diǎn)的亮度電平值相等或者任意兩時刻同一位置上的像素的亮度電平值相 等帶有偶然性,不能說明兩像素相關(guān)。 5.8 根據(jù) JPEG 算法說明 JPEG 圖像顯示時會出現(xiàn)馬賽克現(xiàn)象的原因。 答:由于 JPEG 算法將整幅圖像分成若干個 88 的子塊,解碼也是以子塊為單位的,所 以塊間的解碼誤差可能反映為方塊效應(yīng),在視覺上會出現(xiàn)馬賽克現(xiàn)象。 10 5.9 討論混合編碼的優(yōu)點(diǎn)。 答:混合編碼一般指將預(yù)測編碼與變換編碼相結(jié)合進(jìn)行編碼的方法。預(yù)測編碼根據(jù)相鄰 像素相關(guān)性來確定后繼像素的預(yù)測值,若用差值進(jìn)行編碼則可以壓縮數(shù)據(jù)量;變換編碼對原 始圖像進(jìn)行正交變換,在變換域進(jìn)行抽樣達(dá)到壓縮的目的;混合編碼將兩種編碼方法結(jié)合起 來,可以發(fā)揮兩種編碼方法的優(yōu)點(diǎn),取得更好的效果。 5.10 有了離散傅里葉及其快速算法 FFT,為什么還要提出離散余弦算法 DCT 及其快 速算法?為什么許多視頻國際標(biāo)準(zhǔn)將 DCT 作為幀內(nèi)編碼的基本壓縮算法? 答:在所有的變換編碼方案中,離散 K-L 變換是最佳變換,理論價值較高,常常作為 對其他變換特性進(jìn)行評價的標(biāo)準(zhǔn)。但此變換沒有快速算法,在工程應(yīng)用中受到限制。在次最 佳變換算法中,DFT 和 DCT 都是常用的變換編碼方法,它們分別有快速算法:FFT 和 FCT。 這兩種方法相比較,DFT 涉及到復(fù)數(shù)運(yùn)算,而 DCT 是實(shí)數(shù)變換具有十分吸引人的一些特點(diǎn): 它是一種實(shí)數(shù)變換,計算量較小,其變換矩陣的基向量很好地描述了人類視覺的相關(guān)性,且 對于大多數(shù)圖像來說,該變換的壓縮性能很接近離散 K-L 變換,而且其變換矩陣與圖像內(nèi) 容無關(guān),另外由于它構(gòu)造對稱的數(shù)據(jù)序列,避免了在圖像邊界處的跳躍及所引起的 Gibbs 效應(yīng),并且也有快速算法,因而得到廣泛的應(yīng)用。作為準(zhǔn)最佳變換,它已成為一些靜態(tài)圖像、 視頻壓縮國際標(biāo)準(zhǔn)(或建議)中的基本處理模塊。JPEG 制定了基于 DCT 的有失真靜止圖像 壓縮標(biāo)準(zhǔn)。在 MPEG 視頻編碼器中幀內(nèi)圖像(I 圖像)采用 DCT 的編碼方法。 5.11 為什么二維 DCT 可以轉(zhuǎn)換成兩次一維 DCT 計算? 答:參考第 3 章圖像變換。二維變換可以分解成兩次變換,如先進(jìn)行變換,再進(jìn)行列變 換,或反之。 5.12 Huffman 編碼有何優(yōu)缺點(diǎn)? 答: Huffman 編碼在無失真的編碼方法中效率優(yōu)于其他編碼方法,是一種最佳變長碼, 其平均碼長接近于熵值。但當(dāng)信源數(shù)據(jù)成分復(fù)雜時,龐大的信源集致使 Huffman 碼表較大, 碼表生成的計算量增加,編譯碼速度相應(yīng)變慢;另外不等長編碼致使硬件譯碼電路實(shí)現(xiàn)困難。 上述原因致使 Huffman 編碼的實(shí)際應(yīng)用受到限制。 5.13 Huffman 編碼是最佳編碼,為什么還要研究算術(shù)編碼等其他熵編碼算法? 答:題 5.12 中討論了 Huffman 編碼的優(yōu)缺點(diǎn),其他熵編碼方法可以在某些性能上克服 Huffman 編碼的不足。如,雖然算術(shù)編碼的硬件實(shí)現(xiàn)比 Huffman 編碼方法復(fù)雜,但對圖像的 編碼測試結(jié)果表明,在信源符號概率接近的條件下,算術(shù)編碼效率高于 Huffman 編碼。 5.14 算術(shù)編碼有何優(yōu)點(diǎn)?舉例說明其適用范圍。 答:在信源符號概率接近的條件下,算術(shù)編碼效率高于 Huffman 編碼。因此,在擴(kuò)展 的 JPEG 系統(tǒng)中用算術(shù)編碼取代了 Huffman 編碼。另外,算術(shù)編碼除了常見的基于概率統(tǒng)計 的模式外,還有自適應(yīng)模式。在這種模式下,各個符號的初始概率相同,它們依據(jù)出現(xiàn)的符 號而發(fā)生變化。這種模式特別適用于不便于進(jìn)行符號概率統(tǒng)計的實(shí)際場合中。- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
15 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖像處理 數(shù)字圖像 處理 習(xí)題 參考答案
鏈接地址:http://www.3dchina-expo.com/p-10232574.html