《基于JPEG雙量化效應(yīng)的圖像盲取證》由會(huì)員分享,可在線閱讀,更多相關(guān)《基于JPEG雙量化效應(yīng)的圖像盲取證(4頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、基于JPEG雙量化效應(yīng)的圖像盲取證
摘要:JPEG圖像的雙量化效應(yīng)為JPEG圖像的篡改檢測(cè)提供了重要線索。根據(jù)JPEG圖像被局部篡改后,又被保存為JPEG格式時(shí),未被篡改的區(qū)域(背景區(qū)域)的離散余弦變換(DCT)系數(shù)會(huì)經(jīng)歷雙重JPEG壓縮,篡改區(qū)域的DCT系數(shù)則只經(jīng)歷了1次JPEG壓縮。而JPEG圖像在經(jīng)過(guò)離散余弦變換后其DCT域的交流(AC)系數(shù)的分布符合一個(gè)用合適的參數(shù)來(lái)描述的拉普拉斯分布,在此基礎(chǔ)上提出了一種JPEG圖像重壓縮概率模型來(lái)描述重壓縮前后DCT系數(shù)統(tǒng)計(jì)特性的變化,并依據(jù)貝葉斯準(zhǔn)則,利用后驗(yàn)概率表示出圖像篡改中存在的雙重壓縮效應(yīng)塊
2、和只經(jīng)歷單次壓縮塊的特征值。然后設(shè)定閾值,通過(guò)閾值進(jìn)行分類判斷就可以實(shí)現(xiàn)對(duì)篡改區(qū)域的自動(dòng)檢測(cè)和提取。實(shí)驗(yàn)結(jié)果表明,該方法能快速并準(zhǔn)確地實(shí)現(xiàn)篡改區(qū)域的自動(dòng)檢測(cè)和提取,并且在第2次壓縮因子小于第1次壓縮因子時(shí),檢測(cè)結(jié)果相對(duì)于利用JPEG塊效應(yīng)不一致的圖像篡改盲檢測(cè)算法和利用JPEG圖像量化表的圖像篡改盲檢測(cè)算法有了明顯的提高。
關(guān)鍵詞:雙量化效應(yīng);圖像篡改;拉普拉斯分布;盲取證
引言
JPEG(Joint Photographic Experts Group)是當(dāng)前主流的圖像壓縮標(biāo)準(zhǔn),是目前靜態(tài)圖像中壓縮比較高的,被廣泛地應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,而針對(duì)此
3、類圖像的偽造篡改也是越來(lái)越多,并且僅僅依靠人眼很難辨別出真?zhèn)?。在這種情況下圖像的真實(shí)性也就成為人們所關(guān)注的問(wèn)題。因此,本文對(duì)此類圖像的取證技術(shù)展開(kāi)研究。當(dāng)前數(shù)字圖像取證技術(shù)主要分為兩類:主動(dòng)取證和被動(dòng)取證。主動(dòng)取證技術(shù)[1]是預(yù)先對(duì)數(shù)字圖像嵌入脆弱水印或簽名,通過(guò)提取水印、簽名的手段進(jìn)行取證; 相比之下,數(shù)字圖像被動(dòng)取證技術(shù)作為一種在不依賴任何預(yù)簽名提取或預(yù)嵌入信息對(duì)圖像的真?zhèn)魏蛠?lái)源進(jìn)行鑒別的技術(shù),只需要依靠待檢測(cè)圖像就可以實(shí)施取證,具有更高的應(yīng)用價(jià)值,但其取證難度大于主動(dòng)取證。針對(duì)經(jīng)歷雙重JPEG篡改圖像,研究學(xué)者已經(jīng)提出了各種盲取證算法。很多學(xué)者通過(guò)對(duì)圖像第1次壓縮量化表的估計(jì)來(lái)定位篡改區(qū)
4、域[2-4];Farid[5]則通過(guò)使用不同的壓縮因子對(duì)待測(cè)的JPEG圖像進(jìn)行再次壓縮,當(dāng)壓縮因子與篡改區(qū)域的壓縮因子相同時(shí),篡改區(qū)域表現(xiàn)出的失真程度最小,由此來(lái)實(shí)現(xiàn)對(duì)圖像篡改區(qū)域的檢測(cè)。He等[6]通過(guò)分析JPEG圖像的離散余弦變換(Discrete Cosine Transform, DCT)系數(shù)的雙重量化效應(yīng),通過(guò)尋找局部二次壓縮的痕跡,首次實(shí)現(xiàn)了對(duì)JPEG圖像的篡改區(qū)域的自動(dòng)檢測(cè)和定位。Binghiamton大學(xué)的Fridrich研究小組運(yùn)用將針對(duì)圖像單個(gè)像素點(diǎn)的方法轉(zhuǎn)化為對(duì)圖像塊的操作,提出了一種基于圖像塊的DCT量化系數(shù)分析的盲取證算法[7];李晟等[8]則用一定的壓縮因子對(duì)圖像進(jìn)
5、行再次壓縮,根據(jù)篡改區(qū)域的失真程度大于非篡改區(qū)域的失真程度,實(shí)現(xiàn)對(duì)JPEG圖像的篡改檢測(cè);文獻(xiàn)[9]通過(guò)利用每個(gè)交流(Alternating Current, AC)系數(shù)頻率項(xiàng)的光譜能量密度中的峰值點(diǎn)個(gè)數(shù)與量化步長(zhǎng)之間差值為1的特點(diǎn),估計(jì)出量化表,進(jìn)一步計(jì)算得到圖像的塊特征,通過(guò)塊特征之間的不連續(xù)性來(lái)檢測(cè)圖像是否經(jīng)過(guò)篡改。
然而,現(xiàn)有的大部分盲取證算法大都要求待檢測(cè)圖像是未壓縮或者是壓縮因子較高的圖像,并且能夠廣泛應(yīng)用的JPEG圖像的篡改檢測(cè)算法還比較少。本文基于JPEG圖像壓縮理論基礎(chǔ),通過(guò)對(duì)JPEG圖像雙量化效應(yīng)的分析,利用其DCT域的AC系數(shù)的分布符合拉普拉斯分布,并采用局
6、部鄰域法對(duì)λ進(jìn)行估計(jì),依據(jù)貝葉斯準(zhǔn)則,利用后驗(yàn)概率表示出篡改圖像中存在的雙重壓縮效應(yīng)的篡改塊,實(shí)現(xiàn)對(duì)篡改區(qū)域的自動(dòng)檢測(cè)和提取。與文獻(xiàn)[11]所采用的算法相比,本文方法的檢測(cè)性能有很大的提升,特別是在第2次壓縮因子(QF2)比第1次壓縮因子(QF1)小時(shí),檢測(cè)效果更好。
一、JPEG壓縮原理
JPEG壓縮和解壓過(guò)程如圖1所示,JPEG壓縮是一種有損壓縮,它是基于8×8像素塊的壓縮編碼過(guò)程,主要由預(yù)處理、分塊、離散余弦變換、量化、Huffman編碼等構(gòu)成。
原始圖像數(shù)據(jù)分成8×8的小塊,經(jīng)過(guò)DCT后,其低頻分量都集中在
7、左上角,高頻分量分布在右下角,對(duì)于每一個(gè)8×8的小塊,其中D(0,0)(即第1行第1列元素,D為8×8的圖像塊)代表了直流(Direct Current, DC)系數(shù),其他的63個(gè)元素是AC系數(shù)。而低頻分量包含了圖像的主要信息(如亮度),其中量化的目的就是為了保持低頻分量,抑制高頻分量,達(dá)到壓縮圖像的目的。而DCT系數(shù)的量化這一步驟是不可逆的,量化步長(zhǎng)越大,圖像在進(jìn)行反量化時(shí),所丟失的高頻信息也就會(huì)越多,圖像失真也就會(huì)越明顯。量化矩陣通常與一定的壓縮因子相對(duì)應(yīng), 壓縮因子是一個(gè)從1到100的整數(shù)。圖像進(jìn)行JPEG壓縮時(shí),通常需要指定一個(gè)壓縮因子QF,一旦QF確定,量化矩
8、陣QT就可以通過(guò)式(1)計(jì)算得出:
QT=[(QTij×α(QF)+50)/100]; i, j∈{0,1,2,…,7} (1
α(QF)=5000/QF,1≤QF
200-2QF,50≤QF≤100
其中:QTij是JPEG標(biāo)準(zhǔn)推薦亮度分量的量化矩陣,[]表示四舍五入運(yùn)算。
二、JPEG圖像合成篡改的數(shù)學(xué)模型
JPEG合成篡改圖像是指JPEG格式的圖像的一部分被其他圖像置換,如圖2所示,圖2(a)為一幅JPEG格式的背景圖像P1,圖2(b)
9、為篡改來(lái)源圖像P2,圖2(c)為篡改合成圖像P3,其數(shù)學(xué)模型可用式(2)描述:
y(i, j)=A1⊙P1(i, j)+A2⊙P2(i, j)=AP(i, j)(2)
其中:y(i, j)為JPEG篡改合成圖像;⊙表示Hadamard積;P1(i, j)為一幅JPEG格式的背景圖像;P2(i, j)為其他圖像(可以是JPEG格式的圖像,也可以是其他無(wú)損壓縮格式的圖像);源圖像P(i, j)=[P1(i, j),P2(i, j)]T;置換混合矩陣A=[A1,A2]。這里 A1=1, (i, j)∈U10, (i, j)∈U2
A2=1, (i, j)∈U10, (i, j)∈U2
其中:U1∪U2=U,U1∩U2=。本文的目的就是僅僅根據(jù)篡改合成圖像分離出源圖像P(i, j)中的篡改區(qū)域。
三、JPEG圖像雙重壓縮中的雙量化效應(yīng)
JPEG圖像進(jìn)行第1次壓縮時(shí),需要用量化矩陣QT1對(duì)DCT系數(shù)進(jìn)行量化,得到量化后的DCT系數(shù)。而進(jìn)行第2次壓縮時(shí),則先把量化后的DCT系數(shù)乘以第一次量化矩陣QT1,再使用第2次量化矩陣QT2來(lái)進(jìn)行量化操作。