圖像拼接技術(shù)論文(2)
圖像拼接技術(shù)論文篇二
基于圖切割的圖像拼接技術(shù)
摘要:圖像拼接作為基于圖像繪制的一部分近年來成為研究的熱點(diǎn)之一。本文對圖像拼接技術(shù)進(jìn)行研究,詳細(xì)的分析了新的基于圖切割的拼接方法。該方法在相位校正的基礎(chǔ)上將圖切割和泊松融合相結(jié)合實(shí)現(xiàn)拼接,圖切割用于搜索全局最優(yōu)的縫合線以去除鬼影,泊松融合用于曝光差異的處理。本文給出新的基于梯度方向直方圖統(tǒng)計(jì)的權(quán)值計(jì)算方法,實(shí)現(xiàn)穩(wěn)定的圖切割。另外,本文還設(shè)計(jì)出重疊過渡的泊松融合方法,較好地完成圖像合成。
關(guān)鍵詞:圖像拼接;圖切割;泊松融合
中圖分類號:TP302文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2007)18-31715-02
A NoveI Image Mosaic Method Based on Graph Cut
WANG Qi-hui
(Hangzhou Normal University,Hangzhou 310011,China)
Abstract:Image mosaic is one of the topics of image based rendering(IBR) these years.A noveI image mosaic method based on graPh cut.This method first calculates. Phase correlation and then reaches image mosaic by graph cut and poisson image fusion.Graph cut is used to find a globally optimized seam-line for deghosting while poisson image fusion is used to realize smooth mosaic without exposure difference.A new weight calculation method based on the statistics of guadient direction histogram is presented here in order to robustly realize graph cut.An edge transition poisson image fusion method is also proposed to reach exposure difference removal
Key words:image mosaic;multiresolutions pline mosaic;graph cut
前人對圖切割在圖像編輯上的應(yīng)用已做一些研究[Ag~l2a004,Lvein2004,Li2004,Roht2er0O4],這些應(yīng)用的特點(diǎn)都是如何定義合適的權(quán)系數(shù)以完成特定的應(yīng)用需求,而所有的這些權(quán)系數(shù)都是直接利用色彩強(qiáng)度差或梯度強(qiáng)度差進(jìn)行計(jì)算。在泊松融合方面的應(yīng)用,Ag~ala等A[g~l2a004]提出的基于紐曼邊界條件的泊松融合技術(shù)以實(shí)現(xiàn)片段間的合成,從而保持兩個不同片段間的連續(xù)過渡。本文將圖切割和泊松融合應(yīng)用到圖像拼接中,提出基于圖切割的拼接方法。該方法在相位校正的基礎(chǔ)上先利用圖切割尋找一條最佳縫合線以消除鬼影,再利用泊松融合實(shí)現(xiàn)合成以消除曝光差異。為提高算法的穩(wěn)定性,本文提出新的基于梯度方向直方圖統(tǒng)計(jì)的權(quán)值計(jì)算方法,將梯度強(qiáng)度和方向相結(jié)合,克服前人只是基于強(qiáng)度得到的權(quán)值的不穩(wěn)定性。本文還提出重疊過渡的泊松融合方法,通過將重疊區(qū)劃分成兩個片段然后分別執(zhí)行泊松融合,實(shí)現(xiàn)平滑過渡。
1 基于圖切割的最佳縫合線搜索
1.1 圖切割與最大流問題簡介
在計(jì)算機(jī)視覺里常常遇到標(biāo)識(labeling)問題,比如如何對圖像分段,如何確定象素的深度等。這樣的標(biāo)識問題,實(shí)際上也是最小化問題,即如何保證算法標(biāo)識的結(jié)果和實(shí)際觀察的數(shù)據(jù)之間能量差達(dá)到最小以保證標(biāo)識的正確性:E(f)=Esmooth(f)+Edata(f)
其中,Esmooth(f)仍表示相鄰兩個象素間的光滑度,Edata(f)表示標(biāo)識值與實(shí)際觀察值
之差。標(biāo)識問題中常常要研究如何進(jìn)行兩個標(biāo)識的劃分問題,比如用s和t兩個標(biāo)識對一幅3x3圖像進(jìn)行最佳的標(biāo)識劃分以到能量差最小。如下圖1所示,解決這幅圖像的兩個標(biāo)識劃分問題需要建立如圖所示的帶權(quán)有向圖,權(quán)值的大小在這里簡化為邊的粗細(xì)來表示,用兩個分別叫源節(jié)點(diǎn)s和接收節(jié)點(diǎn)t的終點(diǎn)節(jié)點(diǎn)表示這兩個標(biāo)識。在這個圖里有兩種弧,一種是由源節(jié)點(diǎn)或接收節(jié)點(diǎn)發(fā)出的,叫t弧,權(quán)值為Edata(f);另外一種是相鄰象素間互相連接的弧,叫e弧,權(quán)值為Esmooth(f)。圖的切割(cut)就是要將這個有向圖切成兩個部分S和T,s放在S里,t放在T里。最小切割就是要找到代價最小的一個切割,這也就是我們所說的圖切割問題。如圖1中右圖的虛線就表示這樣的一個切割。
對于圖1所示的帶權(quán)有向圖(其中圓圈表示節(jié)點(diǎn),直線表示有向邊),如果將其想象為圖2所示的一個水管網(wǎng)絡(luò),那么圖切割問題可以描述成如何求解在某一時刻從s到t能通過的最大流量的問題。 [Ford1962]中指出從s和t間的最大流在將這個有向圖分成兩個部分 (S和T)的邊組成的最小切割上飽和,也即這個切割上的水流之和就是最大流。求解有向圖的最小切割問題就是求解最大流的問題,已有很多算法對最大流問題進(jìn)行研究[Boykov2004,Boykovl999],本文的算法引自[Boykovl999]。
1.2最佳縫合線搜索
下圖3顯示如何對圖像重疊區(qū)進(jìn)行圖切割的初始化。在圖3(a)中,IM和IN表示兩幅相鄰圖像,Iover表示重疊區(qū)。首先建立兩幅圖像間的帶權(quán)有向圖,這里假設(shè)重疊區(qū)的大小為3x3,IM和IN分別作源點(diǎn)(M)和接收點(diǎn)(N)。M和N分別向相鄰的重疊區(qū)內(nèi)的象素發(fā)出t弧,同時重疊區(qū)內(nèi)的象素向四個鄰域象素發(fā)出e弧。t弧權(quán)值大小為∞,這樣可以保證切割線不穿過重疊區(qū)的邊界,從而保證切割。e弧權(quán)值的定義方法是實(shí)現(xiàn)圖切割算法的關(guān)鍵。
圖3 圖切割拼接原理
前人的方法都是基于梯度強(qiáng)度或色彩強(qiáng)度進(jìn)行e弧的權(quán)值計(jì)算。由于相鄰圖像存在曝光差異,因此基于色彩強(qiáng)度差是不穩(wěn)定的。梯度強(qiáng)度差雖然在一定程度上強(qiáng)調(diào)幾何結(jié)構(gòu)上的相似的,但是由于噪聲和配準(zhǔn)誤差的影響,僅僅梯度強(qiáng)度上的相似性也是不夠的,還必須要考慮圖像中紋理變化方向的相似性,即梯度方向上的相似性。為此可以對每個象素的鄰域進(jìn)行統(tǒng)計(jì)得到該象素的梯度方向直方圖,然后將e弧權(quán)值的求解建立在相鄰象素間的梯度方向直方圖比較之上,這樣得出的權(quán)值結(jié)合梯度強(qiáng)度和方向的影響,可以有效表達(dá)該象素點(diǎn)及其周圍象素的特點(diǎn)。結(jié)合圖4所示的兩幅帶藍(lán)框標(biāo)識的源圖像,具體的。弧權(quán)值求解過程如下:
(l)初始化:對于圖像上的每個點(diǎn)計(jì)算相鄰區(qū)域的梯度方向直方圖。梯度方向直方圖統(tǒng)計(jì)是對周圍半徑;的圓形區(qū)域,以該象素點(diǎn)為中心采用高斯加權(quán)的方式統(tǒng)計(jì)鄰域內(nèi)所有象素點(diǎn)在各個梯度方向的強(qiáng)度之和。高斯加權(quán)一方面降低噪聲的影響,另外一方面也強(qiáng)調(diào)離中心點(diǎn)近的象素的作用。
(2)峰值求精:梯度方向直方圖峰值反映象素及其周圍的主要分布特征,因此需要對其進(jìn)行求精。求精的方法是首先對峰值方向的強(qiáng)度和其相鄰三個方向的強(qiáng)度的進(jìn)行拋物線擬合,然后用擬合得到的拋物線的峰值替代原峰值。
本文為全文原貌 未安裝PDF瀏覽器用戶請先下載安裝 原版全文
2 重疊過渡的泊松融合
2.1泊松融合原理
R2上的封閉子集s是一個的圖像定義域。?贅是s上的一個封閉子集,其邊界是?鄣?贅,假設(shè)f是定義在?贅上未知的標(biāo)量函數(shù),f*是定義在?鄣?贅上已知的標(biāo)量函數(shù),那么求解f最簡單的方法是用模插值來求解:
圖5中的右圖就是指導(dǎo)場v的一個示意,借助這個指導(dǎo)場,模插值的目標(biāo)就是希望f具有和v一樣的變化場。這樣,上式的最小化就變成如下的相對于指導(dǎo)場的最小化:
具體到圖像合成,取指導(dǎo)場為待合成圖像區(qū)域的梯度場,然后利用上式就可以將被合成的圖像無縫融合到待合成圖像區(qū)域中。
2.2重疊過渡的拼接
圖6如何利用泊松融合技術(shù)實(shí)現(xiàn)基于縫合線的圖像拼接。為方便解釋,我們將這種實(shí)現(xiàn)方法定義為重疊過渡的泊松融合方法。具體執(zhí)行步聚如下:
(3)未知區(qū)域泊松融合求解。對每個未知區(qū)域按前面計(jì)算式進(jìn)行求解就實(shí)現(xiàn)重疊區(qū)的融合過渡。
2.3高斯一賽德爾方程求解
未知區(qū)域的每個象素點(diǎn)得到的計(jì)算式組合到一起,可以寫成UX=v的形式。由于系數(shù)U是對稱、稀疏的正定矩陣,因此可以用超松馳的高斯一塞德爾迭代方法(SOR)求解,迭代過程如下式所示:
對于兩個重疊區(qū)占到三分之一的640x480的圖像來說,每個未知區(qū)域通常會有50000
左右的象素,這樣就會得到一個U為50000x50000左右的超定方程組,顯然直接用SOR法計(jì)算占用空間太大,計(jì)算速度慢。
但是因?yàn)槊總€象素最多4個近鄰,所以上式的n個未知解中只存在4個未知數(shù)需要更新。假設(shè)圖像坐標(biāo)系原點(diǎn)在圖像的左下角,逐行逐列編號,則這4個數(shù)分別為編號小的左鄰和下鄰以及編號大的右鄰和上鄰。因此,假定第i個象素的下鄰和上鄰的編號分別s和t,結(jié)合前面式,可以將上式(簡化為:
這里表示第i象素的相鄰象素的個數(shù),即Np。上述簡化計(jì)算明顯加快計(jì)算速度,節(jié)約存儲空間。
3 結(jié)束語
本文提出基于圖切割的圖像拼接方法,這個方法利用圖切割查找出一條全局最佳縫合線,用泊松融合實(shí)現(xiàn)最終的合成。為提高圖切割的穩(wěn)定性,本文給出基于梯度方向直方圖統(tǒng)計(jì)的權(quán)值計(jì)算方法,通過計(jì)算每個象素點(diǎn)鄰域的梯度方向直方圖,將象素點(diǎn)的梯度強(qiáng)度和方向結(jié)合一起進(jìn)行權(quán)值計(jì)算,克服前人方法基于色彩強(qiáng)度或梯度強(qiáng)度的權(quán)值計(jì)算方法的不穩(wěn)定性,達(dá)到了較好的圖切割縫合線搜索。本文還設(shè)計(jì)重疊過渡的泊松融合方式,通過將重疊區(qū)劃分成兩個未知區(qū)域,分別定義實(shí)現(xiàn)平滑過渡過的邊界值,實(shí)現(xiàn)曝光差異的處理。
參考文獻(xiàn):
[1]梅春暉.基于預(yù)計(jì)算及采樣的實(shí)時高真實(shí)感圖像繪制技術(shù)研究,博士學(xué)位論文,浙江大學(xué),2004.
[2]漆馳,劉強(qiáng).等.攝像機(jī)序列的全景圖拼接,計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2001.
[3]阮宗才,梁棟.等.一種自動全景拼圖的快速算法,計(jì)算機(jī)研究與發(fā)展,2001.
[4]王立峰,潘志庚.全景圖像的拼合及優(yōu)化算法,計(jì)算機(jī)應(yīng)用研究,2006.
看了“圖像拼接技術(shù)論文”的人還看: