裸眼3d技術(shù)論文

時(shí)間：2017-02-07 14:41:44 家文952由分享

裸眼3d技術(shù)論文

　　裸眼3D技術(shù)具有數(shù)據(jù)量小、傳輸效率高、顯示內(nèi)容可自適應(yīng)調(diào)節(jié)，用戶交互性好等優(yōu)點(diǎn)。下面是學(xué)習(xí)啦小編整理了裸眼3d技術(shù)論文，有興趣的親可以來(lái)閱讀一下!

　　裸眼3d技術(shù)論文篇一

　　基于深度圖的多視點(diǎn)裸眼3D立體視頻技術(shù)研究

　　摘　要：3D立體視頻技術(shù)正引起越來(lái)越多的關(guān)注，但是目前絕大多數(shù)3D視頻系統(tǒng)需要佩戴特殊眼鏡才能夠觀看立體效果，或者要求觀看者必須從某個(gè)固定角度進(jìn)行觀看。而多視點(diǎn)裸眼3D立體視頻系統(tǒng)則可以避免以上兩點(diǎn)限制，得到最好的3D觀看體驗(yàn)。目前國(guó)際上最前沿的3D立體視頻研究集中在基于深度圖的多視點(diǎn)3D立體視頻技術(shù)上面，本文對(duì)基于深度圖的多視點(diǎn)裸眼3D立體視頻系統(tǒng)的幾個(gè)關(guān)鍵技術(shù)環(huán)節(jié)，包括深度圖提取、虛擬視點(diǎn)合成、多視點(diǎn)視頻合成等進(jìn)行了研究并進(jìn)行了相應(yīng)的仿真實(shí)驗(yàn)，從實(shí)驗(yàn)效果來(lái)看，基于深度圖的多視點(diǎn)裸眼3D立體視頻系統(tǒng)具有數(shù)據(jù)量小、傳輸效率高、顯示內(nèi)容可自適應(yīng)調(diào)節(jié)，用戶交互性好等優(yōu)點(diǎn)。

　　關(guān)鍵詞：裸眼3D立體視頻;深度圖;3DTV

　　目前3D立體視頻技術(shù)正引起越來(lái)越多人的關(guān)注，其中主流的3D技術(shù)主要包括雙目立體視頻(包含2個(gè)視點(diǎn)的視頻數(shù)據(jù))和多視點(diǎn)立體視頻(包含8個(gè)以上視點(diǎn)的視頻數(shù)據(jù))。雙目立體視頻又可分為配戴眼鏡觀看和雙目裸眼立體顯示兩種，其中前者必須佩帶偏振眼鏡，為觀看帶來(lái)了不便，后者則要求觀看者必須從固定的角度進(jìn)行觀看，當(dāng)有多人同時(shí)觀看同一塊顯示器時(shí)，因?yàn)槎鄶?shù)觀看者無(wú)法獲得最佳觀看位置從而大大影響觀看體驗(yàn)。而對(duì)于多視點(diǎn)立體視頻技術(shù)而言，由于同一塊裸眼3D立體顯示器上可同時(shí)提供多個(gè)視點(diǎn)的內(nèi)容，所以觀看者可以從任意自由的角度來(lái)觀看，極大地提升了觀看的便利性。所以多視點(diǎn)立體視頻已經(jīng)成為當(dāng)前技術(shù)研究的主流。但是，多視點(diǎn)立體視頻相對(duì)于雙目立體視頻而言數(shù)據(jù)量成倍增長(zhǎng)，為存儲(chǔ)和傳輸帶來(lái)了不便，而基于深度圖的多視點(diǎn)立體視頻技術(shù)具有數(shù)據(jù)量小的優(yōu)點(diǎn)，因而成為最有潛力的多視點(diǎn)立體視頻方案。本文深入研究了基于深度圖的多視點(diǎn)3D立體視頻技術(shù)中的若干關(guān)鍵技術(shù)環(huán)節(jié)，并進(jìn)行了相應(yīng)的仿真實(shí)驗(yàn)。本文的章節(jié)內(nèi)容安排如下：第2節(jié)介紹基于深度圖的多視點(diǎn)3D立體系統(tǒng)整體架構(gòu)，第3節(jié)介紹深度圖提取，第4節(jié)介紹虛擬視點(diǎn)生成，第5節(jié)介紹多視點(diǎn)視頻合成，第6節(jié)總結(jié)全文。

　　一、基于深度圖的多視點(diǎn)3D立體視頻系統(tǒng)框架

　　基于深度圖的多視點(diǎn)3D立體視頻系統(tǒng)的技術(shù)框架如圖1所示。首先需要進(jìn)行原始視頻序列的拍攝，雖然最終多視點(diǎn)裸眼立體顯示系統(tǒng)需要9個(gè)甚至更多的視點(diǎn)的視頻內(nèi)容，但是實(shí)際的原始視頻序列拍攝階段只需要拍攝2-3個(gè)視點(diǎn)的視頻即可，這是因?yàn)榛谏疃葓D的虛擬視點(diǎn)生成技術(shù)可以在解碼端通過(guò)2-3個(gè)視點(diǎn)的視頻生成多個(gè)視點(diǎn)(在本文中為9個(gè)視點(diǎn))的虛擬視點(diǎn)視頻，所以基于深度圖的多視點(diǎn)立體視頻技術(shù)具有數(shù)據(jù)量小，易傳輸?shù)膬?yōu)點(diǎn)，克服了多視點(diǎn)視頻數(shù)據(jù)量大的缺陷。

　　在原始視頻序列拍攝完成后需要進(jìn)行深度圖的提取和相機(jī)參數(shù)的計(jì)算，該步驟中提取的深度圖的質(zhì)量直接決定了后期生成虛擬視點(diǎn)視頻的質(zhì)量。完成以上步驟后則需進(jìn)行壓縮編碼并通過(guò)網(wǎng)絡(luò)傳輸?shù)浇獯a端，解碼端對(duì)數(shù)據(jù)進(jìn)行解碼后會(huì)進(jìn)行基于深度圖的虛擬視點(diǎn)生成，將原始的2-3個(gè)視點(diǎn)的視頻數(shù)據(jù)變成9個(gè)視點(diǎn)的視頻數(shù)據(jù)，獲得的9個(gè)視點(diǎn)的視頻數(shù)據(jù)還不能直接在多視點(diǎn)裸眼3D立體顯示器上面播放，必須針對(duì)該顯示器所使用的3D光柵結(jié)構(gòu)進(jìn)行多視點(diǎn)視頻合成。

　　本文的后續(xù)章節(jié)將會(huì)對(duì)深度圖提取、虛擬視點(diǎn)生成、多視點(diǎn)視頻合成三個(gè)環(huán)節(jié)進(jìn)行詳細(xì)介紹并進(jìn)行相應(yīng)的仿真實(shí)驗(yàn)。

　　二、深度圖提取

　　2.1　深度圖介紹

　　深度圖是一副灰度圖像(如圖2-b)，灰度值的范圍為0-255?；叶戎悼山Y(jié)合場(chǎng)景的景深信息進(jìn)行換算得到深度值，立體視頻系統(tǒng)的實(shí)際應(yīng)用中使用的是深度值。

　　深度圖上的像素是0-255的灰度值，前文提到過(guò)深度圖主要用于虛擬視點(diǎn)生成，在該過(guò)程中，我們用到的是實(shí)際的深度值，所以需要建立一個(gè)轉(zhuǎn)換關(guān)系，將深度圖中的像素灰度值換算為實(shí)際的深度值：

　　公式(1)中z就是我們?cè)谔摂M視點(diǎn)生成過(guò)程所需要的深度值，v表示圖2-b中的深度圖像中像素的灰度值，Znear和Zfar分別表示該視頻所拍攝的場(chǎng)景中的最近深度和最遠(yuǎn)深度，這兩個(gè)值需要在原始視頻序列的拍攝過(guò)程中進(jìn)行測(cè)定。

　　2.2　基于塊匹配的深度圖提取

　　用并排平行排列的兩臺(tái)相機(jī)拍攝同一場(chǎng)景，獲得兩幅圖像，要獲得其中一幅圖像的深度圖，需要用另一幅圖像來(lái)與之進(jìn)行像素配對(duì)，經(jīng)過(guò)像素點(diǎn)的配對(duì)匹配之后就會(huì)獲得該幅圖像每個(gè)像素點(diǎn)在兩幅圖像中間的視差，而深度值與視差值之間的關(guān)系如下：

　　其中z為我們要求的深度值，d為經(jīng)過(guò)像素匹配后得到的視差值，f為相機(jī)的焦距，b為兩臺(tái)相機(jī)之間的基線距離。所以有了視差值d之后就可以很容易的獲得深度值z(mì)。但是最關(guān)鍵的環(huán)節(jié)是獲得準(zhǔn)確的視差值，所以需要進(jìn)行精確的像素點(diǎn)匹配，但是實(shí)際上由于不同相機(jī)之間曝光參數(shù)的差異，即使拍攝的是同一場(chǎng)景，像素點(diǎn)之間依然存在亮度差異，所以我們采用了圖像塊匹配的辦法，在一定程度上提高了像素點(diǎn)匹配的魯棒性，在本文的試驗(yàn)中所使用的是3×3大小的圖像塊，必須指出的是，本文默認(rèn)拍攝原始視頻序列的是嚴(yán)格水平平行的兩臺(tái)相機(jī)，所以在進(jìn)行圖像塊的匹配時(shí)只進(jìn)行水平搜索而不進(jìn)行垂直搜索。整個(gè)深度圖提取過(guò)程如圖3所示。

　　對(duì)國(guó)際視頻標(biāo)準(zhǔn)制定組織MPEG提供的多視點(diǎn)視頻序列進(jìn)行實(shí)驗(yàn)提取的深度圖如圖4所示。

　　三、虛擬視點(diǎn)生成

　　虛擬視點(diǎn)生成技術(shù)[2]可以將左右視點(diǎn)中的像素投影到兩視點(diǎn)中間的任意位置，從而生成原本沒(méi)有被相機(jī)拍攝到的虛擬視點(diǎn)的視頻圖像(如圖5所示)，該生成過(guò)程需要用到左右兩個(gè)視點(diǎn)的深度圖以及相機(jī)參數(shù)。該技術(shù)主要用到了3D投影的算法，3D投影算法用于發(fā)現(xiàn)兩個(gè)圖像平面之間的對(duì)應(yīng)點(diǎn)，具體過(guò)程為將一個(gè)圖像平面上的點(diǎn)投影到3D世界坐標(biāo)系，然后再將該點(diǎn)從3D世界坐標(biāo)系投影到另一個(gè)圖像坐標(biāo)平面。

　　對(duì)于任一給定的點(diǎn)p0，坐標(biāo)為(u0，v0)，位于圖像平面V0。如果要找到改點(diǎn)在圖像平面V1的對(duì)應(yīng)點(diǎn)P1的坐標(biāo)(u1，v1)，那么整個(gè)3D投影過(guò)程應(yīng)按如下式所示進(jìn)行計(jì)算：

　　在這里，z是3D世界坐標(biāo)中的點(diǎn)沿著相機(jī)坐標(biāo)系的到相機(jī)的Z軸到相機(jī)的距離，P是對(duì)應(yīng)的投影矩陣。該投影矩陣P由相機(jī)的內(nèi)部矩陣K，旋轉(zhuǎn)矩陣R和平移矩陣T組成，具體P的描述如下所示：　　其中，K是3×3的上三角矩陣，由焦距f，傾斜參數(shù)?酌和虛擬相機(jī)位置上的理論點(diǎn)(u'，　v')組成。R和T描述了世界坐標(biāo)空間下的相機(jī)位置。

　　經(jīng)過(guò)以上步驟即可初步實(shí)現(xiàn)基于深度圖的視點(diǎn)合成。

　　四、多視點(diǎn)視頻合成

　　4.1　裸眼3D立體顯示原理

　　要使觀看者體驗(yàn)到3D立體效果，其核心的原理是使雙眼分別同時(shí)看到不同的畫面，從而獲得立體感，最簡(jiǎn)單的方法就是目前最為常見的佩帶特殊眼鏡，這樣可以強(qiáng)制控制兩眼所看到的內(nèi)容，但是該方案為觀看者帶來(lái)了極大的不便(特別是本身就戴眼鏡的觀眾)。本文使用的方案為裸眼3D立體顯示，主要實(shí)現(xiàn)途徑為在顯示器屏幕前增加視差柵欄，通過(guò)柵欄控制各像素光線的射出方向，使某些圖像僅射入左眼，某些圖像僅射入右眼，從而形成雙目視差，產(chǎn)生立體視覺(如圖6所示)。

　　4.2　多視點(diǎn)視頻合成

　　本文中所使用的裸眼3D視差柵欄結(jié)構(gòu)上更為復(fù)雜，可以通過(guò)其柵欄遮擋控制9個(gè)視點(diǎn)的圖像內(nèi)容，從而實(shí)現(xiàn)了在同一塊顯示器上同時(shí)顯示9個(gè)視點(diǎn)的圖像，雖然觀看者在同一時(shí)刻雙眼只能分別看到其中兩個(gè)視點(diǎn)的圖像從而獲得立體感，但9個(gè)視點(diǎn)的圖像使得顯示器的可觀看角度大大增加。為了配合9視點(diǎn)光柵柵欄的顯示，我們需要對(duì)9個(gè)視點(diǎn)圖像的RGB像素進(jìn)行重排列，重排列的順序如圖7所示。圖中的數(shù)字代表視點(diǎn)的編號(hào)，按圖中的順序?qū)?個(gè)視點(diǎn)圖像的RGB值重新組合排列，會(huì)得到一幅分辨率為原先每個(gè)視點(diǎn)圖像9倍大小的立體圖像，立體圖像可用于在多視點(diǎn)裸眼3D顯示器上播放。由9個(gè)視點(diǎn)圖像合成的立體圖像如圖8所示(該圖像只有在9視點(diǎn)裸眼柵欄式立體顯示器上才可以看到立體效果)。

　　結(jié)論

　　基于深度圖的多視點(diǎn)立體視頻技術(shù)是當(dāng)前3D立體視頻的研究熱點(diǎn)，該技術(shù)不需要佩帶特殊的3D立體視頻眼鏡，并且具有總數(shù)據(jù)量小、觀看可視角度大的優(yōu)點(diǎn)。本文深入研究了基于深度圖的多視點(diǎn)裸眼3D立體視頻系統(tǒng)的幾個(gè)關(guān)鍵技術(shù)環(huán)節(jié)，包括深度圖提取、虛擬視點(diǎn)合成、多視點(diǎn)視頻合成等進(jìn)行了研究并進(jìn)行了相應(yīng)的仿真實(shí)驗(yàn)。

　　參考文獻(xiàn)

　　[1]　Müller，　K.;　Merkle，　P.;　Wiegand，　T.;　，　"3-D　Video　Representation　Using　Depth　Maps，"　Proceedings　of　the　IEEE　，　vol.99，　no.4，　pp.643-656，　April　2011

　　[2]　Ndjiki-Nya，　P.;　Koppel，　M.;　Doshkov，　D.;　Lakshman，　H.;　Merkle，　P.;　Muller，　K.;　Wiegand，　T.;　，　"Depth　Image-Based　Rendering　With　Advanced　Texture　Synthesis　for　3-D　Video，"　Multimedia，　IEEE　Transactions　on　，　vol.13，　no.3，　pp.453-465，　June　2011

　　[3]　Muller，　K.;　Merkle，　P.;　，　"Challenges　in　3D　video　standardization，"　Visual　Communications　and　Image　Processing　(VCIP)，　2011　IEEE　，　vol.，　no.，　pp.1-4，　6-9　Nov.　2011

　　[4]　Sourimant，　G.;　，　"A　simple　and　efficient　way　to　compute　depth　maps　for　multi-view　videos，"　3DTV-Conference：The　True　Vision　-　Capture，　Transmission　and　Display　of　3D　Video　(3DTV-CON)，　2010　，　vol.，　no.，　pp.1-4，　7-9　June　2010

　　[5]　Hopf，　K.;　，　"An　autostereoscopic　display　providing　comfortable　viewing　conditions　and　a　high　degree　of　telepresence，"　Circuits　and　Systems　for　Video　Technology，　IEEE　Transactions　on　，　vol.10，　no.3，　pp.359-365，　Apr　2000

點(diǎn)擊下頁(yè)還有更多>>>裸眼3d技術(shù)論文

裸眼3d技術(shù)論文

裸眼3d技術(shù)論文篇一

相關(guān)文章

熱門文章