Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

本文作者： MarsCao

2018-10-24 11:44

導(dǎo)語(yǔ)：國(guó)內(nèi)對(duì)光場(chǎng)（Light Field）技術(shù)的中文介紹十分匱乏，《Mars說(shuō)光場(chǎng)》系列文章旨在對(duì)光場(chǎng)技術(shù)及其應(yīng)用的科普介紹。

雷鋒網(wǎng)按：光場(chǎng)技術(shù)是目前最受追捧的下一代顯示技術(shù)，谷歌、Facebook、Magic Leap等國(guó)內(nèi)外大公司都在大力布局。然而目前國(guó)內(nèi)對(duì)光場(chǎng)（Light Field）技術(shù)的中文介紹十分匱乏，曹煊博士《Mars說(shuō)光場(chǎng)》系列文章旨在對(duì)光場(chǎng)技術(shù)及其應(yīng)用的科普介紹。

曹煊博士系騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員。優(yōu)圖— 騰訊旗下頂級(jí)的機(jī)器學(xué)習(xí)研發(fā)團(tuán)隊(duì)，專(zhuān)注于圖像處理、模式識(shí)別、深度學(xué)習(xí)。在人臉識(shí)別、圖像識(shí)別、醫(yī)療AI、OCR、哼唱識(shí)別、語(yǔ)音合成等領(lǐng)域都積累了領(lǐng)先的技術(shù)水平和完整解決方案。

《Mars說(shuō)光場(chǎng)》系列文章目前已有5篇，包括：

《Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)》；

《Mars說(shuō)光場(chǎng)（2）— 光場(chǎng)與人眼立體成像機(jī)理》；

《Mars說(shuō)光場(chǎng)（3）— 光場(chǎng)采集》；

《Mars說(shuō)光場(chǎng)（4）— 光場(chǎng)顯示》；

《Mars說(shuō)光場(chǎng)（5）— 光場(chǎng)在三維人臉建模中的應(yīng)用》；

雷鋒網(wǎng)經(jīng)授權(quán)發(fā)布。

【摘要】 — 光場(chǎng)（Light Field）是空間中光線(xiàn)集合的完備表示，采集并顯示光場(chǎng)就能在視覺(jué)上重現(xiàn)真實(shí)世界。全光函數(shù)（Plenoptic Function）包含7個(gè)維度，是表示光場(chǎng)的數(shù)學(xué)模型。光場(chǎng)是以人眼為中心對(duì)光線(xiàn)集合進(jìn)行描述。由于光路是可逆的，以發(fā)光表面為中心來(lái)描述光線(xiàn)集合衍生出與光場(chǎng)類(lèi)似的概念——反射場(chǎng)（Reflectance Field）。反射場(chǎng)也具有7個(gè)維度的信息，但每個(gè)維度的定義與光場(chǎng)不盡相同。不論光場(chǎng)還是反射場(chǎng)，由于7個(gè)維度的信息會(huì)急劇增加采集、處理、傳輸?shù)呢?fù)擔(dān)，因此實(shí)際應(yīng)用中更多的是采用4D光場(chǎng)模型。隨著Magic Leap One的上市，以及Google《Welcome to light field》在Steam上發(fā)布，光場(chǎng)作為下一代成像/呈像技術(shù)，受到越來(lái)越多的關(guān)注。本文將詳細(xì)介紹光場(chǎng)的基本概念，尤其是4D光場(chǎng)成像相比傳統(tǒng)成像的優(yōu)勢(shì)。

1、什么是光場(chǎng)？

在人類(lèi)的五大感知途徑中，視覺(jué)占據(jù)了70%~80%的信息來(lái)源；而大腦有大約50%的能力都用于處理視覺(jué)信息[1]。借助視覺(jué)，我們能準(zhǔn)確抓取杯子，能在行走中快速躲避障礙物，能自如地駕駛汽車(chē)，能完成復(fù)雜的裝配工作。從日常行為到復(fù)雜操作都高度依賴(lài)于我們的視覺(jué)感知。然而，現(xiàn)有的圖像采集和顯示丟失了多個(gè)維度的視覺(jué)信息。這迫使我們只能通過(guò)二維“窗口”去觀察三維世界。例如醫(yī)生借助單攝像頭內(nèi)窺鏡進(jìn)行腹腔手術(shù)時(shí)，因無(wú)法判斷腫瘤的深度位置，從而需要從多個(gè)角度多次觀察才能緩慢地下刀切割。從光場(chǎng)成像的角度可以解釋為：因?yàn)槿狈﹄p目視差，只能依靠移動(dòng)視差來(lái)產(chǎn)生立體視覺(jué)。再例如遠(yuǎn)程機(jī)械操作人員通過(guò)觀看監(jiān)視器平面圖像進(jìn)行機(jī)械遙控操作時(shí)，操作的準(zhǔn)確性和效率都遠(yuǎn)遠(yuǎn)低于現(xiàn)場(chǎng)操作。

人眼能看見(jiàn)世界中的物體是因?yàn)槿搜劢邮樟宋矬w發(fā)出的光線(xiàn)（主動(dòng)或被動(dòng)發(fā)光），而光場(chǎng)就是三維世界中光線(xiàn)集合的完備表示。“Light Field”這一術(shù)語(yǔ)最早出現(xiàn)在Alexander Gershun于1936年在莫斯科發(fā)表的一篇經(jīng)典文章中，后來(lái)由美國(guó)MIT的Parry Moon和Gregory Timoshenko在1939年翻譯為英文[2]。但Gershun提出的“光場(chǎng)”概念主要是指空間中光的輻射可以表示為關(guān)于空間位置的三維向量，這與當(dāng)前“計(jì)算成像”、“裸眼3D”等技術(shù)中提及的光場(chǎng)不是同一個(gè)概念。學(xué)術(shù)界普遍認(rèn)為Parry Moon在1981年提出的“Photic Field”[3]才是當(dāng)前學(xué)術(shù)界所研究的“光場(chǎng)”。隨后，光場(chǎng)技術(shù)受到MIT、Stanford等一些頂級(jí)研究機(jī)構(gòu)的關(guān)注，其理論逐步得到完善，多位相關(guān)領(lǐng)域?qū)W者著書(shū)立作逐步將光場(chǎng)技術(shù)形成統(tǒng)一的理論體系，尤其是在光場(chǎng)的采集[4]和3D顯示[5,6]兩個(gè)方面。歐美等部分高校還開(kāi)設(shè)了專(zhuān)門(mén)的課程——計(jì)算攝像學(xué)（Computational Photography）。

如圖1所示，人眼位于三維世界中不同的位置進(jìn)行觀察所看到的圖像不同，用（x, y, z）表示人眼在三維空間中的位置坐標(biāo)。光線(xiàn)可以從不同的角度進(jìn)入人眼，用（θ, Φ）表示進(jìn)入人眼光線(xiàn)的水平夾角和垂直夾角。每條光線(xiàn)具有不同的顏色和亮度，可以用光線(xiàn)的波長(zhǎng)（λ）來(lái)統(tǒng)一表示。進(jìn)入人眼的光線(xiàn)隨著時(shí)間（t）的推移會(huì)發(fā)生變化。因此三維世界中的光線(xiàn)可以表示為7個(gè)維度的全光函數(shù)（Plenoptic Function, Plen-前綴具有“全能的、萬(wàn)金油”的意思）[7]。

P(x, y, z, θ, Φ, λ, t)

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 1. 7D全光函數(shù)示意圖

上述光場(chǎng)的描述是以人眼為中心。光路是可逆的，因此光場(chǎng)也可以以物體為中心等效的描述。與“光場(chǎng)”相類(lèi)似的另一個(gè)概念是“反射場(chǎng)（Reflectance Field）”。如圖2所示，物體表面發(fā)光點(diǎn)的位置可以用（x, y, z）三個(gè)維度來(lái)表示；對(duì)于物體表面的一個(gè)發(fā)光點(diǎn)，總是向180度半球范圍內(nèi)發(fā)光，其發(fā)光方向可以用水平角度和垂直角度（θ, Φ）來(lái)表示；發(fā)出光線(xiàn)的波長(zhǎng)表示為（λ）；物體表面的光線(xiàn)隨著時(shí)間（t）的推移會(huì)發(fā)生變化。同理，反射場(chǎng)可以等效表示為7維函數(shù)，但其中的維度卻表示不同的意義。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 2. 7D反射場(chǎng)示意圖

對(duì)比光場(chǎng)與反射場(chǎng)可以發(fā)現(xiàn)：光場(chǎng)與反射場(chǎng)都可以用7個(gè)維度來(lái)表征，光場(chǎng)是以人眼為中心描述空間中所有的光線(xiàn)，反射場(chǎng)是以物體表面發(fā)光點(diǎn)為中心描述空間中所有的光線(xiàn)。光場(chǎng)所描述的光線(xiàn)集合與反射場(chǎng)所描述的光線(xiàn)集合是完全一致的。換句話(huà)說(shuō)，光場(chǎng)中的任一條光線(xiàn)都可以在反射場(chǎng)中找到。

2、為什么要研究光場(chǎng)？

【從光場(chǎng)采集的角度來(lái)看】以自動(dòng)駕駛為例，首先需要通過(guò)多種傳感器去“感知”外界信息，然后通過(guò)類(lèi)腦運(yùn)算進(jìn)行“決策”，最后將決策以機(jī)械結(jié)構(gòu)為載體進(jìn)行“執(zhí)行”?，F(xiàn)階段人工智能的發(fā)展更傾向于“類(lèi)腦”的研究，即如何使計(jì)算機(jī)具有人腦類(lèi)似的決策能力。然而卻忽略了“眼睛”作為一種信息感知入口的重要性。設(shè)想一個(gè)人非?！奥斆鳌钡且暳τ姓系K，那么他將無(wú)法自如的駕駛汽車(chē)。而自動(dòng)駕駛正面臨著類(lèi)似的問(wèn)題。如果攝像機(jī)能采集到7個(gè)維度所有的信息，那么就能保證視覺(jué)輸入信息的完備性，而“聰明”的大腦才有可能發(fā)揮到極致水平。研究光場(chǎng)采集將有助于機(jī)器看到更多維度的視覺(jué)信息。

【從光場(chǎng)的顯示角度來(lái)看】以L(fǎng)CD/OLED顯示屏為例，顯示媒介只能呈現(xiàn)光場(chǎng)中（x, y, λ, t）四個(gè)維度的信息，而丟失了其他三個(gè)維度的信息。在海陸空軍事沙盤(pán)、遠(yuǎn)程手術(shù)等高度依賴(lài)3D視覺(jué)的場(chǎng)景中，傳統(tǒng)的2D顯示媒介完全不能達(dá)到期望的效果。實(shí)現(xiàn)類(lèi)似《阿凡達(dá)》中的全息3D顯示，是人類(lèi)長(zhǎng)久以來(lái)的一個(gè)夢(mèng)想。當(dāng)光場(chǎng)顯示的角度分辨率和視點(diǎn)圖像分辨率足夠高時(shí)可以等效為動(dòng)態(tài)數(shù)字彩色全息。研究光場(chǎng)顯示將有助于人類(lèi)看到更多維度的視覺(jué)信息。

從1826全世界第一臺(tái)相機(jī)誕生[8]至今已經(jīng)有近兩百年歷史，但其成像原理仍然沒(méi)有擺脫小孔成像模型。在介紹小孔成像模型之前，先看看如果直接用成像傳感器（e.g. CCD）采集圖像會(huì)發(fā)生什么事呢？如圖3所示，物體表面A、B、C三點(diǎn)都在向半球180度范圍內(nèi)發(fā)出光線(xiàn)，對(duì)于CCD上的感光像素A'會(huì)同時(shí)接收到來(lái)自A、B、C三點(diǎn)的光線(xiàn)，因此A'點(diǎn)的像素值近似為物體表面上A、B、C三點(diǎn)的平均值。類(lèi)似的情況也會(huì)發(fā)生在CCD上的B'和C'點(diǎn)的像素。因此，如果把相機(jī)上的鏡頭去掉，那么拍攝的圖片將是噪聲圖像。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 3. 無(wú)小孔的噪聲成像

如果在CCD之前加一個(gè)小孔，那么就能正常成像了，如圖4所示。CCD上A'點(diǎn)只接收到來(lái)自物體表面A點(diǎn)的光線(xiàn)。類(lèi)似的，CCD上B'和C'點(diǎn)也相應(yīng)只接收到物體表面B點(diǎn)和C的點(diǎn)光線(xiàn)。因此，在CCD上可以成倒立的像。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 4. 小孔成像

實(shí)際的相機(jī)并沒(méi)有采用如圖4中的理想小孔成像模型，因?yàn)樾】字睆捷^小會(huì)導(dǎo)致通光亮非常小，信噪比非常低，成像傳感器無(wú)法采集到有效的信號(hào)；如果小孔直徑足夠小，當(dāng)與光波長(zhǎng)相當(dāng)時(shí)還會(huì)產(chǎn)生衍射現(xiàn)象。而小孔直徑過(guò)大會(huì)導(dǎo)致成像模糊?，F(xiàn)代的成像設(shè)備用透鏡來(lái)替代小孔，從而既能保證足夠的通光量，又避免了成像模糊。如圖5所示，物體表面A點(diǎn)在一定角度范圍內(nèi)發(fā)出的光線(xiàn)經(jīng)過(guò)透鏡聚焦在成像傳感器A’點(diǎn)，并對(duì)該角度范圍內(nèi)所有光線(xiàn)進(jìn)行積分，積分結(jié)果作為A點(diǎn)像素值。這大大增加了成像的信噪比，但同時(shí)也將A點(diǎn)在該角度范圍內(nèi)各方向的光線(xiàn)耦合在一起。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 5. 透鏡小孔成像

小孔成像模型是光場(chǎng)成像的一種降維形式，只采集了（x, y, λ, t）四個(gè)維度的信息。RGB-D相機(jī)多了一個(gè)維度信息（x, y, z, λ, t）。相比全光函數(shù)，其主要丟失的維度信息是光線(xiàn)的方向信息（θ, Φ）。缺失的維度信息造成了現(xiàn)有成像/呈像設(shè)備普遍存在的一系列問(wèn)題。在圖像采集方面，可以通過(guò)調(diào)節(jié)焦距來(lái)選擇聚焦平面，然而無(wú)論如何調(diào)節(jié)都只能確保一個(gè)平面清晰成像，而太近或太遠(yuǎn)的物體都會(huì)成像模糊，這給大場(chǎng)景下的AI識(shí)別任務(wù)造成了極度的挑戰(zhàn)。在渲染顯示方面，由于（θ, Φ）維度信息的缺失會(huì)引起渲染物體缺乏各向異性的光線(xiàn)，從而顯得不夠逼真。好萊塢電影大片中渲染的逼真人物大多采用了光場(chǎng)/反射場(chǎng)這一技術(shù)才得以使得各種科幻的飛禽走獸能栩栩如生。

3、光場(chǎng)4D參數(shù)化

根據(jù)7D全光函數(shù)的描述，如果有一個(gè)體積可以忽略不計(jì)的小球能夠記錄從不同角度穿過(guò)該小球的所有光線(xiàn)的波長(zhǎng)，把該小球放置在某個(gè)有限空間中所有可以達(dá)到的位置并記錄光線(xiàn)波長(zhǎng)，那么就可以得到這個(gè)有限空間中某一時(shí)刻所有光線(xiàn)的集合。在不同時(shí)刻重復(fù)上述過(guò)程，就可以實(shí)現(xiàn)7D全函數(shù)的完備采集。Google Daydream平臺(tái)Paul Debevec團(tuán)隊(duì)在Steam平臺(tái)上推出的《Welcome To Light Field》就是采用了類(lèi)似的思想實(shí)現(xiàn)的。然而，采集的數(shù)據(jù)量巨大。按照當(dāng)前的計(jì)算機(jī)技術(shù)水平，難以對(duì)7D光場(chǎng)這么龐大的數(shù)據(jù)進(jìn)行實(shí)時(shí)處理和傳輸。因此有必要對(duì)7D光場(chǎng)進(jìn)行簡(jiǎn)化降維。

如圖6所示，美國(guó)斯坦福大學(xué)的Marc Levoy將全光函數(shù)簡(jiǎn)化降維，提出（u,v,s,t）4D光場(chǎng)模型[9]。Levoy假設(shè)了兩個(gè)不共面的平面（u,v）和（s,t），如果一條光線(xiàn)與這兩個(gè)平面各有一個(gè)交點(diǎn)，則該光線(xiàn)可以用這兩個(gè)交點(diǎn)唯一表示。Levoy提出的光場(chǎng)4D模型有一個(gè)重要的前提假設(shè)：在沿光線(xiàn)傳播方向上的任意位置采集到的光線(xiàn)是一樣的。換句話(huà)說(shuō)，假設(shè)任意一條光線(xiàn)在傳播的過(guò)程中光強(qiáng)不發(fā)生衰減且波長(zhǎng)不變?？紤]到日常生活中光線(xiàn)從場(chǎng)景表面到人眼的傳播距離非常有限，光線(xiàn)在空氣中的衰減微乎其微，上述Levoy提出的假設(shè)完全合理。

Levoy提出的光場(chǎng)4D模型并不能完備地描述三維空間中所有的光線(xiàn)，與（u,v）或（s,t）平面所平行的光線(xiàn)就不能被該4D模型所表示，例如圖6中紅色標(biāo)示的光線(xiàn)。盡管Levoy提出的4D模型不能完備描述三維空間中所有的光線(xiàn)，但可以完備描述人眼接收到的光線(xiàn)。因?yàn)楫?dāng)光線(xiàn)與人眼前視方向垂直時(shí)，該光線(xiàn)不會(huì)進(jìn)入人眼。因此，這部分光線(xiàn)并不影響人眼視覺(jué)成像。Levoy提出的4D模型既降低了表示光場(chǎng)所需的維度，同時(shí)又能完備表示人眼成像所需要的全部光線(xiàn)。光場(chǎng)4D模型得到了學(xué)術(shù)界的廣泛認(rèn)可，關(guān)于光場(chǎng)的大量研究都是在此基礎(chǔ)上展開(kāi)。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 6. 4D光場(chǎng)模型

4D光場(chǎng)模型具有可逆性，既能表示光場(chǎng)采集，又能表示光場(chǎng)顯示。如圖7所示，對(duì)于光場(chǎng)采集模型，右側(cè)物體發(fā)出的光線(xiàn)經(jīng)過(guò)（s,t）和（u,v）平面的4D參數(shù)化表示，被記錄成4D光場(chǎng)。對(duì)于光場(chǎng)顯示模型，經(jīng)過(guò)（u,v）和（s,t）平面的調(diào)制可以模擬出左側(cè)物體表面的光線(xiàn)，從而使人眼“看見(jiàn)”并不存在的物體。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 7. 4D光場(chǎng)模型的可逆性

如圖8所示，物體表面A、B、C三點(diǎn)發(fā)出的光線(xiàn)首先到達(dá)（u,v）平面，假設(shè)（u,v）平面上有三個(gè)小孔h1、h2、h3，則A、B、C三點(diǎn)發(fā)出的光線(xiàn)經(jīng)三個(gè)小孔分別到達(dá)（s,t）平面。A、B、C三點(diǎn)在半球范圍內(nèi)三個(gè)不同方向的光線(xiàn)被同時(shí)記錄下來(lái)，例如A點(diǎn)三個(gè)方向的光線(xiàn)分別被（s,t）平面上A3’、B3’、C3’記錄。如果（u,v）平面上小孔數(shù)量更多，且（s,t）平面上的像素足夠密集，則可以采集到空間中更多方向的光線(xiàn)。需要說(shuō)明的是，圖8中展示的是（u,v）（s,t）光場(chǎng)采集模型在垂直方向上的切面圖，實(shí)際上可以采集到A、B、C三點(diǎn)9個(gè)不同方向（3x3）的光線(xiàn)。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 8. 4D光場(chǎng)采集空間光線(xiàn)示意圖

圖像分辨率和FOV（Field Of View）是傳統(tǒng)相機(jī)成像性能的主要指標(biāo)。衡量4D光場(chǎng)的指標(biāo)不僅有圖像分辨率和FOV，還有角度分辨率和FOP（Field Of Parallax）。圖9展示了基于微透鏡陣列的光場(chǎng)相機(jī)的光路示意圖，物體表面發(fā)出的光線(xiàn)進(jìn)入相機(jī)光圈，然后被解耦和并分別被記錄下來(lái)。以B點(diǎn)為例，發(fā)光點(diǎn)B在半球范圍內(nèi)發(fā)出各向異性的光線(xiàn)，但并不是所有的光線(xiàn)都進(jìn)入相機(jī)光圈，只有一定角度內(nèi)的光線(xiàn)被成功采集，被光場(chǎng)相機(jī)采集到的光線(xiàn)的角度范圍決定了能夠觀察的最大視差范圍，我們記這個(gè)角度為FOP。換句話(huà)說(shuō)，圖9中光場(chǎng)相機(jī)只能采集到B點(diǎn)FOP角度范圍內(nèi)的光線(xiàn)。但FOP的大小隨著發(fā)光點(diǎn)與光場(chǎng)相機(jī)的距離遠(yuǎn)近而不同，因此通常采用基線(xiàn)的長(zhǎng)度來(lái)衡量FOP的大小，圖9中主鏡頭的光圈直徑等效為基線(xiàn)長(zhǎng)度。

圖9中B點(diǎn)在FOP角度范圍內(nèi)的光線(xiàn)被微透鏡分成4x4束光線(xiàn)，光場(chǎng)相機(jī)的角度分辨率即為4x4，光場(chǎng)相機(jī)的角度分辨率表征了一個(gè)發(fā)光點(diǎn)在FOP角度范圍內(nèi)的光線(xiàn)被離散化的程度。而基于小孔成像模型相機(jī)的角度分辨率始終為1x1。光場(chǎng)的視點(diǎn)圖像分辨率同樣表征了被采集場(chǎng)景表面離散化程度，成像傳感器分辨率除以角度分辨率即為視點(diǎn)圖像分辨率。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 9. 透鏡陣列4D光場(chǎng)的圖像分辨率和角度分辨率

基于相機(jī)陣列的光場(chǎng)相機(jī)同樣可以用視點(diǎn)圖像分辨率、角度分辨率、FOV、FOP四個(gè)參數(shù)來(lái)衡量光場(chǎng)相機(jī)的各方面性能。如圖10所示為4x4相機(jī)陣列，B點(diǎn)半球范圍內(nèi)發(fā)出的光線(xiàn)中FOP角度范圍內(nèi)的光線(xiàn)被相機(jī)陣列分成4x4束并分別被采集。相機(jī)的個(gè)數(shù)4x4即為角度分辨率，單個(gè)相機(jī)成像傳感器的分辨率即為視點(diǎn)圖像分辨率。所有相機(jī)FOV的交集可以等效為光場(chǎng)相機(jī)的FOV?；谙鄼C(jī)陣列的光場(chǎng)相機(jī)的基線(xiàn)長(zhǎng)度為兩端相機(jī)光心之間的距離。一般而言，基于相機(jī)陣列的光場(chǎng)相機(jī)比基于微透鏡陣列的光場(chǎng)相機(jī)具有更長(zhǎng)的基線(xiàn)，也就具有更大的FOP角度。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 10. 相機(jī)陣列4D光場(chǎng)的圖像分辨率和角度分辨率

4、光場(chǎng)4D可視化

4D光場(chǎng)數(shù)據(jù)可以表示為（Vx, Vy, Rx, Ry），其中（Vx, Vy）表征了角度分辨率，表示有Vx*Vy個(gè)視點(diǎn)（View）圖像；（Rx, Ry）表征視點(diǎn)圖像分辨率，表示單個(gè)視點(diǎn)圖像的分辨率為Rx*Ry。如圖11中上側(cè)圖展示了7x7光場(chǎng)的可視化，表示共有49個(gè)視點(diǎn)圖像，每個(gè)視點(diǎn)的圖像分辨率為384x512。視點(diǎn)圖像分辨率越高，包含的細(xì)節(jié)越多。角度分辨率越高，單位角度內(nèi)視點(diǎn)數(shù)量越多，視差過(guò)度就越平滑。角度分辨率越低，視點(diǎn)就越稀疏，觀看光場(chǎng)時(shí)視點(diǎn)跳躍感越明顯。假設(shè)在10度的可視角度內(nèi)水平方向上包含了7個(gè)視點(diǎn)，相鄰視點(diǎn)間的角度為1.67度，在2米的觀看距離，相鄰兩個(gè)視點(diǎn)的水平距離為29毫米。當(dāng)視點(diǎn)個(gè)數(shù)減少，相鄰視點(diǎn)的空間距離變大，觀看者移動(dòng)觀看位置時(shí)就會(huì)感到明顯的視點(diǎn)跳躍。

光場(chǎng)中任意兩個(gè)視點(diǎn)間都存在視差，將光場(chǎng)（Vx, Vy, Rx, Ry）中的部分視點(diǎn)圖像放大，如圖11中下側(cè)所示；同一行所有視點(diǎn)圖像之間只有水平視差，沒(méi)有垂直視差；同一列所有視點(diǎn)圖像之間只有垂直視差，沒(méi)有水平視差。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 11. 光場(chǎng)角度分辨率和視點(diǎn)分辨率可視化分析

光場(chǎng)作為高維數(shù)據(jù)，不便于可視化分析。為了更好的分析光場(chǎng)中的視差，往往將光場(chǎng)中某一個(gè)水平/垂直視點(diǎn)上所有圖像的同一行/列像素堆成一幅2D圖像，稱(chēng)之為光場(chǎng)切片數(shù)據(jù)（Light Field Slice）。光場(chǎng)切片圖像可以將光場(chǎng)中的水平視差和垂直視差可視化，便于直觀分析。如圖12中藍(lán)色線(xiàn)條所在的行像素堆疊后就形成了圖12中下側(cè)的光場(chǎng)切片圖像。類(lèi)似的，如圖11中將光場(chǎng)中同一垂直視點(diǎn)上所有綠色線(xiàn)條所在的列像素堆疊后就形成了圖11中右側(cè)的光場(chǎng)切片圖像。

Mars說(shuō)光場(chǎng)（1）— 為何巨頭紛紛布局光場(chǎng)技術(shù)

圖 12. 光場(chǎng)切片圖例

5、光場(chǎng)技術(shù)展望

從全世界光場(chǎng)技術(shù)的發(fā)展趨勢(shì)來(lái)看，美國(guó)硅谷的科技巨頭爭(zhēng)相布局和儲(chǔ)備光場(chǎng)技術(shù)，有些甚至已經(jīng)出現(xiàn)了Demo應(yīng)用。在光場(chǎng)的采集方面，例如Google在Steam平臺(tái)上發(fā)布的《Welcome to Light Field》、Lytro光場(chǎng)相機(jī)。在光場(chǎng)顯示方面，例如Magic Leap采用的兩層離散光場(chǎng)顯示技術(shù)、NVIDIA發(fā)布的近眼光場(chǎng)顯示眼鏡、Facebook旗下Oculus的道格拉斯?蘭曼團(tuán)隊(duì)正在研發(fā)的光場(chǎng)VR頭盔。

光場(chǎng)技術(shù)的研究主要分為兩大方面，包括光場(chǎng)采集和光場(chǎng)顯示。光場(chǎng)采集技術(shù)相對(duì)更成熟，在某些To B領(lǐng)域已經(jīng)基本達(dá)到可以落地使用的程度。光場(chǎng)采集主要是提供3D數(shù)字內(nèi)容，一次采集可以推廣使用，這并不要求由個(gè)體消費(fèi)者來(lái)完成，一般都是由一個(gè)團(tuán)隊(duì)來(lái)完成。因此對(duì)于光場(chǎng)采集系統(tǒng)的硬件成本、體積、功耗有更大的可接受度。相比之下，光場(chǎng)顯示是偏向To C的產(chǎn)品，個(gè)體用戶(hù)在成本、體積、功耗、舒適度等多方面都極度挑剔。光場(chǎng)顯示在多個(gè)高校和科研機(jī)構(gòu)已經(jīng)完成了原形樣機(jī)的開(kāi)發(fā)，在通往商業(yè)化實(shí)用的道路上，目前最大的挑戰(zhàn)就在于光場(chǎng)顯示設(shè)備的小型化和低功耗。

Magic Leap One的推出似乎并沒(méi)有達(dá)到消費(fèi)者原本對(duì)它的期待，這其中的差距是可以解釋的。是否具備光場(chǎng)顯示對(duì)于VR/AR頭盔來(lái)說(shuō)最大的區(qū)別是能否解決VAC (Vergence–Accommodation Conflicts) 問(wèn)題，關(guān)于VAC的解釋具體可參見(jiàn)《Mars說(shuō)光場(chǎng)（2）— 光場(chǎng)與人眼立體成像機(jī)理》。當(dāng)前的VR/AR頭盔只有一層呈像平面，會(huì)引起頭暈、近視等VAC問(wèn)題。當(dāng)光場(chǎng)VR/AR頭盔中呈現(xiàn)無(wú)窮多層不同距離上的呈像平面時(shí)，VAC的問(wèn)題就會(huì)得到完美解決。然而在可預(yù)見(jiàn)的未來(lái)，實(shí)現(xiàn)無(wú)窮多層呈像平面的光場(chǎng)顯示技術(shù)是不現(xiàn)實(shí)的。換句話(huà)說(shuō)，在可預(yù)見(jiàn)的未來(lái)，讓個(gè)體消費(fèi)者能使用上100%完美理想的光場(chǎng)顯示設(shè)備，這本來(lái)就是一個(gè)不切實(shí)際的目標(biāo)。因此只能盡量增加光場(chǎng)中呈像平面的層數(shù)，VAC的問(wèn)題隨著呈像層數(shù)的增加就會(huì)得到越發(fā)明顯的改善。當(dāng)呈像層數(shù)達(dá)到一定數(shù)量以后，人眼已經(jīng)無(wú)法明顯感受到VAC。就像手機(jī)屏幕的分辨率達(dá)到一定密度以后，雖然仍是由離散的像素點(diǎn)構(gòu)成，但人眼已經(jīng)無(wú)法分辨。因此，并不需要刻意追求無(wú)窮多層可連續(xù)聚焦的光場(chǎng)顯示。

在Magic Leap One上市之前，所有商業(yè)化的顯示設(shè)備都是在追求分辨率、色彩還原度等指標(biāo)的提升，而從來(lái)沒(méi)有顯示維度的突破。Magic Leap One是目前全世界范圍內(nèi)第一款具有大于1層呈像平面的商業(yè)化頭戴顯示設(shè)備。Magic Leap One的2層呈像平面相比HoloLens的1層呈像平面在視覺(jué)體驗(yàn)上并不會(huì)帶來(lái)明顯的改善，但是在對(duì)長(zhǎng)期佩戴所引起的疲勞、不適、近視等問(wèn)題是會(huì)有所改善的。然而用戶(hù)對(duì)此并不買(mǎi)賬，可以解釋為三方面的原因：（1）目前VR/AR設(shè)備的用戶(hù)使用時(shí)間本來(lái)就很短，用戶(hù)對(duì)于緩解疲勞等隱性的改善沒(méi)有立即直觀的體驗(yàn)，這些隱性的改善往往會(huì)被忽略。（2）現(xiàn)代消費(fèi)人群沒(méi)有體驗(yàn)過(guò)黑白電視和CRT顯示器，在新興消費(fèi)人群中1080P、全彩色、無(wú)色差等是他們對(duì)顯示設(shè)備的底線(xiàn)要求，而且這種底線(xiàn)還在逐年提高。當(dāng)Magic Leap One上市時(shí)，一旦分辨率或色彩還原度低于消費(fèi)者能接受的底線(xiàn)，縱然光場(chǎng)顯示帶來(lái)了其他的隱性改善，但消費(fèi)者會(huì)在第一印象中產(chǎn)生抗拒情緒。相比手機(jī)的高質(zhì)量顯示，Magic Leap One和HoloLens在顯示的質(zhì)量上都有所退化，對(duì)于已經(jīng)習(xí)慣2K的用戶(hù)而言，很難接受這樣的顯示質(zhì)量退化。（3）Magic Leap One的呈像平面從1層增加到2層，這并代表其視覺(jué)體驗(yàn)就能改善2倍。只有當(dāng)呈像平面達(dá)到一定數(shù)量以后，人眼才能感覺(jué)到視覺(jué)呈像質(zhì)量的明顯改善。

盡管Magic Leap的2層光場(chǎng)顯示并沒(méi)有得到用戶(hù)的高度認(rèn)可，但它在顯示的維度上實(shí)現(xiàn)了0到1的突破。光場(chǎng)顯示層數(shù)能夠從單層增加到2層，這是光場(chǎng)顯示技術(shù)商業(yè)化的良好開(kāi)端，后續(xù)從2層增加到10層甚至20層只是時(shí)間的問(wèn)題了?；仡櫴謾C(jī)發(fā)展歷史，手機(jī)顯示經(jīng)歷了從大哥大時(shí)代的單行黑白屏到現(xiàn)在iPhone X約2K全彩顯示屏。我相信目前光場(chǎng)顯示設(shè)備就像30年前的大哥大一樣，正處于黎明前的黑暗，必然還需要經(jīng)歷多次的進(jìn)化。一旦成功，其最終光場(chǎng)顯示的效果相對(duì)目前的智能手機(jī)來(lái)說(shuō)將會(huì)是革命性的進(jìn)步。

[1] E. N. Marieb and K. N. Hoehn, Human Anatomy & Physiology (Pearson, 2012).

[2] A. Gershun, “The light field,” Moscow, 1936, P. Moon and G. Timoshenko, translators, J. Math. Phys. XVIII, 51–151 (1939).

[3] Moon P, Spencer D E. The photic field[J]. Cambridge Ma Mit Press P, 1981, 1.

[4] Zhang C, Chen T. Light Field Sampling[J]. Synthesis Lectures on Image Video & Multimedia Processing, 2006(1):102.

[5] Javidi B, Okano F. Three-Dimensional Television, Video, and Display Technology[J]. Materials Today, 2003, 6(2):50.

[6] Ozaktas H M, Onural L. Three-Dimensional Television: Capture, Transmission, Display[J]. Thomas Telford, 2008, 2(1):487 - 488.

[7] E. Adelson and J. Bergen, “The plenoptic function and the elements of early vision,” in Computational Models of Visual Processing (MIT, 1991), pp. 3–20.

[8] Todd Gustavson, George Eastman House. Camera: A history of photography from daguerreotype to digital[M]. Sterling Innovation, 2012.

[9] M. Levoy and P. Hanrahan, Light field rendering[C]. Proceedings of ACM SIGGRAPH, 1996.

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

29人收藏

相關(guān)文章

MarsCao

知情人士

發(fā)私信

當(dāng)月熱門(mén)文章