DeepFocus是一種基于AI的渲染系統(tǒng),用于在VR中渲染自然逼真的人眼聚焦效果。本文來自Facebook工程博客,LiveVideoStack進(jìn)行了翻譯。感謝阿里巴巴高級(jí)算法專家盛驍杰提供的技術(shù)審校。
研究?jī)?nèi)容:
一種新的基于AI的框架,用于在VR中渲染自然逼真的人眼聚焦效果。DeepFocus可與高級(jí)原型頭盔配合使用,在不同的焦距實(shí)時(shí)渲染模糊效果。例如,當(dāng)有人戴著支持DeepFocus的設(shè)備觀看附近的一個(gè)物體時(shí),它會(huì)立即聚焦并變得清晰,而背景物體則會(huì)像在現(xiàn)實(shí)生活中一樣,呈現(xiàn)出失焦模糊效果。這種失焦模糊(也稱為視網(wǎng)膜模糊)對(duì)于實(shí)現(xiàn)VR中的真實(shí)感和深度感知非常重要。DeepFocus是第一個(gè)能夠?yàn)閂R應(yīng)用程序?qū)崟r(shí)產(chǎn)生這種效果的系統(tǒng)。我們現(xiàn)在開放我們的工作和數(shù)據(jù)集,以幫助VR研究界的其他人。
它是如何運(yùn)作的:
一些傳統(tǒng)方法,例如使用累積緩沖算法(accumulation buffer),可以實(shí)現(xiàn)物理上精確的失焦模糊。但它們無法實(shí)時(shí)生成復(fù)雜,豐富的內(nèi)容,因?yàn)檫@種處理,即使是對(duì)于最先進(jìn)的芯片,要求也太高了。與此不同的是,我們使用深度學(xué)習(xí)解決了這個(gè)問題。我們開發(fā)了一種新穎的端到端卷積神經(jīng)網(wǎng)絡(luò),一旦眼睛看到場(chǎng)景的不同部分,就會(huì)產(chǎn)生具有精確視網(wǎng)膜模糊的圖像。該網(wǎng)絡(luò)包括新的保持體積的交織層,以減少輸入的空間維度,同時(shí)充分保留圖像細(xì)節(jié)。然后,網(wǎng)絡(luò)的卷積層運(yùn)行在相同的,降低了的空間分辨率上,從而運(yùn)行時(shí)間能夠明顯減少。
為什么重要:
隨著對(duì)新型VR頭顯技術(shù)的研究不斷深入,DeepFocus將能夠模擬精確的視網(wǎng)膜模糊,從而產(chǎn)生非常逼真的視覺效果。該平臺(tái)還表明AI可以幫助解決VR渲染高度計(jì)算密集型視覺效果的挑戰(zhàn)。DeepFocus為克服未來新型顯示系統(tǒng)的實(shí)際渲染和優(yōu)化限制提供了基礎(chǔ)。
由于DeepFocus僅依賴于標(biāo)準(zhǔn)RGB-D顏色和深度輸入,因此它幾乎適用于所有現(xiàn)有的VR游戲和應(yīng)用程序。它還兼容VR研究界目前正在探索的所有三種頭顯類型,分別是:變焦顯示器(如Half Dome),多焦點(diǎn)顯示器(例如,F(xiàn)RL先前的工作)和光場(chǎng)顯示器。
詳細(xì)了解Facebook Reality Labs如何創(chuàng)建DeepFocus。
(https://www.oculus.com/blog/introducing-deepfocus-the-ai-rendering-system-powering-half-dome/)
閱讀完整的論文:
DeepFocus:用于計(jì)算顯示的學(xué)習(xí)圖像合成
(https://research.fb.com/publications/deepfocus-siggraph-asia-2018/)
-
AI
+關(guān)注
關(guān)注
87文章
31707瀏覽量
270489 -
vr
+關(guān)注
關(guān)注
34文章
9646瀏覽量
150840
原文標(biāo)題:DeepFocus,基于AI實(shí)現(xiàn)更逼真的VR圖像
文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
基于FPGA實(shí)現(xiàn)圖像直方圖設(shè)計(jì)
![基于FPGA<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>圖像</b>直方圖設(shè)計(jì)](https://file1.elecfans.com/web3/M00/03/90/wKgZO2dqHAGARj8XAAAkNh_VJCs585.png)
AI智能體逼真模擬人類行為
高通AI Hub:輕松實(shí)現(xiàn)Android圖像分類
![高通<b class='flag-5'>AI</b> Hub:輕松<b class='flag-5'>實(shí)現(xiàn)</b>Android<b class='flag-5'>圖像</b>分類](https://file1.elecfans.com/web2/M00/0D/4E/wKgaomdFfv-AV-2HAACUww0CQCg180.png)
AI圖像識(shí)別攝像機(jī)
![<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識(shí)別攝像機(jī)](https://file1.elecfans.com/web2/M00/FB/13/wKgaomaMo4WAIxtNAABc_bI4MJ0136.png)
![](https://file1.elecfans.com/web1/M00/F3/CF/wKgZoWcfKSiAE2xbAAszZnEpJvw205.png)
GPU與VR技術(shù)結(jié)合應(yīng)用
AI大模型在圖像識(shí)別中的優(yōu)勢(shì)
Freepik攜手Magnific AI推出AI圖像生成器
深入理解渲染引擎:打造逼真圖像的關(guān)鍵
![深入理解渲染引擎:打造<b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關(guān)鍵](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
北京君正用戶案例:智能報(bào)靶,圖像識(shí)別電子槍
全志T527芯片詳解【二】:高清圖像編解碼
谷歌發(fā)布AI文生圖大模型Imagen
OpenAI發(fā)布圖像檢測(cè)分類器,可區(qū)分AI生成圖像與實(shí)拍照片
隧道橋梁施工VR安全體驗(yàn)館
![隧道橋梁施工<b class='flag-5'>VR</b>安全體驗(yàn)館](https://file1.elecfans.com/web2/M00/C6/DF/wKgZomYNBRqAIkT-AADyTJIDAXo603.png)
評(píng)論