观界创宇科技曾智：下一代全景内容在于实时重建

2017-11-17 17:13 · 稿源: 查看原文

2017年11月16—17日，ICEVE2017北京国际先进影像大会暨展览会（简称ICEVE），在北京电影学院标准放映厅开幕。

在16日下午的“虚拟现实影像内容主题论坛”上，中国科学院自动化研究所高级工程师、成都观界创宇科技有限公司首席研究员曾智发表了主题演讲，他针对目前VRAR全景拍摄存在的问题做出了分析，并对下一代全景拍摄技术进行了探讨。

曾智来自于成都观界科技有限公司，处于VR全景拍摄的第一线，他首先指出，VRAR这两年的爆发引出了全景内容拍摄需求，但是传统的拍摄设备组建的Rig存在缺陷，无法实现高质量的3D立体拍摄。

谈及拍摄问题，曾智介绍了观界科技自主研发的两款全景拍摄相机IDEALOEYE P21和IDEALOEYE C4，前者由21目Sony背照式传感器组成，后者由4目Sony背照式传感器组成，均能实现高性能的360°全景拍摄。

随后，曾智探讨了全景拍摄中画质与拼接的矛盾，他说：“高档相机镜头能够获得更好的画质，但是机身体积过大，导致所组建的Rig里，镜头光心距离大，画面视差大，拼接难度大。”

另一方面，相机FOV越小，像素利用率越高，画质越好，但是小FOV相机组建的Rig，覆盖全景所需的相机数量较多，拼接难度加大。

曾智指出，全景拍摄希望给用户沉浸式体验，但受限于其二维图像的本质，真实感难以提升。另外，由于缺少自由度，全景视频中无法实现漫游。

针对这些问题，曾智从三个方面提出了改进思路，一是硬件设计，二是拼接算法，三是提供Depth数据。

在硬件设计上，他认为，在全景拍摄中需要根据应用场景合理选择相机，比如说sensor靶面大小、镜头大小、FOV大小等。另外要尽量减少相邻镜头光心距离。在拼接算法方面，曾智介绍了基于光流的拼接算法，提高拼接对视差的鲁棒性，利用稠密光流方法计算像素匹配关系等方案。

接着，曾智重点强调了深度信息对于全景视频的意义，他表示，深度信息能够带来更准确的拼接，更靠谱的特效叠加以及局部6自由度的可能。

最后，曾智对下一代全景内容提出了畅想，他认为，下一代全景内容在于实时重建，具体表现在思维重建（空间三维加上时间一维）、基于RGBD相机组环拍、利用GPU并行加速计算三个方面。