眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
新智元报道
编辑:好困 Aeneas【新智元导读】只通过眼球反光,就能复现你眼中的世界?如此科幻的场景,竟然在这篇论文中成为现实。更巧的是,就在同一天,《黑镜》第六季上线。「唯一真正的探索之旅,不是去拜访陌生的土地,而是透过别人的眼睛来观察宇宙。」——马塞尔·普鲁斯特
通过别人的眼睛来看世界,这个又科幻又诗意(又恐怖)的想法,已经成真了!
【资料图】
《黑镜》第一季《你的全部历史》
现在,我们只需利用眼睛的反光,就能三维重建这个人正在观察的物体。
是的,这很黑镜。
最近,来自马里兰大学的团队,提出一种全新的方法——通过利用包含眼睛反光的人像,来对摄像机没有拍到的场景进行三维重建。
论文地址:https://arxiv.org/abs/2306.09348
项目地址:https://world-from-eyes.github.io/
经典科幻中的场景都成真了?
用眼睛反射产生辐射场重建?这个想法看似疯狂,实则有足够的理论依据。
作者介绍说,因为人眼具有高度的反射性,所以从捕捉头部移动的一系列帧中,完全可以做到仅使用眼睛的反射,就能重建和渲染人们正在观察的3D场景。
鉴于这个概念非常「黑镜」,而且这篇论文一发布没几个小时,《黑镜》新一季就宣布上线了,这种巧合简直让人怀疑《黑镜》的导演是不是也注意到了这篇论文。(狗头)
黑镜第六季今日上线
这项研究一出,网友们直接炸了。
所以,我们已经快进到这一步了?
这不就是2000年代《攻壳机动队》中的场景吗?这些虚构全都变成现实了!
100%的《银翼杀手》,现在就给我一份拷贝吧。
儒勒·凡尔纳的《基普兄弟》成真了!
当然,也有人对此表示毛骨悚然:这个技术可千万别被用于调查取证之类的事情。
而在今天,我们已经有了Varjo眼动追踪相机,还有苹果的VisionPro以及其他头显,这些设备都可以捕捉大量镜头素材,结合进这项新技术,无数崭新的科幻场景,恐怕马上都要成真了……
通过利用光线在人眼上的微小反射,研究团队开发了一种方法,可以使用在固定相机位置拍摄的单目图像序列来重建人所观察到的(非直视)场景。
不过,仅仅在观察到的反射上训练辐射场是不够的,原因有几个:1)角膜定位中的固有噪声,2)虹膜纹理的复杂性,3)每张图像中捕获的低分辨率反射。
为了解决这些挑战,团队在训练过程中引入了角膜姿态优化和虹膜纹理分解,并借助基于人眼虹膜的径向纹理正则化损失。
与传统的需要移动相机的神经场训练方法不同,他们使用的方法将相机放置在固定的视点上,完全依赖于用户的移动。
利用人眼反光,实现场景重建
由于准确估计眼睛的姿态十分困难,再加上虹膜和场景反射之间的纹理相互交织,因此这项任务颇具挑战性。
为了解决这一问题,作者针对眼睛姿态、描述场景的辐射场以及观察者的眼睛虹膜纹理,进行了联合优化。
具体来说,主要的贡献有三点:
1.新的三维重建
提出了一种从眼睛图像中重建观察者世界的3D场景的新方法,可以将先前的基础工作与神经渲染的最新进展相结合。
2.虹膜的径向先验
引入了虹膜纹理分解的径向先验,显著提高了重建的辐射场的质量。
3.角膜姿态的优化
开发了一种角膜姿态优化的过程,以减轻眼睛姿态估计的噪声,克服了从人眼中提取特征的独特挑战。
结果显示,利用这个全新的方法,我们可以通过移动画面,从眼睛的反射中获得场景的多个视角,最终实现完整的场景重建。
更厉害的是,团队还尝试利用Miley Cyrus和Lady Gaga的MV,来重建她们眼睛里的景象。
作者表示,他们成功地重建了出现在Miley的眼中的物体,并且从Lady Gaga的眼中似乎看到了一个人的上半身。
然而,由于这些视频的质量不够高,因此还不能断定重建结果的准确性。
LadyGaga
MileyCyrus
如何做到的?
众所周知,健康成年人的角膜几何形状几乎相同。
因此,只需在图像中计算一个人的角膜的像素大小,就可以准确计算出他们的眼睛位置。
接下来,作者通过从相机拍摄光线,并将它们反射出近似的眼睛几何形状,来训练眼睛反射的辐射场。
为了避免人眼的虹膜在重建中出现,作者同时训练了一个学习虹膜纹理的二维纹理映射,来进行纹理分解。
实验评估
合成数据评估首先,作者通过在Blender场景中放置人眼模型,进行了合成数据上的评估。
下图展示了仅利用眼睛反射重建的场景。
由于在现实生活中无法完美估计眼角膜,作者和评估了角膜姿态优化对估计角膜半径噪音的鲁棒性。
为了模拟真实数据中可能遇到的深度估计误差,作者通过使用不同噪音水平对每个图像中观察到的角膜半径进行缩放,来破坏观察到的角膜半径r_img。
下图展示了在不同噪音水平下的性能变化。
值得注意的是,随着噪音的增加,与无姿态优化的重建相比,作者提出的姿态优化重建在重建的几何形状和颜色方面更为鲁棒。
这证明姿态优化对于现实场景至关重要,因为图像中从投影的角膜到初始椭圆拟合并不完美。
此外,在有无纹理分解的情况下的定量比较显示,作者的方法在SSIM和LPIPS方面在纹理分解的情况下表现更好。
值得注意的是,作者没有计算PSNR,因为在设置中,反射和场景本身之间的照明差异非常大。
真实世界评估为了保证视野的真实,作者选择了索尼RX IV相机进行拍摄,并使用Adobe Lightroom对图像进行后处理,以减少角膜反射中的噪声。同时,作者在人物的两侧加入了光源来照亮目标物体。
过程中,被拍的人需要在相机的视野范围内移动,以便团队在每个场景中拍摄5-15帧图像。
由于场景照明具有较大的动态范围,作者在所有实验中使用16位图像,以避免丢失观察到的反射中的信息。
平均而言,每个图像中角膜只覆盖约0.1%的区域,而目标物体大约会占到20x20像素,并与虹膜纹理交错。
数据处理作者首先通过对图像进行角膜中心和半径的估计,来获得角膜的初始位置估计。
然后,使用平均深度和相机的焦距直接近似来计算角膜的三维位置,并计算其表面法线。
为了自动化这个过程,作者使用Grounding Dino定位眼睛的边界框,并使用ELLSeg对虹膜进行椭圆拟合。
尽管角膜通常被遮挡,但我们只需要未遮挡的区域,因此可以使用Segment Anything来获得虹膜的分割掩码。
真实结果从下图展示的效果中可以看出,作者的方法能够从真实世界的人像图片中重建3D场景,尽管存在角膜位置和几何估计的不准确性。
由于角膜边界的模糊性,想要在图像中实现精确的定位十分困难。
此外,对于某些眼睛颜色,如绿色和蓝色,3D重建也会更加困难,因为虹膜纹理较亮。
此外,在没有明确建模纹理时,重建后的画面中还会出现更多的「漂浮物」。
为了解决这些问题,可以通过增加径向正则化的程度,来改善重建的质量。
不过,这个方法依然存在两个主要的限制。
首先,目前的真实世界结果是基于「实验室设置」,例如对人脸进行放大拍摄、使用额外的光源照亮场景等。而在更自由的环境中,就需要面对传感器分辨率较低、动态范围较小且存在运动模糊等更大的挑战。
其次,目前对虹膜纹理的假设(例如恒定纹理、径向恒定颜色)可能过于简化,因此该方法在眼睛大幅度旋转时可能会失效。
作者介绍
共同一作Kevin Zhang,目前是马里兰大学的博士生。
Brandon Y. Feng在马里兰大学获得计算机科学博士学位,研究兴趣集中在计算成像、中层视觉和计算摄影领域。曾开发了用于图像和3D数据处理的机器学习算法,应用范围涵盖混合现实到自然科学等领域。
Jia-Bin Huang是马里兰大学副教授,此前在UIUC获得了博士学位。研究兴趣集中在计算机视觉、计算机图形学和机器学习的交叉领域。
参考资料:https://world-from-eyes.github.io标签:
眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
2023-06-19
后继有人!山东篮坛新星狂飙26分,2米16米淄博小伙新赛季亮相CBA|全球热闻
2023-06-19
黄巢的菊花诗词_黄巢的菊花诗
2023-06-19
世界最新:武汉洪山区2宗地终止出让 原定于6月30日拍卖、合计起拍价61.52亿元
2023-06-19
什么样的床垫最健康最舒服最耐用 ?如何挑选一张适合自己的床垫?
2023-06-19
当前消息!电动摩托:未来的市场黑马?
2023-06-19
你如何看待核心素养和小学生的核心素养之间的关系 世界快看
2023-06-19
中级安全工程师考试报考资格条件
2023-06-19
莫使金樽空对月全诗_莫使金樽空对月全诗_天天新消息
2023-06-19
服装产业搭上AI顺风车,效率提高三成后设计师会被替代吗?|全球热资讯
2023-06-19
后继有人!山东篮坛新星狂飙26分,2米16米淄博小伙新赛季亮相CBA|全球热闻
黄巢的菊花诗词_黄巢的菊花诗
世界最新:武汉洪山区2宗地终止出让 原定于6月30日拍卖、合计起拍价61.52亿元
什么样的床垫最健康最舒服最耐用 ?如何挑选一张适合自己的床垫?
当前消息!电动摩托:未来的市场黑马?
你如何看待核心素养和小学生的核心素养之间的关系 世界快看
中级安全工程师考试报考资格条件
莫使金樽空对月全诗_莫使金樽空对月全诗_天天新消息
服装产业搭上AI顺风车,效率提高三成后设计师会被替代吗?|全球热资讯
庄里燕子的奥尔良烤翅的做法? 全球快资讯
天天播报:AWSL的意思(awsl是什么意思 是什么梗简介介绍)
【天天热闻】仅需一次转化,二氧化碳和废塑“巧变”有用物质
凯龙洁能冲刺A股上市:计划募资约5亿元,曾强为实际控制人
端午给老丈人发红包怎么说
【环球新要闻】关于举办2023年全国职业院校校领导高级研修班的通知
市场上这4款性价比超高的白酒,遇见别错过,全都是优质的纯粮酒
95558是什么电话_95558_世界独家
怀孕六个月 准妈妈6个月时候的变化_世界百事通
2023年6月19日山东省乙二醇价格最新行情预测_世界速递
热头条丨2只科创板新股即将迎来申购 (附股)
衡水林地征地怎样补偿
快穿之直男掰弯系统txt(快穿之直男掰弯系统)|每日快播
“植物大熊猫”银杉迎来新生-环球热点评
荣耀618战报出炉:这几款手机、平板获销量冠军
今日关注:一句禅语道尽人生_一句禅语一句人生
家中存在的安全隐患有哪些 家里常见的安全隐患
万锦晟6.18黄金下周大涨转多,黄金空单被套怎么办?
【晋源美】晋阳湖 城市乐园胜天工_今日热门
世界速看:青岛娱乐场所哪里好玩_青岛娱乐场所
- 中国剪报网址_中国剪报网
- 全球快消息!帮粉丝取了个快递,男主播被判无期!
- 天天动态:眼部麦粒肿怎么快速消除眼肿_下眼睑麦粒肿怎么消除
- 霍启刚患病每天只能睡四小时?本人晒照回应:已看医生并跟进病情-世界观察
- 可怜无定河边骨 犹是春闺梦里人_犹是深闺梦里人
- 撤销新疆队处罚周琦必须回归CBA打球,下家只能有条件的四选一
- 邮储银行湘西州分行:开展存款保险宣传活动
- 千年民间艺术“打铁花”:铁焰当空舞 刹那星如雨 世界热闻
- U17亚洲杯中国队首战平局 目标小组出线
- 以科技为动力,极萌Jmoon不断创新,促进产业健康发展
- 世界时讯:波兰女排悲剧了!国际排联官宣,蔡斌惊喜反转,中国女排成大赢家
- 国乒女神钱天一跟梁靖崑配混双,被网友质疑不搭,马龙曾赞其颜值|世界微头条
- 世界微头条丨初一英语教学工作总结个人_初一英语教学工作总结
- 高筋面粉可以做水饺皮吗_高筋面粉可以做饺子皮吗
- 户外带娃,一老人热射病死亡!出现这种情况要及时干预! 焦点短讯
- 世界滚动:网银怎么转账风控不受影响_网银怎么转账
- 热头条丨爸爸教会我一首歌
- 【天天新要闻】第九届上交会闭幕 达成合作意向535项
- 身份证查公积金怎么查_身份证查公积金
- 北京沙化土地面积减近60% 推进京津冀生态环境联防联治中新社北京分社 世界热议
- 常常的反义词是什么用字母表示_常常的反义词 全球短讯
- 环球时讯:你好,“湖山”
- 今亮点!高安市气象台发布雷电黄色预警信号[III级/较重] 【2023-06-17】
- 美国与伊朗要达成协议了?布林肯否认-天天动态
- 贝莱德中国负责人离职_天天观点
- 全球最新:韩媒:朝鲜无人机曾进入韩总统办公室附近禁飞区
- 紧抓跨境电商发展机遇
- 厦门:多种形式宣传 教您守好钱袋子-天天热头条
- 动态焦点:AC Schnitzer不会等待宝马制造M8
- 世界热文:妄想的概念是什么?_妄想的定义是什么
- 自驾清远连州地下河,丝毫不逊色于张家界黄龙洞,无愧广东第一河 每日资讯
- 中国全球化品牌50强发布:山东3家入选,均来自青岛 热闻
- 90后“新农人”的瓜田逐梦
- 长沙这个地标建筑建设施工有啥特色亮点? 建筑同行纷纷到现场观摩学习
- 全国首家家纺家居类目直播电商闭环载体落户南通川姜 当前讯息
- 亘喜生物美股跌15.92%
- 昌江县好吗,昌江买了划算的楼盘大全 今日精选
- 当前快看:在岸人民币兑美元较上一交易日夜盘收盘跌35点
- 618限时狂降!樱桃MX BOARD键盘直降820元
- 6月16日基金净值:交银启明混合A最新净值1.297,涨1.05%
- 微速讯:起亚EV6将于6月份开启盲订 8月成都车展期间上市
- 发现真善美|闲不住的老党员,义务维修让小物件重新发挥大作用_焦点热闻
- 环球新消息丨今日数据精选:全球巧克力价格上涨14%;一杯奶茶产生87条数据
- 星宿老仙出场口号原文_星宿老仙出场口号
- 6月16日基金净值:南方金融主题灵活配置混合A最新净值1.51,涨1.75%
- 全球动态:清凉补是什么_清凉补
- 念无与为乐者者的翻译_念无与为乐者-世界今头条
- 【世界热闻】普陀暑托班每个班招多少人?(招生规模)
- 世界快看点丨合同能源上市龙头企业是哪些股票?(2023/6/16)
- 【速看料】被梅西攻破球门次数最多的是玻利维亚