突破性技术解决机器3D视觉反射干扰难题
科技日报北京5月20日消息,《自然·通讯》杂志当天发布,美国亚利桑那大学科研团队取得重要进展,推动机器实现“超人级三维视觉”目标。他们开发了一种新的3D成像技术,解决了机器在复杂环境下同时识别反光与非反光物体的难题,使得机器视觉速度更快、成像更细致,甚至超过人眼水平。未来,这一技术有望在自动驾驶、机器人手术、工业检测和生物医学成像等领域发挥作用。
人类拥有天然的三维视觉能力,即由双眼带来的立体感,但让机器达到同样效果并不简单。自动驾驶汽车和机器人手术设备依赖3D传感器理解周围世界,但现实场景中,玻璃、镜子和金属表面常常让设备“判断失误”。目前的大多数传感器只能处理单一类型的表面——要么适用于漫反射的材料,比如墙壁和布料,要么只对高反射的镜面和金属有效。而实际环境中,反光与非反光物体往往同时存在,比如家居空间既有沙发和墙壁,也有镜面家具和窗户;手术过程中既有湿组织,也有皮肤,这让传统设备容易失灵。
以往的方法需要用大型屏幕包围物体,通过观察其反射图案来推断形状。检测一辆汽车车身,甚至要搭建类似隧道的大型设施。此次亚利桑那大学团队采用了“偏折测量法”技术,通过分析屏幕图案在反光表面上的形变来重建物体结构。与传统方式不同,他们让整个环境成为一个巨大的“虚拟显示屏”,反而简化了操作。
具体流程中,团队先用激光扫描整个空间,再通过算法判断哪些区域是反光,哪些是非反光。随后,所有非反光区域,如墙壁、地板和家具,都可以用作辅助测量镜面物体的“屏幕”资源。
他们还应用了一种“神经形态事件相机”,与传统相机逐帧拍摄不同,这种相机只记录画面中发生变化的部分,因此能更高速捕捉动态三维场景,并适应极亮与极暗的环境。
研究人员强调,这项技术目前还处于实验阶段,但拥有较强的扩展性,将来有望用于微观血管到大型建筑等多种三维成像需求,为自动驾驶、机器人和医疗设备构建更具可靠性的视觉系统。





