Background/背景
现实世界的被观测物体存在高速随机移动、复杂动态变化的特性,若对此类目标进行实时观测和稳定追踪,传统的检测及采集机制将会面临很大的技术瓶颈。毫秒级主动视觉追踪和识别技术的运用,可以更清楚的观察和掌握目标的运动细节,获得没有运动模糊的图像信息,使得以高速移动物体为观察对象的研究成为可能,在增强现实、自动驾驶以及辅助医疗等信息领域占据重要的地位。
国内外学者提出了以下几种方案:
(1)基于双轴的机械式视觉追踪结构:如图1(a)所示,相机直接固定于机械云台上,云台拖动相机实现目标追踪。其优势在于能够实现大视野的追踪控制,且不受光学条件干扰,因此在机器人视觉和监视摄像机等领域得到广泛应用。但是机械云台的响应时间一般大于25ms,追踪截止频率小于50Hz,包含相机和机械云台的旋转部件固有的大惯性本质,是制约高速云台视觉伺服系统的关键瓶颈。在高速条件下,很难获得以适当视角聚焦在目标上并使目标居中的图像。
(2)基于多摄像机的数字式视觉追踪机制:如图1(b)所示,利用多组高速相机从不同角度同时捕捉目标的运动数据,通过计算机进行画面校准,生成三维虚拟图像,通常用于电视转播。由于系统带宽限制,数字云台存在宽视野和高分辨率不可兼得的问题。而为了看清运动目标的细节,往往通过牺牲视角来获得高分辨率的图像。
(3)基于双镜面的光电式毫秒级视觉追踪结构:日本东京大学石川正俊(Masatoshi Ishikawa)团队提出高速光电云台(又名,Saccade Mirror),采用“固定相机+扫描振镜”的方案,通过将相机固定,采用扫描振镜的二自由度旋转镜片快速改变光路,进而控制相机的跟踪方向。借助高速视觉伺服控制、高速图像处理、并行计算以及提取感兴趣区域(ROI)等方案,光电式毫秒级视觉追踪结构可降低图像处理的计算量,提高目标追踪实时性,系统响应时间达到3毫秒。该方案解决了基于双轴的机械式视觉追踪结构高速动态响应能力不足的问题以及基于多摄像机的数字式视觉追踪结构分辨率低的问题。

Challenges/问题提出
在追踪具有高度非线性轨迹的高速随机运动目标时,毫秒级光电主动视觉系统存在目标丢失、视觉追踪失效的问题。由于固定self-window有效尺寸范围的限制以及计算机系统的固有延迟,在跟踪高动态目标时,光路调整响应速度无法将目标保持在有效自窗范围内,目标运动信息发生跳变甚至丢失,而为了重新寻找目标,通常采取视角归零、扩大感兴趣区域等方式,则会降低高速追踪系统的实时性和稳定性。


Results/成果
在高速光电云台的基础上,提出了基于自适应self-window的光学信息获取方法,新方法能够实时地动态调整self-window的尺寸,进而提高了针对高动态运动目标追踪稳定性。
课题组通过搭建了一套毫秒级光电主动视觉系统。采用光电云台结构、感兴趣区域提取、并行计算、高速运动目标追踪算法,使得系统响应时间≤5ms,截止频率≥100Hz。通过高速相机以最高750fps的速度获取目标图像,并利用“固定相机+振镜”光路调整方式,实现毫秒级的目标跟踪。图2展示了毫秒级光电主动视觉系统的追踪效果,图3展示了提出的自适应self-window对高动态目标的追踪效果。


Video/视频
手持球及拍球,实验效果视频
Reference/参考
- Ruimin Cao, Jian Fu, Hui Yang, Lihui Wang*, and Masatoshi Ishikawa, “Robust optical axis control of monocular active gazing based on pan-tilt mirrors for high dynamic targets,” Optics Express 29, 40214-40230 (2021) [DOI: 10.1364/OE.439083]
- Ruimin Cao, Lihui Wang, Jian Fu, Adaptive self-window-based optical information acquisition method for high dynamic target, Frontiers in Optics 2020 (FiO 2020)(Online Event. 2020.09.16)/ (Oral Session)