咨询热线:13080701712
返回
沈宇资讯
将监控摄像头引入一个实时系统
我们引入了一个实时系统,用于识别和跟踪大量复杂的现实世界物体的位置和方向,以及对它们进行操作的铰接式机器人操纵器。所提出的系统快速、准确且可靠,但不需要精确的相机校准。这种高水平性能的关键是所有相关场景元素的不断完善的内部 3D 表示。该方法隐式处理遮挡,并使用软约束机制来获得特定感兴趣区域的最高精度。
该系统非常适合在图形处理单元上实施,并且由于图形处理单元的图形和计算能力的紧密集成,可以以超过 40 Hz 的帧速率获得场景更新。我们在复杂的现实世界操纵任务中展示了该系统的鲁棒性和准确性,该任务涉及在存在相机和目标物体运动的情况下的主动端点闭环视觉伺服控制。 在本文中,我们提出了一种用于视频镜头分类的非参数相机运动描述符。在所提出的方法中,通过计算每个宏块的运动矢量(MV)来为每个连续视频帧构建运动矢量场(MVF)。
然后,将MVF划分为多个大小相等的局部区域。接下来,通过运动一致性分析消除每个局部区域的不一致/噪声 MV。来自多个连续帧的每个局部区域的剩余 MV 被进一步收集以用于紧凑表示。最初,使用 MV 形成矩阵。然后,使用奇异值分解技术对矩阵进行分解以表示主要运动。最后,计算保留主成分最大方差的角度并量化,利用直方图来表示局部区域的运动。为了表示全局相机运动,结合了局部直方图。使用支持向量机测试了所提出的视频镜头分类运动描述符的有效性。首先,所提出的用于视频镜头分类的相机运动描述符是在由常规相机运动模式(例如平移、缩放、倾斜、静态)组成的视频数据集上计算的。然后,我们将具有扩展特征集的摄像机运动描述符应用于电影镜头的分类。实验结果表明,所提出的镜头级摄像机运动描述符具有很强的判别能力,可以有效地对不同视频的不同摄像机运动模式进行分类。我们还表明,我们的方法优于最先进的方法。
该系统非常适合在图形处理单元上实施,并且由于图形处理单元的图形和计算能力的紧密集成,可以以超过 40 Hz 的帧速率获得场景更新。我们在复杂的现实世界操纵任务中展示了该系统的鲁棒性和准确性,该任务涉及在存在相机和目标物体运动的情况下的主动端点闭环视觉伺服控制。 在本文中,我们提出了一种用于视频镜头分类的非参数相机运动描述符。在所提出的方法中,通过计算每个宏块的运动矢量(MV)来为每个连续视频帧构建运动矢量场(MVF)。
然后,将MVF划分为多个大小相等的局部区域。接下来,通过运动一致性分析消除每个局部区域的不一致/噪声 MV。来自多个连续帧的每个局部区域的剩余 MV 被进一步收集以用于紧凑表示。最初,使用 MV 形成矩阵。然后,使用奇异值分解技术对矩阵进行分解以表示主要运动。最后,计算保留主成分最大方差的角度并量化,利用直方图来表示局部区域的运动。为了表示全局相机运动,结合了局部直方图。使用支持向量机测试了所提出的视频镜头分类运动描述符的有效性。首先,所提出的用于视频镜头分类的相机运动描述符是在由常规相机运动模式(例如平移、缩放、倾斜、静态)组成的视频数据集上计算的。然后,我们将具有扩展特征集的摄像机运动描述符应用于电影镜头的分类。实验结果表明,所提出的镜头级摄像机运动描述符具有很强的判别能力,可以有效地对不同视频的不同摄像机运动模式进行分类。我们还表明,我们的方法优于最先进的方法。