计划在 ICML 2026 上发表…构建逾 110万帧数据验证性能
有望用于巡逻机器人和智能安防监控,可自动检测开门与物体移动
韩国国内研究团队开发出一项人工智能(AI)技术,即使拍摄时间和位置不同,也能在同一空间中仅找出真正发生变化的物体。预计可用于巡逻机器人自主识别过去与当前环境的差异,或用于安保系统自动监测物体移动与丢失情况。
光州科学技术院(GIST)2日表示,Gim Euihwan 人工智能融合学系教授研究团队开发出一款人工智能模型“VSCDNet(基于视频的场景变化检测网络,Video-based Scene Change Detection Network)”,可比较在不同时间和路径下拍摄的视频,检测真实物体的变化。
在真实机器人环境中应用VSCD的示例。移动机器人多次访问同一空间并拍摄视频,通过比较视频来发现门被打开或物体新出现、消失等变化。检测到的变化区域可用于视觉监控和对象增量学习。研究团队供图
View original image以往的变化检测技术主要通过比较在相似位置和时点拍摄的照片,一旦摄像机位置或移动路径发生变化,准确度就会大幅下降,因此难以长期追踪自动驾驶机器人或室内巡逻机器人的环境变化。
研究团队并非比较单张图像,而是通过分析整段视频的整体流动来解决这一问题。VSCDNet通过比较过去拍摄的基准视频和当前视频,寻找彼此对应的场景,并仅对发生真实物体变化的区域进行精细提取。
借此可以自动识别笔记本电脑消失、物体位置改变、新物体出现等情况。发生变化的区域会以“变化掩膜(Change Mask)”的形式可视化并提供给用户。
为验证技术,研究团队还构建了包含虚拟空间和真实室内环境的大规模数据集。利用由总计1090段视频、逾113万帧画面构成的数据集进行实验结果显示,VSCDNet的性能优于既有变化检测方法。
尤其是在视频长度、画质以及发生变化的物体数量各不相同的多种条件下,该模型依然保持了稳定的检测精度。在真实移动机器人实验中,机器人沿不同路径移动并拍摄的视频中,VSCDNet能够自动检测到门被打开或物体消失的情况,同时也验证了其记忆和学习新出现物体的功能。
研究团队表示,这项技术的意义在于,其能力已超越对当前场景的识别层面,能够与过去进行对比并判断“发生了哪些变化”。即便没有额外的位置信息或空间地图,也能检测环境变化,被认为在室内巡逻机器人、智能安防监控、设施管理、基于物联网(IoT)的智能室内系统等领域具有较高的应用潜力。
Gim Euihwan GIST 人工智能融合学系教授表示:“VSCDNet不仅能识别当前场景,还能自主对比过去画面,掌握发生了哪些变化。由于无需额外的位置信息或空间地图,也能比较沿不同路径拍摄的视频,预计将被应用于多种室内环境管理领域。”
本研究由Gim Euihwan 教授指导,Yun Jiae 人工智能融合学系硕博连读课程学生具体承担,获得科学技术信息通信部和韩国研究财团优秀青年研究者支援项目,以及信息通信企划评价院(IITP)自主视觉智能技术开发项目等的资助。
研究结果将于下月在首尔COEX举行的全球顶级人工智能与机器学习学术会议ICML 2026上发表。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。