광주과학기술원(GIST)이 작업자와 협업에서 최고 효율을 낼 수 있는 AI 로봇 파지 모델을 개발했다.
GIST는 AI융합학과 이규빈 교수 연구팀이 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 'GraspSAM'을 개발했다고 29일 밝혔다.
GraspSAM은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원하며, 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계됐다. 이를 통해 기존 모델의 한계를 극복하고, 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있는 능력을 갖췄다.
기존의 딥러닝 기반 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계를 지니고 있었다. 연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 SAM(Segment Anything Model)을 최초로 로봇 파지 출력이 가능하도록 도입했다.
연구팀이 개발한 GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측하는 혁신적인 모델이다. 이를 위해 어댑터 기법과 학습 가능한 토큰 기법을 적용해 SAM을 파지점 추론에 최적화했다.
GraspSAM은 프롬프트 기반 입력을 지원하며 사용자가 제공하는 간단한 점, 박스, 텍스트 입력을 통해 다양한 환경·물체·상황에 즉각적으로 적응할 수 있도록 설계됐다. 이를 통해 로봇이 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장했다.
GraspSAM은 유명한 파지 벤치마크 데이터세트인 'Grasp-anything'과 'Jacquard'에서 최고 수준(SOTA, State of the Art)의 성능을 달성했다. 또한, 실험 결과 복잡한 실제 환경에서도 로봇이 안정적으로 파지 작업을 수행할 수 있다는 것을 확인했다.
SOTA는 주로 인공지능(AI)과 머신러닝(ML) 분야에서 자주 사용되며, SOTA 모델은 일반적으로 벤치마크 데이터셋에서 최고 성능을 기록하거나 특정 과제에서 가장 효율적이고 정확한 결과를 제공하는 모델을 의미한다.
이규빈 교수는 "GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘해 산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다"고 밝혔다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>