AI 시각 인식 모델 '구글 랜드마크 V2' 오픈소스로공개
랜드마크 20개·이미지 500만개로 대폭 늘려
[아시아경제 이민우 기자] 구글이 인공지능(AI) 기반 시각 인식을 위한 방대한 데이터를 오픈소스로 공개했다. 현실 속의 여러 사물을 구분하는 사진 속의 사물과 실물을 구분하는 등의 기술을 더욱 발전시키겠다는 목표에서다.
5일(현지시간) 벤처비트 등 정보기술(IT) 외신들에 따르면 구글은 이 같은 AI 탐지모델 '구글 랜드마크 V2'를 오픈소스(소스코드까지 무료로 공개) 방식으로 내놨다.
앞서 구글 AI 연구팀은 나이아가라 폭포와 다른 폭포를 구분하거나, 카탈로그 상의 사물과 실제 사물을 구분하는 AI 시스템을 꾸준히 개발해왔다. 올해 발표한 랜드마크 V2는 500만개의 이미지와 20만곳의 랜드마크를 확보했다. 독일 노이반슈타인성, 미국 샌프란시스쿄의 금뮨교, 이집트 기자 스핑크스, 페루 잉카문명 유적지 마추 픽추 등 여러 유명한 지역의 이미지를 정교하게 분류해 포함시킨 것이다.
또한 구글 연구팀은 위키피미디어 커먼즈의 덜 유명한 랜드마크의 이미지, 위키미디어 재단의 무료 공개 사진 등도 모두 포함시켰다. 지난해 발표한 V1보다 이미지는 2배, 랜드마크는 7배 가량으로 대폭 늘린 셈이다.
인식 기법도 개선됐다. 기존 8만6000여개의 이미지를 학습해 사물과 랜드마크를 처음에 인식한 뒤 새롭게 추가된 데이터셋으로 학습한 내용을 토대로 가중치를 부여하며 정확도를 올리는 식이다. 구글 AI 소프트웨어 엔지니어인 빙이 카오와 토비어스 웨이얀드는 "사물을 구분하고 이미지를 보다 정확하게 검색하기 위해서는 AI에게 학습시킬 막대한 데이터가 필요하다"며 "구글 랜드마크 V2는 방대한 데이터셋을 확보한 만큼 AI의 학습량을 대폭 늘리려 AI 시각 인식 기술을 발전시킬 수 있을 것"이라고 설명했다.
이민우 기자 letzwin@asiae.co.kr
꼭 봐야할 주요뉴스
5060 절반 넘는데…2030은 "싫어요" 기피 1순위 '... 마스크영역<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>