본문 바로가기
Dim영역

AI학습의 답은 '물량공세'…구글, 이미지 500만개 오픈소스로 공개

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

AI 시각 인식 모델 '구글 랜드마크 V2' 오픈소스로공개
랜드마크 20개·이미지 500만개로 대폭 늘려

구글 랜드마크V2에 데이터로 포함된 세계 각지의 명소들(출처=구글 AI블로그)

구글 랜드마크V2에 데이터로 포함된 세계 각지의 명소들(출처=구글 AI블로그)

AD
원본보기 아이콘


[아시아경제 이민우 기자] 구글이 인공지능(AI) 기반 시각 인식을 위한 방대한 데이터를 오픈소스로 공개했다. 현실 속의 여러 사물을 구분하는 사진 속의 사물과 실물을 구분하는 등의 기술을 더욱 발전시키겠다는 목표에서다.


5일(현지시간) 벤처비트 등 정보기술(IT) 외신들에 따르면 구글은 이 같은 AI 탐지모델 '구글 랜드마크 V2'를 오픈소스(소스코드까지 무료로 공개) 방식으로 내놨다.

앞서 구글 AI 연구팀은 나이아가라 폭포와 다른 폭포를 구분하거나, 카탈로그 상의 사물과 실제 사물을 구분하는 AI 시스템을 꾸준히 개발해왔다. 올해 발표한 랜드마크 V2는 500만개의 이미지와 20만곳의 랜드마크를 확보했다. 독일 노이반슈타인성, 미국 샌프란시스쿄의 금뮨교, 이집트 기자 스핑크스, 페루 잉카문명 유적지 마추 픽추 등 여러 유명한 지역의 이미지를 정교하게 분류해 포함시킨 것이다.


또한 구글 연구팀은 위키피미디어 커먼즈의 덜 유명한 랜드마크의 이미지, 위키미디어 재단의 무료 공개 사진 등도 모두 포함시켰다. 지난해 발표한 V1보다 이미지는 2배, 랜드마크는 7배 가량으로 대폭 늘린 셈이다.


인식 기법도 개선됐다. 기존 8만6000여개의 이미지를 학습해 사물과 랜드마크를 처음에 인식한 뒤 새롭게 추가된 데이터셋으로 학습한 내용을 토대로 가중치를 부여하며 정확도를 올리는 식이다. 구글 AI 소프트웨어 엔지니어인 빙이 카오와 토비어스 웨이얀드는 "사물을 구분하고 이미지를 보다 정확하게 검색하기 위해서는 AI에게 학습시킬 막대한 데이터가 필요하다"며 "구글 랜드마크 V2는 방대한 데이터셋을 확보한 만큼 AI의 학습량을 대폭 늘리려 AI 시각 인식 기술을 발전시킬 수 있을 것"이라고 설명했다.



이민우 기자 letzwin@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • "편파방송으로 명예훼손" 어트랙트, SBS '그알' 제작진 고소 강릉 해안도로에 정체모를 빨간색 외제차…"여기서 사진 찍으라고?" ‘하이브 막내딸’ 아일릿, K팝 최초 데뷔곡 빌보드 핫 100 진입

    #국내이슈

  • "푸바오 잘 지내요" 영상 또 공개…공식 데뷔 빨라지나 대학 나온 미모의 26세 女 "돼지 키우며 월 114만원 벌지만 행복" '세상에 없는' 미모 뽑는다…세계 최초로 열리는 AI 미인대회

    #해외이슈

  • [포토] '그날의 기억' [이미지 다이어리] 그곳에 목련이 필 줄 알았다. [포토] 황사 극심, 뿌연 도심

    #포토PICK

  • 매끈한 뒤태로 600㎞ 달린다…쿠페형 폴스타4 6월 출시 마지막 V10 내연기관 람보르기니…'우라칸STJ' 출시 게걸음 주행하고 제자리 도는 車, 국내 첫선

    #CAR라이프

  • [뉴스속 용어]'비흡연 세대 법'으로 들끓는 영국 사회 [뉴스속 용어]'법사위원장'이 뭐길래…여야 쟁탈전 개막 [뉴스속 용어]韓 출산율 쇼크 부른 ‘차일드 페널티’

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼