본문 바로가기
Dim영역

2024년이면 전세계 37조 시장, AI 공부시키는 '합성 데이터' 뜬다

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS

합성 데이터 기술 스타트업 빠르게 성장
글로벌 빅테크 기업 합성 데이터에 투자
매년 23% 성장…2024년 시장 규모 261억 달러

이미지=게티이미지뱅크

이미지=게티이미지뱅크

AD
원본보기 아이콘


#자율주행차에 적용된 인공지능(AI)의 '공부량'은 안전과 직결된다. 도로에서 마주치는 위험의 종류는 너무 다양해 충분한 양의 영상 데이터를 학습해야 하기 때문이다. 자칫 어느 한 부분이라도 놓치면 사고로 이어질 수 있다. 하지만 위험이 발생할 수 있는 상황에 대한 실제 데이터는 턱없이 부족하다. 이에 테슬라는 최근 사고 사례 중심의 '합성 데이터'를 만들어 AI를 학습시키고 있다.


#내시경 영상을 분석해 위암을 진단하는 AI, 병변의 위치와 형태는 천차만별인데다가 의료정보의 확보는 쉽지 않아 실제 데이터만으로는 AI 학습이 어렵다. 여기에도 합성 데이터가 쓰인다. 기존 영상에 병변을 합성해 다양한 위암 이미지를 생성하면 AI의 진단 성능은 획기적으로 개선된다.

'합성 데이터'가 가 뜨고 있다. 관련 기업들이 빠르게 성장하고 있고 이 기술을 내세운 스타트업들도 속속 시장에 등장하고 있다. AI가 국가 경제를 이끌 혁신 기술로 대두되면서 AI의 성능을 좌우할 데이터의 중요성이 커진 데 따른 것이다. AI 개발을 위해 필요한 데이터가 너무 적고 확보도 쉽지 않아 양적이나 질적으로 향상된 데이터를 만드는 합성 데이터 기술에 관심이 집중되고 있다.


25일 관련 업계에 따르면 합성 데이터 스타트업 씨앤에이아이(CN.AI)의 주요 파트너사는 지난해 9개에서 올해 34개로 3.8배 증가했다. 신규 확보한 파트너사는 대기업을 포함해 정부기관, 교육기관, 의료기관 등이 주로 포진돼 있다. 2019년 설립된 이 회사는 당시만 해도 국내에서는 낯설었던 AI 합성 데이터 기술을 앞세워 관련 시장을 주도해 왔다. 씨앤에이아이가 짧은 시간에 다양한 분야에서 적용 사례를 만들 수 있었던 것은 AI 기술의 측면에서 합성 데이터에 대한 관심을 방증한다.


합성 데이터는 AI 학습용으로 만들어낸 가상의 데이터를 말한다. 컴퓨터 알고리즘이 실제 데이터의 특징을 반영해 무한대로 생성한다. 합성 데이터가 부상한 것은 AI를 공부시킬 데이터를 확보하는 게 쉽지 않기 때문이다. AI는 학습 데이터양이 많을수록 성능은 올라간다. 하지만 데이터를 구하는 것에는 큰 비용이 든다. 데이터를 분류하는 라벨링 작업은 사람의 손을 거쳐야 해 '21세기판 인형 눈 붙이기'라고 불릴 정도다. 또 실제 데이터는 개인정보 등의 문제로 데이터 수집과 활용에 제한이 있다.

합성 데이터를 사용하면 데이터를 모으는 시간과 비용을 줄일 수 있다고 씨앤에이아이는 설명했다. 올해 MIT테크놀로지리뷰가 합성 데이터를 10대 혁신 기술에 선정한 이유다. 해외에서도 합성 데이터 기술이 주목을 받고 있다. 테슬라가 자율주행 AI 학습에 합성 데이터를 적용하고 있고 엔비디아도 공간 이미지 중심 합성 데이터를 활용해 AI 훈련 데이터셋을 증대시키는 프로세스를 구축했다. 또 AI.리베리라는 미국의 합성 데이터 스타트업은 지난해 메타에 인수됐고 이어 북미 최대 식료품 배달업체인 인스타카트가 캐퍼라는 합성 데이터 기업을 인수했다. 업계 관계자는 "페이스북 같은 플랫폼을 보유한 기업도 데이터 확보를 위해 합성 데이터 회사를 인수한 것은 AI 기술 변화 방향을 보여준다"며 "합성 데이터는 학습데이터 생성, 자율주행 등에서 시작해 전 분야에서 핵심적으로 활용될 것"이라고 설명했다.


시장 전망도 밝다. 글로벌 조사기관 가트너에 따르면 오는 2026년 AI 학습에서 합성 데이터 사용 비율이 실제 데이터 사용 규모를 넘어설 전망이다. 현재 세계적으로 합성 데이터 시장은 매년 23%씩 성장 중이며 2024년 시장 규모는 261억 달러에 이를 것으로 예상된다. 국내에서도 합성 데이터 생성 시장은 2018년 약 1629억원 규모에서 연평균 9.4% 성장해 2024년에는 약 5752억원 규모로 확대될 전망이다.


국내 시장에선 씨앤에이아이 외에도 페블러스, 나니아랩스, 드림투리얼, 어나더리얼 등의 스타트업이 합성 데이터 관련 기술을 앞세워 시장에 뛰어들고 있다. 네이버도 올해 합성데이터 스타트업 젠젠AI에 투자했다. 젠젠AI는 AI 학습 데이터를 자동으로 생성·합성하는 솔루션을 개발하고 있는 회사로 실제 환경에서 수집하기 어려운 고품질의 데이터를 빠르게 확보할 수 있어 AI 모델 성능을 효율적으로 고도화할 수 있다는 점을 강조하고 있다.


이원섭 씨앤에이아이 대표는 "합성데이터는 현재 자율주행이나 로보틱스 등의 분야에 가장 활발하게 적용되고 있고 이 밖에 일반 소매 판매 시장, 스마트시티, 국방 영역 등에서 활용 사례가 늘어날 것"이라고 말했다.




김철현 기자 kch@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • 이종섭 호주대사, 임명 25일만에 사의…윤 대통령 재가할 듯 [포토] 12년만에 서울 버스파업 "웰컴 백 준호!"…손흥민, 태국전서 외친 말…역시 인성갑

    #국내이슈

  • "애플, 5월초 아이패드 신제품 선보인다…18개월 만" 디즈니-플로리다 ‘게이언급금지법’ 소송 일단락 '아일 비 미싱 유' 부른 미국 래퍼, 초대형 성범죄 스캔들 '발칵'

    #해외이슈

  • 올봄 최악 황사 덮쳤다…주말까지 마스크 필수 [이미지 다이어리] 누구나 길을 잃을 때가 있다 푸바오, 일주일 후 中 간다…에버랜드, 배웅시간 만들어

    #포토PICK

  • 첨단사양 빼곡…벤츠 SUV 눈길 끄는 이유 기아, 생성형AI 탑재 준중형 세단 K4 세계 첫 공개 벤츠 G바겐 전기차 올해 나온다

    #CAR라이프

  • [뉴스속 용어]국가 신뢰도 높이는 선진국채클럽 ‘WGBI’ [뉴스속 용어]코코아 t당 1만 달러 넘자 '초코플레이션' 비상 [뉴스속 기업]트럼프가 만든 SNS ‘트루스 소셜’

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼