3D 모델링으로 합성 데이터 생성
AI 생성물과 달리 동종교배 우려 無
컨설팅 비용 줄여 금전 부담 절감

인공지능(AI) 시대 경쟁력은 누가 더 양질의 데이터를 확보하느냐에 달려 있다. 하지만 현실에서 수집된 데이터만으로는 AI를 학습시키기에는 한계가 있다. 일론 머스크 테슬라 최고경영자(CEO)는 "AI 훈련 과정에서 인류가 축적한 지식의 총량이 이미 소진됐다"며 해결책으로 '합성 데이터'를 제시했다. 이는 컴퓨터 프로그램을 통해 인위적으로 생성된 데이터다. 생성형 AI가 만든 이미지와 영상도 포함된다. 그러나 AI로 만든 합성 데이터는 동일한 패턴의 데이터를 학습하면 AI 예측 성능이 저하될 수 있다는 문제를 안고 있다. 아이케미스트는 이런 한계를 극복하기 위해 3D 디지털 트윈 기술을 적용한 합성 데이터 생성기 'CEN'을 개발했다.


정민욱 아이케미스트 대표는 25일 아시아경제와 인터뷰에서 "기존 생성형 AI가 만든 이미지를 학습 데이터로 활용하려면 라벨링 작업이 필요하지만, CEN은 3D 모델을 기반으로 이미지를 렌더링하는 순간 데이터 정제가 자동으로 이뤄진다"고 설명했다. 기존 생성형 AI가 기존 데이터를 변형해 새로운 이미지를 만들어낸다면, CEN은 사용자가 원하는 장면을 3D 모델링을 통해 직접 구현한다. 예컨대 항만 이미지를 생성하고 싶다면 단순히 기존 이미지를 합성하는 것이 아니라 바위에 붙은 이끼까지 정밀하게 3D로 구현한다.

정민욱 아이케미스트 대표가 세계 최대 전자·IT 전시회 CES 2024에 참가해 자사 솔루션을 소개하고 있다. 아이케미스트 제공

정민욱 아이케미스트 대표가 세계 최대 전자·IT 전시회 CES 2024에 참가해 자사 솔루션을 소개하고 있다. 아이케미스트 제공

AD
원본보기 아이콘

이런 기술의 장점은 기존 빅데이터에 없는 데이터까지 생성할 수 있다는 점이다. 정 대표는 "국방과학연구소에서 '밤 배경의 K2 전차' 이미지를 1000장가량 요청했지만 기존 데이터에서는 K2 이미지를 찾을 수 없었다"며 "3D 디지털 트윈 기술을 활용해 초당 10개의 데이터를 직접 생성했다"고 말했다.


현재 엔비디아, 유니티 등 글로벌 기업들도 3D 합성 데이터 생성 플랫폼을 운영 중이다. 하지만 이들 플랫폼은 3D 전문가를 위한 시스템이라 데이터 공학자에겐 진입 장벽이 높다는 게 정 대표의 설명이다. 그는 "해외 플랫폼을 효율적으로 활용하기 위해선 3D 기술에 대한 깊은 이해가 필요하지만, CEN은 데이터 공학자가 더 직관적으로 사용할 수 있도록 설계했다"고 설명했다.

아이케미스트는 데이터 생산 플랫폼의 진입 장벽을 낮추는 동시에 비용 절감에도 집중했다. 정 대표는 "엔비디아의 '옴니버스' 플랫폼 연간 사용료만 약 2000만원에 달한다"며 "보통 합성 데이터 플랫폼은 컨설팅 비용이 많이 드는데 CEN은 데이터 생성 후 검증 과정까지 고객이 직접 수행할 수 있도록 해 비용 부담을 줄였다"고 했다.

AD

아이케미스트는 우선 국내 합성 데이터 시장에서 점유율을 확대하는 것을 목표로 하고 있다. 지난해 기준 국내 데이터 시장 규모는 1조4000억원으로, 이 중 합성 데이터 비율이 40%까지 증가한 것으로 추정된다. 정 대표는 "올해부터 B2G(기업·정부 간 거래) 사업을 확대해 매출 규모를 더욱 키울 계획"이라며 "장기적으로 글로벌 정보기술(IT) 기업들과 협력해 CEN 플랫폼을 직접 제공하는 것이 목표"라고 했다.


이성민 기자 minute@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠

놓칠 수 없는 이슈