김민수 KAIST 교수팀, GPU 대규모 데이터 처리시 병목현상 제거 기술 개발
국내 연구진이 인공지능(AI) 등에 널리 사용되는 GPU 메모리 크기의 한계로 발생하는 연산 결과 병목 현상을 해소할 수 있는 기술을 개발했다. 가정에나 소규모 기업에서 사용하는 개인용컴퓨터(PC)의 GPU를 통해서도 대규모 AI 작업을 할 수 있을 것으로 기대된다.
11일 카이스트(KAIST·총장 이광형)에 따르면 이 학교 전산학부 김민수 교수 연구팀은 최근 GPU가 수 테라바이트의 대규모 데이터를 발생시키는 분석 결과나 AI 생성물을 메인 메모리로 고속으로 전송 및 저장할 수 있는 데이터 처리 기술(INFINEL)을 개발했다.
GPU는 CPU와 비교해 AI 학습에 적합하지만 CPU와 달리 메모리 관리 기능이 매우 제한적이다. 예측할 수 없는 대규모 데이터를 유연하게 관리하기 어렵다는 문제가 발생한다. 이러한 이유로 지금까지는 GPU를 활용해 ‘삼각형 나열’과 같은 난도가 높은 그래프 초병렬 연산을 수행할 수 없었다.
지금은 이런 문제가 제한적이지만 최근 AI의 활용이 급속히 증가하면서 그래프 구조 데이터의 구축과 사용도 점점 증가하고 있다. 그래프 구조의 데이터에 대해 난도가 높은 초병렬 연산을 수행할 경우 그 출력 결과가 매우 크고, 각 스레드의 출력 크기를 예측하기 어려워진다.
김 교수팀이 개발한 ‘INFINEL’ 기술은 이런 문제를 해결하기 위한 ‘특효약’이다. 이 기술을 사용하면 GPU 메모리가 가득 차도 초병렬 연산과 결과 출력 및 저장을 지속할 수 있다. 김 교수는 "메모리 크기가 작은 PC의 GPU로도 수 테라바이트 이상의 출력 데이터가 발생하는 고난도 연산을 빠르게 수행할 수 있다"고 설명했다. 김 교수는 "이번 연구는 AI 학습이 확대되면서 발생할 수 있는 문제점을 파악해 선제적으로 대비할 수 있게 하기 위해 추진됐다"고 부연했다.
김 교수팀은 INFINEL 기술의 성능을 다양한 실험 환경과 데이터 세트를 통해 검증했다. 종래의 최고 성능 동적 메모리 관리자 기술과 비교해 약 55배, 커널을 2번 실행하는 2단계 기술과 비교해 약 32배 연산 성능이 향상함을 보였다.
김 교수는 "생성형 AI나 메타버스(확장 가상세계) 시대에는 GPU 컴퓨팅의 대규모 출력 데이터를 빠르게 처리할 수 있는 기술이 중요해질 것으로 예상되며 INFINEL 기술이 그 일부 역할을 할 수 있을 것"이라고 말했다.
연구진은 INFINEL 기술이 GPU 메모리 크기와 상관없이 일관된 성능을 보여주므로, 제한된 비용으로 분석에 어려움을 겪는 기업들에도 적합하다고 소개했다.
이번 연구는 김 교수의 제자인 박성우 박사과정이 제1 저자로, 김 교수가 창업한 그래프 딥테크 기업인 그래파이 소속의 오세연 연구원이 제2 저자로, 김 교수가 교신 저자로 참여했으며 국제 학술지 ‘PPoPP’에 3월 4일 자로 발표됐다.
백종민 기자 cinqange@asiae.co.kr
꼭 봐야할 주요뉴스
115조원어치 거대 금광 발견했다…주가 오르고 난... 마스크영역<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>