지난해 노벨 화학상을 받은 단백질 구조 예측 인공지능(AI)인 '알파폴드(Alpha Fold)'로 과학계에 혁신을 이끌었던 구글 딥마인드가 유전자 해석이라는 또 다른 난제에 도전했다. 질병 진단과 치료법 및 신약 개발에 막대한 영향을 미칠 것이라는 기대가 나오고 있다.
구글 딥마인드는 26일(현지시간) 인공지능을 활용해 DNA의 비밀을 풀어낼 수 있는 '알파게놈(AlphaGenome)'을 논문으로 소개하고 연구용 API 형태로 공개했다. 알파게놈은 비상업적인 용도로 누구나 내려받아 사용할 수 있다.
알파게놈은 DNA의 작은 변화가 유전자 활동의 증가 또는 감소와 같은 다양한 분자 과정에 어떤 영향을 미치는지 예측할 수 있다. 최대 100만 개의 DNA 문자를 입력받아, 유전자 조절에 관련된 수천 가지 분자 특성을 단 1초 만에 예측할 수 있다.
알파폴드가 단백질의 3D 구조를 밝혀 생명과학 연구의 지형을 바꿨듯, 알파게놈은 유전체의 99%에 숨겨진 비밀을 푸는 열쇠가 되어 유전체학의 새로운 시대를 열것 이다는 예상도 나오고 있다.
게놈(Genome·유전체)은 생명체의 외형, 기능, 성장 등 거의 모든 것을 안내하는 '세포의 설명서'이다. DNA는 인간 유전자 정보를 담고 있다. 인간게놈프로젝트가 지난 2003년 인간게놈 지도를 작성했지만 31억개에 이르는 DNA 서열의 변이가 분자 수준에서 어떻게 작동하는지 파악하는 것은 오랫동안 미스터리로 남아있었다. 알파게놈은 이러한 미스터리를 풀기 위해 개발되었다.
딥마인드는 유전자의 스위치를 켜고 끄는 역할을 하는 '조절 유전체(regulatory genome)'에 주목했다. 조절 유전체에 변이가 생기면 암, 당뇨, 심장병, 자가면역질환 등 수많은 질병의 원인이 될 수 있지만, 조절 유전체의 언어는 매우 복잡하고 광대해 그 기능을 이해하는 것은 현대 유전학의 가장 큰 숙제 중 하나였다.
알파게놈은 DNA의 '문법'을 학습한 '대규모 언어 모델(LLM)'이다. 챗GPT가 '트래스포머'를 이용해 인간의 언어 데이터로 문법과 맥락을 학습하듯, 알파게놈도 방대한 DNA 서열 데이터를 학습해 유전자 조절의 '문법'을 터득했다고 회사 측은 소개했다.
구글 딥마인드는 알파게놈이 기존의 어떤 예측 모델보다 뛰어난 성능을 보였으며, 이전에 알려지지 않았던 수십만 개의 잠재적인 조절 요소를 새롭게 발견했다고 전했다.
푸시밋 콜리 구글딥마인드 연구 담당 부사장은 "우리는 유전체를 이해하는 데 따르는 여러 가지 과제를 통합하는 단일 모델을 처음으로 만들었다"라고 말했다.
구글 딥마인드는 향후 알파게놈의 모든 세부 정보를 공개할 계획이며 생명공학 기업이 상업적인 용도로 사용할 수 있는 방안도 모색하고 있다고 덧붙였다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>