서울대 연구팀, 초고속 단백질 구조 검색도구 '폴드디스코' 개발
미지 단백질 기능 규명부터 신약 설계까지 활용 기대

인공지능(AI)이 예측한 수억 개의 단백질 구조 데이터 속에서 기능을 결정하는 핵심 단서를 몇 초 만에 찾아내는 기술이 개발됐다. 단백질 기능 규명은 물론 신약 개발과 인공 효소 설계에도 활용될 수 있을 것으로 기대된다.


한국연구재단은 마틴 슈타이네거 서울대학교 교수 연구팀이 방대한 단백질 구조 데이터베이스(DB)에서 구조 모티프(structural motif)를 초고속으로 탐색하는 검색 도구 '폴드디스코(Folddisco)'를 개발했다고 11일 밝혔다.

폴드디스코의 작동 원리. 폴드디스코는 단백질의 3차원 구조 정보를 색인화해 대규모 데이터베이스에서 유사 구조를 초고속으로 탐색하고, 구조 모티프 일치 여부를 판별하는 검색 기술이다. 그림설명=김현빈 서울대 박사후연구원

폴드디스코의 작동 원리. 폴드디스코는 단백질의 3차원 구조 정보를 색인화해 대규모 데이터베이스에서 유사 구조를 초고속으로 탐색하고, 구조 모티프 일치 여부를 판별하는 검색 기술이다. 그림설명=김현빈 서울대 박사후연구원

AD
원본보기 아이콘

이번 연구 성과는 생명과학 분야 국제학술지인 Nature Biotechnology에 지난 5일 온라인 게재됐다.

단백질 구조 모티프는 효소의 활성 부위나 결합 부위처럼 단백질 기능을 결정하는 3차원 구조 패턴이다. 연구자들은 이를 단백질의 '입체 지문'으로 부른다. 이 지문을 찾으면 기능이 알려지지 않은 단백질의 역할도 추정할 수 있다.


하지만 최근 AI 기반 단백질 구조 예측 기술 발전으로 데이터가 폭증하면서, 방대한 구조 데이터에서 의미 있는 모티프를 찾는 것이 새로운 과제로 떠올랐다. 기존 검색 방식은 저장공간과 계산 시간이 많이 필요해 대규모 데이터베이스 분석에 한계가 있었다.

단백질 '입체 지문' 초고속 탐색


연구팀은 단백질 구조에서 서로 인접한 아미노산 쌍의 거리와 각도, 방향 정보를 수치화해 색인하는 방식을 개발했다. 여기에 아미노산 곁사슬(side-chain)의 방향 정보까지 반영해 기능 부위의 미세한 형태 차이도 구분할 수 있도록 했다.


또 위치 정보를 저장하지 않는 '위치 없는 색인' 기술과 드문 패턴에 높은 가중치를 부여하는 '희소성 기반 채점' 방식을 적용해 검색 속도와 저장 효율을 동시에 높였다.


그 결과 폴드디스코는 기존 방법보다 색인 저장공간을 4분의 1 수준으로 줄이면서도 검색 속도는 20배, 색인 생성 속도는 11배 향상된 것으로 나타났다.

연구팀 사진. 왼쪽부터 마틴 슈타이네거 교수(교신저자), 김현빈 박사(제1저자), 김성은 연구원(공동저자), 밀롯 미르디타 교수(공동저자), 윤재원 연구원(공동저자). 서울대 제공

연구팀 사진. 왼쪽부터 마틴 슈타이네거 교수(교신저자), 김현빈 박사(제1저자), 김성은 연구원(공동저자), 밀롯 미르디타 교수(공동저자), 윤재원 연구원(공동저자). 서울대 제공

원본보기 아이콘

연구팀은 실제 검증에서도 성과를 확인했다. 기능이 알려지지 않았던 단백질에서 금속 결합 기능과 관련된 '아연집게(zinc finger)' 모티프를 찾아냈으며, 세포막 수용체(GPCR)의 활성 상태와 비활성 상태도 정확히 구분해냈다.


연구진은 이번 기술이 미지의 단백질 기능 규명뿐 아니라 특정 활성 부위를 갖는 인공 효소 설계와 신약 후보물질 개발 등 바이오·의약 분야 전반에서 활용될 것으로 기대하고 있다.

AD

슈타이네거 교수는 "현재는 단백질 구조 검색에 초점이 맞춰져 있지만 향후 핵산과 약물 등 다양한 생체분자로 검색 범위를 확장해 복잡한 생명현상을 통합적으로 분석할 수 있는 플랫폼으로 발전시킬 계획"이라고 말했다.


김종화 기자 justin@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠

놓칠 수 없는 이슈