首尔大学研究团队开发出超高速蛋白质结构检索工具“Folddisco”
有望用于揭示未知蛋白质功能,并应用于新药设计

一项新技术问世,可在人工智能预测的数亿个蛋白质结构数据中,于数秒内找出决定功能的关键线索。该技术有望不仅用于阐明蛋白质功能,还可应用于新药开发和人工酶设计。


韩国研究财团11日表示,首尔大学Martin Steinerger教授研究团队开发出一款名为“Folddisco”的检索工具,可在海量蛋白质结构数据库中超高速搜索结构基序(structural motif)。

Folddisco的工作原理。Folddisco是一种检索技术,将蛋白质三维结构信息建立索引,在大型数据库中以超高速搜索相似结构,并判断结构模体是否匹配。图片说明=Kim Hyeonbin 首尔大学博士后研究员

Folddisco的工作原理。Folddisco是一种检索技术,将蛋白质三维结构信息建立索引,在大型数据库中以超高速搜索相似结构,并判断结构模体是否匹配。图片说明=Kim Hyeonbin 首尔大学博士后研究员

View original image

这项研究成果已于本月5日在线发表于生命科学领域国际学术期刊《Nature Biotechnology》。


蛋白质结构基序是决定蛋白质功能的三维结构模式,例如酶的活性位点或结合位点。研究人员将其称为蛋白质的“立体指纹”。一旦找到这种“指纹”,便可推测功能尚未明确的蛋白质所发挥的作用。


不过,随着近年来基于人工智能的蛋白质结构预测技术发展,数据量激增,如何从海量结构数据中找出有意义的基序,已成为新的课题。现有检索方式需要大量存储空间和计算时间,因此在分析大规模数据库时存在局限。


超高速搜索蛋白质“立体指纹”


研究团队开发出一种索引方法,将蛋白质结构中彼此相邻的氨基酸对之间的距离、角度和方向信息进行数值化处理并建立索引。在此基础上,还纳入了氨基酸侧链(side-chain)的方向信息,从而能够区分功能位点在细微形态上的差异。


此外,团队还采用了不存储位置信息的“无位置索引”技术,以及对罕见模式赋予更高权重的“基于稀疏性的评分”方式,同时提升了检索速度和存储效率。


结果显示,Folddisco在将索引存储空间压缩至现有方法四分之一水平的同时,检索速度提升了20倍,索引生成速度提升了11倍。

研究团队合影。从左起依次为Martin Steinerger教授(通讯作者)、Kim Hyeonbin博士(第一作者)、Kim Seongeun研究员(共同作者)、Milot Mirdita教授(共同作者)、Yun Jaewon研究员(共同作者)。首尔大学供图

研究团队合影。从左起依次为Martin Steinerger教授(通讯作者)、Kim Hyeonbin博士(第一作者)、Kim Seongeun研究员(共同作者)、Milot Mirdita教授(共同作者)、Yun Jaewon研究员(共同作者)。首尔大学供图

View original image

研究团队在实际验证中也确认了成果。他们在功能尚不明确的蛋白质中找到了与金属结合功能相关的“锌指”基序,并准确区分了细胞膜受体——G蛋白偶联受体——的活性状态与非活性状态。


研究团队预计,这项技术不仅可用于揭示未知蛋白质的功能,还将广泛应用于生物与医药领域,包括设计具有特定活性位点的人工酶,以及开发候选新药物质等。



Steinerger教授表示:“目前该技术的重点仍放在蛋白质结构检索上,但未来计划将检索范围扩展至核酸、药物等多种生物分子,并将其发展为可综合分析复杂生命现象的平台。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点