与延世大学、成均馆大学、Ajou University共同研究
"解决以InfiniBand为中心的厂商绑定问题"

人工智能转型(AX)专业企业Acryl将着手推进被视为韩国人工智能(AI)基础设施核心瓶颈的图形处理器(GPU)集群网络技术国产化。

Acryl推进GPU集群网络技术国产化……入选韩国科学技术信息通信部项目 View original image

Acryl于10日表示,已被选定为韩国科学技术信息通信部下属“信息通信企划评价院”推进的国家项目主管机构。该项目名为“面向大规模GPU集群环境中网络效率最大化的基于以太网的GPU集群网络Fabric系统及优化技术开发”。


此次项目为总事业费约67亿韩元规模(政府资助55亿韩元)的大型研发项目,开发周期截至2028年12月。Acryl将作为主管机构,与延世大学、成均馆大学、Ajou University产学合作团共同开展研究。


Acryl计划将通过此次项目 확보的技术与商用GPU基础设施集成平台“JONATHAN GPUBASE”结合。并将其打造为可适用于云服务提供商、托管服务提供商、公共AI数据中心、医疗AI基础设施等场景的国产GPU网络Fabric解决方案。


目前,大规模GPU集群网络由英伟达的InfiniBand主导,但由于高昂的许可成本、专用设备供应延迟以及资本支出负担等厂商绑定带来的运营局限,能够利用现有以太网资产的基于RoCEv2的开放式Fabric正成为替代方案。不过,即使引入RoCE,由于各厂商的网络操作系统与Fabric管理体系彼此分离,运营人员仍会再次受制于各自工具,多厂商运维复杂性问题也被指为新的局限。


Acryl已通过同时支持InfiniBand和RoCEv2的商用GPU基础设施集成平台“GPUBase”,提供可对多厂商RoCE Fabric进行统一观测、管理与优化的通用控制层,以解决上述问题。Acryl计划通过此次项目,将开放式以太网GPU集群Fabric技术与GPUBase结合,并在第三年度于其自建互联网数据中心中的RoCEv2集群开展大规模实证,从而正式引领韩国AI基础设施向以太网/RoCE转型。



Yeom Ikjun、Acryl首席技术官表示:“将通过此次项目,提出能够解决以InfiniBand为中心的架构在成本、供应和资产利用方面局限的开放式以太网GPU网络替代方案,并为韩国AI基础设施生态系统奠定自主发展基础。”


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点