专家:“反而会带来需求增长”
在巴西 ICLR 对 TurboQuant 进行具体验证
“全球人工智能(AI)业界的关注正集中在本月23日至27日于巴西里约热内卢举行的 ICLR(国际学习表征会议)上。这是因为谷歌公开的人工智能(AI)内存压缩技术‘TurboQuant’将在会上接受具体验证。”
在谷歌 TurboQuant 的市场冲击力备受关注之际,国内外 AI 专家都在聚焦 ICLR。ICLR 是人工智能领域三大顶级学术会议之一,谷歌将在该会议上正式发表与 TurboQuant 相关的论文,并在经过同行研究者的验证后,计划于6月左右向全球公开实际程序代码。
此前,谷歌已于上月24日(当地时间)在 Google Research 博客上公开了 TurboQuant 论文,围绕其对全球存储半导体市场影响力的争论迅速升温。TurboQuant 是一种压缩大型语言模型(LLM)用于记忆上下文的“KV 缓存(临时内存)”的技术,过去在不压缩的情况下使用16位表示,而该技术通过大幅削减位宽、提高效率来实现优化。
由于 TurboQuant 将内存使用量减少到原来的六分之一,引发市场担忧,认为这将成为包括美国美光在内的存储半导体生产企业,以及我国的三星电子和 SK海力士等企业的利空因素,相关股价一度大幅下跌。
然而,以学界和 AI 半导体业界为中心,认为市场出现的这场“TurboQuant 冲击”过于夸大的反对意见正逐渐占据上风。
HyperAccel 首席技术官(CTO) Lee Jinwon 表示:“传统方法是在不压缩的情况下使用16位,而通过压缩到3~4位并进行量化等结构性优化的技术,学界早已在持续讨论”,“谷歌采用的量化方式本身确实是一个好点子,但4位量化并非完全全新的东西,当时股市的反应明显过度。”
这位 CTO 还表示:“TurboQuant 通过提升 AI 模型的效率,将会增加那些因成本高昂而无法使用英伟达图形处理器(GPU)等设备的企业的需求”,“相反,如果在 ICLR 会议上得到充分验证,证明 TurboQuant 不仅如预期那样成功压缩了内存存储空间,而且速度也达到了目标,那么这一技术反而会成为突破 AI 服务瓶颈、促进半导体消费的契机。”内存使用量减少到六分之一,意味着通过提高效率可以实现更加复杂、更加庞大的 AI 服务,这最终并不是在压缩存储半导体生产企业的“蛋糕”,而是通过扩大基础设施带动需求增长。
Mobilint 代表 Shin Dongju 也表示:“只是因为谷歌本身具有巨大影响力,又通过媒体传播形成了病毒式扩散,这才被炒成了大话题,但 TurboQuant 并不是突然冒出来的技术”,“像 TurboQuant 这类提升效率的技术,会让原本无法应用 AI 的领域也出现需求,市场规模将进一步扩大,对 SK海力士和三星电子等存储厂商的需求会持续增加。”
Shin 代表认为,对于近期业绩屡创新高的三星电子和 SK海力士而言,其后续股价将更多取决于供给端而非需求端。他表示:“美光、三星电子、海力士三家公司之间的竞争、围绕产能(生产能力)扩张展开的博弈,以及中国存储厂商的追赶,反而可能使供给端因素成为未来决定股价的关键。”
韩国科学技术企划评价院(KISTEP)技术预测中心主任 Shin Dongpyeong 则表示:“TurboQuant 是试图用软件方式解决硬件问题的一种尝试”,“受 TurboQuant 影响,从长期看 AI 服务将持续扩展,越来越多的设备能够进行 AI 运算,届时端侧 AI(On-Device AI)市场也将随之扩大。”
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。