Google Cloud Next 2025
缩短响应时间节省运算成本
推出全新AI芯片“Ironwood”

谷歌发布了全新人工智能(AI)模型“Gemini 2.5 Flash”,其性能效率优于OpenAI和DeepSeek的AI模型。Gemini 2.5 Flash是Gemini 2.5系列推出的第二款模型。与谷歌上月发布的“Gemini 2.5 Pro”相比,新模型进一步降低了响应延迟时间,并节省了运算成本。


法新社 联合新闻提供

法新社 联合新闻提供

View original image

当地时间9日,在美国拉斯维加斯曼德勒海湾会展中心举行的“Google Cloud Next 2025”现场,谷歌首席执行官(CEO)Sundar Pichai表示:“使用Gemini 2.5 Flash,可以控制模型推理的精细程度,并在预算与性能之间取得平衡。”这指的是,系统能够根据用户输入问题的复杂程度自动调整处理时间。其特点是在应对简单请求时,以更低成本快速给出回答。


Google Cloud首席执行官Thomas Kurian补充称:“在谷歌的‘AI超级计算机(AI Hypercomputer)’环境中运行Gemini 2.5 Flash,其性价比将达到OpenAI的‘GPT-4o’的2倍、DeepSeek的‘R1’的5倍以上。”目前,Gemini 2.5 Flash已在面向AI开发者和研究人员的平台“Vertex AI”以及Gemini应用中提供预览版。


谷歌预告将在今年年底推出的第七代张量处理单元(TPU)“Ironwood”。其能效性能较第六代提升2倍,最高算力也扩大至5倍。谷歌云提供

谷歌预告将在今年年底推出的第七代张量处理单元(TPU)“Ironwood”。其能效性能较第六代提升2倍,最高算力也扩大至5倍。谷歌云提供

View original image

谷歌当天还发布了新一代AI芯片“Ironwood”。Ironwood是专门针对推理任务优化的第七代张量处理单元(TPU),是一款用于数据分析和深度学习的专用半导体。其设计可以根据聊天机器人、代码、媒体内容生成等多种AI工作负载进行扩展。Ironwood的开发意在降低对英伟达AI加速器的依赖。由于近期AI市场的重心正迅速转向以推理型模型为中心,谷歌计划凭借强调性价比的自研芯片来抢占市场。今年年底将面向Google Cloud客户推出。


与现有型号相比,Ironwood在能效和容量方面都有大幅提升。每个Pod(TPU集群)可搭载9000枚以上芯片,具备42.5 EFlops(百亿亿次浮点运算)的算力。与谷歌去年发布的第六代TPU“Trillium”相比,其能效提升了2倍,最大计算容量也扩大了5倍。芯片配备带宽为198GB的高带宽内存(HBM),从而减少了数据传输次数。


谷歌当天还在AI及云业务领域点名三星作为合作伙伴。谷歌计划在今年上半年推出的三星家用AI机器人“Ballie”上搭载生成式AI模型。



谷歌发布超越GPT和DeepSeek的新AI模型“Gemini 2.5 Flash” View original image


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济。未经许可不得转载,禁止用于AI训练及使用。

不容错过的热点