谷歌发布超越GPT和DeepSeek的新AI模型“Gemini 2.5 Flash”

by Jun Youngjoo

Published 10 Apr.2025 11:33(KST)

Google Cloud Next 2025
缩短响应时间节省运算成本
推出全新AI芯片“Ironwood”

谷歌发布了全新人工智能（AI）模型“Gemini 2.5 Flash”，其性能效率优于OpenAI和DeepSeek的AI模型。Gemini 2.5 Flash是Gemini 2.5系列推出的第二款模型。与谷歌上月发布的“Gemini 2.5 Pro”相比，新模型进一步降低了响应延迟时间，并节省了运算成本。

法新社联合新闻提供

当地时间9日，在美国拉斯维加斯曼德勒海湾会展中心举行的“Google Cloud Next 2025”现场，谷歌首席执行官（CEO）Sundar Pichai表示：“使用Gemini 2.5 Flash，可以控制模型推理的精细程度，并在预算与性能之间取得平衡。”这指的是，系统能够根据用户输入问题的复杂程度自动调整处理时间。其特点是在应对简单请求时，以更低成本快速给出回答。

Google Cloud首席执行官Thomas Kurian补充称：“在谷歌的‘AI超级计算机（AI Hypercomputer）’环境中运行Gemini 2.5 Flash，其性价比将达到OpenAI的‘GPT-4o’的2倍、DeepSeek的‘R1’的5倍以上。”目前，Gemini 2.5 Flash已在面向AI开发者和研究人员的平台“Vertex AI”以及Gemini应用中提供预览版。

谷歌预告将在今年年底推出的第七代张量处理单元（TPU）“Ironwood”。其能效性能较第六代提升2倍，最高算力也扩大至5倍。谷歌云提供

谷歌当天还发布了新一代AI芯片“Ironwood”。Ironwood是专门针对推理任务优化的第七代张量处理单元（TPU），是一款用于数据分析和深度学习的专用半导体。其设计可以根据聊天机器人、代码、媒体内容生成等多种AI工作负载进行扩展。Ironwood的开发意在降低对英伟达AI加速器的依赖。由于近期AI市场的重心正迅速转向以推理型模型为中心，谷歌计划凭借强调性价比的自研芯片来抢占市场。今年年底将面向Google Cloud客户推出。

与现有型号相比，Ironwood在能效和容量方面都有大幅提升。每个Pod（TPU集群）可搭载9000枚以上芯片，具备42.5 EFlops（百亿亿次浮点运算）的算力。与谷歌去年发布的第六代TPU“Trillium”相比，其能效提升了2倍，最大计算容量也扩大了5倍。芯片配备带宽为198GB的高带宽内存（HBM），从而减少了数据传输次数。

谷歌当天还在AI及云业务领域点名三星作为合作伙伴。谷歌计划在今年上半年推出的三星家用AI机器人“Ballie”上搭载生成式AI模型。