Google 的第六代张量处理单元(Tensor Processing Unit, TPU)被命名为 Trillium,旨在进一步推动人工智慧(AI)领域的发展。?自 2013 年推出首款 TPU 以来,Google 持续致力於开发专为机器学习任务设计的应用专用积体电路(ASIC),以提升 AI 模型的运算效能和效率。?
相较於前一代 TPU v5e,Trillium TPU 在多方面展现出显着的提升:??每颗晶片的峰值运算效能提高了 4.7 倍,推论处理量最多增加至原来的三倍,能源效率提升 67%。高频宽记忆体(HBM)?容量与频宽均提升一倍,使 Trillium 能处理具有更多权重和更大键值快取(key-value caches)的较大模型作业。 晶片间互连网路(ICI)的?频宽加倍,支援训练和推理作业扩展至数万个晶片,提升系统的扩展性和效能。这些改进使 Trillium TPU 成为支援下一代大型 AI 模型训练和部署的关键基础设施,特别是在生成式 AI 领域。?
展??未来,Google 将持续投入资源,推动 Trillium TPU 的技术发展,重点包括:?持续提升运算效能、扩大生态系统合作、并推动永续发展:?在提升效能的同时,注重能源效率,确保 AI 技术的发展对环境影响降至最低。