pvc管粘接胶水厂家「选了谷歌，落后年！」美国AI袖「场」谷歌：省点钱却输了时间！英伟达笑醒？

发布日期：2026-05-28 19:50点击次数：

AI短剧中的情节照进现实pvc管粘接胶水厂家。

就在谷歌年度开发者大会进行时，AI业界袖却毫不留情地场子！到底有多大怨念？

就在几天前的谷歌I/O大会进行期间，文生图AI知名企业Midjourney创始人兼CEO大卫·霍茨（ David Holz）却毫不留情地公开吐槽谷歌TPU，引发了硅谷AI圈的广泛讨论。

霍茨在X平台上表示，因为早年选择了谷歌TPU而非英伟达GPU作为核心训练基础设施，Midjourney的研究进度比本可以达到的水平落后了整整年。“如果可以回到过去，我会开始就采用英伟达芯片。”

这句话之所以具有巨大伤力，因为这是来自与谷歌有度作的知名AI企业，当初是谷歌云广自芯片的张招，而且他们还靠谷歌TPU节省了三分之二的理成本。这次吐槽相当于给英伟达做了好的背书。

霍茨为什么如此不给谷歌面子，要在谷歌发布新芯片的时候场子？

场真实代价的公开复盘

当然，霍茨不是随口抱怨，而是用真实代价做出的公开复盘。它触及了当前AI基础设施竞争核心的矛盾：硬件能的竞赛之外，软件生态的护城河才是真正决定胜负的战场。

要理解霍茨的懊悔，需要先厘清谷歌TPU和英伟达GPU在研究场景下的本质差异。

举个例子，GPU相当于通用并行计的瑞士军刀。英伟达的CUDA平台从2007年就开始布局，今天已经积累了将近二十年的生态沉淀，成为AI行业通用的平台。

AI研究员常用的框架PyTorch与CUDA度绑定，Hugging Face上几乎所有开源模型权重默认GPU格式发布，Nsight能分析器、NCCL通信库、TensorRT理优化工具——这是套完整的研究工具链。全球的AI研究员从学校开始就在CUDA上写代码，PyTorch是他们的母语。

而TPU则是另种生态。它是用集成电路，底层架构围绕脉动阵列设计，门优化度学习张量运，在大规模稳定训练任务上率。但它要求使用JAX或TensorFlow框架，对PyTorch的支持长期残缺不全。社区资源匮乏，调试工具不成熟，几乎所有的排错都要依赖谷歌自己的文档。

回到Midjourney的具体需求，他们做的是图像生成研究，需要大量自定义子实验、快速原型迭代，以及随时调用Hugging Face生态里的扩散模型组件。这些工作在GPU+PyTorch的环境下如鱼得水，在TPU上却步履维艰。

举个简单例子，个研究员想验证个新想法，在GPU上可能只需要几小时；在TPU上，光是配置环境和适配框架就可能耗费几天。长期累积下来pvc管粘接胶水厂家，就是霍茨所说的“落后了年”。

当初为何选择谷歌TPU？

不过需要强调的是，霍茨的吐槽门针对研究和训练阶段。在理阶段，这个逻辑就不同。这也是他们当初为什么迁移到谷歌TPU的直接动力，因为用谷歌TPU可以实实地省钱，而且不用和巨头们争英伟达显卡。

早在2023年，谷歌云就调官宣，Midjourney 已经选择谷歌作为其核心基础设施供应商。Midjourney 利用谷歌的 TPU v4/v5（基于 JAX 框架）来训练其四代和五代的文生图大模型；同时，租用谷歌云上的英伟达 GPU 集群，来处理全球用户数以亿计的日常生成理。

Midjourney的选择很现实。当时英伟达的 H100 被了，Midjourney 作为个没有巨头撑腰的立AI公司，根本排不上号。而谷歌的 TPU 力管够，且对图像这种大规模矩阵运的价比（可以省下六成的成本）在纸面上非常诱人。

2025年二季度，Midjourney将主力理集群也从英伟达A100/H100迁移到谷歌Cloud TPU v6e，月度理支出从约210万美元骤降至70万美元以下，年化节省过1680万美元，回本周期仅11天。

换句话说，TPU在规模化理上的价比优势是真实的。霍茨真正懊恼的是：自己应该在研究阶段用英伟达磨模型，理阶段再迁移到谷歌TPU降本；而不是从开始就在TPU上做研究，为此付出年的进度代价。

英伟达护城河是生态？

奥力斯泡沫板橡塑板专用胶报价联系人：王经理手机：18232851235（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

霍茨的公开吐槽，本质上是份对英伟达生态护城河的证词。英伟达的护城河不在于H100比TPU快多少，而在于数研究员的工作习惯、数以万计的开源代码库，以及整个学术界默认GPU作为实验平台的行业惯。

2026年，PyTorch在研究论文中的占有率仍达85。几乎所有前沿研究的代码都基于英伟达硬件。这意味着，任何想要使用TPU做研究的团队，都须承担个隐成本：将自己与主流社区隔离，放弃大量现成的工具和资源，在个相对小众的技术栈里自探索。

这就是为什么即便TPU在某些指标上已经与GPU相当甚至优，业界大多数研究实验室仍然默认选择GPU。或许硬件能可以追赶，生态积累法速成。黄仁勋花了将近二十年时间建造的这条护城河，正是英伟达值钱的资产。

谷歌显然意识到了问题所在。在今年的谷歌云Next大会上，谷歌发布了八代TPU，并次采用双芯片策略：TPU 8t（训练）和TPU 8i（理）。这是TPU历史上次将训练和理分拆成两颗架构不同的用芯片，就是为了解决霍茨吐槽的问题。

TPU 8t代号Sunfish，由博通作设计，面向大规模预训练。Pod规模达9600颗芯片、共享2PB HBM，训练价比比上代Ironwood提升2.7倍。TPU 8i代号Zebrafish，由联发科设计，攻理和serving，将片上SRAM扩大至384MB，芯片互联带宽翻倍至19.2 Tb/s，并引入全新的Boardfly网络拓扑pvc管粘接胶水厂家，将1024芯片配置的大网络跳数从16跳降至7跳，在大型MoE模型低延迟理上价比比Ironwood提升80。两款芯片采用台积电2纳米工艺，预计2027年量产。

谷歌这次双芯片战略本身就是次重要的战略承认：训练和理已经分化成两种不同形状的工作负载，颗芯片法再同时优化两端。这与英伟达“块GPU通吃”的路线形成了鲜明对比，也是谷歌对英伟达Vera Rubin NVL72和亚马逊Trainium3的正面回击。

而且谷歌这次不只是发布了新硬件。针对霍茨对TPU生态的抱怨，谷歌同步出了TorchTPU项目——个让PyTorch原生运行在TPU上的工程计划，目前处于预览版状态。

按照谷歌的路线图，TorchTPU将支持PyTorch的Eager Mode、与vLLM和TorchTitan度集成、并终实现到完整Pod规模的线扩展。如果TorchTPU真正成熟，那些坚守PyTorch的研究团队将次能够在不重写代码的前提下使用TPU。

然而，TorchTPU目前仍是预览版，不是正式发布版。霍茨那种“改个架构、调个子、快速验证想法”的研究工作流，在TPU 8t上是否真的像在H100上样顺滑，还需要大量实战验证。扇门已经开，但门后的路有多平坦，2027年正式量产之后才能见分晓。

Claude为什么横跨三平台？

如果Midjourney对TPU的训练生态有这么多不满的话，那么现在AI行业新头羊Anthropic是怎么解决脚踏三条船的挑战的？要知道他们同时在英伟达GPU、谷歌TPU和亚马逊Trainium三套硬件上训练和运行Claude。

Anthropic原本是处于AI集团的追赶者角，财力远远不能和谷歌和OpenAI相比，因此他们接受了谷歌和亚马逊的巨额投资，交换条件之就是使用这两个巨头的TPU和Trainium芯片。

谷歌和亚马逊都是Anthropic的战略投资者，两巨头先后给Anthropic投资了近100亿美元。再加上微软投资的50亿美元，相当于全球三大云计巨头在力供养着Anthropic。

巨头们可不是单纯的财务投资。这些投资有大部分都折现成了谷歌和亚马逊的营收，因为Anthropic目前使用着过百万张亚马逊Trainium芯片，万能胶厂家门用于训练和部署新的Claude模型，同时使用着数十万张谷歌TPU，并计划在未来逐步拓展到百万TPU阵列。

与此同时，谷歌云、AWS以及微软Azure也是Claude在全球B端市场的主要分发平台。三大万亿巨头都想用自己的销售网络帮Claude货，自己获得营收提成，重要的是，把力流量留在自的服务器里，同时搭售自的云服务。

这种通吃的局面，也让 Anthropic 成为硅谷历史上成长速度快、底足的立AI巨头。近他们还与SpaceX达成了力租赁协议，每年要支付150亿美元使用马斯克在田纳西州中心囤积的英伟达GPU芯片带来的力。

那么，Anthropic是怎么做到同时使用三大平台芯片的？

Anthropic官表述是：不同工作负载匹配适的芯片。英伟达GPU承接研究实验和快速原型；谷歌TPU和亚马逊Trainium分别承接大规模训练和理的主力工作负载pvc管粘接胶水厂家，两计机供应商之间形成制衡，止单平台绑架定价权。

Anthropic与亚马逊的作规模尤其引人注目。双已签署协议，Anthropic将在未来十年向AWS投入过1000亿美元，获得多5吉瓦的力容量，覆盖Trainium2到Trainium4。

有趣的是，在新谷歌云Next大会宣布与Anthropic入作的时候，亚马逊站出来“公开邀赏”，声称Claude的训练在Trainium上完成，Project Rainier——这个目前运行过100万颗Trainium2芯片的集群——是全球大的AI训练集群之。

与此同时，Anthropic在谷歌Cloud Next大会前不久宣布扩大与谷歌和博通的作，获得多吉瓦的下代TPU容量，预计2027年投入使用。

Anthropic靠什么脚踩三条船？

Anthropic能走出这条路，有个关键的技术DNA：公司核心创始团队来自Google Brain，JAX是他们的母语。从开始，Anthropic就将JAX作为核心训练框架——JAX的设计哲学是硬件关，同套代码通过XLA编译器可以在GPU、TPU乃至Trainium上运行。

这与Midjourney的路径恰好相反：Midjourney先在PyTorch+GPU的生态里建好研究工作流，再试图迁移到TPU，迁移成本才造成了年的损失。

然而这种多平台策略也是有代价的，Anthropic每次模型新都要在三套架构上分别测试，每个bug都有三个潜在成因，部署复杂度是单平台案的三倍。这是三平台策略须承付的工程账单。

谷歌的 TPU 体系基于传统的 JAX 和 XLA 编译器。亚马逊的 Trainium 体系则基于 AWS 自研的 Neuron SDK。这意味着，Anthropic 核心的分布式训练框架，不能直接平移。

因此，Anthropic的工程团队须派驻顶的底层硬件优化，与谷歌和亚马逊的芯片团队闭门联开发，将复杂的子、混精度训练代码，用三套不同的硬件底层汇编逻辑重写并优化。这种人力成本和时间沉淀，确实远纯粹使用英伟达生态的 OpenAI。

相比之下，Midjourney 的团队规模小，根本没有 Anthropic 那种可以跟巨头芯片团队闭门魔改底层的千人工程兵团。在面对 TPU小众的 JAX/XLA 编译环境时，旦遇到诡异的硬件 Bug，整个团队只能停工去死磕底层代码。

此外，2025年8至9月，Claude用户报告了明显的能下降。Anthropic的事后复盘披露了三个立的基础设施漏洞：上下文窗口路由错误影响了某平台上16的Sonnet 4请求；TPU服务器配置错误致Opus 4和Sonnet 4输出损坏；XLA编译器漏洞困扰Haiku 3.5长达两周。

Anthropic在自己的研究论文中反复强调：不要使用复杂的框架，保持架构的度简单与可组。模型层设计得越纯粹、越少花活，在面对多芯片平台交叉测试时，底层暴露出的硬件 Bug 就越少，从而用“设计上的克制”化解了“平台上的繁复”。

付出了这笔昂的工程账单后，Anthropic 收获了全行业羡慕的果实。根据新的 TCO（总拥有成本）数据，谷歌 TPU 和亚马逊 Trainium 在大规模理时的价比，比英伟达平台整整出 50 以上。

相比较OpenAI 赌的是“英伟达纯生态+ Stargate 单点大力”；而 Anthropic 则是用三倍的工程成本，硬生生把自己逼成了个“跨平台黏体”。

这种底层基建的跑通，让 Claude 在如今多模态智能体大规模并发、大流量吞吐的工业落地战役中，拥有了全行业便宜、不被单卡脖子的限力大后。这就是多平台策略牺牲短期人力、换取长期战略制点的终兑现。

未来格局：用芯片时代的竞争逻辑

话题回到霍茨的那条文，某种程度上是AI基础设施进入新阶段的个缩影。接下来几年的竞争格局，已经开始清晰。

训练侧的格局是：英伟达仍然是研究实验和快速迭代的选平台，但在大规模稳定训练上，TPU和Trainium正在以价比优势侵蚀份额。谷歌TPU 8t的2.7倍价比提升、亚马逊Trainium3的持续进化，意味着前沿AI实验室将越来越倾向于“研究用GPU、训练用用芯片”的混策略。

理侧的格局加有利于挑战者。理是AI基础设施中增速快的部分——2026年初理已占AI力总支出的55，预计到2030年将占75。在这个场景下，TPU和Trainium的用优化能带来Midjourney那样65的成本削减，经济账得通。谷歌TPU 8i正是针对这趋势的定向武器。

生态侧的战局则为长期。TorchTPU能否真正让PyTorch研究员缝迁移到TPU，是谷歌2027年重要的挑战。亚马逊的策略则为务实：Trainium与PyTorch的兼容直是其主点，通过Bedrock平台上十万以上的企业客户积累，正在悄悄构建自己的应用层生态。

但英伟达不会坐视对手侵蚀自己的护城河，CUDA的持续进化和Blackwell架构的出，是对“GPU不是研究唯选择”论调的直接反击。

供给侧的变量也同样值得关注，谷歌TPU的大规模量产受制于台积电的封装产能，原计划2026年达到400万颗的目标已迟至2027年。台积电现有AP8工厂已满负荷，新的AP7平台期产能已全部分配给苹果处理器，二期年底才能投入。这意味着即便需求盛，TPU的供给在2026年仍将是制约因素，反而给英伟达留下了缓冲空间。

对大多数中小型AI公司而言，霍茨的懊恼仍然具有实际意义：研究阶段全用英伟达，生态摩擦低，迭代速度快。等到模型架构稳定、理规模上来，再评估TPU迁移的经济账。这不是因为英伟达好，而是因为生态成本在规模较小时会压倒硬件成本。

对Anthropic这个量的前沿实验室，三平台策略的逻辑截然不同：它不只是为了省钱，而是为了确保在任何单供应商出现问题时，Claude的训练和服务都不会中断；同时用多平台需求作为筹码，在与亚马逊和谷歌的谈判中保持议价能力。

硬件能vs生态率，价比vs研究速度，用优化vs通用灵活，这是当前AI芯片战争核心的几大矛盾张力。谷歌用双TPU战略试图两端兼顾，亚马逊用Trainium的兼容策略绕过生态壁垒，英伟达则用二十年积累的软件护城河抵御所有挑战者。

没有人能买到所有筹码，也没有哪公司的选择是错的，都要付出不同的代价。在AI基础设施的棋盘上，芯片能早已不是唯的计分式。（科技）

海量资讯、解读，尽在财经APP 相关词条:设备保温塑料挤出机厂家预应力钢绞线玻璃丝棉万能胶厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定pvc管粘接胶水厂家，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

上一篇：攀枝花万能胶厂家 ST智云成立科技新公司，含AI及卫星相关业务下一篇：恩施万能胶厂李云飞剧透：比亚迪是全球唯拥有芯片全流程制造能力的车企

- 产品中心

热点资讯

pvc管粘接胶水厂家 「选了谷歌，落后年！」美国AI袖「场」谷歌：省点钱却输了时间！英伟达笑醒？

pvc管粘接胶水厂家「选了谷歌，落后年！」美国AI袖「场」谷歌：省点钱却输了时间！英伟达笑醒？