全球数字财富领导者

英伟达的护城河

2023-06-19 17:17:50
老虎证券
老虎证券
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —

英伟达最近很无聊,除了涨还是涨,低点上来已经走了4倍行情了。在震惊的同时,我们也看了一篇介绍英伟达护城河的文章,所以分享给大家,方便大家更好的了解一下英伟达的“江湖地位”。

英伟达在AI芯片领域中占据的市场份额,让市场对英伟达感到兴奋。为了防止被英伟达抢走市场份额,竞争对手也在努力构建自己的AI芯片。于此同时,看涨者也强调,能够构筑英伟达护城河的不仅仅是其A100和H100芯片的卓越性能,还有专为英伟达芯片优化的CUDA软件包,巩固了其护城河地位。 

然而,这只是冰山一角。英伟达在其整套数据中心解决方案中受益于多个网络效应。而竞争对手努力构建自己的AI芯片来与这家科技巨头竞争时,英伟达越来越专注于“数据中心作为产品”,进一步支撑了该股的看涨情绪。 

英伟达的全栈问题,全栈挑战 

那些希望与英伟达有效竞争的半导体公司不仅需要构建可媲美的AI芯片,还需要为芯片建立相应的软件生态系统,以加快开发者的应用程序开发过程。英伟达确实围绕CUDA(或称统一计算设备架构)构建了一个强大的生态系统,包括庞大的开发者社区、第三方软件和硬件供应商以及学术机构。该生态系统形成良性循环,使用CUDA的人越多,第三方开发者和其他合作伙伴就越有动力支持它,为英伟达的GPU编写更多的程序,从而进一步强化生态系统。 

大多数投资者现在已经意识到这种护城河因素。然而,这只是冰山一角,因为英伟达在数据中心的护城河远不止其卓越的AI芯片和CUDA软件包。而竞争对手正试图构建竞争的AI芯片和相应的软件包时,首席执行官黄仁勋将目光集中在更宏大的机会上,将数据中心作为一种产品。

在2024年第一季度的财报电话会议上,CEO 黄仁勋提到:这个问题已经为人所知,并且你们也听过我的谈论,加速计算是一个全栈问题,也是一个全栈挑战。但如果你能够在大量应用领域成功实施,这需要我们15年的时间,几乎所有数据中心的主要应用程序都可以加速,你可以将能耗和成本大幅降低一个数量级。这需要大量资金,因为你必须处理所有的软件和其他方面,并且还需要构建所有的系统等等。但我们已经从事了15年。 

黄仁勋经常谈到加速计算是一个全栈问题和全栈挑战,但他指的是什么呢? 

“栈”基本上是指一组技术,包括硬件组件如GPU和智能网卡,以及软件组件如库和框架,它们共同协作以提供所需的功能。 

当他说加速计算既是一个全栈问题又是一个全栈挑战时,他指的是它涉及多个技术层面,并且需要在每个层面上提供个别和综合的解决方案。 

因此,当他说加速计算是一个全栈问题时,他的意思是它需要在计算栈的每个层面上提供解决方案。这不仅仅涉及开发更快的硬件,还涉及优化软件,设计能够最佳地利用不同硬件组件的功耗的编程框架。

然后,他同时将其称为全栈挑战,他在此处指的是在整个计算栈的每个层面上高效协同工作以最大化加速计算性能所面临的复杂性。所有这些单独的硬件组件及其相应的软件组件需要被有效地整合在一起,以实现整个数据中心的最佳性能。

网络解决方案在整合加速计算栈的各个层面中起着至关重要的作用,实现数据中心基础设施内部各个组件之间的高效数据传输和通信。根据英伟达最新的10-K文件(重点强调):

网络解决方案包括InfiniBand和以太网网络适配器、交换机、相关软件和电缆。这使我们能够构建端到端的数据中心规模计算平台,可以通过高性能网络连接数千个计算节点。虽然在历史上服务器是计算的单位,但随着人工智能和高性能计算工作负载变得非常庞大,跨越数千个计算节点,数据中心已成为新的计算单位,其中网络是一个不可或缺的部分。

在生成式人工智能革命中,InfiniBand网络技术(通过2020年的Mellanox收购获得)将以超高需求存在,因为数据中心运营商正在重新设计其数据中心以适应人工智能时代。正如黄仁勋在电话会议中宣布的那样:

在网络方面,我们看到云服务提供商和企业客户对生成式人工智能和加速计算的强烈需求,这需要像英伟达的Mellanox网络平台这样的高性能网络。...随着生成式人工智能应用程序的规模和复杂性的增长,高性能网络成为在数据中心规模上提供加速计算以满足训练和推理的巨大需求的关键。我们的400G Quantum-2 InfiniBand平台是专为人工智能的基础设施而设计的黄金标准,在主要云和消费者互联网平台(如Microsoft Azure)得到广泛采用。

·····

InfiniBand在上个季度取得了创纪录的业绩。我们将迎来一个巨大的创纪录年度。而且InfiniBand有一个非常出色的路线图,英伟达的Quantum InfiniBand将会是非常令人难以置信的。但是这两种网络是非常不同的。如果可以这样说,InfiniBand是为人工智能工厂而设计的。

...

InfiniBand和以太网之间的差异可能在整体吞吐量上达到15%至20%。如果你花费5亿美元在基础设施上,而差异为10%至20%,而且是1亿美元,那么InfiniBand基本上是免费的。这就是人们使用它的原因。InfiniBand实际上是免费的。数据中心吞吐量的差异实在是太大,无法忽视。

因此,暂时将其AI芯片的优越性放在一边,像InfiniBand这样的网络技术也在维持英伟达的数据中心壁垒方面发挥着重要作用。实际上,英伟达的InfiniBand能够高效地整合数据中心的各个组件,实现快速数据传输和低延迟连接,使数据中心吞吐量(在给定时间内可以在数据中心之间传输或处理的数据量)提高了20%。这一提升远远超过了InfiniBand的成本。

这带来了两个优势。首先,英伟达的数据中心解决方案的令人难以置信的成本效益使竞争对手越来越难以渗透英伟达的市场份额。其次,随着InfiniBand在数据中心吞吐量方面的成本效益越来越好,它为英伟达带来了更强的定价能力,因为只要这些解决方案的成本效益可以轻松覆盖,数据中心客户就不介意为此支付更高的价格。

深入研究网络领域,英伟达提供了各种网络解决方案来优化数据中心的性能。其中包括智能网络接口卡(SmartNICs),它们可以从CPU中卸载某些与网络相关的任务,释放出处理能力用于其他任务。智能网络接口卡旨在提高网络性能,降低延迟,并增强整体数据中心的效率。这些智能网络接口卡配备了英伟达 Mellanox软件开发工具包(SDK)和Mellanox Messaging Accelerator(MMA)软件。开发人员可以在MMA的基础上构建应用程序,以在数据中心环境中优化和提升其性能。MMA为高效的消息传递和网络通信提供了基础,开发人员可以利用其功能根据特定需求进一步定制和调整其应用程序。

网络解决方案还包括网络交换机,它们是将网络流量连接和定向传输到数据中心内的设备、服务器、存储系统和其他组件的中心节点。这些交换机配备了英伟达 Cumulus Linux软件。英伟达 Cumulus Linux是一种专为在开放式网络交换机上运行而设计的网络操作系统。它为开发人员提供了一个灵活可定制的平台,以优化和增强数据中心环境中网络交换机的功能。

在其他数据中心硬件解决方案方面,英伟达还提供英伟达 Bluefield数据处理单元(DPUs),它们旨在加速广泛范围的数据处理任务,超越传统的CPU和GPU的能力,包括网络、存储和安全功能。在其最新的年度报告中,英伟达指出(重点强调):

英伟达的Bluefield DPU得到了基于芯片的数据中心基础架构软件(DOCA)的支持,使开发人员能够为BlueField DPU构建软件定义、硬件加速的网络、安全、存储和管理应用程序。支持Bluefield的合作伙伴包括许多顶级安全、存储和网络公司。我们可以在整个计算、网络和存储堆栈上进行优化,提供数据中心规模的计算解决方案。 

BlueField DPU及其配套软件增强了英伟达在市场上的综合数据中心解决方案,增强了其竞争力。 

因此,尽管投资者关注的是针对英伟达 GPU进行优化的成熟的CUDA软件包,但英伟达也从同时发生的其他网络效应中获益,这得益于其他软件(如DOCA和MMA),它们优化了构建数据中心所涉及的其他组件。黄仁勋在电话会议上强调:

所以,几乎每个关注人工智能的人都会考虑到那个芯片,加速器芯片,事实上,几乎完全错过了整个关键点。我之前提到过,加速计算涉及到整个堆栈,包括软件和网络,记住,我们早期就宣布了一个名为DOCA的网络堆栈,还有加速库Magnum IO。这两个软件是我们公司的宝贵资产之一。很少有人谈论它,因为很难理解,但它使我们能够连接成千上万的GPU。 

将所有数据中心组件集成在一起以实现最佳整体性能是英伟达数据中心成功的关键特点。对英伟达领先行业的AI芯片感兴趣的数据中心客户随后也会购买英伟达的其他数据中心解决方案,以通过深度集成获得优化的性能。这就是为什么英伟达可以提出令人瞠目结舌的销售预测,即2023年第二季度销售额达到110亿美元,因为这不仅是对AI芯片的需求,还有对所有其他数据中心解决方案的强劲需求。随着集成的不断深化,英伟达越来越有能力将相邻的数据中心解决方案进行跨销售。

对英伟达的看涨情况的风险 

AMD也提供了一套全面的数据中心解决方案,并努力迎头赶上英伟达在人工智能领域的竞争。在2023年第一季度,AMD的数据中心收入接近13亿美元,占总收入的24%。相比之下,英伟达在2024年第一季度的最新财报显示,该公司的数据中心收入接近43亿美元,贡献了公司总收入的60%。 

AMD最近宣布的AI芯片MI300X并未给出令人期待的性能规格。AMD还未能宣布其新芯片的重大客户合作伙伴关系,这正是证明了英伟达在这个市场上的强势地位。 

尽管如此,鉴于英伟达朝着更大的"以数据中心为产品"的机遇不断前进,AMD也通过收购Pensando Systems, Inc.(于2022年5月完成收购)加强了自己的数据中心解决方案,该公司专注于网络芯片的生产。 

"Pensando的分布式服务平台将通过高性能数据处理单元(DPU)和软件堆栈,为AMD的数据中心产品组合提供扩展。这些产品已经在云计算和企业客户中得到广泛部署,包括高盛、IBM Cloud、微软Azure和甲骨文云等。" 

AMD确实可以通过积极加强并购策略来迎头赶上英伟达。毕竟,英伟达通过收购Mellanox和Cumulus Networks等公司来构建了自己的数据中心网络解决方案。

鉴于英伟达在该领域的主导地位,AMD可能会尝试通过价格竞争来吸引数据中心客户使用其不断扩大的解决方案套件。然而,对于AMD来说,通过价格竞争挑战英伟达的主导地位将是困难的,因为英伟达通过在数据中心基础设施中推动深度集成,已经非常精通数据中心的架构。正是这些复杂的集成优势和由此产生的成本节省,最终支撑起英伟达的数据中心优势,这与黄仁勋长期以来将加速计算视为全栈问题和全栈挑战的方法密切相关。因此,英伟达在应对竞争威胁方面处于强势地位,正如黄仁勋所确认的: 

我们时刻关注竞争,并且一直面临竞争。但英伟达的核心价值主张是,我们是最低成本的解决方案。我们是最低TCO的解决方案。而这是因为加速计算是我经常谈论的两个问题,它是一个全栈问题,一个全栈挑战,您必须将所有软件、库和算法进行工程化,将它们集成并优化到不仅仅是一颗芯片的架构中,而是整个数据中心的架构,一直到框架、模型的优化。 

AMD必然也会努力通过其解决方案套件的深度集成来降低数据中心客户的TCO,但这将是一场艰苦的斗争。尽管如此,AMD对英伟达领域的不断侵入可能会逐渐削弱其定价能力,对英伟达的股价产生影响,而市场已经对其具有强大的定价能力进行了定价。

话虽如此,在AMD努力迎头赶上的同时,英伟达肯定不会原地踏步。英伟达将继续全面提升自身解决方案的成本效益和性能,以保持领先地位。除了为其AI芯片提供的CUDA之外,英伟达的关键数据中心解决方案同时产生了多重网络效应,为其产品构建了强大的生态系统,使AMD面临更加艰巨的竞争。 

总结

英伟达的数据中心优势不仅仅体现在其卓越的AI芯片和CUDA软件包上。虽然竞争对手正在努力构建竞争性的AI芯片和相应的软件包,但CEO 黄仁勋将目光聚焦在更大的机遇上,即将数据中心作为一种产品。公司对数据中心组件(如SmartNIC、DPU和网络交换机)的深度整合增强了其竞争力和交叉销售机会。 

尽管AMD正在扩大其数据中心解决方案,并可能进行价格竞争,但英伟达专注于全栈问题解决和成本效益,使竞争对手难以挑战其主导地位。

$英伟达(NVDA)$ $美国超微公司(AMD)$

1. 欢迎转载,转载时请标明来源为FX168财经。商业性转载需事先获得授权,请发邮件至:media@fx168group.com。
2. 所有内容仅供参考,不代表FX168财经立场。我们提供的交易数据及资讯等不构成投资建议和依据,据此操作风险自负。
go