全球数字财富领导者

英伟达财报披露前重挫4%!市值一夜蒸发逾5500亿,周三公布的财报或成市场转向关键

2024-02-21 09:04:56
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:英伟达股价下跌逾4%,创下去年10月以来的最大单日跌幅,该公司将在周三市场收盘后公布备受瞩目的财报。截至收盘英伟达股价跌4.35%,总市值单日蒸发逾5500亿元人民币。成份股中包含英伟达和AMD的费城证交所半导体指数下跌1.6%,创下一周最大跌幅。据消息人士透露,微软

英伟达股价下跌逾4%,创下去年10月以来的最大单日跌幅,该公司将在周三市场收盘后公布备受瞩目的财报。截至收盘英伟达股价跌4.35%,总市值单日蒸发逾5500亿元人民币。成份股中包含英伟达和AMD的费城证交所半导体指数下跌1.6%,创下一周最大跌幅。

据消息人士透露,微软正在研发一种新的定制网络卡,旨在减少英伟达网络部门(通过收购Mellanox成立)对微软服务器设备的影响。据报道,这种网络卡类似于英伟达的ConnectX-7型号,最大带宽支持400 Gb以太网。

此外,英伟达还受到其他威胁,近日一款名为Groq的初创公司在AI圈爆火,全新AI芯片横空出世,其推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度。

此前据媒体报道,2月9日在迪拜世界政府峰会上,OpenAI CEOSam Altman(萨姆·奥特曼)正在与包括阿联酋政府在内的投资者进行谈判,为一项雄心勃勃的科技计划筹集资金。该计划将提升全球芯片制造能力,扩大人工智能的应用能力,以及其他方面的能力,耗资数万亿美元。其中一位知情人士说,该项目可能需要筹集至多5万亿至7万亿美元的资金。

无独有偶,2月17日,有知情人透露,日本投资界巨头软银集团(SoftBank Group Corp.)创始人孙正义(Masayoshi Son)正在寻求筹集最高达1000亿美元的资金,打造一家规模庞大的合资芯片公司。

英伟达财报或成市场转向关键

在对经济韧性、货币政策放松和企业盈利的乐观情绪推动标普500指数今年创下历史新高后,对风险资产的需求近期减弱。所有的目光都集中在英伟达的业绩上,因为这家芯片巨头一直是大盘上涨的重要推动力,在2024年就飙升了40%。

“自从最近的突破以来,英伟达经历了一波史诗般的上涨,” Freedom Capital Markets首席全球策略师Jay Woods写道。“在本周公布财报之际,股价停滞不前。他们必须公布什么才能保持涨势?我们将在周三的报告后找到答案。”

随着期权驱动的动量交易将标准普尔500指数推至历史新高,华尔街对于这股“期权狂热”背后的风险越来越感到忧虑。一些市场分析师认为,英伟达(Nvidia Corp.)即将发布的财报可能是给这股热潮踩刹车的关键催化剂,有可能逆转过去四个月市场的大部分涨势。

据衍生品市场专家透露,投资者对高风险的期权押注过于乐观。即便英伟达的业绩符合华尔街预期,仅仅是财报公布这一事实,就可能因期权市场的内部动态而引发美国主要股市指数的下跌。

期权市场的“偏差”衡量的是价外看涨期权与价外看跌期权的需求之差,而目前这一指标已接近2021年迷因股热潮以来的最扭曲水平。这表明,期权买家已从传统的保险购买者转变为更多的投机交易者。

“市场已经在一家公司身上押下了巨大的赌注,”独立股市分析师迈克尔·克莱默表示,“如果英伟达不大幅上涨,什么能让它继续走高?”他指出,今年以来,该股已上涨近50%,在标准普尔500指数自2024年初以来的涨幅中,英伟达贡献了约25%。

传微软正开发英伟达网卡的替代品

据消息人士透露,微软正在研发一种新的定制网络卡,旨在减少英伟达网络部门(通过收购Mellanox成立)对微软服务器设备的影响。据报道,这种网络卡类似于英伟达的ConnectX-7型号,最大带宽支持400 Gb以太网。

然而,由于芯片尚未发布,上市时间尚不确定,最终设计可能会将更高的以太网带宽(例如 800 GbE)作为目标。

这个项目的领导者是Pradeep Sindhu,他曾是Juniper Networks的联合创始人之一。去年,微软收购了Sindhu最新的初创公司 Fungible,并将他聘为负责该项目的主管。通过为人工智能工作负载量身定制高速网络硬件,微软的目标是加快并降低人工智能模型训练的成本,同时减少对英伟达作为高性能网卡主要供应商的依赖。

消息来源称,开发新网络卡预计需要一年多的时间。但如果成功,微软的基础架构可以通过为其超级分压器数据中心定制优化,从而获得性能提升。

与英伟达的网络设备相比,该网络卡还具有更节能的优势,即使模型规模迅速扩大,这也有助于微软控制人工智能培训成本。

从长远来看,拥有专为人工智能定制的网络技术可以为微软带来竞争优势。它将为优化和更新数据中心硬件提供更多控制权,以适应来自OpenAI和其他合作伙伴的不断发展的人工智能工作负载。虽然英伟达图形处理器目前在人工智能加速领域占据主导地位,但微软的 Maia芯片和网络卡等替代品可能会放松对其的控制。

随着人工智能渗透到更多的商业和消费应用中,微软正在为以人工智能为中心的未来在下一代基础设施方面进行大规模投资。

英伟达被“偷家”?全新AI芯片横空出世

芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。

Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。

在Groq的创始团队中,有8人来自仅有10人的谷歌早期TPU核心设计团队。例如,Groq创始人兼CEO Jonathan Ross设计并实现了TPU原始芯片的核心元件,TPU的研发工作中有20%都由他完成,之后他又加入Google X快速评估团队,为谷歌母公司Alphabet设计并孵化了新Bets。

图片

虽然团队脱胎于谷歌TPU,但Groq既没有选择TPU这条路,也没有看中GPU、CPU等路线。Groq选择了一个全新的系统路线——LPU(Language Processing Unit,语言处理单元)

“我们(做的)不是大模型,”Groq表示,“我们的LPU推理引擎是一种新型端到端处理单元系统,可为AI大模型等计算密集型应用提供最快的推理速度。”

从这里不难看出,“速度”是Groq的产品强调的特点,而“推理”是其主打的细分领域。

Groq也的确做到了“快”,根据Anyscale的LLMPerf排行显示,在Groq LPU推理引擎上运行的Llama 2 70B,输出tokens吞吐量快了18倍,优于其他所有云推理供应商。

图片

第三方机构artificialanalysis.ai给出的测评结果也显示,Groq的吞吐量速度称得上是“遥遥领先”。

图片

为了证明自家芯片的能力,Groq还在官网发布了免费的大模型服务,包括三个开源大模型,Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K,目前前两个已开放使用。

图片

图|Groq(Llama 2)对比ChatGPT(来源:X用户JayScambler)

LPU旨在克服两个大模型瓶颈:计算密度和内存带宽。据Groq介绍,在 LLM 方面,LPU较GPU/CPU拥有更强大的算力,从而减少了每个单词的计算时间,可以更快地生成文本序列。此外,由于消除了外部内存瓶颈,LPU推理引擎在大模型上的性能比GPU高出几个数量级

据悉,Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装,其采用14nm制程,搭载230MB SRAM,内存带宽达到80TB/s。算力方面,其整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。

值得注意的是,“快”是Groq芯片主打的优点,也是其使用的SRAM最突出的强项之一。

SRAM是目前读写最快的存储设备之一,但其价格昂贵,因此仅在要求苛刻的地方使用,譬如CPU一级缓冲、二级缓冲。

华西证券指出,可用于存算一体的成熟存储器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中,SRAM在速度方面和能效比方面具有优势,特别是在存内逻辑技术发展起来之后,具有明显的高能效和高精度特点。SRAM、RRAM有望成为云端存算一体主流介质。(综合财联社、智通财经网)

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go