全球数字财富领导者

梁文锋、杨植麟论文 “撞车”,DeepSeek走红,月之暗面尴尬

2025-02-19 10:35:45
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:在AI领域,技术创新与突破一直是各大厂商与研究机构竞相追逐的焦点。近日,两位技术大佬——DeepSeek的梁文锋与月之暗面的杨植麟,因各自发表的论文“撞车”而引发业界广泛关注。与此同时,DeepSeek的迅速崛起更是让月之暗面陷入了尴尬境地,甚至有消息称月之暗面已

在AI领域,技术创新与突破一直是各大厂商与研究机构竞相追逐的焦点。近日,两位技术大佬——DeepSeek的梁文锋与月之暗面的杨植麟,因各自发表的论文“撞车”而引发业界广泛关注。与此同时,DeepSeek的迅速崛起更是让月之暗面陷入了尴尬境地,甚至有消息称月之暗面已大幅降低广告投放。

论文“撞车”:技术路线的殊途同归

2月18日,DeepSeek与月之暗面几乎同时发布了各自最新的论文,而主题直接“撞车”——都是挑战Transformer架构最核心的注意力机制,旨在让它能更高效地处理更长的上下文。DeepSeek的论文提出了名为NSA(原生稀疏注意力)的新架构,该架构在基准测试中表现出色,与全注意力机制相比,准确率相同或更高,处理64k标记序列时速度可提高至11.6倍,且训练更高效,所需算力更少。

而月之暗面的论文则提出了MoBA架构,它同样使用了将“词”变成块的方法,并设计了一套可以自由切换全注意力和稀疏注意力机制的方式,给已有的全注意力模型更多的适配空间。

这两篇论文的发表,不仅展示了两位创始人在技术领域的深厚功底,也揭示了AI大模型技术发展的新方向。清华大学教授章明星在知乎上分享道:“DeepSeek R1和Kimi K1.5都指向了ORM based RL,而Kimi MoBA和DeepSeek NSA再一次都指向了可以反向传递的learned sparse attention。”这充分说明了两位创始人在技术路线上的不谋而合。

DeepSeek的崛起与月之暗面的尴尬

然而,就在两位创始人论文“撞车”的同时,DeepSeek凭借其强大的技术实力和精准的市场定位,迅速在AI领域崭露头角。据悉,DeepSeek在几十天内便达到了3500万DAU(日活跃用户),这一成绩让业界为之震惊。相比之下,月之暗面虽然也推出了Kimi等备受瞩目的产品,但在用户增长方面却显得力不从心。尽管月之暗面也曾投入大量资金进行广告投放,但效果并不理想。据报道,月之暗面用一年多时间大量“烧钱”,只获得了不足千万量级的日活数据。

DeepSeek的崛起无疑给月之暗面带来了巨大的压力。一方面,DeepSeek的技术实力和市场表现让月之暗面的技术优势不再明显;另一方面,DeepSeek的迅速扩张也挤压了月之暗面的市场份额。在此背景下,月之暗面不得不重新审视自己的市场定位和技术路线。

据了解,月之暗面内部认为,要继续在AGI领域竞争,必须坚持基础模型SOTA(当前最佳)。接下来,团队计划重新训练基础模型,同时关注应用层机会,如参考OpenAI的DeepResearch产品方向。尽管月之暗面手握多模态能力(k1.5 多模态模型发布)、资本储备(融资规模大)和品牌余温(春节期间有用户增长,部分因DeepSeek服务器拥堵回流)等筹码,但在竞争激烈的AI市场,留给它的时间窗口正在缩小。

从行业影响来看,DeepSeek的爆发重塑了中国大模型赛道。资本逻辑发生转变,从过去的 “烧钱换估值” 转向关注技术性价比与商业化闭环;生态链重构,百度、腾讯等大厂纷纷接入DeepSeek的开源模型,闭源玩家生存空间被挤压;技术平民化趋势显现,算法创新降低了对进口硬件的依赖,国产芯片能效比提升。在这样的大环境下,月之暗面面临着巨大挑战,如何在开源生态、成本控制或垂直场景中找到新支点,成为其破局的关键。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go