去年开始的轰轰烈烈的AI热潮随着整个行业的进展缓慢,似乎逐渐退潮。
然而现实是,AI浪潮只是从观众眼中淡去,研究的进程仍在推进。
继今年五月零一万物发布千亿参数模型Yi-Large后,近日,零一万物正式对外发布最新旗舰模型Yi-Lightning。
一经出世,便饱受业界关注。
国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o。
这也意味着,仅仅花费了五个月,零一万物就已追上OpenAI的顶级模型。
实则,早在今年6月,零一万物创始人李开复博士在《格隆博士会客厅》的访谈中,已经对国产大模型进行过分析。
彼时他认为,中国大模型与美国顶级大模型之间的差距已经从之前的7至10年迅速缩短至仅有六个月。
而这次,Yi-Lightning超越了OpenAI在2024年5月推出的GPT4o,也就是说,中美大模型的差距进一步被缩短到了5个月。
仔细来看,在分类榜上,Yi-Lightning各项能力都名列前茅。
在中文能力上,Yi-Lightning跃居并列第二,和o1-mini相差无几。数学能力,Yi-Lightning和Gemini-1.5-Pro-002并列第3,仅次于o1-preview、o1-mini。
在代码、Hard Prompts、Longer Query等能力上,Yi-Lightning也都位列前五。
对比五个月前发布的Yi-Large,Yi-Lightning首包速度提升1倍,推理速度也提升了4成,可谓进步飞速。
在这次的发布会上,除了发布新模型,零一万物还首发了AI 2.0数字人方案并公布了零一万物在B端产品上的最新进展。
李开复称,零一万物最新旗舰模型Yi-Lightning的API价格已降至极低水平,每百万token仅收费0.99元。
早在今年5月,字节、百度、阿里云、腾讯、讯飞等大模型厂商纷纷大降价,曾经引起了不小的争议。
当时李开复在发布大模型系统时曾表示,其认为大模型之间搞类似于ofo的流血打法是双输的策略。
这次发布会再次谈及之前的“价格战”,李开复仍旧表示不认可,他认为,当时有很多性能很差的模型价格都降得非常低,甚至是免费,但让接入的企业和个人体验起来都不达预期。
而针对此次零一万物的大模型降价和外界关于零一万物亏钱拉客户的质疑,李开复称,零一万物大模型的真实成本比0.99元低,还有利润空间。
此前,OpenAI官宣获得66亿美元融资,估值突破1500亿美元。随后,媒体报道称,经过对OpenAI财务数据的分析,推测其会在2029年实现盈利。
但在此之前,OpenAI仍会保持较为严重的亏损,预测2026年亏损幅度将达到140亿美元。
作为AI领域绝对的龙头,OpenAI尚且如此,其他企业或许更加艰难,特别是国产大模型初创企业。
月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰,这6家中国大模型初创企业被称为国内的“AI六小虎”。
然而月初,有媒体报道,“AI六小虎”中有两家已经逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。
而李开复回应称,尽管预训练既是技术活也费钱,但目前“AI六小虎”做预训练仍不成问题。
同时他还提到剩下的5家公司,他表示“这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”
这对于国内的大模型公司或许是一个好的迹象,但国产大模型仍在寻找方向。
刚刚过去的9月,OpenAI发布了OpenAI o1系列模型,被业界称为是AGI一大新进程。
李开复认为,OpenAI内部其实攒了很多好东西,除了OpenAI o1以外,OpenAI领先行业足够多,但会等待合适的节点再释放。
放眼现在的AI行业,早已度过了最开始的狂热阶段,但不管是国外还是国内的AI公司,都在暗流中继续前进和竞争。
目前,国内的大模型主要分为两类,一类是基础通用大模型,比如文心一言、通义千问等等,一类则是专注各类细分赛道的大模型,金山的政务大模型,一些公司的医疗、金融等等。
工业和信息化部近日发布的最新数据显示,目前我国完成备案并上线为公众提供服务的生成式人工智能服务大模型已经近200个,注册用户超过6亿,产业相关企业数量超过了4500家。
如果单从数字上看,国产大模型的技术成长可谓相当飞速。
且SuperCLUE的评测结果显示,国内绝大部分闭源模型已超过GPT-3.5Turbo,在技术上和国外大模型的差距不断缩小。
然而,对于国产大模型,不少人仍旧心有疑虑,因为这样的对比对于AI的商业化来说并无意义,更为重要的,是如何对AI进行应用。
尽管各家大厂、垂类企业以及初创公司都在铆足了劲钻研技术,较量日活,不断追求更大的数据量、更强的计算能力以及更复杂的模型训练,但国内市场仍旧缺乏能够承载AI的杀手级应用。
也是因此,在国内大模型技术不断提升的同时,普通人对于AI技术力提升的感知却逐渐减弱,市场对于AI的热情也逐渐削减。
绝大多数人难以体会到95%到99%这一阶段的技术提升,唯一能够让人感受到AI技术提升的是,AI在逐渐被运用到什么日常领域之上,究竟带来了怎样的生产力提升。
因此我们可以看到,尽管在不少垂类行业上,AI愈臻完美,应用也越来越普遍,但反而是在高日活、高个性化的APP上,AI难以施展拳脚。
例如,尽管抖音的豆包等一系列AI已经较为成熟,但是对于抖音的生态本身,并没有带来更大的改变。
因为抖音已经对于用户画像进行高度区分,应用中需要的是超高的定制化和精准化需求,而目前的AI还很难做到这一点。
对于大模型企业来说,相比提升技术力,更为困难的是,如何将AI的技术力,转换成企业乃至个人能够实实在在体会到的生产力。
而这,或许也该是未来大模型企业们努力的方向。
正如互联网出现之后被国人迅速开发,发展出各类新业态,在互联网的应用上,国内一直位于国际领先的地位。
未来,国内大模型企业的出路,也将在应用中逐渐体现。