刚刚过去的 2023 年里,GPT 大模型开启了普通人走向 AI 世界的「魔盒」,也拉开了全球各国科技公司的大模型「军备赛」。
文本、图片、视频大模型纷纷涌现后,应用端狂卷创新,也造成 AI 芯片资源紧缺,「AI 替代论」、 「风险质疑」无时无刻不在上演。AI 的一面是人类对先进生产力的狂热追求,另一面是人类面对新技术的担忧。
站在 2024 年回望,AI 还远远没有到取代人类的阶段,技术瓶颈也显露出来:芯片技术限制了人工智能(AI)通往通用人工智能(AGI)的速度;用于训练大模型的数据们被视作「珍惜材」,掌握在互联网公司的手里;而商业化后的 AI 应用还没有普惠每个人,国内的不好用,海外的不便宜。
假如将它放在更长的时间维度看,当前的 AI 大模型最多算是人类刚刚发现火源。如何用、用在哪将是 2024 年 AI 向前的方向。我们还看到,OpenAI、谷歌等 AI 科技公司们开始研发芯片了,「盗火者」们正在将火力开大。
互联网「新大陆」
2023 年,AI 领域出现了许多历史首次,很多都是 ChatGPT 带来的。
ChatGPT 让普通人第一次见识了计算机对自然语言的理解,人工智能不再是电影中神奇的「秘密武器」;非人类的 ChatGPT 首次上榜「2023 年度十大科学人物」。
从 2022 年 11 月发布到现在,OpenAI 发明的 ChatGPT 所引起的关注和产生的影响,已经超越了信息技术历史上几乎所有热点:用户数 2 天达到 100 万,2 个月达到 1 亿,打破 TikTok 之前的纪录。半年后,ChatGPT iOS App 一经发布快速登顶苹果应用商店总排行榜。
对于 ChatGPT 来说,更具时代意义的是,它成功打破了科技巨头对 AI 技术的垄断,将能理解人类语言的产品带到了每一个普通人面前。
ChatGPT 是许多人平生第一次接触到如此高智能的对话系统,会写文案,会算数学,上知天文,下知地理,能读懂故事,也看得懂网络热梗。尽管起初会「一本正经的胡说八道」,产生幻觉,但它会在人类的提示中修正。
ChatGPT 背后的通用大语言模型的更迭速度也十分惊人,仅仅一年,就从 GPT3.5 版本升级到了 GPT 4 Turbo 版本。而在一个多月前,也就是 2023 年 11 月初,OpenAI 在开发日上正式宣布了 GPTs 计划,ChatGPT Plus 用户可以在 GPT-4 的基础上,利用自己拥有或找到的数据训练出一个专属的 ChatGPT 对话机器人。
OpenAI 再次让人惊掉了下巴,而 GPT-5 的商标申请已经在册。根据美国专利商标局展示的信息,GPT-5 提供的功能包括自然语言处理、文本生成、理解、语音转录、翻译、预测和分析等。
OpenAI 提交了 GPT-5 的商标申请
在 OpenAI 官方的蓝图中,他们之后还会上线 GPTs 商店,支持用户上架自己训练的机器人并提供给其他用户付费使用,由此建立一个新的商业形态。短短不到两个月的时间,用户通过自定义 GPTs 构建的特定领域 ChatGPT 助手已超过数十万个,其欢迎程度可见一斑。
2024 年,OpenAI 若开放 「GPT 商店」,又一波应用热潮将席卷互联网。
应用爆发
OpenAI 成功如同哥伦布发现新大陆一样,他告诉了所有人:这条路走得通。也就在这短短的一年时间内,ChatGPT 直接刺激了全球科技公司之间的人工智能军备竞赛。
数据显示,截至今年 10 月,在不到一年时间,中国拥有 10 亿参数规模以上大模型的厂商及高校院所就超过了 250 家,这里还不包含国外大模型的数量。AI 应用更是喷涌而出,Sensor Tower 报告显示,仅在 2023 年上半年,AI 应用下载量同比增长 114%,突破 3 亿次,超出 2022 年全年水平。与此同时,AI 应用内购收入同比激增 175%,逼近 4 亿美元。
激烈的竞赛中,成千上万个大模型进化出了文生图、图生图、文生视频、图生视频等强大的多模态能力。人们刚刚还惊讶于 ChatGPT 的能说会道,眨眼间,Bard、Clude 等识网梗的模型就出现了。
此外,一些垂直领域也杀出了「独角兽」。
在图片生成上,Midjourney 一马当先,成为最强的文生图工具。从出生到现在,短短半年,Midjourney 已经更迭至 V6 版本,从最初的文生图向图生图、AI 扩图多能力发展。
更令人惊叹的是,在 Midjourney 背后,是仅成立 2 年的 11 人的团队。随着 Midjourney 的蹿红,团队已经扩展至 40 人,仅在今年就实现了 2 亿美元的营收,早早就实现了经济独立。
与大多数追求风投的初创公司不同的是,Midjourney 没有拿 VC 一分钱,「客气一点的说法是,他不需要 VC 进入他的生活。」微软旗下风投基金 M12 的合伙人 Michael Stewart 表示。
AI 应用发展速度之快可用「日更」形容。
Midjourney 走红后不久, Runway 公司的 Gen-2 在视频领域接棒,与其初代产品 Gen-1 相差仅仅 1 个月。最新版本的 Gen-2 不仅可以仅根据一句提示词就可以生成 18 秒的视频,且能熟练运用电影镜头语言。就在最近,Gen-2 新增了图生视频的功能,只需「涂抹」图片中的某个区域,就可以让它动起来。
AI 卷向视频赛道,Pika1.0、Stable Video Diffusion 等后起之秀奋起直追,各类 AI 视频工具「斗法」,进化速度越来越快。其中,刚刚推出没多久的 Pika1.0 的文生视频能力已经可以和 Gen-2 相媲美,甚至首次将 AI 扩图能力带到了视频界。
2024 年,大模型的多模态潜力还将被这些独角兽继续发掘,甚至产生新的独角兽。文本、图片、音频、视频这些代表人类自然语言的产物仍会被 AI 工具精耕细作,而工具将很可能在规模化下变得更加趁手和便宜。
芯片瓶颈
科技大公司卷大模型,小公司卷应用,竞争之外,「卖水者」英伟达赚得盆满钵满。数据显示,英伟达最新第三财季营收达 181 亿美元,同比增长 206%;净利润 92 亿美元,同比增长高达 1259%。而引发这场竞赛的「领头羊」OpenAI 的 2023 年营收仅达到 13 亿美元。在去年,OpenAI 的营收也才 2800 万美元。
2023 年,英伟达无疑坐稳了 AI 的风口,芯片价格一路水涨船高,即便价格高涨,芯片仍是「一卡难求」,有消息称,英伟达 H100 的交付周期长达 36 周至 52 周不等,如此长的交付周期明显无法满足 AI 产品发展的需求。这也可能是 GPT-5 长时间未到来的原因。
算力作为驱动 AI 发展的三驾马车之一,芯片的短缺直接影响了大模型的进化速度,OpenAI、谷歌下场自研芯片,以补充自家大模型训练的缺口。
英伟达的竞争者们也抢着分「蛋糕」,英特尔和 AMD 分别推出 Gaudi3 和 Instinct MI300X 高性能 AI 芯片,微软公布 AI 加速芯片 Azure Maia 100,亚马逊则发布了面向 AI 系统的升级款加速器芯片 Trainium2。
与此同时,美国的芯片制裁进一步加剧了中国芯片短缺的危机。为保市场,英伟达只能推出一些性能缩水的「阉割版」芯片。
为了不再让硬件上被「卡脖子」,华为着力研发 AI 芯片,昇腾 AI 芯片成为了国内支撑,应用方科大讯飞表示,华为昇腾 910B 已经基本做到可对标英伟达 A100。
行至 2023 年末,无论国内还是海外,仍未出现一款可以媲美英伟达 H100 的芯片,尽管芯片厂商已经开足马力,但短期内,芯片资源紧缺的情况仍会持续。或许只有等到 AI 芯片资源问题被解决,GPT-5 以及更加先进、丰富的产品才能更快到来。
但从安全角度来看,这也并非完全是坏事。在这短暂的喘息之际,人类可以为人工智能的发展方向做一个更佳的选择。
要知道,GPT-4 刚刚发布时,一封上千名科技精英的联名信将 AI 安全问题推至聚光灯下,他们联名请求「暂停训练比 GPT-4 更强大的 AI 系统」,用 AI 领域的专家 Gary Marcus 的话说:「用百分之一的人类毁灭风险换取和机器对话的乐趣,这值得吗?」
的确,ChatGPT 刚刚推出时,其颠覆性的创造力确实让人震撼,微软的创始人比尔·盖茨也强调过 AI 失控的可能性是存在的。
今年初,网络还充满着「AI 抢饭碗」「AI 取代人类」的担忧,甚至出现了「碳奸」的梗。但一年过去了,现在大家对去 AI 的态度已经回归理智。
我们还没有真的看到「打工人」因为 AI 而大规模失业,至少在国内,AI 被普遍运用到工作中仍是未来进行时。与此同时,OpenAI 等代表性企业的 AI 安全措施也不得不跟上,各个国家的 AI 安全审查机构相继成立。
AI 的前进是必然的,「火」到底怎么用还在于人类的选择,一席人在制造控制火苗的炉子,另一些人着力火苗还能点亮哪些荒漠。
2024 年,安全仍将是 AI 发展的主题之一,芯片则是生产力能否进一步提升的关键,唯一可以确定的是,AI 将如同互联网一样,将成为未来必不可少的人类工具。
来源:金色财经