全球数字财富领导者

王炸模型Sora来了,如何布局AI风口?

2024-02-27 08:40:00
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —

近日,OpenAI公司再度释放“大招”,正式发布文生视频AI大模型Sora,并发布48个文生视频案例及技术报告,Sora也一度成为了社交平台热议的话题之一。那么,Sora有何“过人之处”,为何大受关注?AI视频的应用价值究竟如何?对后续产业发展又有何深刻影响?

Sora三大视频生成亮点突出

首先,为了方便伙伴们对Sora有一个初步的了解,小编准备先从技术原理和Sora的特点来给大伙做个简单的介绍。Sora是款文生视频AI大模型,采用的是扩散模型(diffusion probabilistic models)技术,基于Transformer架构,这种架构使其在处理语言模型、计算机视觉和图像生成等领域表现出了更为卓越的扩展能力。凭借扎实的技术支撑,使得Sora具有生成视频时间更长、单视频多角度镜头、一定程度“理解”现实世界的模拟能力这三大亮点:

1)生成视频时间更长:在目前文本视频生成热门模型中,Sora生成视频的时长大幅领先其他AI视频生成模型。

资料来源:根据互联网公开资料整理,仅供参考。市场有风险,投资需谨慎

2)单视频多角度镜头:在单个样本中生成同一角色的多个镜头,Sora实现了各种中、近、远景的切换,并能在整个视频中稳定保持其外观。

3)具备一定程度“理解”现实世界的模拟能力:从目前发布的视频样片看,Sora在部分场景逼近真实摄像,画面细节(对于光影反射、运动方式、镜头移动等细节)处理得较为优秀,极大提升了真实感。尽管Sora在模拟能力方面已经取得了显著的进展,但它目前仍然不能理解在部分场景中的“物理规则”运动。

不过,Sora的发布初步实现了AI在理解真实世界场景能力已实现了重大飞跃。可以说,其被认为是迈向通用人工智能的重要里程碑。

Sora或将带来两大层面的投资机会

那么Sora对投资有哪些影响,伙伴们又该把握哪些机会呢?这里,小编主要想从以下两个方面来说。

首先,新技术方案被验证所带来的机会。

(1)算力需求增加。Sora和ChatGPT类似,可以说是Scaling Law(缩放定律)的又一次成功:只要模型足够“大”,根据特定算法,就可能会产生智能“涌现”的能力。Scaling Laws随着模型大小、数据集大小和用于训练的计算浮点数的增加,模型的性能也会提高。

而Sora是采用时空补丁(Spacetime Patch)技术和扩散型Transformer(Diffusion Transformer,简称DiT)架构,使用文本到视频的合成技术,按文本提示生成视频。随着对“生成质量”的要求逐步提高,对算力的需求增长可能会和ChatGPT对算力需求一样,或将会有“井喷式”的发展曲线

资料来源于Sora 的技术报告,网站为https://openai.com/research/video-generation-models-as-world-simulators

以上内容仅供参考,不作为任何个股推荐或投资建议,基金有风险,投资需谨慎。)

(2)数据需求增加。Sora统一了图像与视频的数据表示方式,并通过超大量数据集来扩大模型规模,以提高模型表现,那些拥有海量优质图像或视频资源的玩家有望受益

(3)3D等多模态领域可能会得到加速发展。相比过去的视频生成模型,Sora开始表现出对物理世界的理解能力,这一波视频领域的技术突破可能会给3D领域带来启发,AI 3D引擎的技术拐点可能会比市场原来预期得更快

其次,来自视频生成技术突破后,催生出的应用落地的机会。

1)视频生成技术在广告、电商等垂直领域的商用可行性有望大幅提高。对比之前的模型,Sora的语义理解能力、一致性和灵活性明显增强,这意味着视频生成技术的商用可行性在大幅提高。

2)创意落地的成本或将大幅缩减。Sora最高可生成一分钟的高清视频,这基本已经达到了目前主流短视频创作时长的要求,叠加上之前文字创作、文生图等技术相对成熟,制作不同形态内容的门槛和成本大概率能随之降低。这不仅可以让手上有丰富IP资源的玩家降低试错成本,扩大IP变现途径,而且也可能会催生出现新的商业化空间更大的UGC平台。

3)影视、游戏和MR领域专业创作者可以利用先进的AI技术提质增效。AI技术可以在影视制作的多个环节中发挥更大作用。例如,通过AI进行自动化的角色建模、动画生成、环境渲染等,可以较大程度地减少人力需求和时间成本。此外,AI还可以用于优化动画的质量,使得动画更加流畅和真实。

4)随着视频内容的增加,也会逐渐增加对视频数据传输、视频编解码、视频内容审核等环节的需求。随着Sora的不断更新与完善,其所代表的视频生成大模型将在视频等产业展现出巨大的发展潜力。

如何布局AI视频的投资机遇?

总体来说,人工智能大模型市场前景十分广阔。数据显示,预计2024年全球人工智能市场规模可达6158亿美元,我国将突破7993亿元。在人工智能主要细分领域中,大模型作为前沿热点,增速最快。可以说,行业发展具有中长期投资价值属性。(数据来源:沙利文,2024/1/28。)

人工智能的发展路线逐渐从现实迈向虚拟,从二维三维走进多维世界。那么,伙伴们该如何去分享AI行业的快速发展的红利呢?

毕竟,从当前的“市场声音”来看,多模态可能会是未来人工智能应用的主要形式,而文本生成视频的技术可以将任何天马行空的创意真实的展示出来,这可能会对教育、游戏等多个领域带来“翻天覆地”的变化。因此,这一领域也较有可能会出现“新的科技独角兽企业”。但对于较大多数的普通投资者而言,工智能领域首先是一个高度专业化且在时刻变化的科技领域,其涉及复杂的底层算法和生态产业链,需要具备深厚的专业知识和大量的时间精力去研究、跟踪。其次,人工智能板块的个股表现往往分化较大,伙伴们与其盲目选择个股,不如可以考虑选择与TMT相关的主动基金或是被动型产品,一键布局AI视频的投资机遇哟!

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go