12月10日,备受期待的“Sora Turbo”上线,随及用户爆满,服务器崩溃,导致注册暂停。 人类再次表现出,面对AI视频技术重大飞跃时刻,强烈的渴望与期待。
早在今年6月,国产 AI 视频大模型强势崛起,让这波关注浪潮已经到了一个高峰:以快手可灵 AI为代表一经问世引发了海内外热烈讨论,发布半年来发展超过 600 万用户,累计生成超 6500 万个视频和超 1.75 亿张图片。 与Sora相比,可灵AI在功能凭借更为全面的性能,如视频续写、多尺寸输出、高画质生成等,使其成为视觉创作领域全新的技术工具,带来创作效率和创作质量的数次迭代。 前不久,李少红、贾樟柯等9位电影导演使用可灵AI创作了9部AI电影短片,完全依托视频生成大模型,深度参与电影级内容创作,这在中国还是第一次,海外科技爱好者和专业从业者更有人把可灵AI视为中国AI技术实力的体现。
为什么是快手
回归到快手本身来追溯这个问题,除去印象里快手在娱乐、电商领域的表现,快手作为DAU4亿的短视频平台,海量视频产生、海量用户的交互、海量生意的联通,本身就需要强力的技术能力来做支持。庞大的用户基础和丰富的应用场景,为AI技术提供了实际应用和测试的平台,而快手的内容社区属性,也是大模型具体应用诞生后,最好的检验场景。 除去可灵,快手在AI层面搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景,简单来说,快手已经拥有了全生态的AI产品,并投入在帮助优化用户使用体验。 在Sora推出新版本的同时,快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型,物理规律真实感、人物表演能力和语义理解水平再次提升;而可灵AI旗下的文生图模型——可图也推出1.5版本,AI图片的画面质量和人像美感再上新台阶;同时推出全新的“AI模特”功能,可精准生成高质量AI模特。
为什么是快手可灵AI
可灵AI作为全球首款可供公众测试的文生视频大模型产品, 上线半年就迭代近20次:
➢1.0版本:2024年6月推出,首次推出文生视频和图生视频功能,帮助创作者高效将文字创意转化为影像内容,拉开了AI视频创作的新篇章;
➢1.5版本:2024年7月迭代,模型架构深度优化,生成视频的流畅度与清晰度显著提升,画质全面升级,高清1080p成为标准。新增运动笔刷、对口型等创新功能;
……
与国外产品相比,可灵AI更理解本土文化,生成的内容更能满足本土用户的需求,这一点在全球化竞争中显得更为突出,它能够提供更符合特定市场需求的定制化服务;支持生成长达2分钟的30帧视频,分辨率最高可达1080p,这种高质量视频生成能力远超同期的Sora和国内其他大模型厂商。
最早的可灵大模型算法专注于精准解析文本语义,将抽象描述转化为具象画面,奠定创作基石。随着版本逐步迭代,模型结构的深度优化,最新的可灵1.6版在画面细节与逻辑合理性方面的理解能力实现了更为立体化的升级:
画面质量上,可灵1.6版色彩方面,色域更广、过渡更细腻,无论是描绘晚霞余晖下的宁静海滩,还是霓虹灯下的繁华都市,都能精准还原色彩本真。光影效果上,可灵1.6版可以模拟真实光照,从清晨的柔和日光,到午后的强烈直射光,再到夜晚的朦胧月色,光影变化自然,物体明暗层次分明。
动态质量上,可灵1.6版能准确捕捉人物细微的情感变化和复杂的肢体动作。无论是表情的喜怒哀乐,还是行走、奔跑、跳跃都更加自然,不再生硬机械,告别“人机感”,角色仿佛拥有真实生命,沉浸感十足。
可灵AI的商业价值是什么
可灵AI的技术创新不仅推动了创作效率的提升,还开启了全新的商业化应用场景。尤其在电商、影视、广告等领域,AI视频生成技术展现出了巨大的潜力。
电商应用:商家可以利用可灵AI快速生成高质量的产品展示视频。通过输入产品卖点和使用场景,系统自动生成富有吸引力的演示视频,从而大幅提升用户购买意愿。同时,AI模特功能使得商家能够在几分钟内快速展示多款服装,极大提高了拍摄效率,降低了成本。
影视与游戏行业:传统影视拍摄需要大量的人力、设备和场地,而借助可灵AI,影视制作和游戏开发的成本和周期大幅缩短。创作者可以更快速地迭代创意,减少拍摄、剪辑、后期制作的工作量,提高整体生产效率。
此外,技术的颠覆也有望催生全新的商业模式与业态,成为数字经济时代商业增长的新引擎。就可灵AI自身来说,面向C端用户,推出了会员付费模式,连续包月首月最低价19元、次月58元,可生成约66个视频或3300张图片。
面向B端企业,则通过API服务提供高质量的图像与视频生成服务。9月底,可灵AI正式开放了API服务,新增v1.5高品质模型和视频延长功能,涵盖了视频生成、图像生成和虚拟试穿等模块,为企业级用户提供更为丰富、优质的视频及图像生成和编辑服务。企业可以通过API调用可灵AI的高品质模型,进行大规模内容创作和定制化服务,为企业级用户带来更高效、更灵活的解决方案。
除了新增高品质模型外,API服务还在此前的V1.0模型上新增了视频延长功能。用户可以对生成的视频进行4至5秒的续写,且支持多次续写,总时长可达3分钟。通过微调提示词,用户能够实现视频内容的自然过渡,创造出更加连贯、流畅的作品。这一功能的加入也将为视频创作提供了更大的发挥空间。
从第三季度收入数据来看,可灵AI面向C端(消费端)推出的会员付费和面向B端(企业端)推出的API服务均获得了市场积极的反馈。程一笑在业绩电话会上透露,未来可灵AI还将探索更多元的变现模式,管理层有信心在明年实现可灵收入规模的快速增长。
可灵AI的多元化付费模式和灵活的商业服务,将进一步促进其在全球范围内的应用拓展和收入增长。
AI爆发年,我们还能做什么
当下,AI 技术正以磅礴之势,席卷全球。AI 视频大模型更是其中的闪耀之星,从 OpenAI 年初推出的 Sora,到快手可灵 AI,正是这些前沿模型正重塑人类的视听体验,让想象与现实无缝对接。
展望未来,AI 视频市场恰似一片浩瀚无垠、充满无限可能性的星辰大海: ➢可灵AI作为视频产品工具,降低了视频制作门槛,带来创新的内容表达,对于快手这样的内容公司,提供了非常强劲的技术壁垒去链接创作者与用户; ➢可灵AI已经累计服务了超过600万用户,生成了数亿的视频和图片,大会员付费体系+开放API服务,涵盖了视频生成、图像生成和虚拟试穿等模块,业绩会上管理层已透露目前可灵AI的商业化单月流水超千万人民币; AI技术放眼全球的商业市场,这并不是一场冲刺跑,而是一场漫长的耐力跑。 这个过程,也是商业能力孕育的过程,不能轻视的是,可能在小步快跑的时候,未来不可预期的某一天,我们甚至还没有做好完全准备的那一天,量变引发质变,带来冲突出常规商业思路的变现能力。
对于资本市场来说,当下能做的或许一起去探索期待AI边界突破带来的奇幻想象,并在那一天到来了的时候,一起去感受作为历史时刻的一员,去拥抱AI未来回馈的商业现实回报。
$快手-W(01024)$