Sora来临，它能抢了谁的饭碗？

克劳锐 2024-02-20

OpenAI又有“新活”了，2024年初，OpenAI发布了新的视频生成模型Sora，引起了各行业的广泛关注。本文分享了Sora与其他视频生成模型相比具有的优点，并推断了Sora会对影视行业带来的影响，快来阅读吧！

继ChatGPT后，OpenAI在2024年初又掀起了人们的讨论热情。

2月16日清晨，OpenAI发布了文生视频AI模型Sora，引爆全球网络。与以往的文生视频模型Runway和Pika不同，Sora可以持续地模拟人物、动物和物体，并生成同一角色的多个景别的镜头，在整个视频中保持其外观和背景。

此外，Sora还可以生成图片。与以往相比，这些图片中的细节更清晰，包括脸上的斑点和嘴唇上的细纹，分辨率最高可达2048×2048。

一石激起千层浪，Sora发布后，一众科技圈大佬纷纷下场讨论。马斯克表示“gg humans”（gg/good games原指游戏结束时玩家互相致意，后引申为“游戏结束”）;周鸿祎预言：“这可能给广告业、电影预告片、短视频行业带来巨大颠覆”；前阿里副总裁贾扬清则评价：“真的非常牛”。

“霸榜”近日科技板块热点的Sora大模型亮点在哪里？具体来看，这会对影视制作行业起到怎样的影响？

01 高质量、长时间、多景别

简单来讲，Sora能够根据文本提示，创建60秒的视频、扩展现有视频以及从图像中生成视频，视频中还包含复杂的场景和镜头运动。

OpenAI官网展现了多段Sora制作的视频，身着黑色皮衣、红色裙子的女子在雨后的夜晚行走在东京市区街道上，女子皮肤毛孔色沉清晰可见，路面积水反映着路灯倒影，视频真实度十分之高，如果不是偶尔穿帮的左右腿，很难一眼判断是AI制作的视频。

在运镜、构图等方面，Sora视频都呈现出大幅度的提升，一举将AI视频提升至“next level”。

Sora来临，它能抢了谁的饭碗？

图源OpenAI

此外，Sora不仅能够生成完整的60秒视频，还能延长已生成的视频。也就是说，给Sora一段视频，它可以自动生成前面或者后面的视频。

更离谱的是，Sora可以生成不同机位、不同景别的视频，并进行剪辑。且在不同的机位下，无论是广角、中景、近景、特写，室内还是室外，视频中人物和背景的关系都一致，不受影响。

图源OpenAI

也就是说，仅需要一段文字，Sora模型就可以生成一段60s的1080p视频，包含不同景别镜头。不由得让人感叹——“真实和虚幻的差别，到底还有多大距离？”

值得注意的是，文生视频早已存在，根据知名投资机构a16z统计，截至2023年底，市场上共有21个公开的AI视频模型，例如Google的Lumiere、Stability AI的SVD、以及视频生成大模型Gen-2的开发商Runway。其中，Runway2023年6月底完成C轮融资后，估值则是超过15亿美元。

Sora 公开后，东吴证券对目前主要的视频生成模型做了对比。他将Sora、W.A.L.T、Gen-2和Emu Video、Pika 1.0、Stable Video六个模型的特点、生成视频表现等特点进行对比分析。结论是，Sora在生成时长、一致性等方面都有显著的优势，具有突破性的语义理解能力。

Sora来临，它能抢了谁的饭碗？

图源东吴证券

去年年初，ChatGPT横空出世，而一年后，Sora就实现了视频的快速创作，如此快的发展速度令人心惊。毕竟一年前，AI生成视频还是这样。

Sora来临，它能抢了谁的饭碗？

图源网络

有B站网友表示：“小时候还想过，未来会不会有这样一种拍电影的技术，戴上脑机后靠人脑的想象来生成各种各样壮丽恢宏的电影画面，谁知这个现实已经不远了。”

虽然目前Sora还处于测试阶段，只面向邀请的制作者和安全专家开放测试(据称是一些视觉艺术家、设计师和电影制作人)。然而资本端已然闻风而动，CB Insights的数据则显示，OpenAI目前是世界上最有价值的科技初创企业之一，仅次于字节跳动和SpaceX。

在根据Thrive牵头的收购要约进行现有股票出售后，当前OpenAI的估值已经达到800亿美元以上,达到九个月前的近3倍。

只不过，有人欢喜有人愁，对于一些影视行业从业者和AGI视频初创公司，Sora的问世很难说是喜事。

02 风暴来袭

Sora发布，最直观的影响就是AGI视频创业公司。

曾在2023年热映影片《瞬息全宇宙》中参与制作的Runway，其 CEO瓦伦祖拉在Sora发布后，在X平台上发布了两个字，“Game On.”(竞争开始了)。

Sora来临，它能抢了谁的饭碗？

图源X平台

对于字节跳动来说，Sora的出现无疑是对于剪映的一大威胁。今年，就在Sora问世的一周前，原抖音集团CEO张楠卸任，转而投入剪映，反映出抖音对于AIGC工具的重视。随着Sora的不断发展，剪映如何才能学习Sora并创新，成为了当务之急。

除此之外，Sora类AI模型对于好莱坞以及电影、电视、广告等领域的影响是最直观的。

美国行业调查公司CVL Economics，上个月发布的一项对300位好莱坞行业领袖的调查显示，75%的受访者承认，生成式AI(工具、软件、模型)已经促使他们业务部门削减与合并工作岗位，担忧情绪弥漫在整个好莱坞。

那些掌控着好莱坞行业秩序的大佬预计，未来三年好莱坞总计会有超过20万人的工作岗位会遭受AI冲击，尤其是视觉特效、音效师、画图师等后期工作岗位。

Sora来临，它能抢了谁的饭碗？

图源OpenAI

不过，回顾内容创作的历史，工具的发展无法阻挡，进步是常态，比起抵制，创作者更要思考哪些环节和内容变得更有价值。

从AI 制作视频的流程上来看，当前的Sora需要先输入一段文字，随后再生成视频，视频的原创性还是在依赖着创作者的审美，Sora的工具属性更加突出。比起原创内容，Sora的优势更在于，那些需要耗费大量人力物力的特效片段。

所以，也有网友预测，虽然未来视频制作流程中的剪辑师、特效师等后期岗位会面临更为严峻的处境。但过往那些受限于拍摄成本、拍摄技术的内容，则会更受关注。

理想的情况下，Sora未来能够代替更多机械、重复的工作，使得创作者可以集中精力于创新的、深度的解读，给文化消费者们提供更优质的内容。

此外，由于AI的理解内容更加偏向于输入“关键词”，而非剧本。所以在未来，如何创作出适合AI 理解的剧本，从而生成视频，也是值得关注的问题。

03 Sora的价值，不止视频

目前来看，Sora最直观的影响是视频制作行业，但他的野心，或者是众多大模型的野心远不止于此。

OpenAI官网上，将Sora定位为世界模拟器。OpenAI认为，其能够有效地模拟物理和数字世界，包括其中的物体、动物和人类等各种因素。根据OpenAI的报告显示，Sora在理解地球物理世界的规律层面，取得了巨大的进展。

当然，目前的Sora作为一个模拟器当前还存在着一定的缺陷，世界模型仍然不够完善。在OpenAI发布的48个Sora生成的视频中，就出现了不少穿帮的画面。

例如玻璃杯还没有破碎，但是液体已经流出；人们在沙漠中挖出变形塑料椅子；一个男人在倒着跑跑步机等不符合逻辑的视频内容。简单来说，一些对于人类来说约定俗成的因果规律，Sora模型短期内无法推理。

Sora来临，它能抢了谁的饭碗？

图源OpenAI

就已有信息来看，目前的Sora仍处于1.0阶段，在处理精细的背景时常常出现力不从心的情况，但没人会否认Sora对于AGI实现路程上的里程碑地位。

AI风口下，Sora的出现让我们看到了AGI实现的可能，也逼迫着同行业内不断创新发展。毕竟泡沫过后，赢家只能有一个。

作者：光也

来源：微信公众号：TopKlout克劳锐（ID：TopKlout）

本文由 @TopKlout克劳锐授权发布于运营派，未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议