爆火的Sora,摩拳擦掌的出海人 爆火的Sora,摩拳擦掌的出海人
admin
2024-02-23 17:36:43
0

文|霞光社 麻吉 编辑|刘景丰

一年前AI智能涌现的场景又重现。

2024开年,Sora就引发了全球科技圈的集体躁动。

当地时间2月15日,OpenAI发布最新视频生成模型Sora。根据OpenAI描述,Sora可根据用户输入的简短文本指令,生成长达1分钟的高清视频,并创建具有多个角色、特定类型的运动以及准确的主题和背景细节的复杂场景。

让全球受众感到惊叹的,是Sora生成视频中极具真实感的画面呈现,甚至还带着些许电影质感。


图源:OpenAI网站截图

在OpenAI发布的一系列不同主题视频中,不论是戴墨镜女子走在东京街头的场景,或是动画人物的细节塑造,虽然这些内容完全由AI生成,但其中细节呈现出的画面真实感已经进入一个全新维度。这让不少网友感叹,现实的边界正在数字世界中变得愈发模糊。正如OpenAI 在Sora技术报告的标题中赫然写道的," Sora 这类视频生成模型是「世界的模拟器」"。

对中国出海企业来说,AI技术推动下内容生产力的大幅提升,也将进一步助力产业升级,并加速企业的全球化步伐。而TikTok平台上,已经开始充斥各种由AI生成的视频疯狂吸粉。


去年初,OpenAI发布的大语言模型ChatGPT掀起了一轮人工智能的热潮。ChatGPT上线后,几乎所有全球科技大厂都全速投入AI领域,发布了自己的大语言模型,影响着人们日常搜索信息、查找资料的方式发生改变。

而文生视频模型Sora的发布,更直观地呈现了AI技术正在以何种速度飞速发展。

在社交媒体X上一条Sora演示视频下方,特斯拉创始人马斯克发表评价说"gg 人类"(gg为Good Games缩写,代指"打得好,我认输")。他还表示,由人工智能增强的人类,将会在未来几年之内创作出最杰出的作品。

360集团创始人、董事长周鸿祎则表示,Sora的诞生意味着AGI的实现将从10年缩短至1年。

"Sora把AI视频能力推到了一个新的阶段,是走向实用化的开始。视频生产成本将大幅降低,所需要的技能也将和以前完全不同。以前的技能是如何找到优质的拍摄团队,场地,以及合适的价格进行产品视频拍摄,如何协调和沟通。之后的技能是如何写prompt,如何让AI把自己的产品不失真的融入到视频里,如何让视频看起来真实清晰有质感。"Passioncy创始人郭林告诉霞光社。

就在近日,OpenAI的TikTok账号上,各种由AI生成的视频疯狂吸粉,在短短数天时间内吸粉超10万,获得超50万次点赞。网友们纷纷留言感慨,短视频创作者是否即将会被AI抢了饭碗,甚至连TikTok平台都会受到影响。

虽然Sora还未正式开放给用户使用,但已经在资本市场掀起波澜。市场预计,在最新一轮由风投公司ThriveCapital牵头的融资中,OpenAI的估值有望超过800亿美元。作为对比,去年年初OpenAI发布ChatGPT不久后的估值约为290亿美元。

而在Sora发布次日,几家美国科技公司的股价便应声跌落。据媒体报道,美国电脑软件公司Adobe股价暴跌超7%;美国图片库、图片素材、图片音乐和编辑工具供应商Shutterstock跌超5%;几周前发布了"文生视频"工具Lumiere的谷歌母公司股价下挫1.58%。一天以内,这三家公司的市值就合计蒸发了近480亿美元(折合人民币近3500亿元)。

对不少行业来说,Sora就像是一颗"重磅炸弹",让从业者在展望未来时既兴奋又感到惶恐不安。

其中,影视业首当其冲。在传统的影视制作过程中,后期及特效制作往往需要投入大量人力、物力和时间,而Sora等AI工具将大大降低这些成本,帮助影视制作公司快速创建出高质量的视频片段,缩短制作周期。

在正举行的柏林电影节上,Sora就成为电影人热议的话题之一。

据外媒报道,洛杉矶导演戴夫·克拉克(Dave Clark)认为,创作者需要接受人工智能技术来制作尚未想象或实现的内容,而不是感到威胁。

德国视觉特效工作室Trixter的董事总经理克里斯蒂娜·卡斯珀斯-罗默(Christina Caspers-Roemer)则表示,像Sora这样的人工智能工具被证明在工作流程中更高效、更快,但即便如此,电影和电视制作将仍然以人类创作为基础。"最终我们的客户总会回到现实世界。"她说。


从ChatGPT、DALL-E3,再到Sora,AI内容创作已经从图文席卷至视频创作领域。

而实际上,Sora并不是第一个受到关注的文生视频大模型。近年,全球科技大厂几乎无一例外地重金投入人工智能领域,并计划在未来持续甚至加大投入。

在Sora正式亮相以前,大部分全球头部科技企业就已拥有自己的文生视频大模型。

去年11月,文生视频模型迎来了一波爆发。11月3日,Runway发布Gen-2更新,支持4K清晰度作品;11月16日,Meta发布文生视频大模型Emu Video;11月18日,字节跳动发布PixelDance;11月21日,Stability AI发布生成式视频模型Stable Video Diffusion……

今年1月,谷歌也发布了视频生成模型Lumiere,专门用于将文本转换为视频。

目前,Sora仍处于开发早期阶段,OpenAI表示,当前的模式仍然存在不少弱点。Sora可能难以准确模拟复杂场景的物理原理,也可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后,饼干上可能没有咬痕。

此外,该模型还可能混淆提示的空间细节,例如混淆左和右,并且可能难以精确描述随时间发生的事件。

而细心的网友也在Sora的演示视频中发现了不少Bug。"比如在Sora生成的一个视频中,呈现的是中国农历新年舞龙的场景,虽然视频里龙身上和建筑上的文字很像是中国书法撰写的字体,但实际上并不是中国字,谁也不认识写的是什么,感觉只是AI臆想出来的中文。另一个视频里的猫,动起来的时候有三只前脚。"关注AI行业的一名读者向霞光社表示。


图源:OpenAI网站截图

但即使如此,不论在生成视频时长、实现单视频多机位、拥有精准物理规则的真实世界等技术层面,Sora均已实现"碾压式"领先其他文生视频模型,推动AI视频生成进入了一个新的时代。


Sora这样的生成式AI工具,在降低成本和提高效率方面的显著优势,为内容创作、广告娱乐等行业带来了前所未有的发展契机,也让不同类型的中国出海企业看到了机会。

此前,一些企业将ChatGPT应用于多个场景之中,实现降本增效。AMZ123的一项调查数据显示,2023年,有33%的跨境公司使用ChatGPT,另有将近15%的公司预计将投入使用。

如今Sora尚未完全开放使用,但可以想见,通过更精准的生成式人工智能,不论是制作TikTok等平台短视频,或是为自己的产品制作介绍视频和推广营销视频,都将能大大降低成本、提升效率。

"如何通过AI来生产真正能落地的视频,是大家开始摸索的东西。Sora给行业带来了颠覆性的影响,谁先用上包括Sora在内的新AI技术,谁就能吃到第一波行业红利。"Passioncy创始人郭林说,"中国公司出海肯定要充分利用好现有的AI能力。对于中小企业,尤其很多工贸一体企业来说,难度其实是非常高的。这也是我们目前希望提供帮助的一个方向。"

一名广告行业资深从业者也告诉霞光社,她认为Sora将颠覆旅游、生活方式和服务行业的内容。随着视频制作过程变得更简单,大品牌广告和小品牌广告之间的界限将逐步缩小,而"讲故事"等内容创意环节,将再次成为广告中最重要的因素。

而在游戏出海领域,Share Creators创始人兼CEO Ada Liu认为,视频生成带来的改变将是"跨时代"的。

"在游戏行业, AI可以帮助生成前期的概念图,UI icon等。计算机图形制作的流程非常长,从3D制作,到渲染、合成,每个环节都需要投入大量专业的人员。尤其在风格探索阶段,如果直接生产出视频,相当于直接跳到最后一步,节省了大量的制作时间和成本。"

但 Ada Liu同时认为,AI生成内容想要完全取代人工还存在不少距离。"可能再发展一两年,能取代2D部分的一些低端批量制作工种。但主美之类定方向的美术人员,是不会被取代的。毕竟一个产品的美术风格需要人来选择。"

Ada表示,Sora的演示视频效果令人印象深刻,但还是要关注实际上的效果,因为目前无法试用,只能等等看。而郭林也认为,目前AI工具距离产出"真正能落地"的视频,主要差距仍在于内容真实性,以及工具易用性两个方面。

根据IDC的预测,未来五年内,AIGC对于营销、软件测试等行业将带来巨大影响。到2025年,35%的企业将掌握使用生成式人工智能来开发数字产品和服务。到2026年,生成式AI将承担42%的传统营销琐碎任务,如搜索引擎优化、内容和网站优化、客户数据分析、细分、潜在客户评分以及超级个性化。到2028年,基于生成式AI的工具将能够编写80%的软件测试工作,从而减少对人工测试的需求,提高测试覆盖率、软件可用性和代码质量。

可以预见的是,即便AI生成内容仍然面临道德和滥用方面的潜在风险,但其在创造力和效率方面的无限潜力,将持续吸引全球科技巨头的加码投入和争夺。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...