招商证券:文生视频模型SORA表现效果超预期 带动算力网络建设需求 招商证券:文生视频模型SORA表现效果超预期 带动算力网络建设需求
admin
2024-02-20 17:46:25
0

智通财经APP获悉,招商证券发布研究报告称,Sora打开AIGC在视觉领域的应用空间,算力网络供给持续短缺拉动硬件基础设施建设需求。该行测算训练Sora模型需要约7.09万张H100一个月的训练量。在推理侧,根据相关研究测算生成一张图的算力消耗约为256个词的消耗。由此推算生成一个1分钟时长短视频的算力消耗约是生成一次文字对话的千倍以上。该行认为中短期算力将持续处于短缺不能充分满足推理侧需求。

事件:2月16日OpenAI推出文生视频模型Sora,可以根据文本指令创建现实且富有想象力的场景,能够生成具有多个角色、特定类型的运动,以及主体和背景的准确细节的复杂场景的高清视频,并且时长可以达到一分钟。Sora的超预期表明Transformer模型在视觉领域的有效,为视觉模型的加速迭代奠定基础。

招商证券观点如下:

Sora模型展示效果惊艳,创立视觉模型里程碑。

与之前的视觉模型不同,OpenAI的Sora是视觉数据的通用模型,通过一次为模型提供多帧的预测,解决了一个具有挑战性的问题,即确保主题即使暂时离开视野也保持不变。它可以生成不同时长、长宽比和分辨率的视频和图像,而且最多可以输出长达一分钟的高清视频。Sora的核心优势:一致性、灵活性、稳定性。Sora能够灵活的生成各种像素各种画幅的图像,同时能够根据图像生成视频或者将视频内容扩充出新的视频。与其他模型相比Sora生成的时长达到1分钟的情况下还能保持前后主题的一致性是之前视觉模型所不具备的。同时Sora还涌现出对物理规律的理解能力,在没有人为约束的情况下生成的画面中满足物理学规则使得画面更加逼真。

视觉模型的GPT3时刻,模型迭代进入加速期。

Sora之前,虽然大语言模型随着GPT的成功逐渐成为主要研究方向,不过扩散模型仍在大语言模型占据主导地位。DALL·E、StableDiffusion等广泛使用的视觉模型都采用扩散模型。2023年谷歌提出大语言模型之所以在视频领域表现不佳的主要原因不在于模型本身而在于没有好的表达形式来转化视频,也证明了大语言模型在文生视频领域的可行性。Sora的突破之处在于基于DiT结构,结合了大语言模型和扩散模型的共同优点。使得Diffusion模型也能够规模化,证明GTP4式的大力出奇迹也能在视觉领域出现同样的“涌现”效果。Sora标志了扩散+语言大模型融合路线的成功,未来具有很大的迭代潜力,类似于GPT3的里程碑意义,沿着这条道路持续迭代未来1-2年内有望出现能生成效果更加逼真的视觉模型。

Sora大幅拉动算力需求,拉动硬件建设投资。

根据DiT模型创立者谢赛宁博士粗略测算,Sora模型的参数规模大约为30亿。根据对可训练数据量的研究成果,海外大型视频网站每分钟大约上传500小时视频内容。由此该行测算训练Sora模型需要约7.09万张H100一个月的训练量。在推理侧,根据相关研究测算生成一张图的算力消耗约为256个词的消耗。由此推算生成一个1分钟时长短视频的算力消耗约是生成一次文字对话的千倍以上。中短期算力将持续处于短缺不能充分满足推理侧需求。

投资建议:Sora打开AIGC在视觉领域的应用空间,算力网络供给持续短缺拉动硬件基础设施建设需求。

光模块环节该行重点推荐北美光模块核心供应商:中际旭创(300308.SZ)、新易盛(300502.SZ),及其上游核心供应商天孚通信(300394.SZ),及国产光芯片龙头源杰科技(688498.SH);

交换机环节该行建议关注交换机国产替代龙头紫光股份(000938.SZ)、锐捷网络(301165.SZ),同时建议关注国产交换机芯片龙头盛科通信(688702.SH),同时推荐国内ICT巨头中兴通讯(000063.SZ);

视频编解码环节该行建议关注视频编解码优质公司当虹科技(688039.SH)、维海德(301318.SZ)。

风险提示:核心计算参数假设不准确,Sora模型落地进度不及预期,行业竞争格局恶化

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...