SORA深度解析 VIP免费

SORA深度解析_第1页
SORA深度解析_第2页
SORA深度解析_第3页
请务必阅读报告末页的重要声明证券研究报告|行业专题报告计算机行业行业评级强于大市(维持评级)2024年2月25日Sora技术深度解析证券分析师:施晓俊执业证书编号:S0210522050003研究助理:李杨玲王思华福证券投资要点Sora横空出世引领多模态产业革命。美国时间2月15日,文生视频大模型Sora横空出世,能够根据文本指令或静态图像生成1分钟的视频。其中,视频生成包含精细复杂的场景、生动的角色表情以及复杂的镜头运动,同时也接受现有视频扩展或填补缺失的帧。总体而言,不管是在视频的保真度、长度、稳定性、一致性、分辨率、文字理解等方面,Sora都做到了业内领先水平,引领多模态产业革命。此外,当Sora训练的数据量足够大时,它也展现出了一种类似于涌现的能力,从而使得视频生成模型具备了类似于物理世界通用模拟器的潜力。拆解视频生成过程,技术博采众长或奠定了Sora文生视频领军地位。从技术报告中,Sora视频生成过程大致由“视频编码+加噪降噪+视频解码”三个步骤组成,视频压缩网络、时空patches、transformer架构、视频数据集等技术与资源在其中发挥了重要作用。视频压缩网络:过往VAE应用于视频领域通常需插入时间层,Sora从头训练了能直接压缩视频的自编码器,可同时实现时间和空间的压缩,既节省算力资源,又最大程度上保留视频原始信息,或为Sora生成长视频的关键因素,并为后续处理奠定基础。时空patches:1)同时考虑视频中时间和空间关系,能够捕捉到视频中细微的动作和变化,在保证视频内容连贯性和长度的同时,创造出丰富多样的视觉效果;2)突破视频分辨率、长宽比等限制的同时显著提升模型性能,节约训练与推理算力成本。Transformer架构:1)相比于U-Net架构,transformer突显ScalingLaw下的“暴力美学”,即参数规模越大、训练时长越长、训练数据集越大,生成视频的效果更好;2)此外,在transformer大规模训练下,逐步显现出规模效应,迸发了模型的涌现能力。视频数据集:Sora或采用了更丰富的视频数据集,在原生视频的基础上,将DALL・E3的re-captioning技术应用于视频领域,同时利用GPT保障文字-视频数据集质量,使得模型具有强大的语言理解能力。投资建议:我们认为,在视频压缩网络与时空patches提高计算效率与利用原生视频信息的基础上,transformer或取代U-Net成为扩散模型主流架构。可拓展性更强的transformer需要更为有力的算力支持才能保障视频生成质量,同时相比于大语言模型,视觉数据的训练与...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

Q:已扫码付款购买某文档,但购买成功后没有显示下载入口?

A:建议您微信注册登录后购买,不要再次付款。出现该问题的概率很低,联系客服会尽快解决。

Q:如何查询已购买的文档和支付明细?

A:在您的“个人中心-我的订单”里,您可以查看到自己的文档购买记录。

Q:购买后如何下载?

A:在您的“我的订单”里,您可以下载购买的文档到本地。

Q:文档下载后打不开?

A:推荐使用Edge、Chrome内核浏览器下载。下载成功后,使用较高版本 office 或 wps 打开文档。如果文档扩展名不符,修改文档扩展名即可解决。

Q:下载后文档与页面展示有差异?

A:文档的总页数、文档格式和文档大小以系統显示为准,发生争议时,平台客服以系统显示作为判断依据。

Q:文档购买后可以申请退款吗?

A:所有收费文档都可以先部分预览再购买,且平台自身不编辑或修改文档内容,也不对该等内容的真实性、有效性负责。请您谨慎选择所需内容后支付。除因文档自身质量问题外(如:文档出现空白、乱码、内容缺失或下载后内容不一致、无法正常显示、损坏无法打开等情形),付费文档不予退换。

Q: 购买文档后如何咨询客服?

A: 首页点击页面右下角【在线客服】(周一至周五9点-17点),我们将安排专人为您处理。

医管老道
实名认证
内容提供者

给大家分享医院管理中包括医务、护理、院感、运营、绩效、财务和信息等方便的知识和经验。希望大家喜欢!

确认删除?
回到顶部
在线客服
己有书馆