传媒:视频生成模型再迎突破
- 管理员
-
6 次阅读
-
1 次下载
-
2024-06-13 11:14:38
文档简介:
http://www.huajinsc.cn/1/3请务必阅读正文之后的免责条款部分2024年02月18日行业研究●证券研究报告传媒传媒行业快报行业快报视频生成模型再迎突破视频生成模型再迎突破投资要点投资要点事件:事件:2月16日OpenAI发布文生视频模型Sora,其使用Transformer架构,建立在DALL·E3和GPT模型之上,可以生成长达一分钟的有运动、多机位视频。相比业界水平,Sora将视频生成的时长一次性提升了15倍,直接迈过了市面上所有短视频的时长要求。视频生成模型范式的确定有望进一步推动多模态模型发展视频生成模型范式的确定有望进一步推动多模态模型发展。模型层面模型层面:在文生视频领域,目前模型思路有循环网络(RNN)、生成对抗网络(GAN)和扩散模型(Diffusionmodels),Sora为一种扩散模型相较于GAN,扩散模型的生成多样性和训练稳定性都要更好。生成表现生成表现:扩散模型在图片和视频生成上有更高的天花板,GAN模型从原理上本质上是机器对人的模仿,而扩散模型则更像是机器学会“成为一个人”。Sora基本框架基本框架:基于OpenAI大语言模型思路,
评论
发表评论