OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗

2024-02-16 14:19:23random

random

订阅者

关注

10532
文章

0
粉丝

科技圈子评论104字数 732阅读2分26秒阅读模式

摘要在开发出爆款聊天机器人ChatGPT系列之后，OpenAI继续在生成式人工智能上玩出了“新花样”。2月16日，OpenAI推出了新的AI大模型Sora，据...

在开发出爆款聊天机器人ChatGPT系列之后，OpenAI继续在生成式人工智能上玩出了“新花样”。2月16日，OpenAI推出了新的AI大模型Sora，据称该文生视频大模型能够通过快速文本提示，创建出逼真和富有想象力的60秒视频，视频的效果相较之前又上了一个台阶。

文章源自玩技e族-https://www.playezu.com/811806.html

OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗插图文章源自玩技e族-https://www.playezu.com/811806.html

据了解，该大模型的优势在于不仅能够更好地理解用户在提示中的要求，还能够理解这些东西在现实世界中的存在和运动方式。OpenAI表示，“正在教人工智能理解和模拟运动中的物理世界”，目标是训练模型来“帮助人们解决需要现实世界互动的问题”。文章源自玩技e族-https://www.playezu.com/811806.html

OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗插图1 文章源自玩技e族-https://www.playezu.com/811806.html

Sora生成的中国舞龙场景，与真实场景几乎没有差别文章源自玩技e族-https://www.playezu.com/811806.html

随后，OpenAI还解释了Sora的工作原理，表示Sora作为一个扩散模型，会从类似于静态噪声的视频开始，通过多个步骤逐渐去除噪声，使视频由最初的随机像素转化为清晰地图像场景，而此前大火的Midjourney和Stable Diffusion的图像和视频生成器同样基于扩散模型，但Sora能够通过让模型一次预见多帧画面，确保了即使被摄体在离开视线后仍然能保持不变，也使其展示出了对电影拍摄语法的自发理解。文章源自玩技e族-https://www.playezu.com/811806.html

OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗插图2 文章源自玩技e族-https://www.playezu.com/811806.html

Sora生成的女性眼睛，无论皮肤纹理还是瞳孔、睫毛都非常逼真文章源自玩技e族-https://www.playezu.com/811806.html

一位视频工作者在看到Sora之后表示，“我进入YouTube世界已经15年时间，但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了，素材网站将变得无关紧要，任何人都可以无壁垒获得难以置信的产品，内容背后的‘想法’和故事将变得更加重要。”文章源自玩技e族-https://www.playezu.com/811806.html

OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗插图3 文章源自玩技e族-https://www.playezu.com/811806.html

Sora生成的赛博都市场景

不过，也有不少人在看了Sora生成的视频之后表示：画面很真实，但也很诡异。这其实是由该大模型的缺点决定的。虽然该模型能够在一定程度上模拟现实场景，但仍然难以准确模拟复杂场景中的物理现象，也无法理解具体的因果关系，还存在混淆提示的空间细节等诸多问题。

OpenAI视频模型Sora炸裂登场，视频作者表示：或将彻底端掉行业饭碗插图4

Sora生成的视频中，老人吹蜡烛前后火苗纹丝不动，略显诡异

此外，关于文生视频模型安全性方面，OpenAI表示，正在开发帮助检测误导信息的工具，以此来检查例如极端暴力、性内容、仇恨图像、名人肖像等违反使用政策的文本提示，确保它在显示给用户的内容中没有违反使用政策的内容。

测试交流

测试分享

百科知识

经验总结