OpenAI推出Sora它的生成式AI模型可以根据文本创建视频

  • 发布时间:2024-02-28 16:39:20 来源:
标签:
导读 ChatGPT的创建者OpenAI宣布推出一种名为Sora的新AI模型,该模型可以根据文本指令创建逼真且富有想象力的场景,最长可达一分钟。据OpenAI称

ChatGPT的创建者OpenAI宣布推出一种名为Sora的新AI模型,该模型可以“根据文本指令创建逼真且富有想象力的场景”,最长可达一分钟。

据OpenAI称,Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景,以生成表达充满活力的情感的引人注目的角色。

该公司在一篇帖子中表示:“该模型不仅了解用户在提示中提出的要求,还了解这些东西在现实世界中的存在方式。”

在技​​术帖子中,Sora可以对宽屏1,920x1,080视频、垂直1,080x1,920视频以及介于两者之间的所有视频进行采样。这使得Sora可以直接以其原生宽高比为不同设备创建内容。

OpenAI确实承认当前模型存在弱点,例如混淆左右或因果等空间细节。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。

我们将其从MP4转换为gif。提示:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。

我们将其从MP4转换为gif。提示:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。

Sora目前正在与红队成员(错误信息、仇恨内容和偏见等领域的专家)一起接受安全测试。同时,OpenAI将利用为使用DALL·E3的产品构建的现有安全方法,这些方法也适用于Sora。因此,Sora将拒绝违反我们的使用政策的文本输入提示,例如那些要求极端暴力、性内容、仇恨图像、名人肖像或他人IP的提示。

Sora并不是第一个图像生成AI模型,但它与微软的BingImageCreator之间的主要区别在于,后者创建静态图像,而Sora可以创建移动图像。

  • 免责声明:本文由用户上传,如有侵权请联系删除!