OpenAI Sora概览
母公司:OpenAI
发布时间:暂未正式发布
类型:文本转视频模型(text-to-video model)
官网:https://openai.com/index/sora/
OpenAI Sora简介
Sora是OpenAI的一款文本转视频的生成式人工智能模型,专门用于文本转视频生成。该模型会根据用户的提示生成短视频片段。截至 2024 年 7 月,它尚未发布,尚未向公众开放。
OpenAI Sora发展历程
2024 年 2 月 15 日,OpenAI 首次通过发布其制作的多个高清视频片段来预览 Sora。
OpenAI Sora主要功能
Sora支持文本转视频,图片转视频以及视频扩展,视频到视频编辑
OpenAI Sora发布时间
OpenAI 表示计划向公众推出 Sora,但不会很快推出;目前尚未具体说明具体时间。该公司还与一小群创意专业人士(包括视频制作者和艺术家)分享了 Sora,以寻求有关其在创意领域实用性的反馈。
Sora含义
Sora是以日语中“天空”一词命名,以表示其“无限的创造潜力”。
OpenAI Sora技术实现
Sora 是一个扩散变换器——一个去噪潜在扩散模型,其中一个变换器作为去噪器。通过对 3D“块”进行去噪,在潜在空间中生成视频,然后通过视频解压缩器将其转换到标准空间。
Sora 是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐转换视频。Sora 以 DALL·E 和 GPT 模型的过去研究为基础。它使用了 DALL·E 3 中的重新字幕技术,该技术涉及为视觉训练数据生成高度描述性的字幕。因此,该模型能够更忠实地遵循生成的视频中用户的文本指令。
将视频和图像表示为称为块的较小数据单元的集合,每个块都类似于 GPT 中的令牌。通过统一表示数据的方式,OpenAI可以在比以前更广泛的视觉数据上训练扩散变压器,涵盖不同的持续时间、分辨率和宽高比。
OpenAI Sora官网
官网地址:https://openai.com/index/sora/
OpenAI Sora评分
OpenAI Sora用户评价
There are no reviews yet. Be the first one to write one.
暂无评论内容