Imagen 怎么工作的

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

原始英文链接: 

How Imagen Actually Works

字幕被输入到一个预训练和冻结的 Transformer 编码器中该编码器输出一个向量序列文本编码。这些向量很重要因为它们对标题中的单词如何相互关联进行编码并充当模型所有其他组件的条件信息。

然后将文本编码传递到图像生成扩散模型该模型从高斯噪声开始然后逐渐去除噪声以生成反映标题中语义信息的新图像。该模型的输出是一个 64x64 像素的图像。

在此之后再使用两个扩散模型将此图像超分辨率为最终的 1024x1024 大小同样以文本编码以及较低分辨率的图像为条件。

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6