该团队指出，现有的条件图像合成框架基于用户输入以单一方式生成

nvidia 展示了一种新的合成模型

NVIDIA 展示了一种新的合成模型，允许用户使用多个模块来生成新图像。该团队指出，现有的条件图像合成框架基于用户输入以单一方式生成图像，例如文本、语义分割、草图或样式参考。问题是这些模型通常仅限于单个输入，因此您可以使用文本和草图，但不能同时使用这两个模块。为了应对这一限制，NVIDIA 团队开发了专家产品生成对抗网络 (PoE-GAN) 框架，该框架可以基于所需的模块集生成图像。

GauGAN 2 之前我们有介绍过，不过最近又发现NVIDIA的团队发布了一篇论文，他们开发了一个新的框架 ——PoE-GAN，该框架可以基于所需的模块集生成图像。

也就是说现在可以通过多个条件控制（如：文本、语义分割、草图、参考图）来生成你想要的画面。

这是论文官网的一个demo，大家也可以点击这里体验。文本是“冰湖附近的雪山和天空中粉红色的云”，然后通过逐步增加语义分割和草图两个控制条件后，大家可以直观地看出图像所发生的变化，有没有眼前一亮呢？

PoE-GAN 由 product-of-experts 生成器和多通道多尺度投影鉴别器组成。通过精心设计的训练方案，PoE-GAN 学习合成高质量和多样性的图像，除了在多模态条件图像合成方面取得最新进展外，而且在单模态设置中进行测试时，PoE-GAN 还优于现有的**单模态条件图像合成方法。