当前位置:首页 >  科学 >  涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络

发布时间:2021-03-01 21:56编辑:小狐阅读: 524次 手机阅读

机器之心报道

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图1)

近日,机器之心在 GitHub 上看到了一个非常有意义的项目 PyTorch-StudioGAN,它是一个 PyTorch 库,了条件 / 无条件图像生成的代表性生成对抗网络(GAN)的实现。据主页介绍,该项目旨在一个统一的现代 GAN 平台,这样机器学习领域的研究者可以快速地比较和分析新思路和新方法等。

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图2)

具体而言,该项目具有以下几个显著特征:

了大量 PyTorch 框架的 GAN 实现。

基于 CIFAR 10、Tiny ImageNet 和 ImageNet 数据集的 GAN 基准。

相较原始实现的更好的性能和更低的内存消耗。

完全最新 PyTorch 环境的预训练模型。

支持多 GPU(DP、DDP 和多节点 DDP)混合精度、同步批归一化、LARS、Tensorboard 可视化和其他分析方法。

对于这个 PyTorch GAN 库,有网友表示:看上去很不错!如果可以 top-k 等现代训练实践以及各种增强方法就更棒了。对此,项目称其会在 NeurIPS 论文提交截止日期之后,添加一些改进的方法,如 Sinha 等人的 Tok-K 训练以及 Langevin 采样和 SimCLR 增强。

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图3)

此外,有网友询问是否可以将该项目用于图像之外的其他领域。表示可以,即使无法使用一些稳定器(如 diffaug、ada 等)依然可以通过调整 dataLoader 来训练自己的模型。

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图4)

18+ SOTA GAN 实现

如下图所示,项目了 18 + 个 SOTA GAN 的实现,包括 DCGAN、LSGAN、GGAN、WGAN-WC、WGAN-GP、WGAN-DRA、ACGAN、ProjGAN、SNGAN、SAGAN、BigGAN、BigGAN-Deep、CRGAN、ICRGAN、LOGAN、DiffAugGAN、ADAGAN、ContraGAN 和 FreezeD。

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图5)

cBN:条件批归一化;AC:辅助分类器;PD:Projection 判别器;CL:对比学习。

其中,需要注意以下几点:

Tiny ImageNet 数据集上的实验使用的是 ResNet 架构而不是 CNN。

下图中 StyleGAN2 为即将实现的 GAN 网络,其中 AdaIN 表示自适应实例归一化(Adaptive Instance Normalization)

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图6)

环境要求

Anaconda

sklearn

seaborn

h5py

tqdm

tensorboard

torchlars

用户可以采用以下方法安装推荐的环境:

conda env create -f environment.yml -n studiogan

在 docker 中还可以采用以下方式:

以下是创建名字为studioGAN容器的命令,同样也可以使用端口号为 6006 来连接 tensoreboard。

使用方法

使用 GPU 0 的情况下,在 CONFIG_PATH 中对于模型的训练-t和评估-e进行了定义:

CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -e -c CONFIG_PATH

在使用 GPU (0, 1, 2, 3) 和 DataParallel 情况下,在 CONFIG_PATH 中对于模型的训练-t和评估-e进行了定义:

CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -e -c CONFIG_PATH

在 python3 src/main.py 程序中查看可用选项,通过 Tensorboard 可以监控 IS、FID、F_beta、Authenticity Accuracies 以及最大奇异值:

~ PyTorch-StudioGAN/logs/RUN_NAME>>> tensorboard --logdir=./ --port PORT

可视化以及分析生成图像

StudioGAN 支持图像可视化、k 最近邻分析、线性差值以及频率分析。所有的结果保存在./figures/RUN_NAME/*.png中。

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -iv -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图7)

k 最近邻分析,这里固定 K=7,第一列中是生成的图像:

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -knn -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH

涵盖18+,SOTA,为即将实现的,无条件图像生成的代表性生成对抗网络(图8)

线性插值(仅适用于有条件的 Big ResNet 模型 )的代码和示例如下:

CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -itp -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH

本文相关词条概念解析:

生成

生成有如下意义:养育;长成;指生物,亦泛指物品;指人民;自然形成;生就;保全性命;必定。教育学中的生成可分为两种,一类是我们预设下的现象,另一类是我们不曾预设到的现象。“动态生成”是新课程理念下课堂教学的主要特征,它强调课堂教学要改变传统课堂教学固定不变、按部就班、机械僵化的教学模式,主张课堂教学必须构建生成性的探究性活动过程。

标签:
  • 网友评论
相关文章:

科学本月排行

科学精选