前言

神奇宝贝已经是一个家喻户晓的动画了,我们今天来确认是否可以使用深度学习为他自动创建新的Pokemon。

我最终成功地使用了生成对抗网络(GAN)生成了类似Pokemon的图像,但是这个图像看起来并不像神奇宝贝。
虽然这个尝试失败了,但是我认为其他人可能会喜欢这个过程,现在把他分享出来。

GAN生成对抗网络


这里不想花很多时间讨论GAN是什么,但是上面的图片只是一个非常简单的解释过程。
训练了两个网络-鉴别器和生成器。 生成器学习如何吸收随机噪声并从训练数据生成看起来像图像的图像。 它通过将其生成的图像发送到鉴别器网络,鉴别器网络经过训练可以辨别真实图像和生成的图像。
生成器经过优化,可以更好地欺骗鉴别器,鉴别器经过优化,可以更好地检测生成的图像。因此,他们俩一起进步。

数据

因此,我的假设是,我可以使用真实的神奇宝贝图像作为训练集来训练GAN。 结果将是一个生成器,然后将能够创建新颖的神奇宝贝!
我的第一个挑战是找到神奇宝贝的图像。 幸运的是,Kaggle数据集得以抢救!
有人已经想过类似的想法,尽管听起来他在生成新的Pokemon图像方面没有很大的成功,但是由于他花了时间收集800幅图像,因此决定将它们上传到Kaggle数据集。这节省我很多时间。
我们看一下这个数据集:

这是一张 蒜头王八 妙蛙种子 的图片,大小是256*256

现在,有了数据,下一步就是选择要使用的GAN类型。 可能存在数百种GAN的变体,但过去使用DCGAN可以看到良好的效果。
DCGAN从神经网络中消除了所有完全连接的层,使用转置卷积进行上采样,并用卷积跨度(除其他外)代替了最大池化。
我喜欢DCGAN,因为与其他我尝试过的GAN相比,它们似乎更健壮,因此无需进行超参数的重大调整即可更容易训练。
实际上,DCGAN非常受欢迎,以至于PyTorch的示例就很好地实现了。 同样重要的是,他们的示例可以直接从文件夹读取输入。 因此,使用以下命令,我能够开始训练我的GAN:

python main.py --dataset folder --dataroot /pokemon/  --cuda --niter 10000 --workers 8

该命令从文件夹中读取图像,在具有8个工作程序的GPU上运行以加载数据,并运行10,000次迭代。

事实证明,此问题需要进行10,000次迭代,但我想看看我能推多远。 让我们来看看!

结果

第一步始于一个一无所知的网络,因此产生的只是噪声:

每个box都是一个64 x 64像素的图像,它是尝试从我们的生成器中生成神奇宝贝。 由于我们的网格为8 x 8,因此我们尝试生成64种不同的神奇宝贝。 我将图像缩小到64 x 64,因为在尝试生成更大的图像时这种算法会变得不稳定。

50次迭代以后,有点意思了

150次迭代,图像变得清晰了

3,700点之后,会有一些不错的图片出现了。 此后,它开始趋向于产生更差的结果:

这些看起来根本都不像神奇宝贝!
但是请将浏览器缩小到25%左右,然后再次查看。 在远处,它们看起来惊人地类似于真正的神奇宝贝。
为什么呢?由于我们正在对64 x 64的图像进行训练,因此辨别器很容易被形状和颜色类似于口袋妖怪的图像所迷惑,因此生成器不需要改进。

下一步?

在我看来,显而易见的下一步就是训练更高分辨率的GAN。 实际上,我已经对此进行了一些尝试。
我的第一个尝试是重新编写PyTorch代码以缩放到256 x 256图像。 该代码有效,但是DCGAN崩溃了,我无法稳定新联。 我相信主要原因是因为我只有大约800张图像。 而且,尽管我进行了一些数据扩充,但还不足以训练更高分辨率的DCGAN。
然后,我尝试使用相对论的GAN,该GAN已成功针对具有较小数据集的高分辨率数据进行了成功的训练,但也无法使其正常工作。
目前来看,问题应该出现在数据上,数据量太小,还是满足不了训练的需求。但是我将继续尝试其他一些想法,以产生更高分辨率的Pokemon,如果我有工作的必要,我将发布我使用的技术。

翻车现场:我用pytorch和GAN做了一个生成神奇宝贝的失败模型相关推荐

  1. 和导师的微信聊天翻车现场,你一定经历过

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文整理自:硕博关注 今天我们盘点那些和导师聊天,因为打错字而引发的"翻车现场&qu ...

  2. 美女主播变大妈:在bug翻车现场说测试策略

    戳蓝字"CSDN云计算"关注我们哦! 美女主播变大妈: 在bug翻车现场说测试策略 文 | 珍妮兔 这两天直播圈发生了一起严重的翻车事故. 一个一直以"颜值主播" ...

  3. 不仅仅生成图片,用GAN做无监督的异常检测

    原文:https://zhuanlan.zhihu.com/p/32505627 GAN被LeCun赞为继CNN之后最为重要的一个工作,其原因在于让各位惊呼"这才有点人工智能的样子" ...

  4. 使用PyTorch构建GAN生成对抗网络源码(详细步骤讲解+注释版)01 手写字体识别

    文章目录 1 生成对抗网络基本概念 2 生成对抗网络建模 2.1 建立MnistDataset类 2.2 建立鉴别器 2.3 测试鉴别器 2.4 Mnist生成器制作 3 模型的训练 4 模型表现的判 ...

  5. Pytorch 使用GAN实现二次元人物头像生成 保姆级教程(数据集+实现代码+数学原理)

    Pytorch 使用DCGAN实现二次元人物头像生成(实现代码+公式推导) GAN介绍   算法主体   推导证明(之后将补全完整过程)   随机梯度下降训练D,G   DCGAN介绍及相关原理 Py ...

  6. 老司机翻车现场 续:技术之外,程序员如何自我保护

    原文链接 昨天两件事:Bing 挂了,老司机收到律师函.前面的事太大,兜不住,所以今天只讲后面这件事. mmoaay 跟我说起这事时,我第一反应是:我靠,不好,卓同学出事了. 然后一副副画面浮现在我眼 ...

  7. 基于PyTorch的GAN框架TorchGAN:用架构级API轻松定制GAN项目

    机器之心报道 参与:刘晓坤 TorchGAN 是基于 PyTorch 的 GAN 设计开发框架.该框架旨在为流行的 GAN 提供构造模块,且允许为前沿研究进行定制化. 使用 TorchGAN 的模块化 ...

  8. 尬出天际!和导师微信聊天大型翻车现场!

    今天我们盘点那些和导师聊天,因为打错字而引发的"翻车现场",真是隔着屏幕都能感受到当时那种酸爽和尴尬. >>>> 先看第一个,很容易成为您的学生,尴尬的是, ...

  9. Pytorch《GAN模型生成MNIST数字》

    这里的代码都是,参考网上其他的博文学习的,今天是我第一次学习GAN,心情难免有些激动,想着赶快跑一个生成MNIST数字图像的来瞅瞅效果,看看GAN的神奇. 参考博文是如下三个: https://www ...

最新文章

  1. 我的一些项目管理经验
  2. python利用numpy创建数组(等比,等差,空数组,1数组)
  3. Linux下Shell的for循环语句
  4. ssl提高组周六模拟赛【2018.9.15】
  5. Upload-Labs(6-10)
  6. Mr.J--C语言经典编程100例
  7. jq 正则判断邮箱_Python正则15分钟入门
  8. linux下载TCGA数据,好用的新版TCGA数据下载方法
  9. About 日常生活感想
  10. 2022年版中国天然气制氢市场运营模式分析与投资战略规划报告
  11. 3V升压5V芯片,3V升压5V的电路图
  12. Spring colud gateway 源码小计
  13. 【STM32f401学习之路-02】USART串口通信
  14. WDI面板数据(1990-2020)
  15. 兰大《银行会计学》命题作业离线作业
  16. Android 字体自适应屏幕的方法
  17. 六大云计算厂商南山论剑,收下这封英雄帖!
  18. henu云计算复习-图片版
  19. 水下自动循迹机器人_一种夜间巡逻机器人自动循迹方法
  20. LDK3读书笔记(第一章:LINUX内核简史)

热门文章

  1. 转:“神医”李培刚没治好李宁 日前接受微创手术
  2. 实战|利用Selenium批量下载100首网易云热歌榜音乐
  3. 向量点乘和叉乘的应用
  4. mpstat iostat iotop noload pidstat lsof tcpdump top命令
  5. mini2440安装rtl8712无线网卡驱动
  6. go mod 遇上 gitlab
  7. 如何使文字缩略成点点点
  8. 【转载】爱奇艺个性化推荐排序实践
  9. java螺旋矩阵_Java 实现输出螺旋矩阵
  10. docker-- Docker Compose学习