前言

时光荏苒,岁月如梭,宝可梦宝陪伴了我们大多数90后的童年,小编也是比较喜欢宝可梦的,一直到现在出到了第八世代,各种各样的宝可梦让我们大饱眼福。

小编找来了一份宝可梦的数据集,包含了第一世代到第七世代宝可梦的数据,数据来自 kaggle,发布此数据的作者是从这个网站爬取得数据,这个网站相当于宝可梦的一个wiki,就是一些游戏数值,更新版本数据啥都存在这:

https://serebii.net/

作为热爱宝可梦的一份子,你是否能准确的回答以下问题呢:

  1. 宝可梦性别占比?

  2. 宝可梦体型分布?

  3. 宝可梦每个世代的数量?

  4. 宝可梦每个世代的水平,哪个世代最强,哪个最弱?

  5. 宝可梦属性分布如何?

  6. .宝可梦都被赋予了哪些能力呢?

  7. 宝可梦传奇数量是多少?

  8. 是否能识别传说中的神奇宝贝?

数据说话,接下来我们就从数据的角度来解答以上问题。

 数据说明

数据一共包含了第一世代到第七世代的宝可梦的的数据,总共801条,41列。

关于这些列的含义小编的文档说明有,在这里也解释一下,主要有哪些列:

name:口袋妖怪的英文名称

japanese_name:神奇宝贝的原始日语名称

pokedex_number:国家宠物小精灵中宠物小精灵的条目号

percent_male:是雄性物种的百分比。如果口袋妖怪没有性别,则为空白。

type1:口袋妖怪的主要类型

type2:口袋妖怪的次要类型

classification:日月精灵宝可梦描述的宠物小精灵的分类

height_m:口袋妖怪的高度,以米为单位

weight_kg:口袋妖怪的重量,以千克为单位

capture_rate:宠物小精灵的捕获率

baseeggsteps:孵化神奇宝贝的蛋所需的步数

abilities:口袋妖怪能够拥有的能力的字符串化列表

experience_growth:宠物小精灵的经验成长

base_happiness:神奇宝贝的基本幸福

against_?:十八个特征,表示针对特定类型的攻击所造成的损失

hp:口袋妖怪的基础HP

attack:宠物小精灵的基础攻击

defense:宠物小精灵的基本防御

sp_attack:宠物小精灵的基础特殊攻击

sp_defense:宠物小精灵的基础特殊防御

speed:口袋妖怪的基本速度

generation:口袋妖怪首次引入的编号世代

is_legendary:表示口袋妖怪是否传奇。

把数据导入进来:

宝可梦性别

小编开始也是认为雄性的占比会比雌性的多一些,雄性大约占60%-70%左右吧,但经过计算发现并没有占那么多。

percentage_male 此字段是雄性物种的百分比,我们经过数据查看,雄性平均占比为55%,那雌性占比为45%

绘制圆环图来查看占比情况:

可以看出的确还是雄性宝可梦要多一些,但并没有多很多,可以说是比较均衡的了

宝可梦体型

宝可梦的身高体重是否具有相关性呢,就是说体重越重,身高也越高,我们来绘制散点图查看一下吧:

我们可以看到身高小于3m,体重小于400kg的范围内,身高体重是呈正相关性的,他们相互之间具有一定的影响,身高越高,可能体重也随之越重。

那从体型上划分,我们分为小型(身高≤1m),中型(1m<身高≤2m),大型(身高>2m),他们各自分别占多少呢?

小编的猜想是中小型偏多,大型的最少吧,那是不是这样呢,让我们一起来看看吧~

我们先把身高进行分组,再绘制饼图:

事实上和我们预想的一样,小型的就像皮卡丘这种,中型的喷火龙大家一定都熟悉的,大型的远古古拉顿,裂空座等。

在对比身高体型时,小编特意找了一个视频来查看每个宝可梦的身高,链接:

https://www.bilibili.com/video/BV1iE411N7ua/?spm_id_from=333.788.videocard.2

世代的数量

宝可梦出了那么多个世代,各种各样的宝可梦层出不穷,那从第一代到第七代每一个世代都会涉及多少个宝可梦呢?

我们以世代分组计算,并绘制折线图:

哎呀,可以看出从第一代到第七代的数量走势呈波浪形,一代多一代少这样换着来,但到了第六代突然减少了,可能是前面设计得够多了吧哈哈,当然感兴趣的可以深度挖掘。

世代的水平

出了那么多代,那大家可能比较关心那个世代的最强?那个世代的最弱?每个世代的水平怎么样?

一般从 HP,攻击,防御,特攻,特防,速度这六个指标可以判定一只宝可梦的强弱:

我们以每一个世代进行分组,并计算这六个指标的平均值,绘制雷达图进行对比:

小编之前认为每个世代的水平都差不都,但现在却是二代的水平要弱一些,除了特殊防御,HP 一般以外,其他的都是最低的水平;

第七代除了在速度上有所欠缺其他都是顶尖的,看来第七代还是比较强的;

最为均衡的那就是第四代了,各项都比较平均,不存在“偏科”的情况。

属性分布

那么多宝可梦,什么属性的最多啊?各个属性分布怎么样子呢?那个属性的数量又是最少的呢?

我们通过分组计算,绘制条形图:

看起来是拥有水属性的宝可梦最多,冰属性的最少,水属性的看起来是最受欢迎的一种属性咯,在选择宝可梦,选择大众的水属性的是一个不错的选择呢。

宝可梦能力

那么多宝可梦,大家一定很想知道宝可梦们都被赋予了哪些能力,小编也好奇什么能力最多的赋予给宝可梦。

我们绘制词云来查看一下:

chlorophyll(叶绿素),植物的能力;

sturdy(坚固),就是皮糙肉厚;

keen(敏锐的),速度灵活性方面的能力

swim(游泳),水性的能力,同时再次验证了水属性的宝可梦的数量最多的;

还有其他属性,就不一一解释了,看图即可(主要都是英文╮(╯▽╰)╭)

传奇数量

那传说中的宝可梦一共出了多少呢?

我们直接画一个图告诉大家吧:

 分类器 

既然我们知道了传说中的宝可梦的数量那是否可以建立一个分类器去识别他们呢?

小编选择了一些列,使用逻辑回归进行二分类,如下:

识别准确率达到了90%以上呢,那下次再有新的宝可梦,我们可以使用此模型去判断一下了~

 源码获取

关注微信公众号 “木下学Python”,回复 “宝可梦” 即可获取

END

读者交流群已建立,找到我备注 “交流”,即可获得加入我们~

听说点 “在看” 的都变得更好看呐~

-END-

你知道哪个世代的宝可梦最强吗?相关推荐

  1. 【入门】精灵宝可梦数据集分析

    数据集下载 !wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon. ...

  2. python 宝可梦_Python数据分析 | 宝可梦篇2

    目标: 一.各种族系数量占比 二.各世代宝可梦数量 三.种族值解析 四.传说宝可梦相关分析,各时代占比,属性值与传说宝可梦的相关性,种族系与传说宝可梦的相关性 五.各世代推荐宝可梦 #导入三个Pyth ...

  3. Jetpack Compose 实战 宝可梦图鉴

    文章目录 前言 实现效果 一.架构介绍 二.一些的功能点的介绍 加载图片并获取主色,再讲主色设置为背景 一个进度缓慢增加的圆形进度条 单Activity使用navigation跳转Compose可组合 ...

  4. Compose Desktop 实战 宝可梦图鉴

    Compose Desktop 实战 宝可梦图鉴 前言 阅读本文需要一定compose基础,如果没有请移步Jetpack Compose入门详解(实时更新) 接口数据来源于pokeapi 项目源代码 ...

  5. Python数据分析--平民最强宝可梦

    感谢AI蜗牛车-阿里云天池Python训练营提供的相关学习资料 本节主要介绍python中的数据分析方法,结合之前的学习内容,对于宝可梦精灵中的各种精灵数据进行分析,找寻其中的最强精灵. 十五.数据分 ...

  6. 9适应之力加多少攻击_剑盾铠之孤岛DLC新增内容大全! 宝可梦史上第一款DLC到底香不香(含试玩视频)...

    6月17日晚9点,随着宝可梦公司那个最重要的消息是公布了下周同一时间还有一场发布会的发布会开始,<宝可梦剑/盾>DLC第一弹正式推送了更新,苦苦等待的玩家们表示:不过还有很多小伙伴们没有第 ...

  7. pc端无法ping android模拟器_【内附下载方式】PC端最新宝可梦 Lets Go去皮去伊模拟器+最新dlc+mod...

    游戏名称:精灵宝可梦 Let's go 皮卡丘 +伊布 游戏总大小:9GB+ 游戏简介: <精灵宝可梦 Lets Go 皮卡丘/伊布>是宝可梦系列全新作品,也是该系列首次登上Switch主 ...

  8. 白大脑比超级计算机还,《精灵宝可梦》图鉴376:大脑的运算速度堪比计算机——巨金怪...

    本篇我们要介绍的宝可梦就是金属怪的进化型--巨金怪,说到巨金怪很多人就不陌生啦,它的非官方的常用译名是为合金十字,不管是在动画中还是在游戏中都有着过人的表现力,因此是非常受欢迎的一只宝可梦,特别是在六 ...

  9. 天池赛:宝可梦数据分析–龙系小精灵分享

    目录 一.数据集介绍 二.数据探索 1.数据相关性 2.查看各个种族的属性总值分布 3.种族属性雷达图 三.总体可视化展示 四.龙系宝可梦数据可视化展示 附录 1.龙系宝可梦属性图 2.龙系宝可梦图鉴 ...

最新文章

  1. 老公趴下!62图给你讲Docker
  2. Java内存模型深度解析:final--转
  3. oracle冷备份/恢复
  4. Python中OpenCV2. VS. CV1
  5. AIAR 应用的高效开发,OPPO 技术开放日第三期圆满落幕!
  6. Cocos2d-x特殊节点对象(瓦片地图、粒子系统、视差滚动)概述
  7. python中字典教程_python中字典详解
  8. erp服务器性能测试,浪潮PS-ERP压力测试报告--AMD单路服务器
  9. Apizza在线接口工具如何支持RESTful Path 参数
  10. 估算项目工作量的方法:定额法
  11. opencv换证件照底色
  12. 如何合理的使用统计图表
  13. 各宽带接入服务商简称整理
  14. p图软件pⅰc_pic修图软件下载-pic修图 安卓版v16.4.52-PC6安卓网
  15. 线上软测培训机构柠檬班与iTEST.AI平台赋能测试行业共同发展、共绽异彩
  16. 设备驱动安装不上怎么办?
  17. 微信公众号已认证怎么改名字,公众号昵称可以改吗?
  18. 屏幕处理效果—调整屏幕的亮度,饱和度和对比度
  19. mysql 常用函数
  20. 重t2加权是什么意思_王者荣耀中说的T0、T1,到底是啥意思?这下总算清楚了

热门文章

  1. excel中纯数字字符串递增和数字显示时添加自定义字符串
  2. 控制台五子棋--学习笔记
  3. Vue使用distpicker插件实现省市级下拉框三级联动
  4. OneNote闪退解决方案
  5. 2020-09-13
  6. 山东大学高频电子线路实验六 频率调制及鉴频实验详解
  7. 记录一次word添加图标目录
  8. spring boot 2-文件配置、YAML语法、文件处理器、文件占位符、profile
  9. EC中的QEvent(SCI中断)
  10. 停车费计算器(Parking Charges)