项目数据集课程比赛社区9+中 | En访问飞桨官网文档教育合作
课程>我的课程>Python小白逆袭大神>[作业]Day3-《青春有你2》选手数据分析
Day3-《青春有你2》选手数据分析

课程: Python小白逆袭大神

请在下方提示位置,补充代码,对《青春有你2》对选手体重分布进行可视化,绘制饼状图,如下图所示:
不要求跟下图样式一模一样

任务描述:
基于第二天实践使用Python来爬去百度百科中《青春有你2》所有参赛选手的信息,进行数据可视化分析。

In[15]

如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例:

#!mkdir /home/aistudio/external-libraries
#!pip install matplotlib -t /home/aistudio/external-libraries
In[16]

同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可:

Also add the following code, so that every time the environment (kernel) starts, just run the following code:

import sys
sys.path.append(’/home/aistudio/external-libraries’)
In[17]

下载中文字体

!wget https://mydueros.cdn.bcebos.com/font/simhei.ttf

将字体文件复制到matplotlib字体路径

!cp simhei.ttf /opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/mpl-data/fonts/ttf/

一般只需要将字体文件复制到系统字体目录下即可,但是在aistudio上该路径没有写权限,所以此方法不能用

!cp simhei.ttf /usr/share/fonts/

创建系统字体文件路径

!mkdir .fonts

复制文件到该路径

!cp simhei.ttf .fonts/
!rm -rf .cache/matplotlib
–2020-04-24 10:58:37-- https://mydueros.cdn.bcebos.com/font/simhei.ttf
Resolving mydueros.cdn.bcebos.com (mydueros.cdn.bcebos.com)… 182.61.128.198
Connecting to mydueros.cdn.bcebos.com (mydueros.cdn.bcebos.com)|182.61.128.198|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 9753388 (9.3M) [application/octet-stream]
Saving to: ‘simhei.ttf.3’

simhei.ttf.3 100%[===================>] 9.30M 52.7MB/s in 0.2s

2020-04-24 10:58:37 (52.7 MB/s) - ‘simhei.ttf.3’ saved [9753388/9753388]

mkdir: cannot create directory ‘.fonts’: File exists
绘制选手区域分布柱状图
In[18]
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager

#显示matplotlib生成的图形
%matplotlib inline

with open(‘data/data31557/20200422.json’, ‘r’, encoding=‘UTF-8’) as file:
json_array = json.loads(file.read())

#绘制小姐姐区域分布柱状图,x轴为地区,y轴为该区域的小姐姐数量

zones = []
for star in json_array:
zone = star[‘zone’]
zones.append(zone)
print(len(zones))
print(zones)

zone_list = []
count_list = []

for zone in zones:
if zone not in zone_list:
count = zones.count(zone)
zone_list.append(zone)
count_list.append(count)

print(zone_list)
print(count_list)

设置显示中文

plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体

plt.figure(figsize=(20,15))

plt.bar(range(len(count_list)), count_list,color=‘r’,tick_label=zone_list,facecolor=’#9999ff’,edgecolor=‘white’)

这里是调节横坐标的倾斜度,rotation是度数,以及设置刻度字体大小

plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)

plt.legend()
plt.title(’’’《青春有你2》参赛选手’’’,fontsize = 24)
plt.savefig(’/home/aistudio/work/result/bar_result.jpg’)
plt.show()
No handles with labels found to put in legend.
109
[‘中国湖北’, ‘中国四川’, ‘中国山东’, ‘中国浙江’, ‘中国山东’, ‘中国台湾’, ‘中国陕西’, ‘中国广东’, ‘中国黑龙江’, ‘中国上海’, ‘中国四川’, ‘中国山东’, ‘中国安徽’, ‘中国安徽’, ‘中国安徽’, ‘中国北京’, ‘中国贵州’, ‘中国吉林’, ‘中国四川’, ‘中国四川’, ‘中国江苏’, ‘中国山东’, ‘中国山东’, ‘中国山东’, ‘中国山东’, ‘中国江苏’, ‘中国四川’, ‘中国山东’, ‘中国山东’, ‘中国广东’, ‘中国浙江’, ‘中国河南’, ‘中国安徽’, ‘中国河南’, ‘中国北京’, ‘中国北京’, ‘马来西亚’, ‘中国湖北’, ‘中国四川’, ‘中国天津’, ‘中国黑龙江’, ‘中国四川’, ‘中国陕西’, ‘中国辽宁’, ‘中国湖南’, ‘中国上海’, ‘中国贵州’, ‘中国山东’, ‘中国湖北’, ‘中国黑龙江’, ‘中国黑龙江’, ‘中国上海’, ‘中国浙江’, ‘中国湖南’, ‘中国台湾’, ‘中国台湾’, ‘中国台湾’, ‘中国台湾’, ‘中国山东’, ‘中国北京’, ‘中国北京’, ‘中国浙江’, ‘中国河南’, ‘中国河南’, ‘中国福建’, ‘中国河南’, ‘中国北京’, ‘中国山东’, ‘中国四川’, ‘中国安徽’, ‘中国河南’, ‘中国四川’, ‘中国湖北’, ‘中国四川’, ‘中国陕西’, ‘中国湖南’, ‘中国四川’, ‘中国台湾’, ‘中国湖北’, ‘中国广西’, ‘中国江西’, ‘中国湖南’, ‘中国湖北’, ‘中国北京’, ‘中国陕西’, ‘中国上海’, ‘中国四川’, ‘中国山东’, ‘中国辽宁’, ‘中国辽宁’, ‘中国台湾’, ‘中国浙江’, ‘中国北京’, ‘中国黑龙江’, ‘中国北京’, ‘中国安徽’, ‘中国河北’, ‘马来西亚’, ‘中国四川’, ‘中国湖南’, ‘中国台湾’, ‘中国广东’, ‘中国上海’, ‘中国四川’, ‘日本’, ‘中国辽宁’, ‘中国黑龙江’, ‘中国浙江’, ‘中国台湾’]
[‘中国湖北’, ‘中国四川’, ‘中国山东’, ‘中国浙江’, ‘中国台湾’, ‘中国陕西’, ‘中国广东’, ‘中国黑龙江’, ‘中国上海’, ‘中国安徽’, ‘中国北京’, ‘中国贵州’, ‘中国吉林’, ‘中国江苏’, ‘中国河南’, ‘马来西亚’, ‘中国天津’, ‘中国辽宁’, ‘中国湖南’, ‘中国福建’, ‘中国广西’, ‘中国江西’, ‘中国河北’, ‘日本’]
[6, 14, 13, 6, 9, 4, 3, 6, 5, 6, 9, 2, 1, 2, 6, 2, 1, 4, 5, 1, 1, 1, 1, 1]

In[19]
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager
import pandas as pd

#显示matplotlib生成的图形
%matplotlib inline

df = pd.read_json(‘data/data31557/20200422.json’)
#print(df)

grouped=df[‘name’].groupby(df[‘zone’])
s = grouped.count()

zone_list = s.index
count_list = s.values

设置显示中文

plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体

plt.figure(figsize=(20,15))

plt.bar(range(len(count_list)), count_list,color=‘r’,tick_label=zone_list,facecolor=’#9999ff’,edgecolor=‘white’)

这里是调节横坐标的倾斜度,rotation是度数,以及设置刻度字体大小

plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)

plt.legend()
plt.title(’’’《青春有你2》参赛选手’’’,fontsize = 24)
plt.savefig(’/home/aistudio/work/result/bar_result02.jpg’)
plt.show()
No handles with labels found to put in legend.

请在下面完成作业,对选手体重分布进行可视化,绘制饼状图
In[ ]
In[ ]

Day3-《青春有你2》选手数据分析相关推荐

  1. DAY3《青春有你2》选手数据分析

    首先需要在work目录下添加一个result文件夹 !!!作业说明!!! 请在下方提示位置,补充代码,对<青春有你2>对选手体重分布进行可视化,绘制饼状图,如下图所示: 不要求跟下图样式一 ...

  2. 初级选手数据分析——Python职位数据分析全链路

    目录 0. 数据采集 1. 数据清洗 1.0 筛选python相关的职位 1.1 按照创建时间清洗异常值 1.2 按照薪资清洗异常值 2. 统计分析 2.0 大盘数据 2.1 单维度分析 2.1 二维 ...

  3. 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(二):统计并展示数据

    各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(一):爬虫选手信息 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(二):统计并展示数据 各位集美兄得看过来! 利用 ...

  4. 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(四):AI分析谁最容易出道

    各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(一):爬虫选手信息 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(二):统计并展示数据 各位集美兄得看过来! 利用 ...

  5. 百度paddlepaddle《青春有你2》技术打卡五天学习总结与创意赛参加

    1. 心得 这是我第一次参加百度打卡训练营,之前对python稍有一些了解,因为此前包括现在的研究生硕士阶段一直常用Matlab,但现今python同样作为主要编程软件,尤其在人工智能领域,我希望能多 ...

  6. 百度飞桨《青春有你2》Python小白逆袭大神活动总结与感悟

    在学校老师的推荐下得知这个训练营的活动,有幸参与其中,学到了很多设计上的思路.尤其是最后一天的大作业,初上手时没有头绪,仔细分析过后,根据前面几天的内容发现自己其实可以把它进行逐步实现.最后在自己的代 ...

  7. 百度AI-7Days-打卡集训营总结

    这里写自定义目录标题 打卡训练营总结 Day1 Day2 Day3 Day4 Day5 感悟 打卡训练营总结 本次打卡一共有7次授课,5次任务. Day1:简单的格式化输出和os库的简单应用 Day2 ...

  8. python画饼图_百度飞桨PaddlePaddle之[Python小白逆袭大神]7天训练营

    第三次参加百度的7天训练营了 这次参加的主题是[Python小白逆袭大神],不过你别看是小白逆势...除非你一开始参加就逆袭完,不然你真的是python小白,这个课程还是有难难度的. 说一下个训练营的 ...

  9. 百度飞桨之python小白逆袭训练营

    青春有你2选手图片爬取 1.day01 Python基础练习 2.day02 青春有你2选手信息爬取 2.1.爬取百度百科中<青春有你2>中所有参赛选手信息,返回页面数据 2.2.对爬取的 ...

最新文章

  1. Ubuntu 系统使用命令打开某个目录下的代码文件
  2. R语言编写自定义分组统计函数(customize statistics function)可视化分组箱图并在X轴标签下方添加分组对应的统计值(样本数N、中位数median、四分位数的间距iqr)
  3. 在线等!同事扔需求,不会写代码躲在厕所怎么办 | 每日趣闻
  4. kafka常用的命令
  5. C#调用非托管C++DLL:直接调用法
  6. CIO职业生涯如何进行三级跳
  7. 算法不会,尚能饭否之排序——冒泡排序(bubble sort)
  8. activeMQ 的kahadb存储引擎分析
  9. Android 推荐一个Android系统全系列源码在线阅读网站,Android学习资料,Android各个API使用的网站
  10. GD32F103学习笔记(3)——新建工程
  11. 通过Numba调用CUDA用GPU为Python加速:进阶理解网格跨步、多流、共享内存
  12. 教你如何批量修改图片分辨率?
  13. 半监督学习与直推式学习
  14. 张勋说:溢流型棒磨机在水煤浆气化中的应用及技改(图文)
  15. 一半嫁妆钱,换了90000张照片,一个老爹的摄影计划
  16. 阿里IOT用AMQP在服务端订阅消息,踩坑
  17. 4 数据可视化大屏 - 布局: BootStrap 之网格Grid
  18. [激光原理与应用-60]:激光器 - 光学 - 光的四大理论框架与其层次:几何光学、波动光学、电磁光学、电子光学
  19. 用MVP+OKHttp实现上传图片
  20. 如何在linux内核中增加对应的Makefile和Kconfig选项?

热门文章

  1. Hibernate的下载与安装
  2. python计算化学键,Python语句print((16 14)/2)的输出结果是(? ?)。
  3. SecureCRT and SecureFX 8.5 安装破解版(附注册机+破解教程) 64位
  4. 艾永亮:卖基础款能成日本首富?优衣库打造超级产品逆袭成功
  5. 推荐一个查询网页PV的网站——站长之家
  6. Python量化投资——mplfinance实现全功能动态交互式K线图(蜡烛图)【源码+详解】
  7. QT实现完美无边框窗口(可拖动,可调整大小)
  8. windows / linux 不能连接wifi问题
  9. 从美团外卖小程序观察到的一些思考
  10. 痛惜!年仅48岁,985高校博导因病逝世