疫情数据分析与可视化

    • python实现数据分析与可视化
  • 前言
  • 一、什么是Python爬虫?
  • 二、Python爬虫相关知识
    • 1.相关书籍资料推荐(建议谷歌打开)
    • 2.数据获取
    • 3.知识点
  • 三、数据分析与可视化
    • 1.安装
    • 2.CSV表格操作
    • 3.可视化
  • 总结

python实现数据分析与可视化

前言

本文通过运用所学可视化知识,对现有的疫情数据进行简单分析,同时介绍爬虫相关知识


一、什么是Python爬虫?

Python爬虫即使用 Python程序开发的网络爬虫(网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

二、Python爬虫相关知识

1.相关书籍资料推荐(建议谷歌打开)

https://python3webspider.cuiqingcai.com/

2.数据获取

数据集的获取是我们进行数据分析的第一步。现在获取数据的主要途径一般为:现成数据;自己写爬虫去爬取数据;使用现有的爬虫工具爬取所需内容,保存到数据库,或以文件的形式保存到本地。

博主用的是现有的数据进行数据分析。

3.知识点

request:
它是最基本的 HTTP 请求模块,可以用来模拟发送请求。就像在浏览器里输入网址然后回车一样,只需要给库方法传入 URL 以及额外的参数,就可以模拟实现这个过程了。

正则表达式:
贪婪匹配是尽可能匹配多的字符,非贪婪匹配就是尽可能匹配少的字符。在做匹配的时候,字符串中间尽量使用非贪婪匹配,也就是用 .? 来代替 ,以免出现匹配结果缺失的情况。但如果匹配的结果在字符串结尾,.*? 就有可能匹配不到任何内容了。

空值处理:

s.dropna(how='all')       #删除所有列值为空的行
s.dropna(axis=1)       #列有空值,删除
s.dropna(axis=1,how='all')      #列全为空值,删除,1为列 0为行
dropna()        #删除有空值的所有行列
s.fillna(0,inplace=True)

三、数据分析与可视化

1.安装

博主在jupyter notebook上通过pyecharts实现数据分析与可视化。现仅以jupyter和pyecharts为例示范。

jupyter安装(在命令提示符下输入):

pip install jupyter

pyecharts安装(在命令提示符下输入):

pip install pyecharts

可能遇到的问题及解决方案(管理员身份运行命令提示符):

WARNING: You are using pip version 20.3.1; however, version 20.3.3 is available. You should consider
python -m pip install --upgrade pip -i https://pypi.douban.com/simple

2.CSV表格操作

表格读取:

data=pd.read_csv(r'C:\Users\XX\Desktop\2019_nCoV_data.csv',encoding='utf-8')

表格列删除:

data.drop(["Date","Province/State"],axis=1)  #删除Date,Province/State列

排列:

d1=data.sort_values(by=["Date","Confirmed"],ascending=False)[:10]#排列
d1

3.可视化

选出表格最后日期(2020.04.02),确诊人数最多的十个省制成饼图:

from pyecharts import options as opts
from pyecharts.charts import Bar,Line,Pie
pie=(Pie().add("",[list(i) for i in zip(d1['Province/State'].values.tolist(),d1['Confirmed'].values.tolist())]))
pie.render_notebook()


分析:据图得湖北确诊人数最多,较为直观的显示出病毒爆发地


选出表格最后日期(2020.04.02)以及确诊人数最多的十个省,对比治愈与死亡人数:

line=(Line().add_xaxis(list(d1['Province/State'].values)).add_yaxis("治愈",d1['Recovered'].values.tolist()).add_yaxis("死亡",d1['Deaths'].values.tolist()).set_global_opts(title_opts=opts.TitleOpts(title="治愈与死亡"),legend_opts=opts.LegendOpts(pos_top="30%",pos_right="70%"),))
line.render_notebook()

分析:据图得治愈人数接近于死亡人数,病毒未完全控制


选出表格前六个地区,对比治愈与死亡人数:

bar=(Bar().add_xaxis(list(d1['Province/State'].values)[:6]).add_yaxis("治愈",d1['Recovered'].values.tolist()[:6]).add_yaxis("死亡",d1['Deaths'].values.tolist()[:6]).set_global_opts(title_opts=opts.TitleOpts(title="各地区治愈与死亡人数"),datazoom_opts=[opts.DataZoomOpts()],))
bar.render_notebook()


分析:据图得治愈人数高于死亡人数,但是情形不容乐观。

总结

以上就是所有的内容,本文仅仅简单介绍了爬虫及数据分析可视化,欢迎大家批评指正。

疫情数据分析与可视化相关推荐

  1. 新冠疫情数据可视化python_【一点资讯】新冠疫情数据分析 | Python可视化工具看全国各地的新增趋势 www.yidianzixun.com...

    - 点击上方"中国统计网"订阅我吧!- 文末领取[腾讯疫情分析完整代码+数据包] 本篇文章将分享腾讯疫情实时数据抓取,获取全国各地和贵州省各地区的实时数据,并将数据存储至本地,最后 ...

  2. Python疫情数据分析+数据可视化展示

    采集流程 一. 明确需求 采集/确诊人数/新增人数 二. 代码流程 四大步骤 发送请求 获取数据 网页源代码 解析数据 筛选一些我想用的数据 保存数据 保存成表格 做数据可视化分析 开始代码 1. 发 ...

  3. 美国伊利诺伊州疫情数据分析

    美国伊利诺伊州疫情数据分析 伊利诺伊州目前总确诊病例已经突破70万,昨天一天报告的新增案例高达7759例(感恩节黑五),近两周内新增15万新确诊病例,可见目前整体形势不容乐观,甚至有恶化的倾向.但事实 ...

  4. 【大数据平台】基于Spark的美国新冠肺炎疫情数据分析及预测

    (本实验系中国地质大学(武汉)2022年秋期大数据平台及应用课程设计) 一.选题背景 新型冠状病毒疫情是由严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)导致的2019冠状病毒病(COVID- ...

  5. Python爬虫爬取疫情数据并可视化展示

    这篇文章主要介绍了Python利用爬虫爬取疫情数据并进行可视化的展示,文中的示例代码讲解清晰,对工作或学习有一定的价值,需要的朋友可以参考一下.编程资料点击领取 目录 知识点 开发环境 爬虫完整代码 ...

  6. 【Python】2020年美国新冠肺炎疫情数据分析

    2020年美国新冠肺炎疫情数据分析 一. 需求描述 二. 环境介绍 三. 数据来源描述 四. 数据上传及上传结果查看 五.数据处理过程描述 1.数据集下载 2.格式转换 3.启动Hadoop集群 4. ...

  7. 2020年“泰迪杯”数据分析职业技能大赛B题疫情数据分析

    一.背景 2020年1月新型冠状病毒(以下简称新冠)肺炎在极短时间内就在全球范围内大规模流行,据美国约翰斯·霍普金斯大学11月8日发布的新冠疫情最新统计数据显示,截至美国东部时间11月8日11时24分 ...

  8. 青年生命科学论坛报告:扩增子和宏基因组数据分析与可视化流程—刘永鑫(北京210606)...

    感谢中科院动物所青促会组织的第三届青年生命科学论坛的邀请,参加本次大会,并和微生物所王军老师共同负责了<微生物组>专题的召集工作.感谢11位微生物组专题报告人的辛苦准备和分享. 现将本次1 ...

  9. 刘永鑫:20分钟讲解微生物组数据分析与可视化实战

    编者按: 2020 年 12 月 21 日,国内著名英文期刊 Protein & Cell 与热心肠研究院合作,成功举办了"Protein & Cell人类微生物组专刊线上论 ...

最新文章

  1. c语言程序设计歌手大奖赛,C语言二维数组怎么做:设计青年歌手参加歌曲大奖赛计分系统: 共...,怎样用c语言程序设计? 青年歌手参加歌曲大奖赛,有10个评委...
  2. Spring框架的事务管理之基于AspectJ的XML方式(重点掌握)
  3. 使数据区“可执行”的几种常规办法
  4. ch6 列表和导航条
  5. mysql查看触发器_在mysql中如何查看和修改触发器的代码?请问各位大师,小弟先谢谢了!!!!!!!!!...
  6. Oracle列直方图的问题隐患
  7. 渗透中Meterpreter基本操作和对应的windows上的排查或者现象
  8. 从功能测试到接口测试,原来的技能可以通用
  9. Android Support Library更新到v22.1之AppCompat新特性
  10. 微信朋友圈千亿访问量背后的技术挑战和实践总结
  11. 设为首页 加入收藏 html,如何在网站上添加“设为首页”“加入收藏”
  12. catia制作物料明细_CATIA课时:动力头主架详细标注及物料清单视频教程_翼狐网...
  13. 如何让自己发了疯、拼了命、石乐志的学习?
  14. pvm虚拟机基本原理
  15. 数据结构翻转课堂答疑实录——概述
  16. #2阴阳师首页模块模拟
  17. 计蒜之道 测试赛 (BCD)
  18. 【TCP wrappers】关于/etc/hosts.allow /etc/hosts.deny
  19. 使用Kaptcha生成图片验证码
  20. 用计算机谈歌曲凉凉,快速让你学会唱《凉凉》这首歌,千万不要错过哦!

热门文章

  1. Mybatis、SpringBoot入门实战(微型项目) -- Mysql增删查改、写接口、测试接口
  2. 你被骗了!Kubernetes 的核心是 API 而非容器
  3. 阿里云祝顺民:算力网络架构的新探索
  4. ERP软件市场占有率(2012/2013)
  5. 数据可视化汇总(一)
  6. Saas软件售后服务体系的思考
  7. MoonShell2皮肤文件(.skn) 结构解析
  8. Python 二进制 转换
  9. 世界超算大赛开启ASC17总决赛东道主征选
  10. 使用dreamweavernbsp;制作网页幻灯片