疫情数据分析与可视化
疫情数据分析与可视化
- python实现数据分析与可视化
- 前言
- 一、什么是Python爬虫?
- 二、Python爬虫相关知识
- 1.相关书籍资料推荐(建议谷歌打开)
- 2.数据获取
- 3.知识点
- 三、数据分析与可视化
- 1.安装
- 2.CSV表格操作
- 3.可视化
- 总结
python实现数据分析与可视化
前言
本文通过运用所学可视化知识,对现有的疫情数据进行简单分析,同时介绍爬虫相关知识
一、什么是Python爬虫?
Python爬虫即使用 Python程序开发的网络爬虫(网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
二、Python爬虫相关知识
1.相关书籍资料推荐(建议谷歌打开)
https://python3webspider.cuiqingcai.com/
2.数据获取
数据集的获取是我们进行数据分析的第一步。现在获取数据的主要途径一般为:现成数据;自己写爬虫去爬取数据;使用现有的爬虫工具爬取所需内容,保存到数据库,或以文件的形式保存到本地。
博主用的是现有的数据进行数据分析。
3.知识点
request:
它是最基本的 HTTP 请求模块,可以用来模拟发送请求。就像在浏览器里输入网址然后回车一样,只需要给库方法传入 URL 以及额外的参数,就可以模拟实现这个过程了。
正则表达式:
贪婪匹配是尽可能匹配多的字符,非贪婪匹配就是尽可能匹配少的字符。在做匹配的时候,字符串中间尽量使用非贪婪匹配,也就是用 .? 来代替 ,以免出现匹配结果缺失的情况。但如果匹配的结果在字符串结尾,.*? 就有可能匹配不到任何内容了。
空值处理:
s.dropna(how='all') #删除所有列值为空的行
s.dropna(axis=1) #列有空值,删除
s.dropna(axis=1,how='all') #列全为空值,删除,1为列 0为行
dropna() #删除有空值的所有行列
s.fillna(0,inplace=True)
三、数据分析与可视化
1.安装
博主在jupyter notebook上通过pyecharts实现数据分析与可视化。现仅以jupyter和pyecharts为例示范。
jupyter安装(在命令提示符下输入):
pip install jupyter
pyecharts安装(在命令提示符下输入):
pip install pyecharts
可能遇到的问题及解决方案(管理员身份运行命令提示符):
WARNING: You are using pip version 20.3.1; however, version 20.3.3 is available. You should consider
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
2.CSV表格操作
表格读取:
data=pd.read_csv(r'C:\Users\XX\Desktop\2019_nCoV_data.csv',encoding='utf-8')
表格列删除:
data.drop(["Date","Province/State"],axis=1) #删除Date,Province/State列
排列:
d1=data.sort_values(by=["Date","Confirmed"],ascending=False)[:10]#排列
d1
3.可视化
选出表格最后日期(2020.04.02),确诊人数最多的十个省制成饼图:
from pyecharts import options as opts
from pyecharts.charts import Bar,Line,Pie
pie=(Pie().add("",[list(i) for i in zip(d1['Province/State'].values.tolist(),d1['Confirmed'].values.tolist())]))
pie.render_notebook()
分析:据图得湖北确诊人数最多,较为直观的显示出病毒爆发地
选出表格最后日期(2020.04.02)以及确诊人数最多的十个省,对比治愈与死亡人数:
line=(Line().add_xaxis(list(d1['Province/State'].values)).add_yaxis("治愈",d1['Recovered'].values.tolist()).add_yaxis("死亡",d1['Deaths'].values.tolist()).set_global_opts(title_opts=opts.TitleOpts(title="治愈与死亡"),legend_opts=opts.LegendOpts(pos_top="30%",pos_right="70%"),))
line.render_notebook()
分析:据图得治愈人数接近于死亡人数,病毒未完全控制
选出表格前六个地区,对比治愈与死亡人数:
bar=(Bar().add_xaxis(list(d1['Province/State'].values)[:6]).add_yaxis("治愈",d1['Recovered'].values.tolist()[:6]).add_yaxis("死亡",d1['Deaths'].values.tolist()[:6]).set_global_opts(title_opts=opts.TitleOpts(title="各地区治愈与死亡人数"),datazoom_opts=[opts.DataZoomOpts()],))
bar.render_notebook()
分析:据图得治愈人数高于死亡人数,但是情形不容乐观。
总结
以上就是所有的内容,本文仅仅简单介绍了爬虫及数据分析可视化,欢迎大家批评指正。
疫情数据分析与可视化相关推荐
- 新冠疫情数据可视化python_【一点资讯】新冠疫情数据分析 | Python可视化工具看全国各地的新增趋势 www.yidianzixun.com...
- 点击上方"中国统计网"订阅我吧!- 文末领取[腾讯疫情分析完整代码+数据包] 本篇文章将分享腾讯疫情实时数据抓取,获取全国各地和贵州省各地区的实时数据,并将数据存储至本地,最后 ...
- Python疫情数据分析+数据可视化展示
采集流程 一. 明确需求 采集/确诊人数/新增人数 二. 代码流程 四大步骤 发送请求 获取数据 网页源代码 解析数据 筛选一些我想用的数据 保存数据 保存成表格 做数据可视化分析 开始代码 1. 发 ...
- 美国伊利诺伊州疫情数据分析
美国伊利诺伊州疫情数据分析 伊利诺伊州目前总确诊病例已经突破70万,昨天一天报告的新增案例高达7759例(感恩节黑五),近两周内新增15万新确诊病例,可见目前整体形势不容乐观,甚至有恶化的倾向.但事实 ...
- 【大数据平台】基于Spark的美国新冠肺炎疫情数据分析及预测
(本实验系中国地质大学(武汉)2022年秋期大数据平台及应用课程设计) 一.选题背景 新型冠状病毒疫情是由严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)导致的2019冠状病毒病(COVID- ...
- Python爬虫爬取疫情数据并可视化展示
这篇文章主要介绍了Python利用爬虫爬取疫情数据并进行可视化的展示,文中的示例代码讲解清晰,对工作或学习有一定的价值,需要的朋友可以参考一下.编程资料点击领取 目录 知识点 开发环境 爬虫完整代码 ...
- 【Python】2020年美国新冠肺炎疫情数据分析
2020年美国新冠肺炎疫情数据分析 一. 需求描述 二. 环境介绍 三. 数据来源描述 四. 数据上传及上传结果查看 五.数据处理过程描述 1.数据集下载 2.格式转换 3.启动Hadoop集群 4. ...
- 2020年“泰迪杯”数据分析职业技能大赛B题疫情数据分析
一.背景 2020年1月新型冠状病毒(以下简称新冠)肺炎在极短时间内就在全球范围内大规模流行,据美国约翰斯·霍普金斯大学11月8日发布的新冠疫情最新统计数据显示,截至美国东部时间11月8日11时24分 ...
- 青年生命科学论坛报告:扩增子和宏基因组数据分析与可视化流程—刘永鑫(北京210606)...
感谢中科院动物所青促会组织的第三届青年生命科学论坛的邀请,参加本次大会,并和微生物所王军老师共同负责了<微生物组>专题的召集工作.感谢11位微生物组专题报告人的辛苦准备和分享. 现将本次1 ...
- 刘永鑫:20分钟讲解微生物组数据分析与可视化实战
编者按: 2020 年 12 月 21 日,国内著名英文期刊 Protein & Cell 与热心肠研究院合作,成功举办了"Protein & Cell人类微生物组专刊线上论 ...
最新文章
- c语言程序设计歌手大奖赛,C语言二维数组怎么做:设计青年歌手参加歌曲大奖赛计分系统: 共...,怎样用c语言程序设计? 青年歌手参加歌曲大奖赛,有10个评委...
- Spring框架的事务管理之基于AspectJ的XML方式(重点掌握)
- 使数据区“可执行”的几种常规办法
- ch6 列表和导航条
- mysql查看触发器_在mysql中如何查看和修改触发器的代码?请问各位大师,小弟先谢谢了!!!!!!!!!...
- Oracle列直方图的问题隐患
- 渗透中Meterpreter基本操作和对应的windows上的排查或者现象
- 从功能测试到接口测试,原来的技能可以通用
- Android Support Library更新到v22.1之AppCompat新特性
- 微信朋友圈千亿访问量背后的技术挑战和实践总结
- 设为首页 加入收藏 html,如何在网站上添加“设为首页”“加入收藏”
- catia制作物料明细_CATIA课时:动力头主架详细标注及物料清单视频教程_翼狐网...
- 如何让自己发了疯、拼了命、石乐志的学习?
- pvm虚拟机基本原理
- 数据结构翻转课堂答疑实录——概述
- #2阴阳师首页模块模拟
- 计蒜之道 测试赛 (BCD)
- 【TCP wrappers】关于/etc/hosts.allow /etc/hosts.deny
- 使用Kaptcha生成图片验证码
- 用计算机谈歌曲凉凉,快速让你学会唱《凉凉》这首歌,千万不要错过哦!