明确爬虫需求

爬取网站:全国温室数据系统

爬取字段:平均气温 相对湿度 风速 日照时数

已知字段:代谢率h 吸收情况a 高度角cos∂ 单位照射R

计算字段:温湿指数 风寒指数 着衣指数 综合指数

甘肃省2000-2019年夏季6.7.8月的数据 利用气温,风速,日照时数,相对湿度对温湿指数,风寒指数,着衣指数,旅游气候舒适度进行计算。

diqu={"马鬃山":"52323","鼎新":"52446","敦煌":"52418","玉门镇":"52436","张掖":"52652","永昌":"52674","民勤":"52681","环县":"53821","平凉":"53915"}
# coding=gbk
import requests
import os# Getfile类的代码引用自https://blog.51cto.com/eddy72/2106091?cid=732015
class Getfile:  # 下载文件def __init__(self, url):self.url = urlself.header_flag = False  # 当为True时,设置header,断点续传def downfile(self, filename):self.headers = {}self.mode = 'wb'if os.path.exists(filename) and self.header_flag:self.headers = {'Range': 'bytes=%d-' % os.path.getsize(filename)}self.mode = 'ab'self.r = requests.get(self.url, stream=True, headers=self.headers)with open(filename, self.mode) as code:for chunk in self.r.iter_content(chunk_size=1024):  # 边下载边存硬盘code.write(chunk)def single_download(paras):# 确认访问地址url2 = "http://data.sheshiyuanyi.com/WeatherData/php/downloadWeatherData.php"# 请求头header = {"User-Agent": "Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 78.0.3904.108Safari / 537.36"}requests.get(url2, headers=header, params=paras)filename = "{0}_{1}_{2}_{3}.xlsx".format(paras["staNum"], paras["subIndex"], paras["year"], paras["month"])down_url = "http://data.sheshiyuanyi.com/WeatherData/datafile/{0}".format(filename)temp = Getfile(url=down_url)temp.downfile(filename)#根据网站结构if __name__ == "__main__":# 确定请求参数in_paras = {"action": "one","staNum": "52943","index": "air_temperature","subIndex": "max_tem","year": 2005,"month": 0}single_download(paras=in_paras)print("Completed: {0}_{1}_{2}_{3}.xlsx".format(in_paras["staNum"], in_paras["subIndex"], in_paras["year"], in_paras["month"]))

气象数据爬取(全国温室数据系统)爬虫及逻辑回归相关推荐

  1. python实现数据爬取——糗事百科爬虫项目

    python实现数据爬取--糗事百科爬虫项目 # urllib.request 请求模块 import urllib.request # re 模块使 Python 语言拥有全部的正则表达式功能. i ...

  2. yelp纽约地区数据爬取。使用feapder爬虫框架

    yelp纽约地区数据爬取.使用feapder爬虫框架 本文使用了国内作者的一款feapder轻量级开源爬虫框架.进行yelp站点数据抓取. 第一部分为根据开放api获取店铺信息. 第二部分为根据商店i ...

  3. 汽车用户消费投诉数据爬取分析(Python爬虫)

    多线程爬虫代码 """ name:汽车用户消费投诉_品牌url爬取,已完成 author:zhangxiaoyu """ import _t ...

  4. 全国历史天气查询/历史天气预报查询——全国各月份数据爬取

    全国历史天气查询/历史天气预报查询--全国各月份数据爬取 效果 图1 目标爬取数据 图2 最终实验效果 实验效果:最终可将官网已有的数据进行爬取整理,共363个城市,从2011年1月--至今 数据已上 ...

  5. Python爬虫-CSDN博客排行榜数据爬取

    文章目录 前言 网络爬虫 搜索引擎 爬虫应用 谨防违法 爬虫实战 网页分析 编写代码 运行效果 反爬技术 前言 开始接触 CTF 网络安全比赛发现不会写 Python 脚本的话简直寸步难行--故丢弃 ...

  6. python手机端下载-Python3,x:如何进行手机APP的数据爬取

    Python3,x:如何进行手机APP的数据爬取 一.简介 平时我们的爬虫多是针对网页的,但是随着手机端APP应用数量的增多,相应的爬取需求也就越来越多,因此手机端APP的数据爬取对于一名爬虫工程师来 ...

  7. python怎样获得手机软件app数据_如何进行手机APP的数据爬取?

    平时我们的爬虫多是针对网页的,但是随着手机端APP应用数量的增多,相应的爬取需求也就越来越多,因此手机端APP的数据爬取对于一名爬虫工程师来说是一项必备的技能.我们知道,网页爬取的时候我经常使用F12 ...

  8. 使用python进行股票数据爬取中的时间限制和策略

    股票数据爬取中的时间限制和策略 在进行股票数据爬取时,时间限制和策略是非常重要的考虑因素.本文将介绍两个与此相关的函数:is_trade_day()和stock_work_day(). is_trad ...

  9. Python数据爬取

    文章目录 一.数据爬取介绍 1.数据采集 2.常用数据爬取工具 二.Scrapy爬虫框架 1.安装配置Scrapy框架 2.Debug爬虫工程 3.Scrapy框架组成 4.Scrapy返回爬取页面数 ...

最新文章

  1. 使用多态来实现数据库之间的切换
  2. java调度:(二)在项目中调度策略的选择
  3. 坡度土方计算案例_土石方工程造价中的细节解析(案例+计算式)
  4. php wula,PHP老师没教过你的那些知识点
  5. 软件项目验收汇报ppt_项目验收!万能PPT模板!等你来拿
  6. 快了!华为Mate X国内发布时间曝光:另有麒麟990版本
  7. 奇妙的go语言(面向对象)
  8. 根据一张表更新另一张表
  9. 深度学习自学(十一):Aborted at 1558257386 (unix time)
  10. 开方根运算——没有FPU的解决办法
  11. vue、react隐式实例化
  12. DOM方式操作元素属性
  13. 微信小程序获取数据并展示
  14. SpringBoot - 自动装配 源码解析
  15. 计算机中丢失msvcp140.dll无法启动此程序怎么办(修复教程)
  16. JSP项目进度管理系统myeclipse开发sql数据库BS模式java编程网页结构
  17. 11届蓝桥杯青少年组C++全国赛高级组
  18. ubuntu18.04安装显卡驱动,Anaconda,CUDA,pytorch全套流程
  19. VS2017-C++-使用CSpreadSheet写EXCEL
  20. java 强制类型转换

热门文章

  1. 2020最新最详细K8s安装教程
  2. Web实战之用户头像
  3. 用JS制作《飞机大作战》游戏_第4讲(创建敌方飞机、敌方飞机发射子弹、玩家子弹击中敌方小飞机,小飞机死亡)-陈远波...
  4. OSS与业务场景学习
  5. hexedit使用方法
  6. D3.js — 思维导图
  7. 面试:面经笔记 2017.7
  8. 回收站清空几天可找回?恢复回收站的方法
  9. Android禁止截屏和录屏
  10. mysql 表名是否区分大小写