爬取中彩网双色球开奖数据:

import requests
from bs4 import BeautifulSoup
from collections import Counter# 获取内容
res = requests.get('http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html', timeout = 30)
res.encoding = 'utf-8'
htm = res.text
# 解析内容
soup = BeautifulSoup(htm, 'html.parser')
# url前缀
prefix_url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list'
#获取总页数
total = int(soup.find('p', attrs={"class": "pg"}).find_all('strong')[0].text)
#将获取的信息,写进文件
local_file = open('双色球.txt', 'w')red_num = [] #历史上开出的红球
blue_num = [] #历史上开出的蓝球# 分页获取每一页的开奖信息
for page_num in range(1, total+1):t_url = prefix_url + '_' + str(page_num) + '.html'print(t_url)res2 = requests.get(t_url, timeout = 30)res2.encoding = 'utf-8'page_context = res2.textpage_soup = BeautifulSoup(page_context, 'html.parser')if page_soup.table is None:continueelif page_soup.table:table_rows = page_soup.table.find_all('tr')for row_num in range(2, len(table_rows)-1):row_tds = table_rows[row_num].find_all('td')ems = row_tds[2].find_all('em')# result = '开奖日期:'+ row_tds[0].string +','+'期号:'+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+' '+ems[6].stringresult = row_tds[0].string +','+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+' '+ems[6].stringlocal_file.write(result+'\n')print(result)red_num.append(ems[0].string) # 红球1red_num.append(ems[1].string) # 红球2red_num.append(ems[2].string) # 红球3red_num.append(ems[3].string) # 红球4red_num.append(ems[4].string) # 红球5red_num.append(ems[5].string) # 红球6blue_num.append(ems[6].string) # 蓝球else:continuelocal_file.closered_count = Counter(red_num)
blue_count = Counter(blue_num)
# 按照出现频率顺序
red_count_sorted = sorted(red_count.items(), key=lambda pair: pair[1], reverse=False)
blue_count_sorted = sorted(blue_count.items(), key=lambda pair: pair[1], reverse=False)print(red_count_sorted)
print(blue_count_sorted)ssq_red = red_count_sorted[0:6]
ssq_blue = blue_count_sorted[0:3]
print(list(map(lambda item:item[0], ssq_red)))
print(list(map(lambda item:item[0], ssq_blue)))
ssq_red = list(map(lambda item:item[0], ssq_red))
ssq_blue = list(map(lambda item:item[0], ssq_blue))
ssq_red.sort()
ssq_blue.sort()
print('顺选-1:'+str(ssq_red)+'|'+ssq_blue[0])
print('顺选-2:'+str(ssq_red)+'|'+ssq_blue[1])
print('顺选-3:'+str(ssq_red)+'|'+ssq_blue[2])
print('------------------------------------------------------------------------------')
# 按照出现频率倒序
red_count_sorted = sorted(red_count.items(), key=lambda pair: pair[1], reverse=True)
blue_count_sorted = sorted(blue_count.items(), key=lambda pair: pair[1], reverse=True)print(red_count_sorted)
print(blue_count_sorted)ssq_red = red_count_sorted[0:6]
ssq_blue = blue_count_sorted[0:3]
print(list(map(lambda item:item[0], ssq_red)))
print(list(map(lambda item:item[0], ssq_blue)))
ssq_red = list(map(lambda item:item[0], ssq_red))
ssq_blue = list(map(lambda item:item[0], ssq_blue))
ssq_red.sort()
ssq_blue.sort()
print('反选-1:'+str(ssq_red)+'|'+ssq_blue[0])
print('反选-2:'+str(ssq_red)+'|'+ssq_blue[1])
print('反选-3:'+str(ssq_red)+'|'+ssq_blue[2])

预测结果:

顺选-1:['05', '12', '15', '24', '29', '33']|04
顺选-2:['05', '12', '15', '24', '29', '33']|08
顺选-3:['05', '12', '15', '24', '29', '33']|15
------------------------------------------------------
反选-1:['03', '06', '11', '14', '18', '19']|11
反选-2:['03', '06', '11', '14', '18', '19']|12
反选-3:['03', '06', '11', '14', '18', '19']|16

python 爬取中彩网双色球开奖数据,预测下一期开奖号码相关推荐

  1. 练习:使用Python爬取COVID-19疫情国内当日数据

    练习:使用Python爬取COVID-19疫情国内当日数据 推荐公众号:数据酷客 (里面有超详细的教程) 代码来源数据酷客公众号教程 URL它是Uniform Resource Locator的缩写, ...

  2. python爬取股票信息_利用Python爬取网易上证所有股票数据(代码

    利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...

  3. 如何使用python编程抢京东优惠券 知乎_学好Python爬取京东知乎价值数据

    原标题:学好Python爬取京东知乎价值数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这 ...

  4. python如何爬取实时人流量_使用python爬取微信宜出行人流量数据

    代码地址:https://liujiao111.github.io/2019/06/18/easygo/ 工具介绍: 该工具基于微信中的宜出行提供的数据接口进行爬取,能够爬取一定范围内的当前时间点的人 ...

  5. 使用python爬取BOSS直聘岗位数据并做可视化(Boss直聘对网页做了一些修改,现在的代码已经不能用了)

    使用python爬取BOSS直聘岗位数据并做可视化 结果展示 首页 岗位信息 岗位详情 薪资表 学历需求 公司排名 岗位关键词 福利关键词 代码展示 爬虫代码 一.导入库 二.爬取数据 1.爬取数据代 ...

  6. python爬取火车票网的时刻表数据

    python爬取火车票网的时刻表数据 导包 import re,requests,datetime,time,json from prettytable import PrettyTable from ...

  7. 通过爬取天猫商品评论实例分析Python爬取ajax动态生成的数据

    本文主要通过爬取天猫商品kindle的评论为例来说明利用python爬取ajax动态生成的数据的方式,本文使用的工具如下: 工具 chrome浏览器[寻找评论的动态链接] python3.5[执行代码 ...

  8. python 爬取自如租房的租房数据,使用图像识别获取价格信息

    python 爬取自如租房的租房数据 完整代码下载:https://github.com/tanjunchen/SpiderProject/tree/master/ziru #!/usr/bin/py ...

  9. 使用Python爬取51job招聘网的数据

    使用Python爬取51job招聘网的数据 进行网站分析 获取职位信息 存储信息 最终代码 进行网站分析 进入https://www.51job.com/这个网站 我在这就以python为例搜索职位跳 ...

最新文章

  1. ArrayList Iterator remove java.lang.UnsupportedOperationException
  2. php 静态类内存,php面向对象中static静态属性与方法的内存位置分析
  3. 操作系统学习:Linux0.12文件异步IO
  4. R语言str_sub函数从字符串中提取或替换子字符串(substring):str_sub函数指定起始位置和终止位置抽取子字符、str_sub函数指定起始位置和终止位置替换子字符串
  5. 我的第一个纯手写jQuery插件
  6. 程序的跟踪debug
  7. php use as是什么意思,use关键字在PHP中的几种用法
  8. 用ABAP代码读取S/4HANA生产订单工序明细 1
  9. c语言素数程序出现大空行,C语言实现寻找大素数
  10. java如何获得wlan mac_Android M 如何获取 Wifi MAC地址
  11. 如何查看一个组件的 classid是多少_万一免五(万1免5)是骗人的吗?如何查看自己的交易费率是多少?万一免五最新问题汇总!...
  12. George Fox谈Adobe开发者社区与HTML5内容建设
  13. wp7 应用程序优化
  14. im即时通讯源码带教程/uniapp即时通讯源码,附安装教程
  15. 3次样条曲线差值函数c++实现
  16. Word排版——毕业论文专业排版5——目录
  17. matlab 子函数怎么写,matlab中怎么写函数
  18. 利用selenium携带cookies实现免登录
  19. C语言和win32绿色鼠标连点器,带代码(Windows)
  20. Spring Boot,Whitelabel Error Page解决方法

热门文章

  1. 小唐开始刷蓝桥(三)2018年第九届C/C++ B组蓝桥杯省赛真题
  2. vue使用e-charts制作专题图(广西省为例)---第一篇
  3. 手机浏览器只保存php文件夹,一个PHP文件搞定支付宝系列之手机网站支付(兼容微信浏览器)...
  4. 数据库主键设置 (一看就懂)
  5. 特效大片背后的多视角 3D 人体姿态估计技术
  6. 手机常用术语英文翻译
  7. 开发板——X210开发板的软开关(供电置锁)
  8. HUAWEI+Eudemon1000E+防火墙+典型配置案例
  9. 罕见的jquery旋转式图片切换
  10. 计算机毕业设计JAVA离散制造业产品销售管理系统mybatis+源码+调试部署+系统+数据库+lw