python 爬取中彩网双色球开奖数据,预测下一期开奖号码
爬取中彩网双色球开奖数据:
import requests
from bs4 import BeautifulSoup
from collections import Counter# 获取内容
res = requests.get('http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html', timeout = 30)
res.encoding = 'utf-8'
htm = res.text
# 解析内容
soup = BeautifulSoup(htm, 'html.parser')
# url前缀
prefix_url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list'
#获取总页数
total = int(soup.find('p', attrs={"class": "pg"}).find_all('strong')[0].text)
#将获取的信息,写进文件
local_file = open('双色球.txt', 'w')red_num = [] #历史上开出的红球
blue_num = [] #历史上开出的蓝球# 分页获取每一页的开奖信息
for page_num in range(1, total+1):t_url = prefix_url + '_' + str(page_num) + '.html'print(t_url)res2 = requests.get(t_url, timeout = 30)res2.encoding = 'utf-8'page_context = res2.textpage_soup = BeautifulSoup(page_context, 'html.parser')if page_soup.table is None:continueelif page_soup.table:table_rows = page_soup.table.find_all('tr')for row_num in range(2, len(table_rows)-1):row_tds = table_rows[row_num].find_all('td')ems = row_tds[2].find_all('em')# result = '开奖日期:'+ row_tds[0].string +','+'期号:'+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+' '+ems[6].stringresult = row_tds[0].string +','+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+' '+ems[6].stringlocal_file.write(result+'\n')print(result)red_num.append(ems[0].string) # 红球1red_num.append(ems[1].string) # 红球2red_num.append(ems[2].string) # 红球3red_num.append(ems[3].string) # 红球4red_num.append(ems[4].string) # 红球5red_num.append(ems[5].string) # 红球6blue_num.append(ems[6].string) # 蓝球else:continuelocal_file.closered_count = Counter(red_num)
blue_count = Counter(blue_num)
# 按照出现频率顺序
red_count_sorted = sorted(red_count.items(), key=lambda pair: pair[1], reverse=False)
blue_count_sorted = sorted(blue_count.items(), key=lambda pair: pair[1], reverse=False)print(red_count_sorted)
print(blue_count_sorted)ssq_red = red_count_sorted[0:6]
ssq_blue = blue_count_sorted[0:3]
print(list(map(lambda item:item[0], ssq_red)))
print(list(map(lambda item:item[0], ssq_blue)))
ssq_red = list(map(lambda item:item[0], ssq_red))
ssq_blue = list(map(lambda item:item[0], ssq_blue))
ssq_red.sort()
ssq_blue.sort()
print('顺选-1:'+str(ssq_red)+'|'+ssq_blue[0])
print('顺选-2:'+str(ssq_red)+'|'+ssq_blue[1])
print('顺选-3:'+str(ssq_red)+'|'+ssq_blue[2])
print('------------------------------------------------------------------------------')
# 按照出现频率倒序
red_count_sorted = sorted(red_count.items(), key=lambda pair: pair[1], reverse=True)
blue_count_sorted = sorted(blue_count.items(), key=lambda pair: pair[1], reverse=True)print(red_count_sorted)
print(blue_count_sorted)ssq_red = red_count_sorted[0:6]
ssq_blue = blue_count_sorted[0:3]
print(list(map(lambda item:item[0], ssq_red)))
print(list(map(lambda item:item[0], ssq_blue)))
ssq_red = list(map(lambda item:item[0], ssq_red))
ssq_blue = list(map(lambda item:item[0], ssq_blue))
ssq_red.sort()
ssq_blue.sort()
print('反选-1:'+str(ssq_red)+'|'+ssq_blue[0])
print('反选-2:'+str(ssq_red)+'|'+ssq_blue[1])
print('反选-3:'+str(ssq_red)+'|'+ssq_blue[2])
预测结果:
顺选-1:['05', '12', '15', '24', '29', '33']|04
顺选-2:['05', '12', '15', '24', '29', '33']|08
顺选-3:['05', '12', '15', '24', '29', '33']|15
------------------------------------------------------
反选-1:['03', '06', '11', '14', '18', '19']|11
反选-2:['03', '06', '11', '14', '18', '19']|12
反选-3:['03', '06', '11', '14', '18', '19']|16
python 爬取中彩网双色球开奖数据,预测下一期开奖号码相关推荐
- 练习:使用Python爬取COVID-19疫情国内当日数据
练习:使用Python爬取COVID-19疫情国内当日数据 推荐公众号:数据酷客 (里面有超详细的教程) 代码来源数据酷客公众号教程 URL它是Uniform Resource Locator的缩写, ...
- python爬取股票信息_利用Python爬取网易上证所有股票数据(代码
利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...
- 如何使用python编程抢京东优惠券 知乎_学好Python爬取京东知乎价值数据
原标题:学好Python爬取京东知乎价值数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这 ...
- python如何爬取实时人流量_使用python爬取微信宜出行人流量数据
代码地址:https://liujiao111.github.io/2019/06/18/easygo/ 工具介绍: 该工具基于微信中的宜出行提供的数据接口进行爬取,能够爬取一定范围内的当前时间点的人 ...
- 使用python爬取BOSS直聘岗位数据并做可视化(Boss直聘对网页做了一些修改,现在的代码已经不能用了)
使用python爬取BOSS直聘岗位数据并做可视化 结果展示 首页 岗位信息 岗位详情 薪资表 学历需求 公司排名 岗位关键词 福利关键词 代码展示 爬虫代码 一.导入库 二.爬取数据 1.爬取数据代 ...
- python爬取火车票网的时刻表数据
python爬取火车票网的时刻表数据 导包 import re,requests,datetime,time,json from prettytable import PrettyTable from ...
- 通过爬取天猫商品评论实例分析Python爬取ajax动态生成的数据
本文主要通过爬取天猫商品kindle的评论为例来说明利用python爬取ajax动态生成的数据的方式,本文使用的工具如下: 工具 chrome浏览器[寻找评论的动态链接] python3.5[执行代码 ...
- python 爬取自如租房的租房数据,使用图像识别获取价格信息
python 爬取自如租房的租房数据 完整代码下载:https://github.com/tanjunchen/SpiderProject/tree/master/ziru #!/usr/bin/py ...
- 使用Python爬取51job招聘网的数据
使用Python爬取51job招聘网的数据 进行网站分析 获取职位信息 存储信息 最终代码 进行网站分析 进入https://www.51job.com/这个网站 我在这就以python为例搜索职位跳 ...
最新文章
- ArrayList Iterator remove java.lang.UnsupportedOperationException
- php 静态类内存,php面向对象中static静态属性与方法的内存位置分析
- 操作系统学习:Linux0.12文件异步IO
- R语言str_sub函数从字符串中提取或替换子字符串(substring):str_sub函数指定起始位置和终止位置抽取子字符、str_sub函数指定起始位置和终止位置替换子字符串
- 我的第一个纯手写jQuery插件
- 程序的跟踪debug
- php use as是什么意思,use关键字在PHP中的几种用法
- 用ABAP代码读取S/4HANA生产订单工序明细 1
- c语言素数程序出现大空行,C语言实现寻找大素数
- java如何获得wlan mac_Android M 如何获取 Wifi MAC地址
- 如何查看一个组件的 classid是多少_万一免五(万1免5)是骗人的吗?如何查看自己的交易费率是多少?万一免五最新问题汇总!...
- George Fox谈Adobe开发者社区与HTML5内容建设
- wp7 应用程序优化
- im即时通讯源码带教程/uniapp即时通讯源码,附安装教程
- 3次样条曲线差值函数c++实现
- Word排版——毕业论文专业排版5——目录
- matlab 子函数怎么写,matlab中怎么写函数
- 利用selenium携带cookies实现免登录
- C语言和win32绿色鼠标连点器,带代码(Windows)
- Spring Boot,Whitelabel Error Page解决方法
热门文章
- 小唐开始刷蓝桥(三)2018年第九届C/C++ B组蓝桥杯省赛真题
- vue使用e-charts制作专题图(广西省为例)---第一篇
- 手机浏览器只保存php文件夹,一个PHP文件搞定支付宝系列之手机网站支付(兼容微信浏览器)...
- 数据库主键设置 (一看就懂)
- 特效大片背后的多视角 3D 人体姿态估计技术
- 手机常用术语英文翻译
- 开发板——X210开发板的软开关(供电置锁)
- HUAWEI+Eudemon1000E+防火墙+典型配置案例
- 罕见的jquery旋转式图片切换
- 计算机毕业设计JAVA离散制造业产品销售管理系统mybatis+源码+调试部署+系统+数据库+lw