用Python实现火车票查询(含票价版)

  • 写在前面:

网上关于用Python3编写火车查询脚本的版本众多,我在前人的基础上编写了自己的这个版本。

我觉得的写的这个版本有以下几个特色:

1,智能引导输入,我一直比较喜欢这种方式。如果直接做成GUI的图形界面,虽然一目了然,知道该点击什么,输入

什么内容,但是显然做GUI比较费时。

所以较之网上的其他版本,要输入一长串字符。设定input引导输入还是不错的选择。

2,支持价格显示,查看网上众多版本,没有一个显示价格的,带着好奇心我编写了显示价格的相关代码并将之实现

(当然期间也遇到了一些问题,这个在后面的代码部分介绍)

3,添加了一些个性化旁白(这个可能并不能成为大家眼中的特色了)

但是还是有一些不足之处:

1,由于学的不是很深入,对class等框架不是特别熟悉,所以代码中没有规范的类,我不知道这样会不会影响代码执行效率,还是希望以后能够更加规范的写代码。

2,添加价格显示之后,执行时间变长,因为价格的信息是通过三次匹配得到的,所查询的列车越多,等待时间越长。

从开始分析网页到最后成功显示相关信息的过程中,还是学到了很多东西。最大的感触就是字典的强大吧,还有就是一些正则匹配技巧,判断关键字是否存在的if语句,将str转化为dic的语句,可以格式化显示数据prettytable模块的用法。

成果展示:

  • 接下来就是一层层剥洋葱的过程:

首先打开12306火车票查询网站,输入查询站名,在审查元素,network中找到相关网址:

打开连接,有新发现:

没错,查询日期内所有列车的信息都在里面(票价除外)

但是不要高兴的太早,现在有两个问题:第一网址怎么匹配,第二得到网址内容之后怎么匹配你需要的信息,比如车

次,时间等。

因为需要匹配两个网址,为了不混淆,我将存储车次等信息的网址成为网址1,存储票价的网址称为网址2.

首先看一下这个网址的组成结构:https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-09-23&from_station=WHN&to_station=BJP

发现有三个变量:queryDate;from_station;to_station。即时间,出发站,到达站。时间有格式:2016-09-23,中间有

短线,月份也是由两位数构成。站名是对应的字母缩写。所以要找到汉字对应的站名缩写。

有一个网址里面存储了相关信息:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955

可以编写关于stations的字典,keys为中文的站名,values为网址中的英文缩写。

'''
@author: yzw
'''
#!/usr/bin/python
# -*- coding:utf-8 -*-
import re
import urllib
from urllib import request
import requests
from pprint import pprint
url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955'
req = urllib.request.Request(url)
r = urllib.request.urlopen(req).read().decode('utf-8')
#print (r)
stations =re.findall(r'([\u4e00-\u9fa5]+)\|([A-Z]+)',r) #匹配中文和对应的英文
stations = dict(stations)
stations = dict(zip( stations.keys(),stations.values()))#将匹配的内容转化为字典
pprint(stations)                                        #以列的形式打印出来

通过以上代码就生成了stations的字典。新建一个stations的py文件,将打印的stations复制到stations中,这样之后调用的时候,直接引用固定的stations.py,而不需要执行生成stations字典的过程。

stations={'一面坡': 'YPB','一面山': 'YST','七台河': 'QTB','七甸': 'QDM','七营': 'QYJ','七里河': 'QLD','万乐': 'WEB','万发屯': 'WFB','万宁': 'WNQ','万州': 'WYW','万州北': 'WZE','万年': 'WWG','万源': 'WYY',...}

得到中文对应英文字典,这样一个包含火车相关信息的网址1就匹配出来了。

可以新建一个模块:get_urltrain.py,存储匹配网址1:

from station import stations
import warningsf1= input('请输入起始城市:\n')
f = stations[f1]t1= input('请输入目的城市:\n')
t = stations[t1]d1=input('请输入出发时间: \n')
d=str('2016-')+str(d1)                   #这里讲年份设置为固定值,可以减少输入操作。
print ('正在查询'+f1+'至'+t1+'的列车,请听听音乐...')  #个性旁白url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate='+d+'&from_station='+f+'&to_station='+t
warnings.filterwarnings("ignore")         #这个网站是有安全警告的,这段代码可以忽略警告</span></span>
  • 如何解析网址1中的内容:

通过观察发现,每个列车的相关信息都是独立在一个大括号当中,每个大括号里面的内容相当于一个独立的字典,整个网页的内容相当于这些字典构成的列表list。这样可以通过for循环依次提取相关信息了。

每个字典中包含了很多信息,所以我们需要通过网页前端显示的信息和网页源码对比,找到对应的信息,比如:station_train_code就表示表头中的车次...

所以直接在字典中匹配这个英文就会返回车次的信息。其他信息的提取也是如此,这就是字典的方便之处。

还可以添加一个改变显示颜色的模块color_set.py,改变一些双行显示的信息的颜色,比如车站有始发站和到达站,用不同的颜色形成对比:

'''@author: yzw
'''
#!/usr/bin/python
# -*- coding:utf-8 -*-  def colored(color, text):table = {'red': '\033[91m','green': '\033[92m',# no color'nc': '\033[0m'}cv = table.get(color)nc = table.get('nc')return ''.join([cv, text, nc])

以下是不含票价信息的最后执行模块,代码中都有注释,很容易看懂。

import json
from get_urltrain import d
import urllib
from urllib import request
import requests
from pprint import pprint
from get_urltrain import url
from prettytable import PrettyTable
from color_set import coloredr = requests.get(url, verify=False)   #请求网址1的内容
rows = r.json()['data']['datas']      #将内容解析为列表
trains= PrettyTable()
trains.field_names=["车次","车站","时间","历时","商务座","特等座","一等座","二等座","高级软卧","软卧","硬卧 ","软座 ","硬座","无座"]#设置table的header
num = len(rows)                       #打印列表的个数
for row in rows :                                                #列表循环trains.add_row([row['station_train_code'],'\n'.join([colored('green', row['from_station_name']),colored('red', row['to_station_name'])]),'\n'.join([colored('green', row['start_time']),    #对于双行示的信息,设置颜色colored('red', row['arrive_time'])]),row['lishi'],row['swz_num'],row['tz_num'],row['zy_num'],row['ze_num'],row['gr_num'],row['rw_num'],row['yw_num'],row['rz_num'],row['yz_num'],row['wz_num']])
print ('查询结束,共有 %d 趟列车。'%num )   #列表个数也就是列车个数
print (trains)

运行结果如下图:

  • 如何得到票价的相关信息:

在12306查询之后,初次显示的内容中没有票价的信息,只要当你点击相关座位之后才会在另外一行显示出票价,所以票价和车次的信息不在一个网页当中。

通过上面的分析network方法,找到票价对应的网址2:

https://kyfw.12306.cn/otn/leftTicket/queryTicketPrice?train_no=770000G31005&from_station_no=12&to_station_no=19&seat_types=OM9&train_date=2016-09-23

通过观察发现了里面有了更多的变量:train_no,from_station_no,to_station_no,seat_types,train_date。而这些变量都是网址1中所对应的信息,所以要提出票价的修改信息就要进行二次匹配。

所以在得到网址1的内容之后,通过字典匹配变量的内容,如何匹配出网址2。这个方法和匹配网址1类似。

得到网址2对应的内容:

{"validateMessagesShowId":"_validatorMessage","status":true,"httpstatus":200,"data":{"OT":[],"WZ":"¥519.5","M":"¥827.5","A9":"¥1640.5","9":"16405","O":"¥519.5","train_no":"770000G31005"},"messages":[],"validateMessages":{}}

观察发现我们需要的价格的信息在一个data所对应的大括号当中,但是和之前不同的是整个网址2的内容并不是一个字典,而是一个字符串。这算是我遇到的一个小瓶颈吧。每次直接把它当做字典用就会报错,说str没有key()的属性。然后我就通过百度操作如何将字符串转化为字典的方法,找了很久都没找到。后来看到一个网页上面介绍了一个模块:json和json.loads的方法可以转化。如何用这个方法测试了一下,确实可以。

    r_price = urllib.request.urlopen(req).read().decode('utf-8')r_price = json.loads(r_price)price = r_price['data']price = dict(price)</span>

顿时又有了信心,用三次匹配才提取出包含了价格信息的data字典,发现每个车次的价格字典里面,并没有显示所有10个座位类型的价格,还是通过前端和源码的不断对比找到了每个代码代表的车座类型,比如:A1就代表硬座。

因为有些车次只有少许类型,没有的类型的价格信息不会显示。所以直接通过字典将所有类型的车票信息匹配的话,肯定会报错,没有关键字。想了一个办法,就是通过if判断是否有相关车座类型的关键字,如果没有将值设为空,如果有则通过字典匹配后面的价格。这样就有10个if语句了。

A = ('A9' in price.keys())   #判断关键字A9(商务座)是否在字典price中if A == False :A =''else:A =price['A9']#TDZB = ('P' in price.keys())if B == False :B =''else:B =price['P']#YDZC = ('M' in price.keys())if C == False :C =''else:C =price['M']......

提取出相关的价格信息后就可以将相关信息放在车座类型的后面,一起显示出来。

colored('green',row['swz_num'])+'\n'+A,
colored('green',row['tz_num'])+'\n'+B,
colored('green',row['zy_num'])+'\n'+C, #后面的A,B,C就是价格的信息。

最后运行的结果如开始图片所示。

虽然功能实现了,但是运行速度很慢,我觉得就是因为三次匹配,而且后两次的匹配都在row in rows循环中,每一次循环都有执行一次匹配网址2,匹配data,执行10个关键字是否存在的if语句。所以到最后print(table)的过程要漫长很多。

最后一个令我纠结的问题是,我用prettytable打印出来的包含中文的表格并不是很整齐,虽然我查到了prettytable的英文介绍只支持ascii字符的排列。但是我看到网上的图片都可以将中文对齐,最后在第二天早上我换用了pycharm软件运行,结果显示正常。

我整理了两个版本,一个包含价格的,一个不包含价格的。

都在我的github中,欢迎批评指正。最后附上github中的完整代码

用Python实现火车票查询(含票价版)相关推荐

  1. python实现火车票查询_Python脚本实现12306火车票查询系统

    最近我看到看到使用python实现火车票查询,我自己也实现了,感觉收获蛮多的,下面我就把每一步骤都详细给分享出来.(注意使用的是python3) 首先我将最终结果给展示出来: 在cmd命令行执行:py ...

  2. python实现火车票查询_Python3 实现火车票查询工具

    项目简介:使用 Python3 抓取 12306 网站信息提供一个命令行的火车票查询工具.通过该项目的实现,可以熟悉 Python3 基础及网络编程,以及 docopt,requests,pretty ...

  3. python实现火车票查询工具_Python 实现一个火车票查询的工具

    原标题:Python 实现一个火车票查询的工具 作者 sexycoder 本文转载自简书,转载需授权 使用 python 实现一个查询火车票的小工具 主要功能: 输入出发车站,到达车站,时间,然后返回 ...

  4. python实现火车票查询_python实现12306火车票查询器

    12306火车票购票软件大家都用过,怎么用Python写一个命令行的火车票查看器,要求在命令行敲一行命令来获得你想要的火车票信息,下面通过本文学习吧. Python火车票查询器 接口设置 先给这个小应 ...

  5. Python实现火车票查询小工具

        这个小工具通过抓取12306网站提供的数据并进行解析,从而实现通过命令行的方式查询火车票余票数的功能.主要运用了docopt,requests,prettytable,colorama的库函数 ...

  6. python实现火车票查询_基于python的火车票查询工具

    效果图 1.只查询动车票 2.查询所有票 Github链接 接口设计 1.查询火车票,需要出发地点,目的点,日期和所乘列类型这几个参数,因此设计出的接口为python3 tickets.py [-gd ...

  7. python作业火车票订购系统_Python脚本实现12306火车票查询系统

    最近我看到看到使用python实现火车票查询,我自己也实现了,感觉收获蛮多的,下面我就把每一步骤都具体给共享出来.(注重使用的是python3) 首先我将最终结果给展示出来: 在cmd命令行执行:py ...

  8. 12306火车票查询——Python

    欢迎加入Python学习交流QQ群:535993938  禁止闲聊 ! 名额有限 ! 非喜勿进 ! 最近我看到看到使用python实现火车票查询,我自己也实现了,感觉收获蛮多的,下面我就把每一步骤都详 ...

  9. python作业火车票订购系统_Python实现12306火车票查询系统

    最近我看到看到使用python实现火车票查询,我自己也实现了,感觉收获蛮多的,下面我就把每一步骤都详细给分享出来.(注意使用的是python3) 首先我将最终结果给展示出来: 在cmd命令行执行:py ...

最新文章

  1. 8Manage项目管理:嵌入人工智能的项目管理平台
  2. QT的QBluetoothDeviceDiscoveryAgent类的使用
  3. ASP.NET Core Linux下为 dotnet 创建守护进程(必备知识)
  4. python 批量读取xlsx并合并_python合并多个excel表格数据-python如何读取多个excel合并到一个excel中...
  5. 互联网日报 | 6月23日 星期三 | 苏宁置业否认破产及相关传闻;满帮集团正式登陆纽交所;百度公布2030碳中和目标...
  6. Group by 第二选择 OVER
  7. ApacheCN 数据科学译文集 2020.8
  8. Integer的常用方法和String类型的常用方法
  9. 饭局潜规则,吃饭时的最大忌讳,就是低头玩手机
  10. I - Arbitrage(判断是否有无正环 II)
  11. Delphi 正则表达式TPerlRegEx : Split 函数
  12. 五种不同的微博评论数据获取方法
  13. 几何校正(坐标变换+灰度重采样)
  14. 2021年中国非接触式传感设备市场趋势报告、技术动态创新及2027年市场预测
  15. 国内外已知SAR卫星相关信息整理(持续更新-2022.9.6)
  16. 支付网关和api网关_什么是支付网关
  17. android studio 运行按钮为灰色的解决办法之一
  18. pthon之异常、文件练习题
  19. 阿里图标库icon字体使用详细步骤
  20. 开启火狐浏览器的账号密码导入功能

热门文章

  1. Mysql索引优化详解
  2. 深入浅出,白话文Docker入门,万字笔记
  3. 点燃设计之火-PS鼠绘一只打火机
  4. 使用element ui select下拉框多选,编辑状态下回显数据
  5. 简单解释什么是Rest接口
  6. 社科院房地产蓝皮书:北京房价今年易涨难跌
  7. Python -- 抽象类、包装器
  8. 鸿蒙系统啥时候开源,鸿蒙操作系统什么时候上市 鸿蒙操作系统开源
  9. 面试篇:前端优化整理
  10. 外观时尚多色可选,OPPO R9s领衔情人节值得购买手机一览