目录

  • tarnado
  • tarnado源码安装
  • tarnado测试程序
  • application类的解析

一. tarnado简介

  最近在学习Python,无意间接触到的tarnado,感觉tarnado还蛮好的那么tarnado到底什么呢?tarnado是由Python开发的一个非阻塞式web服务器框架,他与许多主流的web框架有很大的不同(当然其他的web框架我还真的不知道多少),epoll和非阻塞的方式让他可以每秒数以千计的连接,非常适合与实时的web服务。以下地址为tarnado官方的解释http://www.tornadoweb.cn/

二. tarnado源码安装

  到上面的地址上去下载tornado-1.2.1.tar.gz

  解压缩之后在cmd命令框中找到此路径,进行安装,具体步骤如下:

 注意:经过本人测试,在python3.5上此代码不能执行,在2.7上面可以执行,因此建议安装在python2.7上进行测试和学习。

三. 测试程序

  安装完成之后,打开pycharm, 新建py文件,把下面测试代码写入,执行后,在浏览器中输入http://127.0.0.1:8888会显示hello, world字样,就代表这安装成功。

 1 import tornado.ioloop2 import tornado.web3 4 class MainHandler(tornado.web.RequestHandler):5     def get(self):6         self.write("Hello, world")7 8 application = tornado.web.Application([9     (r"/", MainHandler),
10 ])
11
12 if __name__ == "__main__":
13     application.listen(8888)
14     tornado.ioloop.IOLoop.instance().start()

测试代码

四. application类的解析

  下面终于要进行application的解析了,但是在解析之前,大概说一下关于测试代码的执行流程。

 1 #!/usr/bin/env python2 # -*- coding:utf-8 -*-3 # zhou4 # 2017/6/275 6 # 导入两个模块7 import tornado.ioloop8 import tornado.web9
10 # 1. 把类RequestHandler载入到内存中
11 # 2. 把类RequestHandler做为参数传入MainHandler中
12 # 3. 把类MainHandler载入到内存中
13 # 以上三个步骤实质上都不会坐任何操作,仅仅只是把类装载到内存中以便后续调用
14 class MainHandler(tornado.web.RequestHandler):
15     def get(self):
16         self.write("Hello, world")
17
18
19 # 丛这一步骤开始才开始真正的创建对象
20 # 1. 类Application创建了一个对象,名称为application
21 # 2. r"/" 这个是正则表达式类型的/,也就是我们在浏览器中输入的url
22 # 3. 把类MainHandler作为参数传递到application中
23 # 4. 这里面传递的仅仅只是一个变量[]
24 application = tornado.web.Application([
25     (r"/", MainHandler),
26 ])
27
28 if __name__ == "__main__":
29
30     # 调用application对象中的listen方法,把8888作为端口号传递进去
31     application.listen(8888)
32     tornado.ioloop.IOLoop.instance().start()

测试程序执行流程简介

  接下来就首先剖析的是下面这一行代码

application = tornado.web.Application([(r"/", MainHandler),
])类application的作用:

A collection of request handlers that make up a web application.把许多请求处理器组合起来以实现web应用

1. application的初始化过程

1 def __init__(self, handlers=None, default_host="", transforms=None,2              wsgi=False, **settings):3     if transforms is None:4         self.transforms = []5         if settings.get("gzip"):6             self.transforms.append(GZipContentEncoding)7         self.transforms.append(ChunkedTransferEncoding)8     else:9         self.transforms = transforms
10     self.handlers = []
11     self.named_handlers = {}
12     self.default_host = default_host
13     self.settings = settings
14     self.ui_modules = {}
15     self.ui_methods = {}
16     self._wsgi = wsgi
17     self._load_ui_modules(settings.get("ui_modules", {}))
18     self._load_ui_methods(settings.get("ui_methods", {}))
19     if self.settings.get("static_path"):
20         path = self.settings["static_path"]
21         handlers = list(handlers or [])
22         static_url_prefix = settings.get("static_url_prefix",
23                                          "/static/")
24         handlers = [
25                        (re.escape(static_url_prefix) + r"(.*)", StaticFileHandler,
26                         dict(path=path)),
27                        (r"/(favicon\.ico)", StaticFileHandler, dict(path=path)),
28                        (r"/(robots\.txt)", StaticFileHandler, dict(path=path)),
29                    ] + handlers
30     if handlers: self.add_handlers(".*$", handlers)
31
32     # Automatically reload modified modules
33     if self.settings.get("debug") and not wsgi:
34         import autoreload
35         autoreload.start()

初始化代码

  代码一

    <1>. 就是为对象application封装了tranforms变量,

    <2>. 如果用户没有规定变量的时候,系统默认规定了在服务器和客户端之间进行传输的过程中要对其进行一定的压缩,而且要进行一块一块的传输

###################################################
if transforms is None:self.transforms = []if settings.get("gzip"):self.transforms.append(GZipContentEncoding)self.transforms.append(ChunkedTransferEncoding)
else:self.transforms = transforms
###################################################这里面主要包含了三个类:GZipContentEncoding(OutputTransform)        # gzip内容编码ChunkedTransferEncoding(OutputTransform)    # 分块传输编码OutputTransform()                           # 是上面两个类的父类解释:A transform modifies the result of an HTTP request(e.g., GZip encoding)主要是用来对一个http请求的结果进行转换的,可以是gzip压缩

代码二

    <1>. 就是为对象application封装了一系列的变量,ui_modules和ui_methods这两个变量暂时还没有看懂,之后会进行补充。

self.handlers = []
self.named_handlers = {}
self.default_host = default_host
self.settings = settings
self.ui_modules = {}
self.ui_methods = {}
self._wsgi = wsgi

  代码三

    <1>. 主要是为对象application封装ui的模块的方法,和上面的ui模块和方法的区别在哪里呢,我认为应该是自己定义的和系统默认给出的模块和方法。

self._load_ui_modules(settings.get("ui_modules", {}))
self._load_ui_methods(settings.get("ui_methods", {}))

  他主要调用了两个方法,在此仅仅对第一个方法进行简单的描述(_load_ui_modules)

  因为第二个方法和这个modules是一样的

 1 def _load_ui_modules(self, modules):2     if type(modules) is types.ModuleType:3         self._load_ui_modules(dict((n, getattr(modules, n))4                                    for n in dir(modules)))5     elif isinstance(modules, list):6         for m in modules: self._load_ui_modules(m)7     else:8         assert isinstance(modules, dict)9         for name, cls in modules.iteritems():
10             try:
11                 if issubclass(cls, UIModule):
12                     self.ui_modules[name] = cls
13             except TypeError:
14                 pass

_load_ui_modules源代码

  对于上面源代码解析

# 把传入的模块modules全部变成字典的形式封装到ui_modules变量中
def _load_ui_modules(self, modules):# types是一个.py文件,他主要是为了定义一些简单的函数,类似于内置函数可以直接拿来使用的# types里面关于ModuleType的描述是:ModuleType = type(sys) 也就是sys的类型<type 'module'># 这里其实就是为了判断传出的modules是不是一个模块的类型,如果是就把它变成一个字典形式递归判断if type(modules) is types.ModuleType:self._load_ui_modules(dict((n, getattr(modules, n))for n in dir(modules)))#判断modules是不是一个列表,如果是列表,就把列表里面的元素重新代入方法中进行调用                             elif isinstance(modules, list):for m in modules: self._load_ui_modules(m)else:# 此处是一个断言机制,也就是说已经肯定了modules一定是一个字典形式的样子assert isinstance(modules, dict)# 因为modules是一个字典,所以就把键和值分别赋值给name和cls,然后判断每一个键的值cls是不是UIModule的一个子类,如果是# 就把这个值添加到前面封装的一个变量中self.ui_modules[name] = clsfor name, cls in modules.iteritems():try:if issubclass(cls, UIModule):self.ui_modules[name] = clsexcept TypeError:pass

代码四

   <1>. 它定义了一系列的变量,最重要的变量是handler,  其中又引出了一个类StaticFileHandler而这个类又是继承了RequestHandler,因为此处并没有创建任何关于这个类的对象,所以此处不再深究等真正调用时候在来关注。

   但是从条件语句中,我们就可以看出来,当setting中不含static的时候,并不会去创建这些变量,这一点是要注意的。

# 定义了一系列的变量如handlers,path,static_url_prefix
# 当settings中包含了static_path这个键的时候,才会去定义这些变量
if self.settings.get("static_path"):path = self.settings["static_path"]handlers = list(handlers or [])static_url_prefix = settings.get("static_url_prefix","/static/")handlers = [(re.escape(static_url_prefix) + r"(.*)", StaticFileHandler,dict(path=path)),(r"/(favicon\.ico)", StaticFileHandler, dict(path=path)),(r"/(robots\.txt)", StaticFileHandler, dict(path=path)),] + handlers  

代码五

    <1>. 添加给定的处理器到系统的处理器列表中。(其实这样说可能不太准确, 因为我们从代码四就可以看出来,如果我们给定的url包含了static_path,那么给定的处理器无论如何都会发生改变)

if handlers: self.add_handlers(".*$", handlers)

  代码六  

    add_handles函数的解析

def add_handlers(self, host_pattern, host_handlers):# 添加给定的处理器到系统的处理器列表中,注意主机模式是按顺序进行处理的,直到第一个被匹配到的这就意味着所有给定主机的处理器必须被添加到处理器中"""Appends the given handlers to our handler list.Note that host patterns are processed sequentially in theorder they were added, and only the first matching pattern isused.  This means that all handlers for a given host must beadded in a single add_handlers call."""# 如果给定主机模式不是以"$"结尾的,就添加$到结尾if not host_pattern.endswith("$"):host_pattern += "$"handlers = []# The handlers with the wildcard host_pattern are a special# case - they're added in the constructor but should have lower# precedence than the more-precise handlers added later.# If a wildcard handler group exists, it should always be last# in the list, so insert new groups just before it.# 带有通配符的handlers是一个特殊情况,他们本来在构造方法就已经被添加了,但是他们的优先级却低于一些重要的处理器,因此应该在之后被添加# 所以如果带有通配符的处理器组存在,就应该把他们放在一个列表的最后面,否则就插在他的前面# 下面这段代码就是这个意思,如果他的pattern是'.*$'开头的,代表他是没有通配符的,所以就把他插入最后一个的前面,否则有通配符的就直接添加到后面if self.handlers and self.handlers[-1][0].pattern == '.*$':self.handlers.insert(-1, (re.compile(host_pattern), handlers))else:self.handlers.append((re.compile(host_pattern), handlers))# 这个是对我们传入的host_handlers进行一个解析,把第一个采纳数给pattern,第二个给handler如果有三个,就赋值给kwargs如果没有第三个kwargs=={}for spec in host_handlers:if type(spec) is type(()):assert len(spec) in (2, 3)pattern = spec[0]handler = spec[1]if len(spec) == 3:kwargs = spec[2]else:kwargs = {}# 赋值完成之后就把这些参数封装到类URLSpec中spec = URLSpec(pattern, handler, kwargs)# 类URLSpec创建了对象spec之后,会重新给self.named_handlers添加一个handlers的键值对,如果键值本身就存在,就会往日志里面写入警告信息handlers.append(spec)if spec.name:if spec.name in self.named_handlers:logging.warning("Multiple handlers named %s; replacing previous value",spec.name)self.named_handlers[spec.name] = spec

代码七

  类URLSpec的解析

  在代码六中创建了一个spec对象,用的类URLSpec创建的

class URLSpec(object):# 这个类的作用主要是在url和handlers之间做一个特定的映射,主要的体现应该就是前面的变量name_handlers# 前面的赋值语句:self.named_handlers[spec.name] = spec"""Specifies mappings between URLs and handlers."""def __init__(self, pattern, handler_class, kwargs={}, name=None):"""Creates a URLSpec.Parameters:# 传递进来得主机模式pattern: Regular expression to be matched.  Any groups in the regexwill be passed in to the handler's get/post/etc methods asarguments.# 这个不是特别懂,但是意思是RequestHandler的子类将被调用handler_class: RequestHandler subclass to be invoked.kwargs (optional): A dictionary of additional arguments to be passedto the handler's constructor.# 这个handler的名字,是一个额外的参数name (optional): A name for this handler.  Used byApplication.reverse_url."""if not pattern.endswith('$'):pattern += '$'self.regex = re.compile(pattern)self.handler_class = handler_classself.kwargs = kwargsself.name = nameself._path, self._group_count = self._find_groups()

代码八

  方法self._find_groups()

  这个方法比较有意思,后面会带一个例子来解释一下

def _find_groups(self):# 就是给特定的url返回一个元组,下面的就是例子,括号里面的内容都会转换成%s,后面的2代表小括号括号的个数"""Returns a tuple (reverse string, group count) for a url.For example: Given the url pattern /([0-9]{4})/([a-z-]+)/, this methodwould return ('/%s/%s/', 2)."""# 得到pattern的字符串形式,去掉开头的^和结尾的$符号pattern = self.regex.patternif pattern.startswith('^'):pattern = pattern[1:]if pattern.endswith('$'):pattern = pattern[:-1]# 如果正常情况下regex.groups的值应该是等于count的,除非特别复杂的url,会返回两个noneif self.regex.groups != pattern.count('('):# The pattern is too complicated for our simplistic matching,# so we can't support reversing it.return (None, None)# 这个就是把url转换成元组的具体代码,代码实现的是把括号里面的内容全部转换成%spieces = []for fragment in pattern.split('('):if ')' in fragment:paren_loc = fragment.index(')')if paren_loc >= 0:pieces.append('%s' + fragment[paren_loc + 1:])else:pieces.append(fragment)# 把picese重新拼接成字符,返回回去return (''.join(pieces), self.regex.groups)

事例:

import repattern = "/abcd123([0-9]{4})/lwjeg([a-z-]+)/"
regex = re.compile(pattern)
pieces = []
print(pattern.split('('))
for fragment in pattern.split('('):if ')' in fragment:# 找到‘)’的位置paren_loc = fragment.index(')')if paren_loc >= 0:# 把')'之后的所有内容拼接起来pieces.append('%s' + fragment[paren_loc + 1:])else:pieces.append(fragment)
print(pieces)结果:
['/abcd123', '[0-9]{4})/lwjeg', '[a-z-]+)/']
['/abcd123', '%s/lwjeg', '%s/']

事例

  代码九

# 自动的去重载改变的模块,这个调用的是autorelaad模块实现的
# Automatically reload modified modules
if self.settings.get("debug") and not wsgi:import autoreloadautoreload.start()  

  至此 

application = tornado.web.Application([(r"/", MainHandler),
])就解析完成了,下一篇待续。。。。

  

转载于:https://www.cnblogs.com/huwentao/p/7091935.html

tarnado源码解析系列一相关推荐

  1. Redux 源码解析系列(一) -- Redux的实现思想

    文章来源: IMweb前端社区 黄qiong(imweb.io) IMweb团队正在招聘啦,简历发至jayccchen@tencent.com Redux 其实是用来帮我们管理状态的一个框架,它暴露给 ...

  2. TiKV 源码解析系列文章(二)raft-rs proposal 示例情景分析

    作者:屈鹏 本文为 TiKV 源码解析系列的第二篇,按照计划首先将为大家介绍 TiKV 依赖的周边库 raft-rs .raft-rs 是 Raft 算法的 Rust 语言实现.Raft 是分布式领域 ...

  3. Tomcat源码解析系列二:Tomcat总体架构

    Tomcat即是一个HTTP服务器,也是一个servlet容器,主要目的就是包装servlet,并对请求响应相应的servlet,纯servlet的web应用似乎很好理解Tomcat是如何装载serv ...

  4. prometheus变量_TiKV 源码解析系列文章(四)Prometheus(下)

    本文为 TiKV 源码解析系列的第四篇,接上篇继续为大家介绍 rust-prometheus.上篇主要介绍了基础知识以及最基本的几个指标的内部工作机制,本篇会进一步介绍更多高级功能的实现原理. 与上篇 ...

  5. TiKV 源码解析系列 - Raft 的优化

    这篇文章转载TiDB大牛 唐刘 的博客:https://mp.weixin.qq.com/s?__biz=MzI3NDIxNTQyOQ==&mid=2247484544&idx=1&a ...

  6. Netty 源码解析系列-服务端启动流程解析

    netty源码解析系列 Netty 源码解析系列-服务端启动流程解析 Netty 源码解析系列-客户端连接接入及读I/O解析 五分钟就能看懂pipeline模型 -Netty 源码解析 1.服务端启动 ...

  7. Mybatis3 源码解析系列

    简介 Mybatis作为一个优秀的Java持久化框架,在我们的日常工作中相信都会用到,本次源码解析系列,就开始探索下Mybatis 总结 在MyBatis的学习中,首先通读了<MyBatis3源 ...

  8. openGauss数据库源码解析系列文章——openGauss开发快速入门(二)

    在上一篇openGauss数据库源码解析系列文章--openGauss开发快速入门(上)中,我们介绍了openGauss的安装部署方法,本篇将具体介绍openGauss基本使用. 二. openGau ...

  9. openGauss数据库源码解析系列文章--openGauss简介(一)

    openGauss数据库是华为深度融合在数据库领域多年经验,结合企业级场景要求推出的新一代企业级开源数据库.此前,Gauss松鼠会已经发布了openGauss数据库核心技术系列文章,介绍了openGa ...

最新文章

  1. 常见的容错机制+failover+failback
  2. 用vue制作饿了么首页(1)
  3. [文摘]标准的软件开发过程
  4. 关于set的自定义比较函数的使用及结构体的上下二分用法
  5. PAT 1073 多选题常见计分法(20)(代码+思路)
  6. three.js获取模型大小
  7. 药物用法拉丁文缩写词
  8. 利用计算机实现排列组合公式,计算机算法基础 ——数学(排列组合函数)
  9. java osgi框架_4大 Java OSGi 框架比较 (Knopflerfish, Apache Felix, Equinox, Spring DM)
  10. fuzzy仿真 MATLAB,基于MATLAB的FUZZY控制器的设计和仿真
  11. Python学习DAY5|数据分析简介与实战
  12. MonoX被偷袭?快准狠直击命门
  13. 应用程序.f/q(f了个墙)
  14. SDUT OJ 2132 (一般算术表达式转换成后缀式)
  15. 快速排序算法quickSort
  16. neutron理解总结(一)
  17. QT学习-----按钮弹起效果的实现
  18. asp.net 文件上传和下载管理源码
  19. HIS系统是什么意思?HIS系统的主要功能有哪些?
  20. ppt护理文书流程图_降低护理文件书写完整率.ppt

热门文章

  1. Python内置函数之--open
  2. html运用以及工具
  3. LTE Module User Documentation(翻译6)——物理误差模型、MIMO模型、天线模型
  4. 安卓自动化测试(一)
  5. Arcgis for Javascript实现两个地图的联动
  6. 约瑟夫问题(丢手帕问题)的java实现
  7. 延迟或计划邮件的发送(zz.is2120)
  8. 压缩信息立方体和集合技术内幕
  9. JSP第四篇【EL表达式介绍、获取各类数据、11个内置对象、执行运算、回显数据、自定义函数、fn方法库】...
  10. 10月13日云栖精选夜读:【云栖大会】阿里云和红帽达成合作为百万级客户提供更多企业级解决方案...