一个轻便易用的消息队列
PS:工作的时候遇到一个需要更新几千万关键词的热度等属性的功能,最开始使用普通的for循环,但是这个方法明显的不理想,后来想到使用消息队列,因为之前从来没有使用过消息队列,所以临时网上去找一些常用的消息队列,工作要求是找个比较容易入手能够快速实现的,所以最终确定了使用HTTPSQS消息队列服务.很容易搭建,很容易实现,性能也不错,所以留阅.
HTTPSQS(HTTP Simple Queue Service)是一款基于 HTTP GET/POST 协议的轻量级开源简单消息队列服务,使用 Tokyo Cabinet 的 B+Tree Key/Value 数据库来做数据的持久化存储。
使用环境:Linux(同时支持32位、64位操作系统,推荐使用64位操作系统)
软件作者:张宴
队列(Queue)又称先进先出表(First In First Out),即先进入队列的元素,先从队列中取出。加入元素的一头叫“队头”,取出元素的一头叫“队尾”。利用消息队列可以很好地异步处理数据传送和存储,当你频繁地向数据库中插入数据、频繁地向搜索引擎提交数据,就可采取消息队列来异步插入。另外,还可以将较慢的处理逻辑、有并发数量限制的处理逻辑,通过消息队列放在后台处理,例如FLV视频转换、发送手机短信、发送电子邮件等。
HTTPSQS 具有以下特征:
● 非常简单,基于 HTTP GET/POST 协议。PHP、Java、Perl、Shell、Python、Ruby等支持HTTP协议的编程语言均可调用。
● 非常快速,入队列、出队列速度超过10000次/秒。
● 高并发,支持上万的并发连接,C10K不成问题。
● 支持多队列。
● 单个队列支持的最大队列数量高达10亿条。
● 低内存消耗,海量数据存储,存储几十GB的数据只需不到100MB的物理内存缓冲区。
● 可以在不停止服务的情况下便捷地修改单个队列的最大队列数量。
● 可以实时查看队列状态(入队列位置、出队列位置、未读队列数量、最大队列数量)。
● 可以查看指定队列ID(队列点)的内容,包括未出、已出的队列内容。
● 查看队列内容时,支持多字符集编码。
● 源代码不超过800行,适合二次开发。
1、HTTPSQS 1.7 压力测试:
采用Apache ab命令进行压力测试,开启10个线程,放入10万条文本数据(每条512字节)到队列中:
使用HTTP Keep-Alive时:23018 requests/sec
关闭HTTP Keep-Alive时:11840 requests/sec
采用Apache ab命令进行压力测试,开启10个线程,从队列中取出10万条文本数据(每条512字节):
使用HTTP Keep-Alive时:25982 requests/sec
关闭HTTP Keep-Alive时:13294 requests/sec
详细测试内容: http://code.google.com/p/httpsqs/wiki/BenchmarkTest
生产环境应用:在 金山游戏官网 中,新闻、论坛帖子、客服公告、SNS社区等发生的增、删、改操作,文本内容实时写入HTTPSQS队列,全站搜索引擎增量索引准实时(1分钟内)更新的数据源取自HTTPSQS。HTTPSQS 2009年12月18日上线至今,运行稳定,既有来自Web服务器的入队列操作,也有来自命令行脚本的批量入、出队列操作。
2、HTTPSQS 的生产环境应用:
●金山通行证( https://my.xoyo.com )
队列应用类型:手机短信上行、手机短信下发、邮件下发
队列应用要求:稳定性高,存储数据量大
队列部署结构:一主、一备两台 HTTPSQS 热备模式
●金山用户行为分析系统( http://kbi.xoyo.com )
队列应用类型:用户鼠标点击、访问URL原始数据采集
队列应用要求:并发性能高,存储数据量大
队列部署结构:多台 HTTPSQS 应用层哈希分布式模式
●金山网络游戏运营平台 KingEyes
队列应用类型:用户操作日志记录
●金山逍遥网站内搜索
队列应用类型:索引准实时更新。在 金山游戏官网 中,新闻、论坛帖子、客服公告、SNS社区等发生的增、删、改操作,文本内容实时写入HTTPSQS队列,全站搜索引擎增量索引准实时(1分钟内)更新的数据源取自HTTPSQS。
●金山逍遥网全站通用评论系统
队列应用类型:评论发表
●金山《剑侠情缘》电视连续剧四大角色人物选秀活动( http://zt.xoyo.com/haixuan/ )
队列应用类型:用户上传的照片异步裁剪、缩放处理
●新浪邮箱( http://mail.sina.com.cn )
队列应用类型:用户登陆日志记录
3、HTTPSQS 编译安装:
wget http://httpsqs.googlecode.com/files/libevent-2.0.12-stable.tar.gz
tar zxvf libevent-2.0.12-stable.tar.gz
cd libevent-2.0.12-stable/
./configure --prefix=/usr/local/libevent-2.0.12-stable/
make
make install
cd ../
wget http://httpsqs.googlecode.com/files/tokyocabinet-1.4.47.tar.gz
tar zxvf tokyocabinet-1.4.47.tar.gz
cd tokyocabinet-1.4.47/
./configure --prefix=/usr/local/tokyocabinet-1.4.47/
#注:在32位Linux操作系统上编译Tokyo cabinet,请使用./configure --enable-off64代替./configure,可以使数据库文件突破2GB的限制。
#./configure --enable-off64 --prefix=/usr/local/tokyocabinet-1.4.47/
make
make install
cd ../
wget http://httpsqs.googlecode.com/files/httpsqs-1.7.tar.gz
tar zxvf httpsqs-1.7.tar.gz
cd httpsqs-1.7/
make
make install
cd ../
4、HTTPSQS 服务器使用文档:
[root@xoyo ~]# httpsqs -h
-p <num> 监听的TCP端口(默认值:1218)
-x <path> 数据库目录,目录不存在会自动创建(例如:/opt/httpsqs/data)
-t <second> HTTP请求的超时时间(默认值:3)
-s <second> 同步内存缓冲区内容到磁盘的间隔秒数(默认值:5)
-c <num> 内存中缓存的最大非叶子节点数(默认值:1024)
-m <size> 数据库内存缓存大小,单位:MB(默认值:100)
-i <file> 保存进程PID到文件中(默认值:/tmp/httpsqs.pid)
-a <auth> 访问HTTPSQS的验证密码(例如:mypass123)
-d 以守护进程运行
-h 显示这个帮助
示例:
httpsqs -d -p 1218 -x /data0/queue
请使用命令“killall httpsqs”、“pkill httpsqs”和“kill `cat /tmp/httpsqs.pid`”来停止httpsqs。
注意:请不要使用命令“pkill -9 httpsqs”和“kill -9 httpsqs的进程ID”来结束httpsqs,否则,内存中尚未保存到磁盘的数据将会丢失。
5、HTTPSQS 客户端使用文档:
(1)、入队列(将文本消息放入队列):
HTTP GET 协议(以curl命令为例):
HTTP POST 协议(以curl命令为例):
以浏览器为例:
如果入队列成功,返回:
如果入队列失败,返回:
如果队列已满,返回:
从HTTPSQS 1.2版本开始,在返回给客户端的HTTP Header头中增加了一行“Pos: xxx”,输出当前队列的读取位置点,例如:
Content-Type: text/plain
Keep-Alive: 120
Pos: 19
Date: Thu, 18 Mar 2010 04:57:08 GMT
Content-Length: 14
HTTPSQS_PUT_OK
(2)、出队列(从队列中取出文本消息):
HTTP GET 协议(以curl命令为例):
以浏览器为例:
返回消息队列的内容给客户端。
如果没有未取出的消息队列,则返回:
从HTTPSQS 1.2版本开始,在返回给客户端的HTTP Header头中增加了一行“Pos: xxx”,输出当前队列的读取位置点,例如:
Content-Type: text/plain; charset=utf-8
Keep-Alive: 120
Pos: 7
Date: Thu, 18 Mar 2010 04:56:01 GMT
Content-Length: 18
消息队列内容
参数charset说明(例如:/?charset=utf-8):
指定HTTP输出Header头的字符编码,即:
Content-Type: text/plain; charset=utf-8
任何 在IANA注册的字符编码 均可使用,但是,并不是所有的浏览器都能解析全部的字符编码。对于中文,常用的字符编码有:utf-8、gb2312、gbk、gb18030、big5等。
(3)、查看队列状态(普通方式,便于浏览器查看):
HTTP GET 协议(以curl命令为例):
返回(示例):
------------------------------
Queue Name: xoyo
Maximum number of queues: 1000000
Put position of queue (1st lap): 45
Get position of queue (1st lap): 6
Number of unread queue: 39
如果“队列写入点值”大于“最大队列数量值”,将重置“队列写入点”为1,即又从1开始存储新的队列内容,覆盖原来队列位置点的内容:
------------------------------
Queue Name: xoyo
Maximum number of queues: 1000000
Put position of queue (2st lap): 4562
Get position of queue (1st lap): 900045
Number of unread queue: 104517
以浏览器为例:
(4)、查看队列状态(JSON方式,便于程序处理返回内容):
从HTTPSQS 1.3版本开始支持此功能。
HTTP GET 协议(以curl命令为例):
返回(示例):
如果“队列写入点值”大于“最大队列数量值”,将重置“队列写入点”为1,即又从1开始存储新的队列内容,覆盖原来队列位置点的内容:
(5)、查看指定队列位置点的内容:
跟一般的队列系统不同的是,HTTPSQS 可以查看指定队列ID(队列点)的内容,包括未出、已出的队列内容。可以方便地观测进入队列的内容是否正确。
另外,假设有一个发送手机短信的队列,由客户端守护进程从队列中取出信息,并调用“短信网关接口”发送短信。但是,如果某段时间“短信网关接口”有故障,而这段时间队列位置点300~900的信息已经出队列,但是发送短信失败,我们还可以在位置点300~900被覆盖前,查看到这些位置点的内容,作相应的处理。
HTTP GET 协议(以curl命令为例):
pos >=1 并且 <= 1000000000
返回指定队列位置点的内容。
(6)、重置指定队列:
HTTP GET 协议(以curl命令为例):
如果重置成功,返回:
如果重置失败,返回:
(7)、更改指定队列的最大队列数量:
默认的最大队列长度(100万条):1000000
HTTP GET 协议(以curl命令为例):
num >=10 并且 <= 1000000000
如果更改最大队列数量成功,则返回:
更改的最大队列数量必须大于当前的“队列写入点”。另外,当“队列写入点”小于“队列读取点”时(即PUT位于圆环的第二圈,而GET位于圆环的第一圈时),本操作将被取消,然后返回给客户端以下信息:
(8)、不停止服务的情况下,修改定时刷新内存缓冲区内容到磁盘的间隔时间:
从HTTPSQS 1.3版本开始支持此功能。
默认间隔时间:5秒 或 httpsqs -s <second> 参数设置的值。
HTTP GET 协议(以curl命令为例):
num >=1 and <= 1000000000
如果修改间隔时间成功,则返回:
如果 num 不在 1 ~ 1000000000 之间,本操作将被取消,然后返回给客户端以下信息:
(9)、密码校验失败:
从HTTPSQS 1.5版本开始支持此功能。
如果密码校验失败(/?auth=xxx),将返回以下信息:
(10)、全局错误:
如果发生全局错误(即指令、参数错误等),将返回以下信息:
6、HTTPSQS 客户端
(1)、PHP 客户端说明文档:
A、PHP 客户端扩展(第三方提供,详情请访问: http://code.google.com/p/php-httpsqs-client/ )
B、PHP 客户端 Class 文件(官方提供:适用于 HTTPSQS 1.7 以上版本,推荐使用。)
查看 PHP Class 源代码: httpsqs_client.php
PHP Client 所有函数使用示例: test_example.php
PHP Client 命令行运行示例: test_commandline.php
用法:
- <?php
- include_once("httpsqs_client.php");
- $httpsqs = new httpsqs($httpsqs_host, $httpsqs_port, $httpsqs_auth, $httpsqs_charset);
- /*
- 1. 将文本信息放入一个队列(注意:如果要放入队列的PHP变量是一个数组,需要事先使用序列化、json_encode等函数转换成文本)
- 如果入队列成功,返回布尔值:true
- 如果入队列失败,返回布尔值:false
- */
- $result = $httpsqs->put($queue_name, $queue_data);
- /*
- 2. 从一个队列中取出文本信息
- 返回该队列的内容
- 如果没有未被取出的队列,则返回文本信息:HTTPSQS_GET_END
- 如果发生错误,返回布尔值:false
- */
- $result = $httpsqs->get($queue_name);
- /*
- 3. 从一个队列中取出文本信息和当前队列读取点Pos
- 返回数组示例:array("pos" => 7, "data" => "text message")
- 如果没有未被取出的队列,则返回数组:array("pos" => 0, "data" => "HTTPSQS_GET_END")
- 如果发生错误,返回布尔值:false
- */
- $result = $httpsqs->gets($queue_name);
- /*
- 4. 查看队列状态(普通方式)
- */
- $result = $httpsqs->status($queue_name);
- /*
- 5. 查看队列状态(JSON方式)
- 返回示例:{"name":"queue_name","maxqueue":5000000,"putpos":130,"putlap":1,"getpos":120,"getlap":1,"unread":10}
- */
- $result = $httpsqs->status_json($queue_name);
- /*
- 6. 查看指定队列位置点的内容
- 返回指定队列位置点的内容。
- */
- $result = $httpsqs->view($queue_name, $queue_pos);
- /*
- 7. 重置指定队列
- 如果重置队列成功,返回布尔值:true
- 如果重置队列失败,返回布尔值:false
- */
- $result = $httpsqs->reset($queue_name);
- /*
- 8. 更改指定队列的最大队列数量
- 如果更改成功,返回布尔值:true
- 如果更改操作被取消,返回布尔值:false
- */
- $result = $httpsqs->maxqueue($queue_name, $num);
- /*
- 9. 修改定时刷新内存缓冲区内容到磁盘的间隔时间
- 如果更改成功,返回布尔值:true
- 如果更改操作被取消,返回布尔值:false
- */
- $result = $httpsqs->synctime($num);
- ?>
(2)、Perl 客户端说明文档(第三方提供,作者:tonny0830):
查看Perl客户端源代码: perl client
开发平台:CentOS 5.4
Perl版本:5.8.8
Editor: VIM
##################################################################
new 方法:
参数个数:4个
参数说明:
1.HttpSQS-服务器IP地址。
2.HttpSQS-工作端口号。
3.Proto-连接服务器协议类型,TCP 还是UDP. 默认是TCP连接。
4.Charset-字符集。默认是UTF-8。
###################################################################
put方法:
参数个数:2个
传递参数:
1.队列名
2.以POST方式提交的字符串
####################################################################
get方法:
参数个数:1个
传递参数:
1.队列名
####################################################################
status方法:
参数个数:1个
传递参数:
1.队列名
#####################################################################
view方法:
参数个数:2个
传递参数:
1.队列名
2.查看队列的编号
#####################################################################
reset方法:
参数个数:1个
传递参数:
1.队列名
#####################################################################
maxqueue方法:
参数个数:2个
传递参数:
1.队列名
2.指定的最大队列数
#####################################################################
pput方法:
参数个数:2个
传递参数:
1.队列名
2.POST方式提交的数据。
#####################################################################
pget方法:
参数个数:1个
传递参数:
1.队列名
#####################################################################
pstatus方法:
参数个数:1个
传递参数:
1.队列名
#####################################################################
pview方法:
参数个数:2个
传递参数:
1.队列名
2.查看队列的编号。
#####################################################################
pmaxqueue方法:
参数个数:2个
传递参数:
1.队列名
2.指定队列的最大数。
#####################################################################
preset方法:
参数个数:1个
传递参数:
1.队列名
#####################################################################
使用的例子见:
httpsqs_cmdline_test.pl
httpsqs_cmdline_loop_test.pl
(3)、C 客户端示例(第三方提供,作者:李博):
查看C客户端示例源代码: C client
(4)、Java 客户端
A、第一款客户端(推荐)(第三方提供,作者:Snow Young):
下载 1.0 版本: http://httpsqs.googlecode.com/files/httpsqs4j-java-client-1.0.zip
从SVN下载最新代码:svn checkout http://httpsqs.googlecode.com/svn/trunk/client/httpsqs4j/ httpsqs4j
帮助文档: http://blog.zyan.cc/book/httpsqs/client/httpsqs4j/
B、第二款客户端(第三方提供,作者:李博):
查看Java客户端示例源代码: Java client
(5)、Python客户端(第三方提供,作者:Wendal):
下载: http://wendal.net/261.html
7、HTTPSQS 生产环境典型应用案例架构:
一个采用PHP编写的HTTPSQS客户端简单守护进程框架如下:
环境,假设PHP安装路径为/usr/local/webserver/php,使用PHP编写一个文件/opt/httpsqs_client_daemon.php:
- <?php
- include_once dirname(__FILE__)."/httpsqs_client.php";
- $httpsqs = new httpsqs($host, $port, $auth, $charset);
- while(true) {
- $result = $httpsqs->gets($name);
- $pos = $result["pos"]; //当前队列消息的读取位置点
- $data = $result["data"]; //当前队列消息的内容
- if ($data != "HTTPSQS_GET_END" && $data != "HTTPSQS_ERROR") {
- ...去做应用操作...
- } else {
- sleep(1); //暂停1秒钟后,再次循环
- }
- }
- ?>
在Linux下,推送到后台执行即可:
8、HTTPSQS 软件版本修改历史:
● [2009年12月29日] HTTPSQS 1.1 版本发布。这是第一个开源发布版本。
● [2010年03月18日] HTTPSQS 1.2 版本发布。 点击这儿查看该版本的新增功能 。
● [2010年06月28日] HTTPSQS 1.3 版本发布。 点击这儿查看该版本的新增功能 。
● [2011年04月21日] HTTPSQS 1.6 版本发布。 点击这儿查看该版本的新增功能 。
● [2011年07月26日] HTTPSQS 1.7 版本发布。 点击这儿查看该版本的新增功能 。
附:本使用文档修改历史
● [2009年12月30日] [Version 1.1.0] HTTPSQS 1.1 版本使用文档。
● [2010年03月18日] [Version 1.2.0] HTTPSQS 1.2 版本使用文档。增加了 HTTPSQS 1.2 版本新增功能的说明,以及生产环境典型应用案例架构图。
● [2010年03月19日] [Version 1.2.1] 在第7节中,增加了一个采用PHP编写的HTTPSQS客户端简单守护进程框架代码。
● [2010年04月07日] [Version 1.2.2] 在第6节中,增加了第三方的C客户端示例和Java客户端示例。
● [2010年04月30日] [Version 1.2.3] 在第6节中,再增加了一款第三方Java客户端:httpsqs4j。
● [2010年05月11日] [Version 1.2.4] 解决了在某些Linux系统上,默认动态链接库目录中找不到TC动态链接库的问题:/usr/bin/httpsqs: error while loading shared libraries: libtokyocabinet.so.9: cannot open shared object file: No such file or directory。
● [2010年06月29日] [Version 1.3.0] HTTPSQS 1.3 版本使用文档。增加了 HTTPSQS 1.3 版本新增功能的说明。
● [2010年08月26日] [Version 1.3.1] 在第6节中,增加了第三方PHP客户端扩展链接。
● [2011年04月21日] [Version 1.6.0] HTTPSQS 1.6 版本使用文档。增加了 HTTPSQS 1.6 版本新增功能的说明。
● [2011年07月26日] [Version 1.7.0] HTTPSQS 1.7 版本使用文档。修复一处BUG,改为动态编译HTTPSQS。
● [2011年11月04日] [Version 1.7.1] 增加支持 HTTPSQS 1.7 版本的 PHP Client Class。
一个轻便易用的消息队列相关推荐
- python 消息队列 go_gmq: gmq是基于redis提供的特性,使用go语言开发的一个简单易用的消息队列;支持延迟任务,异步任务,超时任务,优先级任务...
1. 概述 gmq是基于redis提供的特性,使用go语言开发的一个简单易用的队列;关于redis使用特性可以参考之前本人写过一篇很简陋的文章Redis 实现队列; gmq的灵感和设计是基于有赞延迟队 ...
- mysql 消息队列_一个简单的 MySQL 批量事务消息队列
基于 MySQL 的批量事务消息队列 消息队列本质上是一个存储介质,通常是链表结构,不同的进程或线程可以向消息队列中写入或读取消息.消息队列的使用场景有很多,比如异步处理任务.应用解耦.流量削锋等等. ...
- 用户请求队列化_分布式消息队列选型分析
高并发架构是成为架构师的必修课,而消息队列,则是王冠上最闪亮的那颗明珠!能否驾驭消息队列这款高并发神器,亦成为架构师的试金石.本文将从队列本质.技术选型两个方面,给大家整理下个人心得,希望能对大家有所 ...
- 【烈日炎炎战后端】消息队列(1.0万字)
消息队列 1. 消息队列的优点有哪些? 2. 消息队列的缺点有哪些? 3. 如何保证消息的有序性? 4. 如何保证消息的可靠性传输? 5. RabbitMQ如何实现消息确认机制? 6. 如何保证消息队 ...
- 【消息中间件MQ系列】消息队列之ActiveMQ、RocketMQ、RabbitMQ、Kafka不得不说的秘密
热门系列: [消息中间件MQ系列]RabbitMQ安装与使用,并与SpringBoot整合 程序人生,精彩抢先看 目录 1.消息队列/消息中间件介绍 1.1 消息中间件是什么 1.1.1 消息中间件的 ...
- 厚积薄发--一文带您了解阿里云 RocketMQ 轻量版消息队列(MNS)
作者: 周新宇&陈涛&李凯 阿里云 RocketMQ 轻量版(MNS)消息队列是一个轻量.可靠.可扩展且完全托管的分布式消息队列服务.MNS 能够帮助应用开发者在他们应用的分布式组件上 ...
- 深入剖析 RabbitMQ —— Spring 框架下实现 AMQP 高级消息队列协议
前言 消息队列在现今数据量超大,并发量超高的系统中是十分常用的.本文将会对现时最常用到的几款消息队列框架 ActiveMQ.RabbitMQ.Kafka 进行分析对比. 详细介绍 RabbitMQ 在 ...
- Java架构之消息队列 (一):消息队列的概述
消息队列系列分享大纲: 一.消息队列的概述 二.消息队列之RabbitMQ的使用 三.消息队列之Kafka的使用 四.消息队列之RabbitMQ的原理详解 五.消息队列之Kafka的原理详解 六.消息 ...
- JSD-2204-(业务逻辑开发)-续消息队列-Kafka-RabbitMQ-Day15
虚拟机镜像网盘路径 链接:百度网盘 请输入提取码 提取码:egno 618M:Virtualbox用的,纯净的RockyLinux 3.5G:VMware用的,安装好所有软件的RockyLinux 4 ...
最新文章
- Python MemoryError 问题
- VS2010实现opencv基于DCT的图像压缩
- 解析:Web前端未来的前景如何呢?
- 史上最强福利,阿里云半价+Plesk免费2万台速抢!
- 在WebRTC上实现ML Kit笑容检测
- 澎思科技新出行人再识别(ReID)算法,刷新三大数据集最高记录
- vshost32.exe停止工作
- video标签播放视频
- jQuery控制表单重置
- 设置只能开启一个程序实例
- win10设置HTML桌面背景,Win10系统直接将视频设置为桌面背景的方法
- 正则表达式——特殊字符(MyBatis)
- Rundll32.exe 转自5iuu.com
- Facebook的新算法可以预测出你的贫富阶级
- 安卓逆向——AS开发Xposed插件HOOK案例
- vite按需引入 Ant Design Vue 3.0
- 精彩回顾 | 一文盘点2021年中小企业数字化转型最新趋势
- 智慧电厂拥抱“双碳”,空冷岛设施数字化转型
- python-tems,keys,values
- picsart下载_PicsArt美易照片编辑下载
热门文章
- adams打不开提示msc license_安装adams后,打开时弹出的错误,如何修改才能用?
- 如何中断forEach循环
- vue-i18n插件报错:Uncaught TypeError: _ctx.$t is not a function
- 【电商AI工具一期】AI引领电商新风潮:20款AI电子商务工具盘点,让你实现财富增长!
- MySQL数据库——查询
- c语言摆动序列找规律,数学探秘【数学探秘数学头条】- 数学探秘知识点 - 中企动力...
- Cesium快速上手1-CesiumWidget-Scene结构
- 把图片中的文字转成文本
- oracle统计最高学历,最高学历更新
- openGL学习笔记十四: 透视投影