Celery,Tornado,Supervisor构建和谐的分布式系统

Celery 分布式的任务队列

与rabbitmq消息队列的区别与联系：

rabbitmq 调度的是消息，而Celery调度的是任务.
Celery调度任务时，需要传递参数信息，传输载体可以选择rabbitmq.
利用rabbitmq的持久化和ack特性，Celery可以保证任务的可靠性.

优点:

轻松构建分布式的Service Provider,提供服务。
高可扩展性，增加worker也就是增加了队列的consumer。
可靠性，利用消息队列的durable和ack，可以尽可能降低消息丢失的概率，当worker崩溃后，未处理的消息会重新进入消费队列。
用户友好，利用flower提供的管理工具可以轻松的管理worker。

flower
使用tornado-celery,结合tornado异步非阻塞结构，可以提高吞吐量，轻松创建分布式服务框架。
学习成本低，可快速入门

快速入门
定义一个celery实例main.py：

from celery import Celery
app = Celery('route_check', include=['check_worker_path'], 
        broker='amqp://user:password@rabbitmq_host:port//')
app.config_from_object('celeryconfig')

include指的是需要celery扫描是否有任务定义的模块路径。例如add_task 就是扫描add_task.py中的任务

celery的配置文件可以从文件、模块中读取，这里是从模块中读取，celeryconfig.py为：

from multiprocessing import cpu_count

from celery import platforms
from kombu import Exchange, Queue

CELERYD_POOL_RESTARTS = False
CELERY_RESULT_BACKEND = 'redis://:password@redis_host:port/db'
CELERY_QUEUES = (
    Queue('default', Exchange('default'), routing_key='default'),
    Queue('common_check', Exchange('route_check'), routing_key='common_check'),
    Queue('route_check', Exchange('route_check'), routing_key='route_check', delivery_mode=2),
    Queue('route_check_ignore_result', Exchange('route_check'), routing_key='route_check_ignore_result',
          delivery_mode=2)
)
CELERY_ROUTES = {
    'route_check_task.check_worker.common_check': {'queue': 'common_check'},
    'route_check_task.check_worker.check': {'queue': 'route_check'},
    'route_check_task.check_worker.check_ignore_result': {'queue': 'route_check_ignore_result'}
}
CELERY_DEFAULT_QUEUE = 'default'
CELERY_DEFAULT_EXCHANGE = 'default'
CELERY_DEFAULT_EXCHANGE_TYPE = 'direct'
CELERY_DEFAULT_ROUTING_KEY = 'default'
# CELERY_MESSAGE_COMPRESSION = 'gzip'
CELERY_ACKS_LATE = True
CELERYD_PREFETCH_MULTIPLIER = 1
CELERY_DISABLE_RATE_LIMITS = True
CELERY_TIMEZONE = 'Asia/Shanghai'
CELERY_ENABLE_UTC = True
CELERYD_CONCURRENCY = cpu_count() / 2
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'
CELERY_TASK_PUBLISH_RETRY = True
CELERY_TASK_PUBLISH_RETRY_POLICY = {
    'max_retries': 3,
    'interval_start': 10,
    'interval_step': 5,
    'interval_max': 20
}
platforms.C_FORCE_ROOT = True

这里面是一些celery的配置参数。

在上面include的add_task.py定义如下：

#encoding:utf8

from main import app

@app.task
def add(x,y):
    return x+y

启动celery
celery -A main worker -l info -Ofair

-A 后面是包含celery定义的模块,我们在main.py中定义了app = Celery...
测试celery:
-l 日志打印的级别，这里是info
-Ofair 这个参数可以让Celery更好的调度任务

# encoding:utf8
__author__ = 'brianyang'

import add_task

result = add_task.add.apply_async((1,2))
print type(result)
print result.ready()
print result.get()
print result.ready()

输出是

<class 'celery.result.AsyncResult'>
False
3
True

当调用result.get()时，如果还没有返回结果，将会阻塞直到结果返回。这里需要注意的是，如果需要返回worker执行的结果，必须在之前的config中配置CELERY_RESULT_BACKEND这个参数，一般推荐使用Redis来保存执行结果，如果不关心worker执行结果，设置CELERY_IGNORE_RESULT=True就可以了，关闭缓存结果可以提高程序的执行速度。
在上面的测试程序中，如果修改为：

# encoding:utf8
__author__ = 'brianyang'

import add_task

result = add_task.add.(1,2)
print type(result)
print result

输出结果为:

<type 'int'>
3

相当于直接本地调用了add方法，并没有走Celery的调度。
通过flower的dashbord可以方便的监控任务的执行情况：

task list

task detail

还可以对worker进行重启，关闭之类的操作

taks_op

使用Celery将一个集中式的系统拆分为分布式的系统大概步骤就是:

根据功能将耗时的模块拆分出来，通过注解的形式让Celery管理
为拆分的模块设置独立的消息队列
调用者导入需要的模块或方法，使用apply_async进行异步的调用并根据需求关注结果。
根据性能需要可以添加机器或增加worker数量，方便弹性管理。

需要注意的是：

尽量为不同的task分配不同的queue,避免多个功能的请求堆积在同一个queue中。

celery -A main worker -l info -Ofair -Q add_queue启动Celery时，可以通过参数Q加queue_name来指定该worker只接受指定queue中的tasks.这样可以使不同的worker各司其职。

CELERY_ACKS_LATE可以让你的Celery更加可靠，只有当worker执行完任务后，才会告诉MQ，消息被消费。

CELERY_DISABLE_RATE_LIMITS Celery可以对任务消费的速率进行限制，如果你没有这个需求，就关闭掉它吧，有益于会加速你的程序。

tornado-celery

tornado应该是python中最有名的异步非阻塞模型的web框架，它使用的是单进程轮询的方式处理用户请求，通过epoll来关注文件状态的改变，只扫描文件状态符发生变化的FD(文件描述符)。
由于tornado是单进程轮询模型，那么就不适合在接口请求后进行长时间的耗时操作，而是应该接收到请求后，将请求交给背后的worker去干，干完活儿后在通过修改FD告诉tornado我干完了，结果拿走吧。很明显，Celery与tornado很般配，而tornado-celery是celery官方推荐的结合两者的一个模块。
整合两者很容易，首先需要安装:

tornado-celery
tornado-redis
tornado代码如下：

# encoding:utf8
__author__ = 'brianyang'

import tcelery
import tornado.gen
import tornado.web

from main import app
import add_task

tcelery.setup_nonblocking_producer(celery_app=app)


class CheckHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    @tornado.gen.coroutine
    def get(self):
        x = int(self.get_argument('x', '0'))
        y = int(self.get_argument('y', '0'))
        response = yield tornado.gen.Task(add_task.add.apply_async, args=[x, y])
        self.write({'results': response.result})
        self.finish


application = tornado.web.Application([
    (r"/add", CheckHandler),
])

if __name__ == "__main__":
    application.listen(8889)
    tornado.ioloop.IOLoop.instance().start()

在浏览器输入：http://127.0.0.1:8889/add?x=1&y=2
结果为：

通过tornado+Celery可以显著的提高系统的吞吐量。

Benchmark

使用Jmeter进行压测，60个进程不间断地的访问服务器：
接口单独访问响应时间一般在200~400ms

uwsgi + Flask方案：
uwsgi关键配置：

processes       = 10
threads         = 3

Flask负责接受并处理请求，压测结果：
qps是46,吞吐量大概是2700/min

uwsgi+Flask

tornado+Celery方案:
Celery配置：
CELERYD_CONCURRENCY = 10也就是10个worker(进程),压测结果：
qps是139,吞吐量大概是8300/min

tornado+Celery

从吞吐量和接口相应时间各方面来看，使用tornado+Celery都能带来更好的性能。

Supervisor

什么是supervisor
supervisor俗称Linux后台进程管理器
适合场景
-- 需要长期运行程序，除了nohup，我们有更好的supervisor
-- 程序意外挂掉，需要重启，让supervisor来帮忙
-- 远程管理程序，不想登陆服务器，来来来，supervisor提供了高大上的web操作界面.
之前启动Celery命令是celery -A main worker -l info -Ofair -Q common_check,当你有10台机器的时候，每次更新代码后，都需要登陆服务器，然后更新代码，最后再杀掉Celery进程重启，恶不恶心，简直恶心死了。
让supervisor来，首先需要安装：
pip install supervisor
配置文件示例:

[unix_http_server]
file=/tmp/supervisor.sock   ; path to your socket file
chmod=0777
username=admin
password=admin

[inet_http_server]
port=0.0.0.0:2345
username=admin
password=admin

[supervisord]
logfile=/var/log/supervisord.log ; supervisord log file
logfile_maxbytes=50MB       ; maximum size of logfile before rotation
logfile_backups=10          ; number of backed up logfiles
loglevel=info               ; info, debug, warn, trace
pidfile=/var/run/supervisord.pid ; pidfile location
nodaemon=false              ; run supervisord as a daemon
minfds=1024                 ; number of startup file descriptors
minprocs=200                ; number of process descriptors
user=root                   ; default user
childlogdir=/var/log/            ; where child log files will live

[rpcinterface:supervisor]
supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface

[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ; use unix:// schem for a unix sockets.
username=admin
password=admin
[program:celery]
command=celery -A main worker -l info -Ofair

directory=/home/q/celeryTest
user=root
numprocs=1
stdout_logfile=/var/log/worker.log
stderr_logfile=/var/log/worker.log
autostart=true
autorestart=true
startsecs=10

; Need to wait for currently executing tasks to finish at shutdown.
; Increase this if you have very long running tasks.
stopwaitsecs = 10

; When resorting to send SIGKILL to the program to terminate it
; send SIGKILL to its whole process group instead,
; taking care of its children as well.
killasgroup=true

; Set Celery priority higher than default (999)
; so, if rabbitmq is supervised, it will start first.
priority=1000

示例文件很长，不要怕，只需要复制下来，改改就可以
比较关键的几个地方是：

[inet_http_server]
port=0.0.0.0:2345
username=admin
password=admin

这个可以让你通过访问http://yourhost:2345 ，验证输入admin/admin的方式远程管理supervisor,效果如下：

remote supervisor

[program:flower]这里就是你要托管给supervisor的程序的一些配置,其中autorestart=true可以在程序崩溃时自动重启进程，不信你用kill试试看。
剩下的部分就是一些日志位置的设置，当前工作目录设置等，so esay~

supervisor优点：

管理进程简单，再也不用nohup & kill了。
再也不用担心程序挂掉了
web管理很方便

缺点：

web管理虽然方便，但是每个页面只能管理本机的supervisor,如果我有一百台机器，那就需要打开100个管理页面，太麻烦了.

怎么办～

supervisor-easy闪亮登场

通过rpc调用获取配置中的每一个supervisor程序的状态并进行管理，可以分组，分机器进行批量/单个的管理。方便的不要不要的。来两张截图：

分组管理：

group
分机器管理:

server

通过简单的配置，可以方便的进行管理。

最后编辑于：2017.12.03 07:50:24

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 158,560评论 4赞 361
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,104评论 1赞 291
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,297评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,869评论 0赞 204
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,275评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,563评论 1赞 216
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,833评论 2赞 312
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,543评论 0赞 197
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,245评论 1赞 241
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,512评论 2赞 244
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,011评论 1赞 258
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,359评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,006评论 3赞 235
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,062评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,825评论 0赞 194
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,590评论 2赞 273
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,501评论 2赞 268