flask + celery 遇到的那些坑

0.12字数 889阅读 4390

特么的。。。写好的东西不见了一半。。。又得重写。。
星期一开始,有同事和我说要不要把我们的项目加上celery,异步发送邮件。我想了想这块我没碰过,正好学点新东西。
celery是干什么的,我这里抄点别人的文字

###来源 http://www.ziyoubaba.com/archives/590

flask是一个阻塞式的框架。这里的“阻塞”是指flask处理请求的时候,一次只能处理一个,当多个requests过来,flask会说,大家不要急,一个一个来。如果恰好这时候某个请求耗费了大量的时间(种种原因),在这段时间内,flask说:我忙着呢,后来的排好队。然后服务进程被占用着,后来的请求得不到处理。这就叫做被阻塞住了。说得再多不如一只栗子:
def long_time_def():
    for _ in range(10000):
        for j in range(10000):
            i = 1
    return 'hello'

我的老爷机运行这只函数需要大约8s的时间,可以很好地用来充当“阻塞侠”的角色。如果你的本配置比较好,可以适当增大数字。然后我们这么构建一个flask服务端:

###  flask_celery.py  ###
app = Flask(__name__)

@app.route("/")
def hello():
    print ("耗时的请求")
    result=long_time_def()
    return result

@app.route('/t')
def test():
    return 'test!'

if __name__ == "__main__":
    app.run(debug=True)

    


运行一下,同时访问‘/’与‘/t’你就能明白,当‘/’未返回结果的时候,‘/t’是没有响应的。

多进程的方案只能说可以缓解这种“阻塞”,但无法根治,因为进程有限,访问量不可控,早晚所有进程都被阻塞。所以一个分布式的任务队列框架被搬上台面:celery。

celery会这么说:flask,你把那些请求起来比较耗时的任务丢给我,我帮你处理,你留着资源去处理下一个请求吧!很仗义的样子有木有!只是flask说,好啊,不过,你有地方放吗?因为celery进程也是按照先来后到的原则处理任务,多个任务到来,flask也会来不及处理的时候。它想到:那就先存起来!不过它自己却不提供存储任务的机制。所以这个时候celery需要一个中间人,可以将所有任务统一保存在中间人这里,然后依次处理。这个中间人,官网上给出了两个:RabbitMQ 或者 Redis。本教程选择Redis。

打个比方,假如有1000个人同时注册你的网站,那你的网站就一直在处理注册请求,发送邮件。网站会一直卡在那里,然后崩溃。所以,需要用到异步发送邮件。可是一般情况下,我们的网站一年都不会有1000访问量。干这个有什么用??这说的有道理。但是,我手上就有上百万用户的数据。我可以写个脚本,怼到服务器,什么也不干就24小时地不停注册你的网站,直接怼到你把网站关了!

所以,celery很有必要!
然后我看了下教程。。。。弄了四天。。。踩了好多坑。希望我踩过的坑,能够帮助准备入坑的童鞋。

看看我这几天都经历了些什么

  • cannot connect to amqp

微信截图_20170608175231.png

](http://upload-images.jianshu.io/upload_images/2577034-4c5402dd3bb71732.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
原因:flask中没有给celery配置redis,在创建实例的时候就要加上redis。
celery = Celery(app.import_name, broker='redis://localhost:6379/0',bckend='redis://localhost:6379/0')

不要像下面这样,不要像下面这样,不要像下面这样

celery = Celery()

  • cannot import name _uuid_generate_random

原因:celery从4.0版本开始就不再支持windows了。。。。。。。。。所以,换系统吧

Windows[](http://docs.celeryproject.org/en/latest/faq.html?highlight=windows#windows)
Does Celery support Windows?[](http://docs.celeryproject.org/en/latest/faq.html?highlight=windows#does-celery-support-windows)
**Answer**: No.
Since Celery 4.x, Windows is no longer supported due to lack of resources.
But it may still work and we are happy to accept patches.
  • 不知道怎么启动worker

flask文档上写的启动方式太过简单,让人摸不到头脑

$ celery -A your_application worker
your_application 字符串必须指向创建 celery 对象的应用包或者模块。

这个我就搞不懂了。比方说我有一个名为flask的项目,我的所有应用放在app这个包里,然后我要启动的task在一个叫crawemail的文件里
如果按照教程写的只想创建celery对象的应用或者模块。那不就成了
$celery -A app worker
但跑起来是这样的

微信截图_20170608175231.png

看到没有,tasks里是空的,没有任何东西。所以这样跑,是不对滴!
再试试
$celery -A app.crawemail worker

微信截图_20170608175527.png

成功了!任务怼进去了!!!

但是,接下来还有坑。。。。。

  • 任务没跑起来,celery终端一直保持这个画面。。。。

这个就是因为傻乎乎的,没有用.delay()函数启动celery的tasks

  • tasks not register,keyerror
微信截图_20170608180235.png

这是什么导致的我并不太清楚。但这个错误的出现是我单独写了个只有一个py文件的flask测试项目运行时候出现的。后来我的解决方法是,再写一个文件,用来创建app,然后import他们。
from commontools import app,send_async_email,long_time_def
然后就成功跑起来了

微信截图_20170608182503.png
  • Error: xxxxx is* not JSON *serializable

原因:把多余的东西传了进delay()函数,所以多余的参数不要传。我之前就是send_email.delay(app,msg)
把app这个多余的传进去了所以报错。

以上是我这四天遇到的坑。。。。
你开上帝视角的话觉得也没什么啊。。。。。。可你得站在我的角度思考。。。我全程是蒙眼懵逼状态啥也不懂
一步一步摸着石头过河的!
填完这些坑。。。我觉得我好长一段时间不想再看到celery

推荐阅读更多精彩内容