Avatar notebook default
19篇文章 · 9349字 · 0人关注
  • Scrapy使用FormRequest POST采集团贷网投资计划和投资人资料

    爬虫主要功能是什么 采集团贷网投资计划和投资人资料,采集的都是网页上的公开数据 为什么要写这个爬虫 帮以前同事写的 花了多久时间 很久没写爬虫了...

  • 只需一行代码,为你的爬虫添加缓存功能

    用装饰器实现了一个为现有爬虫实现本地缓存功能的模块,只需要引入这个spidercache.py文件,然后在爬虫下载文件的方法顶部添加@cache...

  • Resize,w 360,h 240
    Python笔记 (二) 进阶

    进阶语法 with ... as 上下文管理协议 with 语句适用于对资源进行访问的场合,确保不管使用过程中是否发生异常都会执行必要的“清理”...

  • django admin实现后台多用户隔离

    很多人说django自带的后台只能用来做管理,其实简单的多用户发布需求还是可以用自带的admin模块来做的。核心是使用request.user获...

  • Resize,w 360,h 240
    用django写微信公众号自动回复

    闲来无事的时候看了下微信api,发现未认证用户可用接口少的可怜,不过自动回复功能还是有点用的,就用django写了个微信自动回复的功能,回复的数...

  • Resize,w 360,h 240
    django自动发送邮件 + celery使用

    参考资料:celery官方教程Demo给网站做了一个留言板,留言后直接发送邮件给管理员,顺便加上celery测试了一下异步任务。celery基本...

  • 多ip服务器出口ip切换

    一般采集都是直接抓取互联网上公开的http代理,做某个网站的时候,考虑到可能需要稳定且相应速度快的代理,就用了socket bind 本地的多个...

  • redis

    Redis基本命令 查看信息 http://blog.csdn.net/chendaoqiu/article/details/45080237i...

  • 同步、异步(gevent,asyncio)、多线程(threading)效率对比

    对比了三种情况下采集50个网页所需时间,可以看出多线程在效率上是远高于gevent的。第一次测试的时候,没有使用monkey这个补丁,socke...

文集作者