240 发简信
IP属地:云南
  • kubernetes中部署spark集群

    在写这个的时候,spark版本为2.2.1。 基于kubernetes部署的两种方式 直接使用kubernetes作为集群管理器(Cluster...

  • Resize,w 360,h 240
    较大规模图片 使用phash去重

    起因 先说下为什么要做这个事。做的图片站的图片来源为很多美女图片站,自然地,会有很多重复的图片,而我的目标就是要把重复的图片找出来,剔除掉或者是...

  • TIME_WAIT状态存在的意义

    什么时候会TIME_WAIT TCP在关闭的时候有个四次挥手的过程,主动关闭方在四次挥手的最后一个ACK发送之后会变成TIME_WAIT状态。 ...

  • Resize,w 360,h 240
    chrome抓包websocket frame显示为空

    尝试抓websocket的包,遇上一个奇葩的问题,分享下。测试网站如下http://websocket.org/echo.htmlchrome抓...

  • python 随笔----__dict__

    先上一段代码,来源是github。 上面这一段代码,乍看挺神奇的,Borg 的各个实例共享了state。实现起来也很巧妙,利用了__dict__...

  • Resize,w 360,h 240
    爬虫——百度指数

    蛮早之前公司有个产品问我能不能爬百度指数,我随便瞄了眼,直接回了可以,然后...光速打脸...今儿个有空,研究研究这玩意儿。嫌长的可以直接拉到最...

  • 简析pyspider

    pyspider优势所在 pyspider非常适合那种很小很杂的爬虫的管理,比如有100个小网站,规则又各不相同,我要获取他的一些很简单的内容,...

  • phash计算png图片指纹返回总为0

    今天在用phash做线上封面图去重,之前自己开发机mac上有个用port install phash安装的phash,源码是phash.org中...

  • 品读 werkzeug reloader 实现机制

    werkzeug使用reloader可以在文件被改变时自动加载更改过的文件,使用方法也很简单,run_simple('localhost', 4...