240 发简信
  • 120
    ABT架构设计

    背景 策略或算法需要在线上不断上线,不断优化,优化之后怎么确定是好是坏。这时就需要ABTest来确定,最近想的办法、优化的算法、优化的逻辑数据是...

  • MLeap线下线上pipeline测试

    实验目的 为了实现开箱即用的机器学习平台,只需简单修改配置,就可实现线下特征处理和训练的模型,一键部署到线上,保持线上线下一致性。离线训练平台选...

  • 120
    Google Professional Data Engineer(PDE)考试

    在国内参加PDE考试的人比较少,导致资料也很少。我在19年1月30号去上海参加PDE考试,参加前也是完全没底,因为时间短资料少,但幸运的是顺利通...

  • 120
    在线模型部署选型

    业界已有的解决方法 各种方法分析 RServer 基本上我们用Rserver方式,针对一次1000条或者更少请求的预测,可以控制95%的结果在1...

  • 120
    《构建实时机器系统》

    这本书主要介绍了一些常用的工具如数据分析pandas、机器学习scikit-learn、安装部署docker技术、消息队列、实时数据监控ELK。...

  • 广告常用名词

    网络广告形式 SEM(Search Engine Marketing)搜索引擎营销,包括两部分SEO(Search Engine Optimiz...

  • 记一次HDFS性能问题排查

    问题表现 HDFS刚上线没有任何问题。就最近现网读写HDFS时,阶段性比较慢,也不是一直都比较慢,慢的时候读取一次需要20秒左右,一般毫秒级就可...

  • 树、二叉树、二叉查找树、AVL树、红黑树、B-树、B+树、trie树综述

    AVL树,红黑树,B树,B+树,Trie树都分别应用在哪些现实场景中? 参考知乎知友的回答AVL树,红黑树,B树,B+树,Trie树现实应用场景...

  • java 并发多线程之一

    多线程的优点 可以提高资源利用率。比如读取多个文件,并进行处理。在读取文件的时候,CPU在 wait I/O,这时CPU就可以处理文件。如果是多...

个人介绍
Talk is cheap, show me the code!

分布式框架、大数据、机器学习

github: https://github.com/jacksu