240 发简信
  • 120
    IaaS之后

    引子 云服务的热度越来越高,IaaS、PaaS、SaaS开始逐渐为大家所知,论坛时期的那些草根站长也开始不自己购买服务器转而使用云主机了,大环境...

    0.1 7137 2 52
  • 如何接手一个新业务的运维工作

    丑话说前头 先跟研发leader沟通,灌输运维理念,丑话说在前头,我们不做保姆式运维,我们会致力于线上服务安全、稳定、低成本、快速迭代,从运维视...

    0.5 3235 5 33
  • 120
    运维的价值和目标拆解

    这里说的运维主要是指应用运维,非系统部的偏硬件和网络的运维 我不幸福 很多运维同学感觉自己很苦逼,感觉每天都在救火,给研发擦屁股,做一些重复工作...

  • Open-Falcon存在的问题,重写一套?

    一转眼,Falcon在小米已经跑了一年了,看着自己的孩子一点点长大、成熟,也是一件蛮开心的事情。Open-Falcon开源之后,受到了很多业界同...

    0.1 16080 5 18 5
  • 中小公司如何启动运维平台构建之路

    这里所谓的中小公司,是我的个人定义,服务器数量在5000以下的公司。大公司通常都已经走上了这条路,应该不会看我这篇文章了:) 运维平台收益 先说...

    1.0 1076 5 18 1
  • 120
    运维蓝图思考

    最近在做17年规划,思考运维到底应该干哪些事,得出如下图表一张,欢迎各位同仁一起讨论 * 定标准 我们希望线上环境是统一的、干净的、规范的,所以...

    0.3 3070 3 13 1
  • 做一个职业的运维人

    很多三四年工作经验的同学,因为缺少必要的职业素养的培训,工作的方式方法或多或少存在一些问题,这影响了自身的职业发展。怎么做才算是会工作,这里有几...

    0.5 1875 3 13 6
  • 下一代监控系统构思

    写在前面 之前文章中讲到笔者想要实现一个新的监控系统,原文地址。细思之,重做一遍Open-Falcon并没有意义。所以新的系统会从Open-Fa...

  • 错误预算上线机制

    在读《SRE - Google运维解密》的时候看到Google提出的错误预算上线机制,觉得不错,在这里细化一下,如果你们公司线上变更老是出问题,...

    0.1 634 0 4 2
个人介绍
滴滴云运维负责人,互联网监控解决方案Open-Falcon主程,国内第一套开源PaaS平台DINP作者