• [北京-滴滴招聘]运维架构师&云平台产品经理

    以下职位,均属于滴滴基础平台部(也就是章文嵩所带领的团队),在滴滴,我们尊重每个人的发展,「把个人的成长当做最重要的事情」是滴滴工程师文化最重要的体现之一。对于高水平的人才,...

  • 120
    falcon-plus(v0.2) changelog && 平滑升级方案

    首先,推荐在 github 上关注 falcon-plus,这样可以更方便的关注到项目的持续更新 。 全新的前端 Open-Falcon 所有前端组件进行了统一整合,包括da...

  • 120
    IaaS平台建设

    在本部分,我们探讨当传统IT建设和云计算的浪潮相遇的时候,作为互联网企业究竟应该如何抉择,是顺势而为投入云计算的怀抱,还是坚持基础设施自建,精耕细作。其实这两者并不矛盾,在我...

  • 120
    分布式调用跟踪系统

    分布式调用跟踪系统,是在分布式系统日趋复杂、规模越来越大的背景下,监控系统在功能上的一种延伸。Google在2010年4月发布了一篇题为Dapper, a Large-Sca...

  • 120
    互联网企业级监控系统实践

    在上一章中,我们介绍和对比了业界一些杰出的开源监控解决方案。早期,我们一直在用Zabbix,不过随着业务的快速发展,以及互联网公司特有的一些需求,现有的开源监控系统在性能、扩...

  • 120
    开源监控系统的选择

    开源的或者商业的监控系统很多,具体可以参考维基百科的条目Comparison_of_network_monitoring_systems。一个完整的监控系统,往简单了讲,主要...

  • 120
    互联网运维工作

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够7×24小时为用户提供高质量的服务。 运维人员对公司互联网业务所依赖的基础设施、基础服务...

  • 前言

    运维之下 「开放运维」,相信开放的力量,开启运维的新方向。本书遵循「知识共享许可协议 CC-BY-NC-SA 4.0 International」,未经作者书面许可,不允许用...

  • 运维五条军规

    「对线上保持敬畏感」 提前通报要记得 操作需发单,操作步骤命令化,回滚步骤不能缺,double check要确保 严禁高峰窗口做操作 严格小流量和灰度 上线后按照checkl...