Open-Falcon存在的问题,重写一套?

一转眼,Falcon在小米已经跑了一年了,看着自己的孩子一点点长大、成熟,也是一件蛮开心的事情。Open-Falcon开源之后,受到了很多业界同仁的关注,深感欣慰。

过程中,也暴露出了一些问题,今天我们来细数一下Open-Falcon的缺点,对各位做方案选型提供一些帮助。

*系统不易分发

Open-Falcon是从内部版本衍生的,去掉了对小米内部其他系统的依赖,本身组件还是比较多,部分组件使用Python开发,给软件分发造成不小的麻烦,如果对整个架构不熟悉,不知如何troubleshooting,安装过程很难一帆风顺。

*安全性考虑不到位

Dashboard、AlarmDash不用登陆直接就可以查看数据,如果被扫描,还有可能被写入脏数据,被删除数据。Falcon在小米内部因为有网络隔离,外网访问不了,但是一些稍小的公司,直接将Dashboard、AlarmDash放在公网上,就麻烦了

*没有通盘考虑的权限设计

所有的操作理应都有相应权限控制,API的调用也应有相应控制,现在做得还是比较乱,比较弱

*策略表达式易用性不够

现在的策略表达式中只能配置一条规则,此处应该支持配置多条,任何一条触发,就要发报警,不同规则之间应该支持覆盖

*复杂度稍高

对于产品线dev,可能只是想push一些业务监控项,做一些简单的报警配置,把机器分组、策略模板、模板继承等概念暴露给这部分人,增加了他们的理解成本

*每个Graph实例均是单点

这点其实在很大程度上已经算是解决了,Transfer中可以配置Graph双写,虽然手工维护Graph双写列表麻烦了点,好在这个列表基本不怎么变,也可以接受吧

*Graph扩容有损

现在社区的版本,Graph扩容是通过设置migrating标识,新旧集群同时写一段时间,比如一个月,然后去掉老集群,只使用新集群提供服务,一致性哈希的分片策略,会让部分数据发生迁移,这部分发生了迁移的监控项,就只有migrating这段时间的历史数据了。这点我们内部已经在着手解决,敬请期待。

*上下游组件没有naming

Transfer中配置的Graph列表、Judge列表,Query中配置的Graph列表,都是直接写到配置文件中的,缺少一个动态机制,管理起来不方便

*报警没有入库

当前未恢复的报警是存在Alarm内存中的,重启就丢了,历史报警没有入库,无法追溯

*报警现场没有保存

因为使用rrd存储历史数据,一天以后的数据被做了归档处理,查看历史报警时刻的趋势图,无法查看当时的准确值

哇,这么多缺点,我还敢不敢用啊……其实问题没有想得那么大啦,翻阅之前介绍Open-Falcon的文章,你就可以看到很多Open-Falcon的优点啦。小米使用这套系统抗住了每个周期8000多万数据。

一个软件没有经历过几次重写,代码很难变得漂亮,那,笔者现在就在纠结,是否花业余时间重写一套,尝试解决上面提到的这些问题,至少应该做到:

  • 减少组件数量,全部使用Go编写
  • 改进安全性,看图、未恢复的报警均须登录方可访问
  • 增加API访问权限,设计统一的第三方系统调用控制
  • 增强易用性,增强策略表达式功能
  • 保留报警现场
  • 改进历史数据的存储,去除单点
  • 报警事件处理引入类似MQ机制,方便接入其他的报警事件处理模块
  • 简化配置,上下游实例列表动态化
  • 改进索引建立机制,加快索引建立速度
  • 无用的历史数据增加删除机制

嗯,暂时想到这么多,支持笔者做这个事情么?用打赏表明你的态度,(__) 嘻嘻……

附:


update:我们终于完成了这个重写的目标,夜莺来了

夜莺英文名字Nightingale

可以称为Open-Falcon的下一代产品,欢迎试用!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,012评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,589评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,819评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,652评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,954评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,381评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,687评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,404评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,082评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,355评论 2 241
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,880评论 1 255
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,249评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,864评论 3 232
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,007评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,760评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,394评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,281评论 2 259

推荐阅读更多精彩内容