Prometheus 系统监控方案 二 安装与配置

下载Prometheus
下载最新安装包,本文说的都是在Linux x64下面内容,其它平台没尝试过,请选择合适的下载。
Prometheus 主程序,主要是负责存储、抓取、聚合、查询方面。
Alertmanager 程序,主要是负责实现报警功能。
Pushgateway 程序,主要是实现接收由Client push过来的指标数据,在指定的时间间隔,由主程序来抓取。
*_exporter 这类是不同系统已经实现了的集成。

下载解压,一般默认的配置就可以运行。
tar xvfz prometheus-.tar.gzcd prometheus-

go写的东西,直接打包成二进制包了,其本上没有别的依赖。
下面我们主要来了解一下他的配置文件,这是一个非常重要的步聚。
配置Prometheus监控自已
Prometheus 通过默认 http://localhost:9090/metrics* HTTP接口暴露了自己的性能指标数据,当然也就可以配置抓取目标 targets 为自己了。Prometheus 采集自身性能数据就是一个十分好的例子了,打开解压目录下面的prometheus.yml*文件。

全局配置global: scrape_interval: 15s # �默认 15秒到目标处抓取数据 # 这个标签是在本机上每一条时间序列上都会默认产生的,主要可以用于 联合查询、远程存储、Alertmanger时使用。 external_labels: monitor: 'codelab-monitor'# 这里就表示抓取对象的配置# �设置抓取自身数据scrape_configs: # job name 这个配置是表示在这个配置内的时间序例,每一条都会自动添加上这个{job_name:"prometheus"}的标签。 - job_name: 'prometheus' # �重写了全局抓取间隔时间,由15秒重写成5秒。 scrape_interval: 5s static_configs: - targets: ['localhost:9090']

启动Prometheus
使用刚才的配置文件启动Prometheus。
./prometheus -config.file=prometheus.yml

这时候Prometheus应该正确启动了,如果报错,请检查配置文件。(注意:yml格式是对缩进有要求的。) 使用浏览器打开该机器的http://部署机器:9090*,或者http://localhost:9090/ 即可以看到Prometheus的graph页面了。一般等几秒抓取,就会有数据写进Prometheus里面了。
如果相验证Prometheus自己输出了什么性能数据,可以打开 http://localhost:9090/metrics 这个页面看看。
Prometheus默认是有多少个CPU内核就使用多少OS线程,主要是由GOMAXPROCS 这个环境变量控制的,开发GO的应该都清楚。一般默认就好了,太高的话可能会带来意想不到的后果。Prometheus默认大概会占用3G左右的内存,如果想调小一点,得修改配置文件,或者添加启动参数。
使用Prometheus 自带的表达式浏览器
如果想查看Prometheus都抓了些什么数据,可以使用它内置的一个浏览页面。打开
http://localhost:9090/graph*,默认是在graph的页面。试试在表达式 expression 输入框:
prometheus_target_interval_length_seconds

查询Promethues目标抓取间隔时间长度。执行后会返回很多条时间序列,Console 内列出的是最后一次抓到的数值。不同的标签表示不同的时间间隔和耗时%。
如果想查询99%的抓取耗时,可以这样:
prometheus_target_interval_length_seconds{quantile="0.99"}

如果想查询返回的时间序列有多少条,可以这样:
count(prometheus_target_interval_length_seconds)

推荐阅读更多精彩内容