Linux之systemd的工作原理及使用

0.15字数 5191阅读 4630

System的简介

Systemd 是 Linux 系统中最新的初始化系统(init),它主要的设计目标是克服 sysvinit 固有的缺点,提高系统的启动速度Systemd 的很多概念来源于苹果 Mac OS 操作系统上的 launchd。

System的特点:

  • 兼容SysVinit和LSB init scripts
  • 更快的启动速度,以并发启动原理
    • 尽可能启动更少的进程
    • 尽可能将更多进程并行启动
  • 提供按需启动能力

当 sysvinit 系统初始化的时候,它会将所有可能用到的后台服务进程全部启动运行。并且系统必须等待所有的服务都启动就绪之后,才允许用户登录。这种做法有两个缺点:首先是启动时间过长;其次是系统资源浪费。
某些服务很可能在很长一段时间内,甚至整个服务器运行期间都没有被使用过。比如 CUPS,打印服务在多数服务器上很少被真正使用到。您可能没有想到,在很多服务器上 SSHD 也是很少被真正访问到的。花费在启动这些服务上的时间是不必要的;同样,花费在这些服务上的系统资源也是一种浪费。
Systemd 可以提供按需启动的能力,只有在某个服务被真正请求的时候才启动它。当该服务结束,systemd 可以关闭它,等待下次需要时再次启动它。

  • 采用linux的cgroup特性跟踪和管理进程的生命周期

init 系统的一个重要职责就是负责跟踪和管理服务进程的生命周期。它不仅可以启动一个服务,也必须也能够停止服务。这看上去没有什么特别的,然而在真正用代码实现的时候,您或许会发现停止服务比一开始想的要困难。
服务进程一般都会作为精灵进程(daemon)在后台运行,为此服务程序有时候会派生(fork)两次。在 UpStart 中,需要在配置文件中正确地配置 expect 小节。这样 UpStart 通过对 fork 系统调用进行计数,从而获知真正的精灵进程的 PID 号.如果 UpStart 找错了,将 p1作为服务进程的 Pid,那么停止服务的时候,UpStart 会试图杀死 p1进程,而真正的 p1``进程则继续执行。换句话说该服务就失去控制了。
还有更加特殊的情况。比如,一个 CGI 程序会派生两次,从而脱离了和 Apache 的父子关系。当 Apache 进程被停止后,该 CGI 程序还在继续运行。而我们希望服务停止后,所有由它所启动的相关进程也被停止。
为了处理这类问题,UpStart 通过 strace 来跟踪 fork、exit 等系统调用,但是这种方法很笨拙,且缺乏可扩展性。systemd 则利用了 Linux 内核的特性即 CGroup 来完成跟踪的任务。当停止服务时,通过查询 CGroup,systemd 可以确保找到所有的相关进程,从而干净地停止服务。
CGroup 已经出现了很久,它主要用来实现系统资源配额管理。CGroup 提供了类似文件系统的接口,使用方便。当进程创建子进程时,子进程会继承父进程的 CGroup。因此无论服务如何启动新的子进程,所有的这些相关进程都会属于同一个 CGroup,systemd 只需要简单地遍历指定的 CGroup 即可正确地找到所有的相关进程,将它们一一停止即可。

  • 启动挂载点自动挂载的管理

传统的 Linux 系统中,用户可以用/etc/fstab 文件来维护固定的文件系统挂载点。这些挂载点在系统启动过程中被自动挂载,一旦启动过程结束,这些挂载点就会确保存在。这些挂载点都是对系统运行至关重要的文件系统,比如 HOME 目录。和 sysvinit 一样,Systemd 管理这些挂载点,以便能够在系统启动时自动挂载它们。Systemd 还兼容/etc/fstab 文件,您可以继续使用该文件管理挂载点。
有时候用户还需要动态挂载点,比如打算访问 DVD 内容时,才临时执行挂载以便访问其中的内容,而不访问光盘时该挂载点被取消(umount),以便节约资源。传统地,人们依赖 autofs 服务来实现这种功能。
Systemd 内建了自动挂载服务,无需另外安装 autofs 服务,可以直接使用 systemd 提供的自动挂载管理能力来实现 autofs 的功能。

  • 实现事务性依赖关系管理

系统启动过程是由很多的独立工作共同组成的,这些工作之间可能存在依赖关系,比如挂载一个 NFS 文件系统必须依赖网络能够正常工作。Systemd 虽然能够最大限度地并发执行很多有依赖关系的工作,但是类似"挂载 NFS"和"启动网络"这样的工作还是存在天生的先后依赖关系,无法并发执行。对于这些任务,systemd 维护一个"事务一致性"的概念,保证所有相关的服务都可以正常启动而不会出现互相依赖,以至于死锁的情况。

  • 能够对系统进行快照和恢复

systemd 支持按需启动,因此系统的运行状态是动态变化的,人们无法准确地知道系统当前运行了哪些服务。Systemd 快照提供了一种将当前系统运行状态保存并恢复的能力。
比如系统当前正运行服务 A 和 B,可以用 systemd 命令行对当前系统运行状况创建快照。然后将进程 A 停止,或者做其他的任意的对系统的改变,比如启动新的进程 C。在这些改变之后,运行 systemd 的快照恢复命令,就可立即将系统恢复到快照时刻的状态,即只有服务 A,B 在运行。一个可能的应用场景是调试:比如服务器出现一些异常,为了调试用户将当前状态保存为快照,然后可以进行任意的操作,比如停止服务等等。等调试结束,恢复快照即可。
这个快照功能目前在 systemd 中并不完善,似乎开发人员也没有特别关注它,因此有报告指出它还存在一些使用上的问题,使用时尚需慎重。

  • 日志服务
    • 简单性:代码少,依赖少,抽象开销最小
    • 零维护:日志是除错和监控系统的核心功能,因此它自己不能再产生问题。举例说,自动管理磁盘空间,避免由于日志的不断产生而将磁盘空间耗尽。
    • 移植性:日志 文件应该在所有类型的 Linux 系统上可用,无论它使用的何种 CPU 或者字节序。
    • 性能:添加和浏览 日志 非常快
    • 最小资源占用:日志 数据文件需要较小
    • 统一化:各种不同的日志存储技术应该统一起来,将所有的可记录事件保存在同一个数据存储中。所以日志内容的全局上下文都会被保存并且可供日后查询。例如一条固件记录后通常会跟随一条内核记录,最终还会有一条用户态记录。重要的是当保存到硬盘上时这三者之间的关系不会丢失。Syslog 将不同的信息保存到不同的文件中,分析的时候很难确定哪些条目是相关的
    • 扩展性:日志的适用范围很广,从嵌入式设备到超级计算机集群都可以满足需求
    • 安全性:日志 文件是可以验证的,让无法检测的修改不再可能
  • 能向后SysV的服务脚本

Systemd的基本概念

System单元的概念

系统初始化需要做的事情非常多。需要启动后台服务,比如启动 SSHD 服务;需要做配置工作,比如挂载文件系统。这个过程中的每一步都被 systemd 抽象为一个配置单元,即 unit。可以认为一个服务是一个配置单元;一个挂载点是一个配置单元;一个交换分区的配置是一个配置单元;等等。systemd 将配置单元归纳为以下一些不同的类型

单元的常见类型
  • service unit : 文件扩展名为.service,用于定义系统类服务
  • target unit : 文件扩展为.target,用于实现模拟"运行级别"
  • device unit : 文件扩展为.device,用于定义内核识别的设备。
  • mount unit : 文件扩展为.mount,定义文件系统挂载点,利用logind服务,为用户的会话进程分配CGroup资源
  • socket unit : 文件扩展为.socket,用于标识进程间通信的socket文件
  • snapshot unit : 文件扩展为.snapshot,管理系统快照
  • swap unit : 文件扩展为.swap,用于标识swap设备
  • automount unit : 文件扩展为.automount,文件系统自动挂载设备
  • path unit : 文件扩展为.path,用于定义文件系统中的一个文件或目录
  • timer unit : 文件扩展为.timer,定时器配置单元,用来定时触发用户定义的操作,这类配置单元取代了atd、crond等传统的定时服务
Target和运行级别的对应关系
  • sysvinit和systemd目标的对应表
sysvinit systemd target 备注
0 poweroff.target 关闭系统
1,s,single rescue.target 单用户模式
2,4 multi-user.target 用户定义/域特定运行级别。默认等同于 3
3 multi-user.target 多用户,非图形化界面
5 graphical.target 多用户,图形化界面
6 reboot.target 重启
emergency emergency.target 紧急shell

Systemd的并发启动原理

  • 并发启动原理之一:解决socket依赖

绝大多数的服务依赖是套接字依赖。比如服务 A 通过一个套接字端口 S1 提供自己的服务,其他的服务如果需要服务 A,则需要连接 S1。因此如果服务 A 尚未启动,S1 就不存在,其他的服务就会得到启动错误。所以传统地,人们需要先启动服务 A,等待它进入就绪状态,再启动其他需要它的服务。Systemd 认为,只要我们预先把 S1 建立好,那么其他所有的服务就可以同时启动而无需等待服务 A 来创建 S1 了。如果服务 A 尚未启动,那么其他进程向 S1 发送的服务请求实际上会被 Linux 操作系统缓存,其他进程会在这个请求的地方等待。一旦服务 A 启动就绪,就可以立即处理缓存的请求,一切都开始正常运行。
那么服务如何使用由 init 进程创建的套接字呢?
Linux 操作系统有一个特性,当进程调用 fork 或者 exec 创建子进程之后,所有在父进程中被打开的文件句柄 (file descriptor) 都被子进程所继承。套接字也是一种文件句柄,进程 A 可以创建一个套接字,此后当进程 A 调用 exec 启动一个新的子进程时,只要确保该套接字的 close_on_exec 标志位被清空,那么新的子进程就可以继承这个套接字。子进程看到的套接字和父进程创建的套接字是同一个系统套接字,就仿佛这个套接字是子进程自己创建的一样,没有任何区别。
这个特性以前被一个叫做 inetd 的系统服务所利用。Inetd 进程会负责监控一些常用套接字端口,比如 Telnet,当该端口有连接请求时,inetd 才启动 telnetd 进程,并把有连接的套接字传递给新的 telnetd 进程进行处理。这样,当系统没有 telnet 客户端连接时,就不需要启动 telnetd 进程。Inetd 可以代理很多的网络服务,这样就可以节约很多的系统负载和内存资源,只有当有真正的连接请求时才启动相应服务,并把套接字传递给相应的服务进程。
和 inetd 类似,systemd 是所有其他进程的父进程,它可以先建立所有需要的套接字,然后在调用 exec 的时候将该套接字传递给新的服务进程,而新进程直接使用该套接字进行服务即可。

  • 解决D-bus依赖

D-Bus 是 desktop-bus 的简称,是一个低延迟、低开销、高可用性的进程间通信机制。它越来越多地用于应用程序之间通信,也用于应用程序和操作系统内核之间的通信。很多现代的服务进程都使用D-Bus 取代套接字作为进程间通信机制,对外提供服务。比如简化 Linux 网络配置的 NetworkManager 服务就使用 D-Bus 和其他的应用程序或者服务进行交互:邮件客户端软件 evolution 可以通过 D-Bus 从 NetworkManager 服务获取网络状态的改变,以便做出相应的处理。
D-Bus 支持所谓"bus activation"功能。如果服务 A 需要使用服务 B 的 D-Bus 服务,而服务 B 并没有运行,则 D-Bus 可以在服务 A 请求服务 B 的 D-Bus 时自动启动服务 B。而服务 A 发出的请求会被 D-Bus 缓存,服务 A 会等待服务 B 启动就绪。利用这个特性,依赖 D-Bus 的服务就可以实现并行启动。

  • 解决文件系统依赖

系统启动过程中,文件系统相关的活动是最耗时的,比如挂载文件系统,对文件系统进行磁盘检查(fsck),磁盘配额检查等都是非常耗时的操作。在等待这些工作完成的同时,系统处于空闲状态。那些想使用文件系统的服务似乎必须等待文件系统初始化完成才可以启动。但是 systemd 发现这种依赖也是可以避免的。
Systemd 参考了 autofs 的设计思路,使得依赖文件系统的服务和文件系统本身初始化两者可以并发工作。autofs 可以监测到某个文件系统挂载点真正被访问到的时候才触发挂载操作,这是通过内核 automounter 模块的支持而实现的。比如一个 open()系统调用作用在"/misc/cd/file1"的时候,/misc/cd 尚未执行挂载操作,此时 open()调用被挂起等待,Linux 内核通知 autofs,autofs 执行挂载。这时候,控制权返回给 open()系统调用,并正常打开文件。
Systemd 集成了 autofs 的实现,对于系统中的挂载点,比如/home,当系统启动的时候,systemd 为其创建一个临时的自动挂载点。在这个时刻/home 真正的挂载设备尚未启动好,真正的挂载操作还没有执行,文件系统检测也还没有完成。可是那些依赖该目录的进程已经可以并发启动,他们的 open()操作被内建在 systemd 中的 autofs 捕获,将该 open()调用挂起(可中断睡眠状态)。然后等待真正的挂载操作完成,文件系统检测也完成后,systemd 将该自动挂载点替换为真正的挂载点,并让 open()调用返回。由此,实现了那些依赖于文件系统的服务和文件系统本身同时并发启动。
当然对于"/"根目录的依赖实际上一定还是要串行执行,因为 systemd 自己也存放在/之下,必须等待系统根目录挂载检查好。
不过对于类似/home 等挂载点,这种并发可以提高系统的启动速度,尤其是当/home 是远程的 NFS 节点,或者是加密盘等,需要耗费较长的时间才可以准备就绪的情况下,因为并发启动,这段时间内,系统并不是完全无事可做,而是可以利用这段空余时间做更多的启动进程的事情,总的来说就缩短了系统启动时间。

  • 服务的循环依赖

Systemd 能保证事务完整性。Systemd 的事务概念和数据库中的有所不同,主要是为了保证多个依赖的配置单元之间没有环形引用,存在循环依赖,那么 systemd 将无法启动任意一个服务。此时 systemd 将会尝试解决这个问题,因为配置单元之间的依赖关系有两种:required 是强依赖;want 则是弱依赖,systemd 将去掉 wants 关键字指定的依赖看看是否能打破循环。如果无法修复,systemd 会报错。Systemd 能够自动检测和修复这类配置错误,极大地减轻了管理员的排错负担

  • 基于path激活机制

判断一个文件在不在, 如果在可以立即激活一个进程或服务

SysVinit与systemd管理命令对比

项目|sysvinit | systemd | 备注|
---------|----------------|----------|
启动|service NAME start | systemctl start NAME.service|
停止|service NAME stop | systemctl stop NAME.service|
重启|service NAME restart| systemctl restart NAME.service|
状态查看|service NAME status|systemctl status NAME.service|
条件式重启|service NAME condrestart |systemctl condrestart NAME.service|如果服务运行就重启
重载或重启服务|---|systemctl reload-or-restart NAME.service|如果支持reload就reload,不然就重启|
重载或条件式重启服务|----|systemctl reload-or-restart NAME.service|
查看某服务当前激活与否的状态|---|systemctl is-active NAME.service|
查看所有已激活的服务|chkconfig --list | systemctl list-units -t service|
查看所有服务(已激活及未激活)|--|systemctl list-units -t service -a|
设置服务开机自启| chkconfig NAME on | systemctl enable NAME.service|
禁止服务开机自启| chkconfig NAME off | systemctl disable NAME.service|
查看某服务是否能开机启动| chkconfig --list NAME | systemctl is-enabled NAME.service|
禁止某服务设定为开机自启|---|systemctl mask NAME.service|
取消禁止某服务开机自启|---| systemctl unmask NAME.service|
查看服务的依赖关系|---| systemctl list-dependencies NAME.service| |
修改默认运行级别|修改/etc/inittab文件| systemctl set-default NAME.target|将/usr/lib/systemd/system/的文件连接至/etc/systemd/system/目录中|
切换系统运行级别| init RUNLEVEL | systemctl isolate NAME.target|
查看目前的运行级别|runlevel,who -r| systemctl get-default |

systemd电源管理命令

命令 操作
systemctl reboot 重启机器
systemctl poweroff 关机
systemctl suspend 挂起
systemctl hibernate 休眠
systemctl hybrid 混合休眠模式(快照并挂起)

service unit file的配置说明:

文件通常由三部分组成:
  • [Unit] : 定义与unit类型无关的通用选项,用于提供当前unit的描述信息,unit行为及依赖关系等
  • [Install] :定义由systemctl enable或systemctl disable命令在实现服务启用或禁用时用到的选项
    unit段的常用选项:
    Description: 描述信息;意义性描述
    After : 定义unit的启动次序,表示当前unit应该晚于那些unit启动,其功能与before相反
    Requies : 依赖到的其它units,强依赖,被依赖的units无法激活时,当前unit即无法激活
    wants: 指明依赖到的其它units,弱依赖,依赖的不激活,也能激活自己,
    Conflicts: 定义units间的冲突关系
    service段的常用选项:
    type:用于定义影响execstart及相关参数的功能的unit进程启动类型
    simple: 由execstart启动的命令为主进程
    forking: 由execstart启动的命令,其中一个子进程会成为主进程,父进程会退出
    onehot: 功能类simple
    dubs
    notify: 类似于simple
    idle : 
    environmentfile:启动时环境配置文件,为execstart提供变量
    execstart :指明启动unit要运行的命令或脚本,execstartpre ,execstartpost
    execreload
    execstop: 指明停止unit要运行的命令或脚本
    restart : 
    Install 段的常用选项
    alias
    requireby: 被哪些units所依赖
    wantsby : 被那些units所依赖
注意:对于新创建的unit文件或修改了unit文件,要通知systemd重载配置文件
  • systemctl daemon-reload

systemd的相关配置文件路径

  • /usr/lib/systemd/system
  • /run/systemd/system
  • /etc/systemd/system

推荐阅读更多精彩内容

  • 最近在研究Docker的源码.读到ApiServer的启动过程时,发现其有一个新的概念,叫做service act...
  • tl;dr应用场景:对日常系统启动过程进行管理,优化启动速度。 1. systemd原理 1.1 基础概念-Uni...
  • linux资料总章2.1 1.0写的不好抱歉 但是2.0已经改了很多 但是错误还是无法避免 以后资料会慢慢更新 大...
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...