2016年3月9日星期三

阮一峰的网络日志

阮一峰的网络日志


Systemd 入门教程:实战篇

Posted: 08 Mar 2016 05:51 AM PST

上一篇文章,我介绍了 Systemd 的主要命令,今天介绍如何使用它完成一些基本的任务。

一、开机启动

对于那些支持 Systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件。

如果你想让该软件开机启动,就执行下面的命令(以httpd.service为例)。

 $ sudo systemctl enable httpd 

上面的命令相当于在/etc/systemd/system目录添加一个符号链接,指向/usr/lib/systemd/system里面的httpd.service文件。

这是因为开机时,Systemd只执行/etc/systemd/system目录里面的配置文件。这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。

二、启动服务

设置开机启动以后,软件并不会立即启动,必须等到下一次开机。如果想现在就运行该软件,那么要执行systemctl start命令。

 $ sudo systemctl start httpd 

执行上面的命令以后,有可能启动失败,因此要用systemctl status命令查看一下该服务的状态。

 $ sudo systemctl status httpd  httpd.service - The Apache HTTP Server    Loaded: loaded (/usr/lib/systemd/system/httpd.service; enabled)    Active: active (running) since 金 2014-12-05 12:18:22 JST; 7min ago  Main PID: 4349 (httpd)    Status: "Total requests: 1; Current requests/sec: 0; Current traffic:   0 B/sec"    CGroup: /system.slice/httpd.service            ├─4349 /usr/sbin/httpd -DFOREGROUND            ├─4350 /usr/sbin/httpd -DFOREGROUND            ├─4351 /usr/sbin/httpd -DFOREGROUND            ├─4352 /usr/sbin/httpd -DFOREGROUND            ├─4353 /usr/sbin/httpd -DFOREGROUND            └─4354 /usr/sbin/httpd -DFOREGROUND  12月 05 12:18:22 localhost.localdomain systemd[1]: Starting The Apache HTTP Server... 12月 05 12:18:22 localhost.localdomain systemd[1]: Started The Apache HTTP Server. 12月 05 12:22:40 localhost.localdomain systemd[1]: Started The Apache HTTP Server. 

上面的输出结果含义如下。

  • Loaded行:配置文件的位置,是否设为开机启动
  • Active行:表示正在运行
  • Main PID行:主进程ID
  • Status行:由应用本身(这里是 httpd )提供的软件当前状态
  • CGroup块:应用的所有子进程
  • 日志块:应用的日志

三、停止服务

终止正在运行的服务,需要执行systemctl stop命令。

 $ sudo systemctl stop httpd.service 

有时候,该命令可能没有响应,服务停不下来。这时候就不得不"杀进程"了,向正在运行的进程发出kill信号。

 $ sudo systemctl kill httpd.service 

此外,重启服务要执行systemctl restart命令。

 $ sudo systemctl restart httpd.service 

四、读懂配置文件

一个服务怎么启动,完全由它的配置文件决定。下面就来看,配置文件有些什么内容。

前面说过,配置文件主要放在/usr/lib/systemd/system目录,也可能在/etc/systemd/system目录。找到配置文件以后,使用文本编辑器打开即可。

systemctl cat命令可以用来查看配置文件,下面以sshd.service文件为例,它的作用是启动一个 SSH 服务器,供其他用户以 SSH 方式登录。

 $ systemctl cat sshd.service  [Unit] Description=OpenSSH server daemon Documentation=man:sshd(8) man:sshd_config(5) After=network.target sshd-keygen.service Wants=sshd-keygen.service  [Service] EnvironmentFile=/etc/sysconfig/sshd ExecStart=/usr/sbin/sshd -D $OPTIONS ExecReload=/bin/kill -HUP $MAINPID Type=simple KillMode=process Restart=on-failure RestartSec=42s  [Install] WantedBy=multi-user.target 

可以看到,配置文件分成几个区块,每个区块包含若干条键值对。

下面依次解释每个区块的内容。

五、 [Unit] 区块:启动顺序与依赖关系。

Unit区块的Description字段给出当前服务的简单描述,Documentation字段给出文档位置。

接下来的设置是启动顺序和依赖关系,这个比较重要。

After字段:表示如果network.targetsshd-keygen.service需要启动,那么sshd.service应该在它们之后启动。

相应地,还有一个Before字段,定义sshd.service应该在哪些服务之前启动。

注意,AfterBefore字段只涉及启动顺序,不涉及依赖关系。

举例来说,某 Web 应用需要 postgresql 数据库储存数据。在配置文件中,它只定义要在 postgresql 之后启动,而没有定义依赖 postgresql 。上线后,由于某种原因,postgresql 需要重新启动,在停止服务期间,该 Web 应用就会无法建立数据库连接。

设置依赖关系,需要使用Wants字段和Requires字段。

Wants字段:表示sshd.servicesshd-keygen.service之间存在"弱依赖"关系,即如果"sshd-keygen.service"启动失败或停止运行,不影响sshd.service继续执行。

Requires字段则表示"强依赖"关系,即如果该服务启动失败或异常退出,那么sshd.service也必须退出。

注意,Wants字段与Requires字段只涉及依赖关系,与启动顺序无关,默认情况下是同时启动的。

六、[Service] 区块:启动行为

Service区块定义如何启动当前服务。

6.1 启动命令

许多软件都有自己的环境参数文件,该文件可以用EnvironmentFile字段读取。

EnvironmentFile字段:指定当前服务的环境参数文件。该文件内部的key=value键值对,可以用$key的形式,在当前配置文件中获取。

上面的例子中,sshd 的环境参数文件是/etc/sysconfig/sshd

配置文件里面最重要的字段是ExecStart

ExecStart字段:定义启动进程时执行的命令。

上面的例子中,启动sshd,执行的命令是/usr/sbin/sshd -D $OPTIONS,其中的变量$OPTIONS就来自EnvironmentFile字段指定的环境参数文件。

与之作用相似的,还有如下这些字段。

  • ExecReload字段:重启服务时执行的命令
  • ExecStop字段:停止服务时执行的命令
  • ExecStartPre字段:启动服务之前执行的命令
  • ExecStartPost字段:启动服务之后执行的命令
  • ExecStopPost字段:停止服务之后执行的命令

请看下面的例子。

 [Service] ExecStart=/bin/echo execstart1 ExecStart= ExecStart=/bin/echo execstart2 ExecStartPost=/bin/echo post1 ExecStartPost=/bin/echo post2 

上面这个配置文件,第二行ExecStart设为空值,等于取消了第一行的设置,运行结果如下。

 execstart2 post1 post2 

所有的启动设置之前,都可以加上一个连词号(-),表示"抑制错误",即发生错误的时候,不影响其他命令的执行。比如,EnvironmentFile=-/etc/sysconfig/sshd(注意等号后面的那个连词号),就表示即使/etc/sysconfig/sshd文件不存在,也不会抛出错误。

6.2 启动类型

Type字段定义启动类型。它可以设置的值如下。

  • simple(默认值):ExecStart字段启动的进程为主进程
  • forking:ExecStart字段将以fork()方式启动,此时父进程将会退出,子进程将成为主进程
  • oneshot:类似于simple,但只执行一次,Systemd 会等它执行完,才启动其他服务
  • dbus:类似于simple,但会等待 D-Bus 信号后启动
  • notify:类似于simple,启动结束后会发出通知信号,然后 Systemd 再启动其他服务
  • idle:类似于simple,但是要等到其他任务都执行完,才会启动该服务。一种使用场合是为让该服务的输出,不与其他服务的输出相混合

下面是一个oneshot的例子,笔记本电脑启动时,要把触摸板关掉,配置文件可以这样写。

 [Unit] Description=Switch-off Touchpad  [Service] Type=oneshot ExecStart=/usr/bin/touchpad-off  [Install] WantedBy=multi-user.target 

上面的配置文件,启动类型设为oneshot,就表明这个服务只要运行一次就够了,不需要长期运行。

如果关闭以后,将来某个时候还想打开,配置文件修改如下。

 [Unit] Description=Switch-off Touchpad  [Service] Type=oneshot ExecStart=/usr/bin/touchpad-off start ExecStop=/usr/bin/touchpad-off stop RemainAfterExit=yes  [Install] WantedBy=multi-user.target 

上面配置文件中,RemainAfterExit字段设为yes,表示进程退出以后,服务仍然保持执行。这样的话,一旦使用systemctl stop命令停止服务,ExecStop指定的命令就会执行,从而重新开启触摸板。

6.3 重启行为

Service区块有一些字段,定义了重启行为。

KillMode字段:定义 Systemd 如何停止 sshd 服务。

上面这个例子中,将KillMode设为process,表示只停止主进程,不停止任何sshd 子进程,即子进程打开的 SSH session 仍然保持连接。这个设置不太常见,但对 sshd 很重要,否则你停止服务的时候,会连自己打开的 SSH session 一起杀掉。

KillMode字段可以设置的值如下。

  • control-group(默认值):当前控制组里面的所有子进程,都会被杀掉
  • process:只杀主进程
  • mixed:主进程将收到 SIGTERM 信号,子进程收到 SIGKILL 信号
  • none:没有进程会被杀掉,只是执行服务的 stop 命令。

接下来是Restart字段。

Restart字段:定义了 sshd 退出后,Systemd 的重启方式。

上面的例子中,Restart设为on-failure,表示任何意外的失败,就将重启sshd。如果 sshd 正常停止(比如执行systemctl stop命令),它就不会重启。

Restart字段可以设置的值如下。

  • no(默认值):退出后不会重启
  • on-success:只有正常退出时(退出状态码为0),才会重启
  • on-failure:非正常退出时(退出状态码非0),包括被信号终止和超时,才会重启
  • on-abnormal:只有被信号终止和超时,才会重启
  • on-abort:只有在收到没有捕捉到的信号终止时,才会重启
  • on-watchdog:超时退出,才会重启
  • always:不管是什么退出原因,总是重启

对于守护进程,推荐设为on-failure。对于那些允许发生错误退出的服务,可以设为on-abnormal

最后是RestartSec字段。

RestartSec字段:表示 Systemd 重启服务之前,需要等待的秒数。上面的例子设为等待42秒。

七、[Install] 区块

Install区块,定义如何安装这个配置文件,即怎样做到开机启动。

WantedBy字段:表示该服务所在的 Target。

Target的含义是服务组,表示一组服务。WantedBy=multi-user.target指的是,sshd 所在的 Target 是multi-user.target

这个设置非常重要,因为执行systemctl enable sshd.service命令时,sshd.service的一个符号链接,就会放在/etc/systemd/system目录下面的multi-user.target.wants子目录之中。

Systemd 有默认的启动 Target。

 $ systemctl get-default multi-user.target 

上面的结果表示,默认的启动 Target 是multi-user.target。在这个组里的所有服务,都将开机启动。这就是为什么systemctl enable命令能设置开机启动的原因。

使用 Target 的时候,systemctl list-dependencies命令和systemctl isolate命令也很有用。

 # 查看 multi-user.target 包含的所有服务 $ systemctl list-dependencies multi-user.target  # 切换到另一个 target # shutdown.target 就是关机状态 $ sudo systemctl isolate shutdown.target 

一般来说,常用的 Target 有两个:一个是multi-user.target,表示多用户命令行状态;另一个是graphical.target,表示图形用户状态,它依赖于multi-user.target

八、Target 的配置文件

Target 也有自己的配置文件。

 $ systemctl cat multi-user.target  [Unit] Description=Multi-User System Documentation=man:systemd.special(7) Requires=basic.target Conflicts=rescue.service rescue.target After=basic.target rescue.service rescue.target AllowIsolate=yes 

注意,Target 配置文件里面没有启动命令。

上面输出结果中,主要字段含义如下。

Requires字段:要求basic.target一起运行。

Conflicts字段:冲突字段。如果rescue.servicerescue.target正在运行,multi-user.target就不能运行,反之亦然。

After:表示multi-user.targetbasic.targetrescue.servicerescue.target之后启动,如果它们有启动的话。

AllowIsolate:允许使用systemctl isolate命令切换到multi-user.target

九、修改配置文件后重启

修改配置文件以后,需要重新加载配置文件,然后重新启动相关服务。

 # 重新加载配置文件 $ sudo systemctl daemon-reload  # 重启相关服务 $ sudo systemctl restart foobar 

(完)

文档信息

2016年3月7日星期一

阮一峰的网络日志

阮一峰的网络日志


Systemd 入门教程:命令篇

Posted: 06 Mar 2016 10:37 PM PST

Systemd 是 Linux 系统工具,用来启动守护进程,已成为大多数发行版的标准配置。

本文介绍它的基本用法,分为上下两篇。今天介绍它的主要命令,下一篇介绍如何用于实战。

一、由来

历史上,Linux 的启动一直采用init进程。

下面的命令用来启动服务。

 $ sudo /etc/init.d/apache2 start # 或者 $ service apache2 start 

这种方法有两个缺点。

一是启动时间长。init进程是串行启动,只有前一个进程启动完,才会启动下一个进程。

二是启动脚本复杂。init进程只是执行启动脚本,不管其他事情。脚本需要自己处理各种情况,这往往使得脚本变得很长。

二、Systemd 概述

Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套完整的解决方案。

根据 Linux 惯例,字母d是守护进程(daemon)的缩写。 Systemd 这个名字的含义,就是它要守护整个系统。

(上图为 Systemd 作者 Lennart Poettering

使用了 Systemd,就不需要再用init了。Systemd 取代了initd,成为系统的第一个进程(PID 等于 1),其他进程都是它的子进程。

 $ systemctl --version 

上面的命令查看 Systemd 的版本。

Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂。事实上,现在还有很多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反"keep simple, keep stupid"的Unix 哲学

(上图为 Systemd 架构图)

三、系统管理

Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。

3.1 systemctl

systemctl是 Systemd 的主命令,用于管理系统。

 # 重启系统 $ sudo systemctl reboot  # 关闭系统,切断电源 $ sudo systemctl poweroff  # CPU停止工作 $ sudo systemctl halt  # 暂停系统 $ sudo systemctl suspend  # 让系统进入冬眠状态 $ sudo systemctl hibernate  # 让系统进入交互式休眠状态 $ sudo systemctl hybrid-sleep  # 启动进入救援状态(单用户状态) $ sudo systemctl rescue 

3.2 systemd-analyze

systemd-analyze命令用于查看启动耗时。

 # 查看启动耗时 $ systemd-analyze                                                                                         # 查看每个服务的启动耗时 $ systemd-analyze blame  # 显示瀑布状的启动过程流 $ systemd-analyze critical-chain  # 显示指定服务的启动流 $ systemd-analyze critical-chain atd.service 

3.3 hostnamectl

hostnamectl命令用于查看当前主机的信息。

 # 显示当前主机的信息 $ hostnamectl  # 设置主机名。 $ sudo hostnamectl set-hostname rhel7 

3.4 localectl

localectl命令用于查看本地化设置。

 # 查看本地化设置 $ localectl  # 设置本地化参数。 $ sudo localectl set-locale LANG=en_GB.utf8 $ sudo localectl set-keymap en_GB 

3.5 timedatectl

timedatectl命令用于查看当前时区设置。

 # 查看当前时区设置 $ timedatectl  # 显示所有可用的时区 $ timedatectl list-timezones                                                                                     # 设置当前时区 $ sudo timedatectl set-timezone America/New_York $ sudo timedatectl set-time YYYY-MM-DD $ sudo timedatectl set-time HH:MM:SS 

3.6 loginctl

loginctl命令用于查看当前登录的用户。

 # 列出当前session $ loginctl list-sessions  # 列出当前登录用户 $ loginctl list-users  # 列出显示指定用户的信息 $ loginctl show-user ruanyf 

四、Unit

4.1 含义

Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单位)。

Unit 一共分成12种。

  • Service unit:系统服务
  • Target unit:多个 Unit 构成的一个组
  • Device Unit:硬件设备
  • Mount Unit:文件系统的挂载点
  • Automount Unit:自动挂载点
  • Path Unit:文件或路径
  • Scope Unit:不是由 Systemd 启动的外部进程
  • Slice Unit:进程组
  • Snapshot Unit:Systemd 快照,可以切回某个快照
  • Socket Unit:进程间通信的 socket
  • Swap Unit:swap 文件
  • Timer Unit:定时器

systemctl list-units命令可以查看当前系统的所有 Unit 。

 # 列出正在运行的 Unit $ systemctl list-units  # 列出所有Unit,包括没有找到配置文件的或者启动失败的 $ systemctl list-units --all  # 列出所有没有运行的 Unit $ systemctl list-units --all --state=inactive  # 列出所有加载失败的 Unit $ systemctl list-units --failed  # 列出所有正在运行的、类型为 service 的 Unit $ systemctl list-units --type=service 

4.2 Unit 的状态

systemctl status命令用于查看系统状态和单个 Unit 的状态。

 # 显示系统状态 $ systemctl status  # 显示单个 Unit 的状态 $ sysystemctl status bluetooth.service  # 显示远程主机的某个 Unit 的状态 $ systemctl -H root@rhel7.example.com status httpd.service 

除了status命令,systemctl还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。

 # 显示某个 Unit 是否正在运行 $ systemctl is-active application.service  # 显示某个 Unit 是否处于启动失败状态 $ systemctl is-failed application.service  # 显示某个 Unit 服务是否建立了启动链接 $ systemctl is-enabled application.service 

4.3 Unit 管理

对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)。

 # 立即启动一个服务 $ sudo systemctl start apache.service  # 立即停止一个服务 $ sudo systemctl stop apache.service  # 重启一个服务 $ sudo systemctl restart apache.service  # 杀死一个服务的所有子进程 $ sudo systemctl kill apache.service  # 重新加载一个服务的配置文件 $ sudo systemctl reload apache.service  # 重载所有修改过的配置文件 $ sudo systemctl daemon-reload  # 显示某个 Unit 的所有底层参数 $ systemctl show httpd.service  # 显示某个 Unit 的指定属性的值 $ systemctl show -p CPUShares httpd.service  # 设置某个 Unit 的指定属性 $ sudo systemctl set-property httpd.service CPUShares=500 

4.4 依赖关系

Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。

systemctl list-dependencies命令列出一个 Unit 的所有依赖。

 $ systemctl list-dependencies nginx.service 

上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示。如果要展开 Target,就需要使用--all参数。

 $ systemctl list-dependencies --all nginx.service 

五、Unit 的配置文件

5.1 概述

每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit 。

Systemd 默认从目录/etc/systemd/system/读取配置文件。但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/,真正的配置文件存放在那个目录。

systemctl enable命令用于在上面两个目录之间,建立符号链接关系。

 $ sudo systemctl enable clamd@scan.service # 等同于 $ sudo ln -s '/usr/lib/systemd/system/clamd@scan.service' '/etc/systemd/system/multi-user.target.wants/clamd@scan.service' 

如果配置文件里面设置了开机启动,systemctl enable命令相当于激活开机启动。

与之对应的,systemctl disable命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。

 $ sudo systemctl disable clamd@scan.service 

配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket。如果省略,Systemd 默认后缀名为.service,所以sshd会被理解成sshd.service

5.2 配置文件的状态

systemctl list-unit-files命令用于列出所有配置文件。

 # 列出所有配置文件 $ systemctl list-unit-files  # 列出指定类型的配置文件 $ systemctl list-unit-files --type=service 

这个命令会输出一个列表。

 $ systemctl list-unit-files  UNIT FILE              STATE chronyd.service        enabled clamd@.service         static clamd@scan.service     disabled 

这个列表显示每个配置文件的状态,一共有四种。

  • enabled:已建立启动链接
  • disabled:没建立启动链接
  • static:该配置文件没有[Install]部分(无法执行),只能作为其他配置文件的依赖
  • masked:该配置文件被禁止建立启动链接

注意,从配置文件的状态无法看出,该 Unit 是否正在运行。这必须执行前面提到的systemctl status命令。

 $ systemctl status bluetooth.service 

一旦修改配置文件,就要让 SystemD 重新加载配置文件,然后重新启动,否则修改不会生效。

 $ sudo systemctl daemon-reload $ sudo systemctl restart httpd.service 

5.3 配置文件的格式

配置文件就是普通的文本文件,可以用文本编辑器打开。

systemctl cat命令可以查看配置文件的内容。

 $ systemctl cat atd.service  [Unit] Description=ATD daemon  [Service] Type=forking ExecStart=/usr/bin/atd  [Install] WantedBy=multi-user.target 

从上面的输出可以看到,配置文件分成几个区块。每个区块的第一行,是用方括号表示的区别名,比如[Unit]。注意,配置文件的区块名和字段名,都是大小写敏感的。

每个区块内部是一些等号连接的键值对。

 [Section] Directive1=value Directive2=value  . . . 

注意,键值对的等号两侧不能有空格。

5.4 配置文件的区块

[Unit]区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系。它的主要字段如下。

  • Description:简短描述
  • Documentation:文档地址
  • Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败
  • Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败
  • BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行
  • Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动
  • After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动
  • Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行
  • Condition...:当前 Unit 运行必须满足的条件,否则不会运行
  • Assert...:当前 Unit 运行必须满足的条件,否则会报启动失败

[Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。它的主要字段如下。

  • WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中
  • RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
  • Alias:当前 Unit 可用于启动的别名
  • Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。

  • Type:定义启动时的进程行为。它有以下几种值。
  • Type=simple:默认值,执行ExecStart指定的命令,启动主进程
  • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
  • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
  • Type=dbus:当前服务通过D-Bus启动
  • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
  • Type=idle:若有其他任务执行完毕,当前服务才会运行
  • ExecStart:启动当前服务的命令
  • ExecStartPre:启动当前服务之前执行的命令
  • ExecStartPost:启动当前服务之后执行的命令
  • ExecReload:重启当前服务时执行的命令
  • ExecStop:停止当前服务时执行的命令
  • ExecStopPost:停止当其服务之后执行的命令
  • RestartSec:自动重启当前服务间隔的秒数
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启)、on-successon-failureon-abnormalon-aborton-watchdog
  • TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数
  • Environment:指定环境变量

Unit 配置文件的完整字段清单,请参考官方文档

六、Target

启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。

简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。

传统的init启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。

 # 查看当前系统的所有 Target $ systemctl list-unit-files --type=target  # 查看一个 Target 包含的所有 Unit $ systemctl list-dependencies multi-user.target  # 查看启动时的默认 Target $ systemctl get-default  # 设置启动时的默认 Target $ sudo systemctl set-default multi-user.target  # 切换 Target 时,默认不关闭前一个 Target 启动的进程, # systemctl isolate 命令改变这种行为, # 关闭前一个 Target 里面所有不属于后一个 Target 的进程 $ sudo systemctl isolate multi-user.target 

Target 与 传统 RunLevel 的对应关系如下。

 Traditional runlevel      New target name     Symbolically linked to...  Runlevel 0           |    runlevel0.target -> poweroff.target Runlevel 1           |    runlevel1.target -> rescue.target Runlevel 2           |    runlevel2.target -> multi-user.target Runlevel 3           |    runlevel3.target -> multi-user.target Runlevel 4           |    runlevel4.target -> multi-user.target Runlevel 5           |    runlevel5.target -> graphical.target Runlevel 6           |    runlevel6.target -> reboot.target 

它与init进程的主要差别如下。

(1)默认的 RunLevel(在/etc/inittab文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target,通常符号链接到graphical.target(图形界面)或者multi-user.target(多用户命令行)。

(2)启动脚本的位置,以前是/etc/init.d目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d/etc/rc5.d等),现在则存放在/lib/systemd/system/etc/systemd/system目录。

(3)配置文件的位置,以前init进程的配置文件是/etc/inittab,各种服务的配置文件存放在/etc/sysconfig目录。现在的配置文件主要存放在/lib/systemd目录,在/etc/systemd目录里面的修改可以覆盖原始设置。

七、日志管理

Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf

journalctl功能强大,用法非常多。

 # 查看所有日志(默认情况下 ,只保存本次启动的日志) $ sudo journalctl  # 查看内核日志(不显示应用日志) $ sudo journalctl -k  # 查看系统本次启动的日志 $ sudo journalctl -b $ sudo journalctl -b -0  # 查看上一次启动的日志(需更改设置) $ sudo journalctl -b -1  # 查看指定时间的日志 $ sudo journalctl --since="2012-10-30 18:17:16" $ sudo journalctl --since "20 min ago" $ sudo journalctl --since yesterday $ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00" $ sudo journalctl --since 09:00 --until "1 hour ago"  # 显示尾部的最新10行日志 $ sudo journalctl -n  # 显示尾部指定行数的日志 $ sudo journalctl -n 20  # 实时滚动显示最新日志 $ sudo journalctl -f  # 查看指定服务的日志 $ sudo journalctl /usr/lib/systemd/systemd  # 查看指定进程的日志 $ sudo journalctl _PID=1  # 查看某个路径的脚本的日志 $ sudo journalctl /usr/bin/bash  # 查看指定用户的日志 $ sudo journalctl _UID=33 --since today  # 查看某个 Unit 的日志 $ sudo journalctl -u nginx.service $ sudo journalctl -u nginx.service --since today  # 实时滚动显示某个 Unit 的最新日志 $ sudo journalctl -u nginx.service -f  # 合并显示多个 Unit 的日志 $ journalctl -u nginx.service -u php-fpm.service --since today  # 查看指定优先级(及其以上级别)的日志,共有8级 # 0: emerg # 1: alert # 2: crit # 3: err # 4: warning # 5: notice # 6: info # 7: debug $ sudo journalctl -p err -b  # 日志默认分页输出,--no-pager 改为正常的标准输出 $ sudo journalctl --no-pager  # 以 JSON 格式(单行)输出 $ sudo journalctl -b -u nginx.service -o json  # 以 JSON 格式(多行)输出,可读性更好 $ sudo journalctl -b -u nginx.serviceqq  -o json-pretty  # 显示日志占据的硬盘空间 $ sudo journalctl --disk-usage  # 指定日志文件占据的最大空间 $ sudo journalctl --vacuum-size=1G  # 指定日志文件保存多久 $ sudo journalctl --vacuum-time=1years 

(完)

文档信息

2016年2月28日星期日

阮一峰的网络日志

阮一峰的网络日志


Linux 守护进程的启动方法

Posted: 27 Feb 2016 08:30 PM PST

"守护进程"(daemon)就是一直在后台运行的进程(daemon)。

本文介绍如何将一个 Web 应用,启动为守护进程。

一、问题的由来

Web应用写好后,下一件事就是启动,让它一直在后台运行。

这并不容易。举例来说,下面是一个最简单的Node应用server.js,只有6行。

 var http = require('http');  http.createServer(function(req, res) {   res.writeHead(200, {'Content-Type': 'text/plain'});   res.end('Hello World'); }).listen(5000); 

你在命令行下启动它。

 $ node server.js 

看上去一切正常,所有人都能快乐地访问 5000 端口了。但是,一旦你退出命令行窗口,这个应用就一起退出了,无法访问了。

怎么才能让它变成系统的守护进程(daemon),成为一种服务(service),一直在那里运行呢?

二、前台任务与后台任务

上面这样启动的脚本,称为"前台任务"(foreground job)。它会独占命令行窗口,只有运行完了或者手动中止,才能执行其他命令。

变成守护进程的第一步,就是把它改成"后台任务"(background job)。

 $ node server.js & 

只要在命令的尾部加上符号&,启动的进程就会成为"后台任务"。如果要让正在运行的"前台任务"变为"后台任务",可以先按ctrl + z,然后执行bg命令(让最近一个暂停的"后台任务"继续执行)。

"后台任务"有两个特点。

  1. 继承当前 session (对话)的标准输出(stdout)和标准错误(stderr)。因此,后台任务的所有输出依然会同步地在命令行下显示。
  2. 不再继承当前 session 的标准输入(stdin)。你无法向这个任务输入指令了。如果它试图读取标准输入,就会暂停执行(halt)。

可以看到,"后台任务"与"前台任务"的本质区别只有一个:是否继承标准输入。所以,执行后台任务的同时,用户还可以输入其他命令。

三、SIGHUP信号

变为"后台任务"后,一个进程是否就成为了守护进程呢?或者说,用户退出 session 以后,"后台任务"是否还会继续执行?

Linux系统是这样设计的。

  1. 用户准备退出 session
  2. 系统向该 session 发出SIGHUP信号
  3. session 将SIGHUP信号发给所有子进程
  4. 子进程收到SIGHUP信号后,自动退出

上面的流程解释了,为什么"前台任务"会随着 session 的退出而退出:因为它收到了SIGHUP信号。

那么,"后台任务"是否也会收到SIGHUP信号?

这由 Shell 的huponexit参数决定的。

 $ shopt | grep huponexit 

执行上面的命令,就会看到huponexit参数的值。

大多数Linux系统,这个参数默认关闭(off)。因此,session 退出的时候,不会把SIGHUP信号发给"后台任务"。所以,一般来说,"后台任务"不会随着 session 一起退出。

四、disown 命令

通过"后台任务"启动"守护进程"并不保险,因为有的系统的huponexit参数可能是打开的(on)。

更保险的方法是使用disown命令。它可以将指定任务从"后台任务"列表(jobs命令的返回结果)之中移除。一个"后台任务"只要不在这个列表之中,session 就肯定不会向它发出SIGHUP信号。

 $ node server.js & $ disown 

执行上面的命令以后,server.js进程就被移出了"后台任务"列表。你可以执行jobs命令验证,输出结果里面,不会有这个进程。

disown的用法如下。

 # 移出最近一个正在执行的后台任务 $ disown  # 移出所有正在执行的后台任务 $ disown -r  # 移出所有后台任务 $ disown -a  # 不移出后台任务,但是让它们不会收到SIGHUP信号 $ disown -h  # 根据jobId,移出指定的后台任务 $ disown %2 $ disown -h %2 

五、标准 I/O

使用disown命令之后,还有一个问题。那就是,退出 session 以后,如果后台进程与标准I/O有交互,它还是会挂掉。

还是以上面的脚本为例,现在加入一行。

 var http = require('http');  http.createServer(function(req, res) {   console.log('server starts...'); // 加入此行   res.writeHead(200, {'Content-Type': 'text/plain'});   res.end('Hello World'); }).listen(5000); 

启动上面的脚本,然后再执行disown命令。

 $ node server.js & $ disown 

接着,你退出 session,访问5000端口,就会发现连不上。

这是因为"后台任务"的标准 I/O 继承自当前 session,disown命令并没有改变这一点。一旦"后台任务"读写标准 I/O,就会发现它已经不存在了,所以就报错终止执行。

为了解决这个问题,需要对"后台任务"的标准 I/O 进行重定向。

 $ node server.js > stdout.txt 2> stderr.txt < /dev/null & $ disown 

上面这样执行,基本上就没有问题了。

六、nohup 命令

还有比disown更方便的命令,就是nohub

 $ nohup node server.js & 

nohup命令对server.js进程做了三件事。

  • 阻止SIGHUP信号发到这个进程。
  • 关闭标准输入。该进程不再能够接收任何输入,即使运行在前台。
  • 重定向标准输出和标准错误到文件nohup.out

也就是说,nohup命令实际上将子进程与它所在的 session 分离了。

注意,nohup命令不会自动把进程变为"后台任务",所以必须加上&符号。

七、Screen 命令与 Tmux 命令

另一种思路是使用 terminal multiplexer (终端复用器:在同一个终端里面,管理多个session),典型的就是 Screen 命令和 Tmux 命令。

它们可以在当前 session 里面,新建另一个 session。这样的话,当前 session 一旦结束,不影响其他 session。而且,以后重新登录,还可以再连上早先新建的 session。

Screen 的用法如下。

 # 新建一个 session $ screen $ node server.js 

然后,按下ctrl + Actrl + D,回到原来的 session,从那里退出登录。下次登录时,再切回去。

 $ screen -r 

如果新建多个后台 session,就需要为它们指定名字。

 $ screen -S name  # 切回指定 session $ screen -r name $ screen -r pid_number  # 列出所有 session $ screen -ls 

如果要停掉某个 session,可以先切回它,然后按下ctrl + cctrl + d

Tmux 比 Screen 功能更多、更强大,它的基本用法如下。

 $ tmux $ node server.js  # 返回原来的session $ tmux detach 

除了tmux detach,另一种方法是按下Ctrl + Bd ,也可以回到原来的 session。

 # 下次登录时,返回后台正在运行服务session $ tmux attach 

如果新建多个 session,就需要为每个 session 指定名字。

 # 新建 session $ tmux new -s session_name  # 切换到指定 session $ tmux attach -t session_name  # 列出所有 session $ tmux list-sessions  # 退出当前 session,返回前一个 session  $ tmux detach  # 杀死指定 session $ tmux kill-session -t session-name 

八、Node 工具

对于 Node 应用来说,可以不用上面的方法,有一些专门用来启动的工具:forevernodemonpm2

forever 的功能很简单,就是保证进程退出时,应用会自动重启。

 # 作为前台任务启动 $ forever server.js  # 作为服务进程启动  $ forever start app.js  # 停止服务进程 $ forever stop Id  # 重启服务进程 $ forever restart Id  # 监视当前目录的文件变动,一有变动就重启 $ forever -w server.js  # -m 参数指定最多重启次数 $ forever -m 5 server.js   # 列出所有进程 $ forever list 

nodemon一般只在开发时使用,它最大的长处在于 watch 功能,一旦文件发生变化,就自动重启进程。

 # 默认监视当前目录的文件变化 $ nodemon server.js  # 监视指定文件的变化    $ nodemon --watch app --watch libs server.js   

pm2 的功能最强大,除了重启进程以外,还能实时收集日志和监控。

 # 启动应用 $ pm2 start app.js  # 指定同时起多少个进程(由CPU核心数决定),组成一个集群 $ pm2 start app.js -i max  # 列出所有任务 $ pm2 list  # 停止指定任务 $ pm2 stop 0  # 重启指定任务 $ pm2 restart 0  # 删除指定任务 $ pm2 delete 0  # 保存当前的所有任务,以后可以恢复 $ pm2 save  # 列出每个进程的统计数据 $ pm2 monit  # 查看所有日志 $ pm2 logs  # 导出数据 $ pm2 dump  # 重启所有进程 $ pm2 kill $ pm2 resurect  # 启动web界面 http://localhost:9615 $ pm2 web 

十、Systemd

除了专用工具以外,Linux系统有自己的守护进程管理工具 Systemd 。它是操作系统的一部分,直接与内核交互,性能出色,功能极其强大。我们完全可以将程序交给 Systemd ,让系统统一管理,成为真正意义上的系统服务。

下一篇文章,我就来介绍 Systemd。

(完)

文档信息

2016年2月22日星期一

阮一峰的网络日志

阮一峰的网络日志


库切的《青春》

Posted: 21 Feb 2016 07:59 AM PST

上周,我整理了过去几年读过的书,做了一份书单

然后,发现自己好久没写读后感了,上一篇还是两年多前的《做学问的八个境界》。过去几年,这个博客已经偏向纯技术了。虽然今后也会如此,但我觉得,读后感还是应该坚持写下去。

今天就介绍,我最近读完的一本非常好看的小说《青春》

这本书是2003年诺贝尔文学奖得主、南非作家库切的"自传体"小说。

它讲述了一个名叫约翰的年轻人,大学毕业后,为了逃避南非的种族对立,独自一人来到伦敦追求理想的故事。小说内容跟库切的个人经历完全吻合,但又有艺术加工和虚构的部分。读来让人觉得很真实,但又像在听故事。

整本书都是约翰的内心独白,没有贯穿始终的情节。他讲述生活中的各种遭遇,然后倾述自己的内心感觉。自己提问,自己回答。如果你喜欢曲折的情节,大概不会喜欢这本书。但是,如果你对探索精神世界有兴趣,尤其是有过精神苦闷,那么你会爱不释手的。

约翰爱好文学,希望成为一个诗人或者艺术家。但是,他来到伦敦后,只找到一份IBM公司程序员的工作。

面试官想知道的第一件事,是他是否永远离开南非了。

是的,他答道。

为什么?面试官问。

"因为那个国家要发生革命了。"他回答说。

约翰很快发现,IBM公司的这份工作,根本就在扼杀自己的生命力。

"随着时间一周一周地过去,他发现自己越来越痛苦。惊恐会向他袭来,他费力地将其击退。在办公室里,他感到自己的灵魂在受到袭击。办公楼是一个毫无特色的玻璃水泥大厦,似乎散发出一种气体,无色、无味,一直钻进他的血液,使他麻木。他敢发誓,IBM在杀死他,把他变成一具僵尸。"

他在伦敦的生活也很糟糕,因为没钱。

"他在伦敦北部牌楼路附近的一所房子里,独自租一个房间住。房间在三楼,能够看见水库,有个煤气取暖器和小凹室,里面有煤气炉灶和放食物及碗碟等用品的架子。在一个角落里是煤气表,你放进去一个先令,得到价值一先令的煤气供应。"

"他一早就离家,回来得很晚,很少看见其他的房客。他在书店、美术馆、博物馆、电影院里度过星期六。星期日他在房间里看《观察家报》,然后出去看个电影,或到荒野去散步。星期六和星期天的晚上是最难熬的。那时,寂寞感会传遍全身,和伦敦的阴沉多雨的灰色天气、冰冷铁硬的人行道合在一起。"

在冰冷的现实面前,他原来的人生计划很快就破灭了。

"原本,他来英国时,心底里计划就是找个工作,攒点钱。当他有了足够的钱就放弃工作,献身于写作。积蓄的钱花完了就去找个新工作,如此等等。"

"很快他就发现,这个计划是多么幼稚。他在IBM的税前工资是每月六十英镑,他最多能够存下十英镑。一年的劳动能够为他挣得两个月的自由,而这其中的许多时间还得花费在寻找下一个工作上。南非给他的奖学金只够勉强交学费。"

"而且他还得知,他不能够随意自由地更换雇主。管理居住在英国的外国人的新条例规定,每一次改变就业都需得到内政部的批准。禁止闲散无业,如果他在IBM辞了职,必须很快找到別的工作,要不就必须离开英国。"

他陷入了深深的苦闷。

"他觉得自己像个狄更斯小说里厌倦无聊的小职员,成天坐在凳子上抄写发霉了的文件。惟一打破一天的单调沉闷的是十一点和三点半。这时,送茶的女士推着小车,在每个人面前啪地放下一杯英国浓茶("给你,亲爱的")。"

"他为什么会在这个巨大而冷漠的城市里,在这里仅仅为了能活下去,就意味着需要永远死命拼搏、力求不要倒下?"

"他暗自想到,我们要为了精神生活而献身吗?我以及在大英博物馆深处的这些孤独的流浪者,有一天我们会得到报答吗?我们的孤独感会消失吗,还是说精神生活就是它本身的报答?"

当时正是越南战争时期,他憎恨西方资本主义国家。

"他给中国驻伦敦的大使馆写了一封信。既然他猜想中国不需要计算机,就没有提计算机编程的事情。他说自己准备到中国去教英语,作为对世界斗争的一个贡献。工资多少对他并不重要。"

"他把信寄了出去,等待答复。与此同时,他买了《自学汉语》,开始学习汉语那陌生的咬紧牙齿的发音。"

"一天又一天过去了,中国人没有答复。英国特工截下了他的信销毁了吗?他们截下并销毁所有寄往中国大使馆的信件吗?如果这样,允许中国人在伦敦设立大使馆有什么意义呢?或者是,在截下了他的件以后,英国特工有没有把他的信转到内政部,并附上一张条子,说在XX计算机公司服务的那个南非人暴露出了他具有的共产党倾向?他会不会因为政治丢掉工作,被驱逐出英国?如果出现了这种情况,他不打算对此提出质疑。这将是命运的声音;他准备接受命运的决定。"

他对自己产生了巨大的怀疑,自问追求的东西是不是错了,要不要放弃理想。

"这是一个他可以逃避的世界----现在逃还不晚,或者与之和解,和他看到的周围的一个个年轻人那样,满足于婚姻、住宅和汽车,满足于生活能够实际提供的,把精力放进工作之中。他懊恼地看到,讲求实际的原则多么奏效。"

他与不同的女孩交往,频繁地发生性关系,为了不让自己被苦闷淹没。但是,还是无法摆脱深入骨髓的孤独感,以及对未来的无力和迷惘。

"在泰特画廊,他和一个他以为是来旅游的女孩聊了起来。她相貌平平,戴副眼镜,身体结实,是他不感兴趣的那种女孩,但很可能他自己就属于那种人。她告诉他她叫阿斯特丽德,来自奥地利----是克拉根福,不是维也纳。"

"原来阿斯特丽德不是旅游者,而是个以干家务换取在主人家吃住的女孩。第二天,他请她出去看电影。他们的趣味很不相同,这点他立刻就看出来了。然而当她邀请他一起回到她工作的人家去的时候,他没有拒绝。他看了一眼她的房间:一间阁楼,蓝色方块布窗帘和颜色相配的床罩,枕头上靠着一只玩具熊。"

"后来,他再一次邀请阿斯特丽德出来。没有什么特别的原闵,他说服她和他一起回到他的住处。她还不到十八岁,还有点胖乎乎的娃娃样。他从来没有和这么年轻的人在一起过----其实她还是个孩子。他给她脱衣服的时候,她的皮肤摸上去冷而黏湿。他已经知道自己犯了个错误。他没有性欲。至于阿斯特丽德,虽然通常女人和她们的性需求对他是个谜,他确知她也没有感到有性欲。但是他们两个已经走得太近,欲罢不能,因此就干到底了。"

"在此后的几个星期中,他们又一起过了几个晚上,但是时间永远是个问题。阿斯特丽德只有在主人家的小孩上床睡觉后才能出来,在返回肯辛顿的末班火车之前,他们最多能有匆忙的一个小时,有次,她大起胆子和他过了一整夜。他假装喜欢有她在,但事实上他不喜欢。他单独睡觉睡得好些,有人和他同床。他整夜紧张地直挺挺地躺在那里,醒来时筋疲力尽。"

"有好几个星期,他没有和阿斯特丽德联系了,她来电话了。她在英国的时间巳经结束,要回奥地利的家里去了。"我猜我不会再见到你了,"她说,"所以打电话和你告別。"

"她尽力就事论事地说话,但是他能够听出她含泪的声音。他愧疚地建议见一面。他们一起喝咖啡;她和他一起回到他的房间里过了一夜(她称之为"我们最后的一夜"),紧紧依偎着他,柔声哭泣。第二天一早(是个星期日),他听见她悄悄下床,蹑手蹑脚地走进楼梯平台处的卫生间去穿衣服。她回来的时候他假装睡着了。他知道,他只要稍作暗示,她就会留下来。如果在对她表示出关心之前他想先做别的事情,比方看报纸,她就会安静地坐在角落里等着。在克拉根福,女孩子在行为举止上似乎受到的就是这样的教育:不提出要求,等待着男人准备好的时候,然后为他服务。"

"他很想对阿斯特丽德好一些,她是这徉年轻,在这个大城市里是这样孤单。他很想给她擦干眼泪,逗她笑;他很想对她证明,他的心肠不像看上去那么冷酷,他能够用自己的乐意回应她的乐意,乐意像她希望被搂抱的那样搂抱她,倾听她讲述的关于她在老家的母亲和兄弟们的故事。但是他必须小心谨慎。过多的热情她就可能把票退掉,留在伦敦,搬来和他同住。两个失败者在彼此的怀抱中躲避,彼此安慰:这个情景太令人羞辱了。要是这样,他和阿斯特丽徳还不如结婚, 然后像病人般互相照顾,度过一生。因此他没有作出暗示,而是躺在那儿紧闭着眼睛,直到听见楼梯的吱咯声和前门咔哒一声关上。"

这样日复一日,他过着这种毫无希望、似乎看不到尽头的生活。他知道,自己必须做出改变了。

"他所做的一切都是在等待他的命运之神到来。命运之神不会在南非来到他的身边,他对自己说,它只会在欧洲的大城市之中。他在伦敦等待了几乎两年,受了两年罪,命运之神没有来。"

"他心里明白。除非他促使她来,否则命运之神是不会来找他的。他必须坐下来创作,这是唯一的办法。"

小说就到这里结束了。

现实生活中,库切从IBM公司辞职,离开了英国,到美国攻读文学博士,从此走上了作家的道路。

(完)

文档信息