Linux 从 0 到 1(四) - 延时执行,文件压缩,ssh,文件传输

延时执行

到目前为止,我们所运行的命令都是立即执行的。也就是我们按下回车键的那一刻,命令就开始执行了。

其实,在Linux中,命令还可以延时执行。这一课我们就来学习几个命令,可以帮助我们“稍后”执行程序。比如我们即将学习到的crontab命令。

这一课新学的命令都涉及到时间的观念,所以我们先来看一下有关系统时间的规格。

date命令:调节时间

早期我们已經介绍过date命令了。但那时我们只学习了date命令的最基本用法:输出当前时间。

date命令其实挺强大的,它不仅可以输出当前时间,而且如果用man date来查看date命令的手册,就可以发现我们还可以自定义它的输出:可以选择输出哪部分信息,输出格式以及输出的顺序。

为了自定义date命令的输出,我们需要用到+号,后接其他的符号,表示不同的定制部分,这些信息最好都写在双引号间。我们来看几个例子,你就会使用了:

date "+%H"

输出是 10。

再来一个复杂点的:

date "+%H:%M:%S"

可以看到,在刚才+%H的基础上,添加了%M和%S,分别表示分钟数和秒数。所以以上命令用于显示当前的小时数,分钟数和秒数。我们用自定义的冒号来分隔三个部分信息。

当然了,我们也可以自定义其他的分隔字符,例如:

date "+%H时%M分%S秒"

可以看到,经过定制,我们的显示变得更加人性化了。只有紧跟%号之后的符号会被解析,而其他如《时,分,秒》等信息则原样输出。

用date修改系统时间

date命令还可以修改系统时间。是的,你没有看错。

修改系统时间需要使用root身份,因此我们可以这样做:

sudo date 12101250

date命令后接的参数可以是多种形式的,此处的12101250表示《12月10日12点50分》,没有指定年份和秒数,所以年份和秒数不变。

再次用date命令输出当前系统时间,可以看到已经改为了

Thu Dec 10 12:50:02 CET 2015
at命令:延时执行一个程序

你想要延时执行一个程序(所有的命令说到底都是程序)。我们可以用at命令来设定一个程序的执行时间。

注意:at命令只能让程序执行一次。

如果你要定时重复执行程序,那就要用crontab命令。

at命令有几种用法,我们先来看第一种:

在指定时刻执行程序

在这种用法下,at命令的使用顺序如下:

  • 先用at命令后接想要程序执行的确定时刻

  • 再输入你想要在以上指定时刻执行的命令

例如:

at 17:12

终端会显示at>,提示你输入要在17点12分执行的命令。

我们可以输入

touch file.txt

表示我们想要在17点12分创建一个文件,名叫file.txt。

然后,回车。at命令会继续显示at>,提示你输入在指定时刻想要执行的其他命令。你可以继续输入。但你也可以就此打住。

那么怎么结束输入退出at命令呢?可以使用Ctrl + D组合键,at会显示<EOT>,表示《End Of Transmission》(表示《传输结束》)。然后会打印出一句话:

job 1 at Sun Sep 20 17:12:00 2015

之后,到了17点12分,就会创建file.txt这个文件了。

如果说我们不想要在今天的17点12分执行指定命令,而想要在明天的17点12分执行,怎么做呢?可以这样:

at 17:12 tomorrow

那我要在2015年12月10日的17点12分执行呢?

at 17:12 12/10/15

日期的格式是美国日期的格式,所以是 12/10/15,依次是《月/日/年》。

在指定间隔之后执行程序

at还有第二种用法,就是在指定时间间隔之后执行程序。

例如,我要在10分钟之后执行指定程序:

at now +10 minutes

这里我随便写了一个命令:

cp file.txt file_copy.txt

所以,job 2被创建了,就是在现在开始的10分钟会执行《拷贝file.txt文件到file_copy.txt》。

当然了,不止minutes这个关键字可以使用,我们列出几乎所有可以使用的关键字:

  • minutes:表示《分钟》。

  • hours:表示《小时》。

  • days:表示《天》。

  • weeks:表示《星期》。

  • months:表示《月》。

  • years:表示《年》。

例如:

at now +7 weeks

表示在距今7个星期之后执行。

atq和atrm命令:列出和删除正在等待执行的at任务

每次我们用at命令指定延时执行的命令,at都会为其分配一个job编号,比如我们上面的两个例子,分别被分配了1和2的编号。1号是touch file.txt,2号是cp file.txt file_copy.txt

atq命令可以列出正等待执行的at任务。q是英语queue的首字母,会列出at命令的任务队列。

atrm命令可以删除正在等待执行的at任务。rm是英语remove的首字母,后接at任务的编号。例如1和2这样的编号。

sleep命令:休息一会

其实,我们可以用分号隔开多个命令,使之一个接一个执行。跟之前的管道不一样,管道是前一个命令的输出作为后一个命令的输入。用分号隔开的各个命令并没有关联。例如:

touch file.txt ; rm file.txt

上面用分号隔开的两句命令的作用:创建file.txt文件,然后删除之。

我们在两句命令之前可以插入一定的暂停等待时间,用sleep命令。

touch file.txt ; sleep 10 ; rm file.txt

上面的三句命令分别表示:

  • touch file.txt :创建文件file.txt

  • sleep 10 :暂停10秒

  • rm file.txt :删除file.txt

默认地,sleep后面的数值表示秒数。但我们也可以指定其表示分钟或小时或天:

  • m:minute的缩写,表示《分钟》。

  • h:hour的缩写,表示《小时》。

  • d:day的缩写,表示《天》。

例如:
touch file.txt ; sleep 15m ; rm file.txt
上面的三句命令会依次执行:创建file.txt文件,暂停15分钟,删除file.txt文件。

&& 和 || :真真假假

上面我们讲了sleep命令的用法,也提到了分号的作用:可以用于分隔多个命令,使多个命令可以写在一行里,然后依次执行,分号前的一个命令执行完,就会执行分号后的一个命令。但是分号前的命令执行成功与否并不会影响后面的命令。不管如何,分号前后的命令都会执行。

我们来学习两个很有用的符号:&& 和 ||

&&及||和分号一样,用于分隔两个命令,使得命令依次执行,貌似和分号类似,但是有区别。

简单说来,就是:

  • &&:分号前的命令执行成功,才会执行后面的命令。

  • ||:分号前的命令执行失败,才会执行后面的命令。

  • 分号:不论分号前的命令执行成功与否,都执行分号后的命令。前后命令之间没有相关性。

这三个符号非常有用,可以提高我们命令行的效率和丰富程度。

crontab命令:定时执行程序

crontab命令是Linux中很常用也很强大的一个命令。它使我们可以定时执行程序。

前面我们学过的at命令,只能执行某个(或某几个)命令一次。

但是crontab却可以重复执行命令。例如:每小时,每分钟,每天,每星期,等等。

安装crontab

一般来说,Ubuntu下是默认安装了crontab程序的。不过有的Linux发行版可能没装crontab。

crontab的安装,举yum系列和apt-get系列两个例子来看看吧:
在CentOS(Fedora下也类似)中安装Crontab

sudo yum install vixie-cron crontabs  #安装Crontab
chkconfig crond on                    #设为开机自启动
service crond start                   #启动
在Debian(Ubuntu是Debian一族的)中安装Crontab
sudo apt-get install cron               # 大部分情况下Debian都已安装
service cron restart 或者 restart cron  # 重启crontab
Ubuntu下启动,停止和重启动crontab:

service cron start
service cron stop
service cron restart
前期配置工作

在我们学习crontab之前,我们需要先做一些配置。我们来修改 .bashrc 这个文件,之前的课程我们已经学习过了,这是bash这个shell(简单地说就是控制我们当前终端的程序)的配置文件。

也没什么太大的修改,就是想让Nano这个文本编辑器成为我们默认的文本编辑器。因为Ubuntu系统一般默认的文本编辑器是vi,而vi是比较难的文本编辑器。

我们要做的就是把这一句话加入 .bashrc 文件:

export EDITOR=nano

用我们学过的重定向的知识,我们可以这样做:

echo "export EDITOR=nano" >> ~/.bashrc

这样,就把export EDITOR=nano这句话追加到了家目录下的.bashrc文件最后。

运行以下命令使改动立即生效,不然须要重开一个终端或者重新登录才能生效。

source ~/.bashrc

ok,准备工作做好了,我们来认识crontab吧。

crontab,是什么呢?

crontab其实是一个命令,用来读取和修改名为crontab的文件。这个crontab文件包含了你要定时执行的程序列表,也包含了执行的时刻。

实际上,有两个命令,一个叫crontab,一个叫cron。crontab用于修改crontab文件,cron用于实际执行定时的程序。

crontab命令如何使用呢?

有三个参数要了解:

  • -e:修改crontab文件。

  • -l:显示crontab文件。

  • -r:删除crontab文件

我们首先尝试显示crontab文件:

crontab -l

可以看到,显示了《no crontab for oscar》,表示《用户oscar暂时没有任何crontab文件》。

好吧,既然暂时我们的用户还没有crontab文件,那么我们就来创建咯。
可以用

crontab -e

命令,之前我们说过crontab -e用于修改crontab文件,那既然文件不存在,就会新建一个,用什么编辑器编辑此crontab文件呢?就是用我们指定的Nano文本编辑器。

如果你之前正确配置了.bashrc文件,也就是在文件最后添加了export EDITOR=nano 这一行的话,那么运行crontab -e命令之后,会用nano编辑器来打开你的crontab文件。如果没有正确配置.bashrc,那么将会由默认的vi编辑器来打开。

修改crontab文件

暂时,我们的crontab文件刚被创建,所以没什么实际内容,如下图:


可以看到,我们的crontab文件位于/tmp/crontab.5gvGPg/目录中。

crontab文件中只有一句话:

# m h dom mon dow command

注意,这句话是以#开头的,因此是注释。

其实,这句话给出了crontab中的每行指令的书写格式:

  • m:minute。表示《分钟》。

  • h:hour。表示《小时》。

  • dom:day of month。表示《一个月的哪一天》。

  • mon:month。表示《月份》。

  • dow:day of week。表示《星期几》。

  • command:需要定时执行的命令。

用下图表述:
所以每一行的写法很清楚:你须要先写定时是在什么时候,然后在最后写上定时执行什么命令。

上图中用X表示的五个区域分别是《分钟,小时,日,月份,星期几》,这五个区域要么用数字加符号填充,要么写上一个星号(*),表示任意值。

我希望每天的17点12分都在我的家目录下创建file.txt文件。可以在crontab文件里写入:

12 17 * * * touch /home/oscar/file.txt

路径最好用绝对路径,因为你并不能确定cron命令执行这些语句的时候是在哪个目录。

然后,保存退出Nano。如果语法正确的话,crontab会显示:

crontab: installing new crontab

意思是:安装新的crontab文件。

现在,既然已经设置好了。那么file.txt文件将会在每天的17点12分被创建于/home/oscar这个目录下(如果file.txt文件不存在的话)。

下面我们来看几个例子:

Crontab 意义
47 * * * * command 每个小时的47分都执行command命令,也就是 00点47, 01点47, 02点47, 等等
0 0 * * 1 command 每个礼拜一的凌晨都执行command命令
30 5 1-15 * * command 每个月的1~15日的5点30分都执行command命令
0 0 * * 1,3,4 command 每个礼拜一,礼拜三,礼拜四的凌晨都执行command命令
0 */2 * * * command 每2个小时的整点(0,2,4,6,等等)都执行command命令
*/10 * * * 1-5 command 每个礼拜一到礼拜五的每个10的倍数的分钟(0,10,20,等等)都执行command命令

你可以自己设计出很多很多不同的组合用法,来实现你的定时程序。

crontab -r

用于删除crontab文件。

可以看到,我们运行crontab -l,此时我们有一个crontab文件,显示的内容就是我们之前用Nano编辑器填写的。

然后我们用crontab -r来删除crontab文件,则再用crontab -l命令时,就显示《no crontab for oscar》,就是又不存在crontab文件了,也就没有定时执行的任务了。

文件压缩

在Linux下,我们有很多免费的压缩解压软件可供选择,比如gzip和bzip2。不过,gzip和bzip2,不能同时压缩多个文件,一次只能压缩一个文件。不过,Linux的开源社群可厉害了,他们还有一个软件tar,tar可以同时压缩多个文件。
当然了,Linux下也有解压zip和rar格式的软件。

首先,我们需要弄清楚两个概念:打包和压缩。

  • 打包 : 是将多个文件变成一个总的文件,这个总的文件我们通常称为archive,是英语《存档,归档》的意思。

  • 压缩 : 是将一个大文件通过某些压缩算法变成一个小文件。

所以,其实引言中所提到的tar命令,gzip和bzip2命令是这样使用的:

用tar将多个文件归档为一个总的文件,称为archive。
用gzip或bzip2命令将archive压缩为更小的文件。


我们来实际操作一下。

先创建了一个目录,叫做compression,然后在此文件夹中再创建一个目录,叫做tutorial,在tutorial目录中,我放入三个C语言的源文件。

-cvf:创建一个tar归档

我们可以这样来创建一个tar归档:

tar -cvf tutorial.tar tutorial/

tar命令的三个选项参数分别表示:

  • c:c是create的缩写,表示“创建”。

  • v:v是verbose的缩写,表示“冗余”。会显示操作的细节。

  • f:f是file的缩写,表示“文件”。指定归档文件。

执行以上的命令之后,可以从tutorial这个文件夹(里面包含ws.c,test.c,hanio.c三个文件)创建tutorial.tar这个归档。

难道我们一定要先把三个文件都放到tutorial这样的一个目录,才能用tar归档吗?

不是的,我们也可以直接对文件进行归档操作,不需要先把所有文件放到一个目录里,如下:

tar -cvf archive.tar file1.txt file2.txt file3.txt

就会把file.txt,file2.txt,file3.txt归档为archive.tar。但是由于不在目录里,解开归档的时候就会显得很乱,所以还是推荐用目录的形式创建归档。

-tf:显示归档里的内容,并不解开归档

我们可以用tf选项参数来看一下我们刚生成的归档tutorial.tar中的内容。

tar -tf tutorial.tar

可以看到,tutorial.tar这个文件里,首先包含的是tutorial这个目录,目录里有三个文件:ws.c,test.c,hanio.c 。

-rvf:追加文件到归档

例如:

tar -rvf archive.tar file_extra.txt

表示将file_extra.txt这个文件添加到archive.tar归档中。

-xvf:解开归档

算是-cvf的相反操作。将生成的归档解开。

tar -xvf tutorial.tar
gzip和bzip2命令:压缩归档

现在我们已经学会用tar命令来创建一个归档了,接下来,我们就学习如何压缩这个归档吧。

Linux中常用的压缩命令是gzip和bzip2,它们的功能类似。

  • gzip:比较常用。

  • bzip2:不是那么常用。bzip2的压缩率比gzip更大,但是更耗时。

这两个命令的用法也很简单,只需传入要压缩的归档作为参数。经过压缩,归档的后缀名也会改变。

  • .tar.gz:这是用gzip命令压缩后的文件后缀名。

  • .tar.bz2:这是用bzip2命令压缩后的文件后缀名。

两个压缩命令的用法如下:

gzip tutorial.tar

bzip2 tutorial.tar

就会分别生成tutorial.tar.gz和tutorial.tar.bz2两个压缩文件。

如果要对这两个命令生成的压缩文件分别进行解压,可以使用gunzip和bunzip2两个命令:

gunzip tutorial.tar.gz

bunzip2 tutorial.tar.bz2
用tar命令同时归档和压缩

之前我们只介绍了tar命令的归档作用,其实我们可以用tar命令同时完成归档和压缩的操作,一气呵成。

当然了,也就是给tar命令多加一个选项参数,使之完成归档操作后,还是调用gzip或bzip2命令来完成压缩操作。

-zcvf:归档,然后用gzip来压缩归档
tar -zcvf tutorial.tar.gz tutorial/

一步到位,从tutorial目录,归档、压缩,生成tutorial.tar.gz文件。

要解压,也可以一步到位:

tar -zxvf tutorial.tar.gz
-jcvf:归档,然后用bzip2来压缩归档
tar -jcvf tutorial.tar.bz2 tutorial/

一步到位,从tutorial目录,归档、压缩,生成tutorial.tar.bz2文件。

要解压,也可以一步到位:

tar -jxvf tutorial.tar.bz2
zcat,zmore,zless:直接显示用gzip压缩的文件的内容

cat,more和less三个命令我们已经很熟悉了,是用于显示文件内容。

如果是压缩文件,比如我们上面生成的tutorial.tar.gz,如果直接用cat,more或less命令来显示,是会显示乱码的。

但是用zcat,zmore,zless命令就可以显示用gzip命令压缩的文件的内容了:

zcat tutorial.tar.gz
unzip和unrar命令:解压zip和rar文件

尽管不常用,但还是可能会遇到zip 和 rar 文件。

zip -r archive.zip archive/

将目录压缩成 .zip,必须加 -r ,不然会生成一个空的压缩包。
Linux 下 rar 压缩要收费。

SSH

远程连接的协议

  • Telnet协议:简单易用危险多
    这个协议简单,易用,在20世纪80年代就被创立了。它的功用就是在机器间传输简单信息。
    但是这个协议有什么缺点呢?那就是它太简单太基础了,因此传输的信息并没有经过加密,而是明文传输。
  • SSH协议:保护信息的好方法
    SSH是英语Secure SHell的缩写,直译过来就是“安全的Shell”。

使用SSH的信息交换是如何加密的?

不同的加密方法

我们需要知道加密算法大致分两类:

  • 对称加密

  • 非对称加密

对称加密

对称加密是比较简单的加密算法,但简单并不意味着不保险(有很安全的对称加密算法)。简单意味着功能比较好理解。

对称加密算法用一个密钥(英文称为Key,是《钥匙》的意思。是在明文转换为密文或将密文转换为明文的算法中输入的参数)来加密信息。

对称加密中“对称”的意思就是指加密和解密使用的是同一个密钥。

对称加密虽然强大,但是有一个致命的缺陷:必须谨慎地传递密钥。但这几乎是不可能的:因为首先得把密钥传递过去。

为了加密用于对称加密的密钥,我们将用另一种方法:

非对称加密

对称加密方法中,我们只用一个密钥来进行加密和解密。

非对称加密方法中,我们用一个密钥来进行加密,用另一个密钥来解密。

因此,非对称加密有两个密钥:

  • 一个是"公钥"(Public Key),用于加密。

  • 一个是"私钥"(Private Key),用于解密。

公钥可以在网络上以明文传输。
但是,私钥,用于解密的,却不能被公开传输,需要保管好。

非对称算法,最有名的要数RSA算法了。

SSH结合使用非对称加密和对称加密两种方法

SSH以如下顺序使用两种加密方法:非对称加密和对称加密。

首先,使用非对称加密,安全地传输对称加密的密钥。

之后,就一直使用对称加密的密钥来作为加密和解密的手段。

为什么不一直用非对称加密?
非对称加密,有一个缺陷:非对称加密太消耗电脑资源了。非对称加密比对称加密要慢大概100~1000倍。

用SSH进行连接

将你的电脑配置成SSH服务器。

假如你要将自己的电脑配置成SSH服务器,以便自己或别人以后可以远程用SSH登录你的电脑,你可以这么做:

首先,安装openssh,OpenSSH 是 SSH协议的免费开源实现。

安装完成后,它会自动开启sshd这个精灵进程(Daemon Process,或称为守护进程。是一种运行在后台的特殊进程)。

你也可以手动开启sshd:

sudo service ssh start

要停止的话:

sudo service ssh stop

如果你要对SSH的配置做修改,可以修改/etc/ssh/ssh_config,然后运行

sudo service ssh reload

从一台Linux电脑上通过SSH连接

假定你要以用户名user,用SSH协议登录远程服务器host,只要一条简单命令就可以了:

ssh user@host

如果本地用户名与远程用户名一致,登录时可以省略用户名:

ssh host

SSH的默认端口是22。也就是说,你的登录请求会被送进远程服务器的22端口。

使用p参数,可以修改这个端口:

ssh -p 250 user@host

如果你是第一次登录远程服务器,系统会出现类似下面的提示:

The authenticity of host 'host (12.18.429.21)' can't be established.
RSA key fingerprint is 98:2e:d7:e0:de:9f:ac:67:28:c2:42:2d:37:16:58:4d.
Are you sure you want to continue connecting (yes/no)?

这段话的意思是:无法确认host服务器的真实性,只知道它的公钥指纹,你还想继续连接吗?

所谓"公钥指纹",是因为公钥长度较长(这里采用RSA算法,长达1024位),很难比对,所以对其进行MD5计算,将它变成一个128位的指纹(也就是上例中的98:2e:d7:e0:de:9f:ac:67:28:c2:42:2d:37:16:58:4d 这一串十六进制数),再进行比较,就容易多了。

很自然的一个问题就是:用户怎么知道远程服务器的公钥指纹应该是多少?回答是没有好办法,远程服务器必须在自己的网站上贴出公钥指纹,以便用户自行核对。

假定经过风险衡量以后,用户决定接受这个远程服务器的公钥(输入yes,回车):

Are you sure you want to continue connecting (yes/no)? yes

系统会出现一句提示,表示host主机(也就是我们在操作的电脑)已经得到认可:

Warning: Permanently added 'host,12.18.429.21' (RSA) to the list of known hosts.

然后,会要求输入密码:

Password: (enter password)

如果密码正确,就可以登录了。
当远程服务器的公钥被接受以后,它就会被保存在文件$HOME/.ssh/known_hosts之中(HOME是环境变量,通常保存了用户家目录的绝对路径,比如我的HOME就是/home/oscar)。下次再连接这台服务器时,系统就会认出它的公钥已经保存在本地了,从而跳过警告部分,直接提示输入密码。

每个SSH用户都有自己的known_hosts文件。此外系统也有一个这样的文件,通常是/etc/ssh/ssh_known_hosts,保存一些对所有用户都可信赖的远程服务器的公钥。

用密钥实现自动身份验证
使用密码登录,每次都必须输入密码,非常麻烦。幸亏SSH还提供了公钥登录,可以省去输入密码的步骤。

所谓"公钥登录",原理很简单,就是用户将自己的公钥储存在远程服务器上。登录的时候,发送一个经过公钥加密的随机数据给客户机,这个数据只能通过私钥解密,客户机将解密后的信息发还给服务器,服务器验证正确后即确认客户机是可信任的,从而建立起一条安全的信息通道,直接允许登录shell,不再要求密码。

这种方法要求用户必须提供自己的公钥。如果没有现成的,可以直接用ssh-keygen命令生成一个:

ssh-keygen

运行上面的命令以后,系统会出现一系列提示,可以一路回车。其中有一个问题是,要不要对私钥设置口令(passphrase),如果担心私钥的安全,这里可以设置一个。一般都不设置。

运行结束以后,在$HOME/.ssh/目录下,会新生成两个文件:id_rsa.pubid_rsa。前者是你的公钥,后者是你的私钥。

这时再输入下面的命令,将公钥传送到远程服务器host上面:

ssh-copy-id user@host

好了,从此你再登录,就不需要输入密码了。

如果还是不行,就打开远程服务器的/etc/ssh/sshd_config这个文件,检查下面几行前面的"#"注释是否取掉。

RSAAuthentication yes
PubkeyAuthentication yes
AuthorizedKeysFile .ssh/authorized_keys

然后,重启远程服务器的ssh服务:

# Ubuntu系统
sudo service ssh restart

文件传输

wget:下载文件。

它可以使我们直接从终端控制台下载文件,只需要给出文件的HTTP或FTP地址。

命令格式:

wget [参数] [URL地址]

例如:

wget http://cdimage.debian.org/debian-cd/8.6.0/i386/iso-cd/debian-8.6.0-i386-netinst.iso

wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性。
如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。
如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。
这对从那些限定了链接时间的服务器上下载大文件非常有用。简直是bug般的存在。

继续中断的下载

要继续一个中断的下载,只要在相同的下载命令中加入 -c 参数,

wget的一个优点是会显示下载的进度。稍后我们会学习的ftp命令则不会显示下载进度。

scp:网间拷贝

scp是Secure CoPy的缩写,表示“安全拷贝”。这个命令可以使我们通过网络,把文件从一台电脑拷贝到另一台。当然,拷贝的信息是安全的,正如它的名字所示。

也有一个命令rcp,是Remote CoPy的缩写, 表示"远程拷贝"。也可以做同样的事,但是信息没有得到安全保护,不推荐。

scp使用起来有点类似SSH(Secure SHell)。这并不是巧合,因为scp是基于SSH的原理来运作的。SSH首先会在两台通过网络连接的电脑之间创建一条安全通信的管道(如上一课所示),scp就利用这条管道安全地拷贝文件。

scp的基本命令格式如下:

scp original_file destination_file
  • original_file表示源文件,就是被拷贝的文件。
  • destination_file表示目标文件,就是拷贝产生的文件。

这两个文件都可以如下方式来表示:

user@ip:file_name

从自己电脑拷贝文件到另一台电脑
这很简单,例如:

scp image.png oscar@89.231.45.67:/home/oscar/images/

表示把我的电脑中当前文件夹下的image.png文件拷贝到远程电脑(ip地址是89.231.45.67)的用户oscar的/home/oscar/images目录下,

当然了,scp会请求你输入远程电脑(ip地址是89.231.45.67)的用户oscar的密码。输入密码,回车,就开始拷贝了。

从另一台电脑拷贝文件到自己电脑
类似的用法,例如:

scp oscar@89.231.45.67:/home/oscar/images/image.png file_changed_name.png

修改端口
上述命令中,我们并没有指定用哪个端口,只指定了ip地址。默认的端口号是22,和SSH一样。我们也可以修改端口号,用-P参数。例如:

scp -P 7821 oscar@89.231.45.67:/home/oscar/images/image.png .

从私有的FTP服务器上传或下载文件。当我们从服务器出租商处租用一台服务器作为个人网站之用时,出租商通常会给我们一个FTP的登录名和密码,我们可以连接,以上传及下载文件。这种情况下,连接是需要身份验证的。

我们试着连接到Debian的FTP服务器,地址如下:ftp://ftp.debian.org

方法很简单:

ftp ftp.debian.org

Debian的FTP服务器应该会有所回应,并向你请求输入用户名和密码。对于公共的FTP服务器,用户名一般都填写 anonymous (表示“匿名”)。

密码你随便输入什么都会被接受。

登录成功后,会看到类似以下信息:

230 Login successful.
Remote system type is UNIX.
Using binary mode to transfer files.
ftp>

现在你有了命令提示符了,就是那个

ftp>

你就可以输入FTP命令了。

在FTP服务器中操作

你在FTP服务器上可以使用的命令基本和我们到目前为止学习的Linux命令是一样的。

文件传输

如果你想要上传及下载文件,需要知道两个命令:

  • put:用于上传文件

  • get:用于下载文件

我们来下载一个文件试试(README):

ftp> get README
local: README remote: README
200 PORT command successful. Consider using PASV.
150 Opening BINARY mode data connection for README (940 bytes).
226 File send OK.
940 bytes received in 0.00 secs (918.9 kB/s)

下载完毕,README文件现在位于你的当前目录了。

如果你连接到FTP服务器,但又想要在自己的电脑上运行命令,怎么办呢?

只要在命令前加一个感叹号就可以了,例如:

!pwd

就会在自己电脑上执行pwd命令,而不是在FTP服务器上执行。

其他的ftp命令

要从FTP服务器断开连接,你可以用Ctrl+D组合键。也可以用bye,exit或quit命令,效果是一样的。

sftp:安全加密的ftp

ftp命令虽然方便,但是有一个致命缺点:不安全,数据不是加密传输的。任何人,只要连接到同一个网络,可以想办法截取到你传输的数据,或者你的密码。

因此,我们需要请出sftp。sftp是Secure FTP的缩写。表示“安全的FTP”。

sftp也是基于SSH的,所以登录需要用户名和密码,用法如下:

sftp user@ip

例如:

sftp oscar@coderunity.com

一旦你输入用户名和密码,连接上之后,其他的操作和ftp是一样的。只不过通信被加密了,更安全。

上述命令中,我们并没有指定用哪个端口,只指定了ip地址。默认的端口号是22,和SSH一样。我们也可以修改端口号,用-oPort参数。例如:

sftp -oPort 3592 oscar@89.231.45.67
rsync:同步备份

rsync命令易于使用,功能很强大。

rsync是一个小程序,需要安装,默认系统一般没有这个命令。

sudo apt-get install rsync

rsync命令使我们可以同步两个目录,不管这两个目录位于同一台电脑还是不同的电脑(用网络连接)。

rsync应该是最常用于“增量备份”的命令了吧。什么是“增量备份”呢?

增量备份(incremental backup)是备份的一个类型,指在一次全备份或上一次增量备份后,以后每次的备份只需备份与前一次相比增加或者被修改的文件。

rsync就好像更智能的scp命令。

备份到同一台电脑的其他目录

rsync -arv Images/ backups/

以上命令,将Images目录下的所有文件备份到backups目录下。

-arv参数分别表示:

  • -a:保留文件的所有信息,包括权限,修改日期,等等。

  • -r:递归调用。表示子目录的所有文件也都包括。

  • -v:冗余模式。输出详细操作信息。

删除文件

默认地,rsync在同步时并不会删除目标目录的文件。例如,你的源目录(被同步目录)中删除了一个文件,但是用rsync同步时,它并不会删除同步目录中的相同文件。

如果要使rsync也同步删除操作。那么可以这么做:

rsync -arv --delete Images/ backups/

加上 --delete 参数就可以了。

备份到另一台电脑的目录

rsync -arv --delete Images/ oscar@89.231.45.67:backups/

当然,rsync的强大之处绝不止于此。

你可以自己配置rsync,使得它从指定目录(可以是多个目录)备份到指定的ip地址的目录下,而且可以指定哪些类型文件是要备份的,哪些类型不要备份,然后把这一长串命令统一用Shell来写成一个文件(例如取名叫backup),使之可执行(用chmod命令),再把这个文件的路径添加到PATH中。

这样你以后不论在哪个目录下输入backup,rsync就帮你自动同步该目录了。

分析网络

host和whois命令:告诉我你是谁

我们已经知道,每台连上网的电脑都会被一个IP地址所标识,这个IP地址是全球唯一的。

目前,大多数IP地址是这样的形式:

96.172.150.23

这样的形式被称为IPv4格式(以小数点分隔)。IP是Internet Protocol("网际协议")的缩写,v是version("版本")的首字母,4表示这是"版本四"。

不过,因为IPv4的地址不够用的关系,现在已经有不少IP地址的格式是IPv6的格式了,已有的IPv4地址也被慢慢替换成IPv6。IPv6的IP地址类似这样:

fa80::109:62fa:cb80:29d2

上面的是简写形式(两个冒号::用于合并连续的几组0),完整的形式是:

fa80:0000:0000:0000:0109:62fa:cb80:29d2

我们看到, IPv6的IP地址是以冒号分隔的8组4位的16进制(也就是8组16位二进制,因为2的4次方是16),所以 8 * 16 = 128。

IPv6把 IP 地址由IPv4的32 位(4个2的8次方,4 * 8 = 32)增加到 128 位。

我们可以为每一个IP地址绑定一个主机名,主机名的英语是host name。

注意:
这里的主机名其实应该被称为完整主机名: Fully Qualified Domain Name (FQDN),是由主机名(host name)和域名(domain name)一起构成。我们一般会用主机名或域名来代称FQDN,其实不是那么准确。

IP地址和主机名的互相转换

使用host(host是英语“主机”的意思)这个命令我们可以实现IP地址和主机名的互相转换,例如:

host baidu.com (或 host www.baidu.com)会得到IP地址:58.96.181.197

host 58.96.181.197则会得到主机名

IP地址和主机名的解析是由DNS(Domain Name System,域名解析系统)服务器完成的。

whois:了解有关域名的信息

每一个域名在登记注册时都须要填写:姓,名,联系地址,联系方式,等等。这是规定。

whois命令就可以帮助我们轻松获得域名背后的这些信息。

ifconfig和netstat命令:控制和分析网络流量

ifconfig:列出网络接口

ifconfig是Linux中用于显示或配置网络设备(网络接口卡)的命令,英文全称是(Network) Interface Configuration。if是Interface的缩写,表示“接口”;configuration是“配置”的意思。

一般来说,你的电脑拥有好几个网络接口,也就是说有多种连接网络的方式。

在小编的电脑上有三个网络接口,分别是:

eth0
lo
wlan0

在你的电脑上可能网络接口多于三个,也可能少于三个,本不足为奇,取决于你电脑的设备。幸好小编的电脑的三个网络接口都是最常见的三个,详述如下:

  • eth0:对应有线连接(对应你的有线网卡),就是用网线来连接的上网(一般是RJ45网线,见下图),如果你的电脑目前使用网线来上网,那就是在使用这个接口。有些电脑可能同时有好几条网线连着(有好几个有线接口),例如服务器,那么除了eth0(第一块有线网卡),你还会看到例如eth1,eth2,等等。

  • lo:本地回环(Local Loopback的缩写,对应一个虚拟网卡)。可以看到它的IP地址是127.0.0.1,似曾相识是吗?对啊,之前我们在/etc/hosts文件中看到对应localhost的就是这个IP。每台电脑都应该有这个接口,因为它对应着连向... 自己的链接。这也是我们称之为本地回环的原因:所有经由这个接口发送的东西都会回到你自己的电脑。看起来好像并没有什么用,但是有时为了某些缘故(可以百度或Google继续探究),我们需要连接自己。例如用来测试一个网络程序,但又不想让局域网或外网的用户能够查看,只能在此台主机上运行和查看所用的网络接口。比如把 HTTPD服务器指定到回环地址,在浏览器输入 127.0.0.1 就能看到你所架设的Web网站了。但只有你自己能看得到,局域网的其它主机或用户无从知道。

  • wlan0:对应Wi-Fi无线连接(对应你的无线网卡)。假如你有好几块无线网卡,那么会看到wlan1,wlan2,等等。

小编此时用的是有线连接的方式上网。证明就在eth0的信息中:

RX packets : 4853
TX packets : 4821

分别是接收包和发送包的数目。RX是receive(表示“接收”)的缩写,TX是transmit(表示“发送”)的缩写。packet是英语“包,数据包”的意思。

而wlan0的信息中,这两行是0。表示没有发送和接收任何数据。

当然,本地回环的这两行也有148呢。所以说,给自己发送东西也是会发生的。

有一个简单的配置方式我们可以学习:接口的激活/关闭。

使用格式如下:

ifconfig interface state
  • interface:由你想要修改的网络接口名称代替(eth0,wlan0等等)。

  • state:由up或down代替,分别表示激活和关闭对应接口。

例如:

# 关闭eth0这个有线接口,之后就没有任何网络传输会在eth0上进行了。
ifconfig eth0 down
# 激活eth0这个有线接口。
ifconfig eth0 up
配置IP地址

用ifconfig命令可以配置网络接口的IP地址和其他数据。

例如:

ifconfig eth0 192.168.120.56 netmask 255.255.255.0 broadcast 192.168.120.255

上面的命令用于给eth0网卡配置IP地址(192.168.120.56),加上子网掩码(255.255.255.0),加上个广播地址(192.168.120.255)。

还有更多命令选项就用man ifconfig来查看吧。

netstat : 网络统计

netstat可以显示很多信息,但是我们可以用参数来控制显示信息的种类和样式。下面介绍几个常用的参数吧:

netstat -i : 网络接口的统计信息

首先,试试i参数吧:

netstat -i

会显示一张统计列表,列出你电脑的所有网络接口的一些统计信息,例如小编的电脑就列出了eth0,lo,wlan0这三个接口的使用信息。

netstat -uta : 列出所有开启的连接

运行

netstat -uta

参数uta分别表示:

  • -u : 显示UDP连接(u是udp的首字母)

  • -t : 显示TCP连接(t是tcp的首字母)

  • -a : 不论连接的状态如何,都显示(a是all的首字母)

TCP和UDP是两种不同的协议,用于在网络上传输数据。

UDP(User Datagram Protocol,用户数据报协议)一般用于网络游戏,音频通讯(例如Skype)。

除此之外,一般来说TCP(Transmission Control Protocol,传输控制协议)是最常用的。一般在互联网上都是用TCP/IP协议。

我们也可以只显示TCP连接的信息:

netstat -ta

或者只显示UDP连接的信息(不常用):

netstat -ua

再来看看上面图片中state(状态)那一列的信息,有好几种不同状态:

  • ESTABLISHED:与远程电脑的连接已建立。establish是英语“建立”的意思。

  • TIME_WAIT : 连接正在等待网络上封包的处理,一旦处理完毕就开始关闭连接。

  • CLOSE_WAIT:远程服务器中止了连接(也许你太久没什么动作,处在不活跃状态)。

  • CLOSED:连接没有被使用。关闭了。

  • CLOSING:连接正在关闭,但有些数据还没有发送完毕。

  • LISTEN:监听着可能进入的连接。此时连接还没有被使用。listen是英语“听”的意思。

"端口"是英文port的意译,可以认为是设备与外界通讯交流的出口。
端口可分为虚拟端口和物理端口。
其中虚拟端口指计算机内部或交换机路由器内的端口,不可见。例如计算机中的80端口、21端口、23端口等。
物理端口又称为接口,是可见端口,例如计算机背板的RJ45网口,交换机路由器集线器等RJ45端口。电话使用的RJ11插口也属于物理端口的范畴。

  • 80端口,是为HTTP(HyperText Transport Protocol,超文本传输协议)开放的,此为上网冲浪使用次数最多的协议,主要用于WWW(World Wide Web,万维网)传输信息的协议。可以通过HTTP地址(即常说的“网址”)加“:80”来访问网站,因为浏览网页服务默认的端口号都是80,因此只需输入网址即可,不用输入“:80”了。

  • 110端口,是为POP3(邮件协议3)服务开放的,用于收发电子邮件。

  • 21端口,用于FTP(File Transfer Protocol,文件传输协议)服务,FTP服务主要是为了在两台计算机之间实现文件的上传与下载。

netstat -lt : 列出状态是LISTEN的统计信息
netstat -s : 列出总结性的统计信息

推荐阅读更多精彩内容