Nginx $host变量详解

96
大富帅
2018.03.20 19:24* 字数 1505

$host变量的官方解释

$host:in this order of precedence: host name from the request line, or host name from the “Host” request header field, or the server name matching a request

host变量的值按照如下优先级获得:

  1. 请求行中的host.
  2. 请求头中的Host头部.
  3. 与一条请求匹配的server name.

什么是请求行中的host

我们知道,HTTP是一个文本协议,建立在一个可靠的传输层协议之上。这个传输层协议要是可靠的,面向连接的。由于TCP的普及程度,让它成了HTTP下层协议事现上的标准。但我们要知道,HTTP并不仅限于建立在TCP之上。只要是可靠的,面向连接的传输层协议,都可以用来传输HTTP。下面所说的HTTP,都是指搭载在TCP之上的HTTP。

一个HTTP请求过程是这样的,客户端先与服务器建立起TCP连接,然后再与服务器端进行请求和回复的收发。请求包含请求行、请求头和请求体,其中,根据请求方法的不同,请求体是可选的。

在发送请求行之前,客户端与服务器已经建立了连接。所以此时请求行中并不需要有服务器的信息。我们用telnet测试, 例如:

GET /index.php HTTP/1.1

这就是一个完整的HTTP请求行。虽然请求行中不需要有服务器的信息,但仍然可以在请求行中包含服务器的信息。例如:

GET www.test.info/index.php HTTP/1.1

两者一比较,就很容易理解什么叫请求行中的host了。第一个请求行中,就没有host,第二种请求行中,就带了host,为www.test.info

Host请求头与HTTP/1.0、HTTP/1.1

一个请求,请求行下面就是一些列的请求头。这些请求头,在HTTP/1.0中,都是可选的,且HTTP/1.0不支持Host请求头;而在HTTP/1.1中,Host请求头部必须存在,否则会返回400 Bad Request
我们看个例子, 使用telnet 连接:

GET /index.php HTTP/1.1

HTTP/1.1 400 Bad Request
Server: nginx/1.4.6 (Ubuntu)

但是HTTP/1.0是不支持Host头部的,所以请求,不需要带这个Host,我们也测试一下:

HEAD /rec/app/detail/youxidaren.html HTTP/1.0

HTTP/1.1 404 NOT FOUND
Server: nginx/1.4.6 (Ubuntu)

可以看到没有返回400, 而是返回了404,说明这个请求还是来到nginx处理,命中了其中一个配置的"虚拟主机", 我到nginx下面看access_log,看到日志写在了第一个的nginx虚拟主机配置的日志文件下面,说明http1.0情况下,没有带host头部,请求默认来到了nginx 第一个虚拟主机下处理。

什么是与请求匹配的server name

server name是指在Nginx配置文件中,在server块中,用server_name指令设置的值。一个server可以多次使用server_name指令,来实现俗称的“虚拟主机”。例如:

server {  
    listen      80;  
    server_name example.org www.example.org;  
    ...  
}  
  
server {  
    listen      80;  
    server_name example.net www.example.net;  
    ...  
}  
  
server {  
    listen      80;  
    server_name example.com www.example.com;  
    ...  
}  

关于虚拟主机的确定方法,还是引用Nginx的官方文档:

在这个配置中,nginx仅仅检查请求的“Host”头以决定该请求应由哪个虚拟主机来处理。如果Host头没有匹配任意一个虚拟主机,或者请求中根本没有包含Host头,那nginx会将请求分发到定义在此端口上的默认虚拟主机。在以上配置中,第一个被列出的虚拟主机即nginx的默认虚拟主机——这是nginx的默认行为。而且,可以显式地设置某个主机为默认虚拟主机,即在”listen”指令中设置”default_server”参数:
server {
listen 80 default_server;
server_name example.net www.example.net;

}

这就解释了上面的HTTP1.0请求,不带Host头,默认来到了第一个配置的server处理了。
然后我测试一下把www.test.info这个域名设成默认的主机default_server,看请求能不能正常来到www.test.info这个server来处理。

nginx 配置修改:

server {
    listen      80 default_server;
    server_name www.test.info
}

再次请求:

HEAD /index.php HTTP/1.0

HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)

实际测试,正常,default_server确实起作用了。

延伸: Nginx 的 $host 与 $http_host 的区别

$host 是nginx的官方变量,可以从官方查询
$http_host 则是读取请求头header里面的key,所有请求头里面的key再nginx里面都可以通过小写和下划线来让nginx读取。例如header里面的Host就能转成$http_host, user_agent可以转成$http_user_agent。
所以,只要是header的请求头都可以这样被nginx读取, 我们测试一下:

HEAD /rec/app/detail/youxidaren.html HTTP/1.1 
Host: mo.ouwan.com
Content-type: html/txt
Test-key: test-value

HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)
Date: Thu, 22 Mar 2018 12:28:56 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Vary: Cookie
# 这三个头都是我请求的时候加的。
x_host: mo.ouwan.com
x_test_key: test-value
x_content_type: html/txt

当然这个几个头部能在response显示是因为在nginx加了add_header控制的:

location / {
        add_header x_host   $http_host;
        add_header x_test_key $http_test_key;
        add_header x_content_type $http_content_type;
}

$http_header的应用:当我们一个项目部署在两个服务器下面,然后在另外一个服务器搭建nginx反响代理,反响代理把请求转发给两个服务器的时候,他们的日志记录的是反向代理的ip, 而不是真正请求的用户IP, 这时就可以通过配置proxy_set_header 把真实IP设置给一个X-forwarded-For 或者 X-Real-IP 转给后端服务器,然后后端服务器读取通过http_x_real_ip来读取真实IP, 记录到access_log下面

 location / {
                proxy_pass http://tg_web_cluster;
                proxy_set_header Host      $host;
                proxy_set_header X-Real-IP $remote_addr;
                proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
                # proxy_set_header X-Forwarded-Proto $scheme;
        }

日志的格式把第一个IP换成刚才转发过来的头部X-Real-IP就可以记录用户IP了:

    log_format tg_log '$http_x_real_ip - $remote_user [$time_local] '
                '"$request" $status $body_bytes_sent '
                '"$http_referer" "$http_user_agent" "$gzip_ratio" - $request_time';

总结:

  • $host变量的值按照如下优先级获得:
  1. 请求行中的host.
  2. 请求头中的Host头部.
  3. 与一条请求匹配的server name.
  • nginx 可以通过$http_header读取请求头的值,实际应用就可以负载均衡的时候读取IP

参考:

关于nginx中的host变量
What's the difference of $host and $http_host in Nginx

Nginx
Web note ad 1