http错误码原理及复现 - 499,500,502,504

502,504在超时的场景下会比较像,经常有人不能区分它们。499产生的原因也常常会和504会有内在的关联,你都了解吗?本文不光复现它们,而且会循序渐进,在对比之中复现它们。

下面所有复现的场景,修改nginx或者php-fpm的配置后,记得要重新启动。

环境介绍

  • 系统环境和软件环境为:Linux,Nginx,php-fpm
    • nginx 配置
    fastcgi_connect_timeout 5; # nginx连接fastcgi的超时时间
    fastcgi_send_timeout 10; #nginx往fastcgi发送参数的超时时间
    fastcgi_read_timeout 10; #nginx从fastcig获取数据的超时时间
    
    • php-fpm配置
    ; 一次请求的最长执行时间
    request_terminate_timeout = 30s
    
    所有复现场景都是在nginx根目录下创建一个hello.php文件,然后通过访问http://127.0.0.1/hello.php 来查看http响应code,hello.php代码如下:
    <?php
    
       sleep(7);  // 通过调整sleep秒数,来达成不同的复现
       echo 'hello world';
    ?>
    

499

499, Client Closed Request, 客户端主动断开连接。
是指一次http请求在客户端指定的时间内没有返回响应,此时,客户端会主动断开连接,此时表象为客户端无响应返回,而nginx的日志中会status code 为499。

此状态码在浏览器请求时几乎不可见,因为浏览器默认的超时时间会很长。多见于服务之间的调用,在业务架构中常常会分层设计,拆分为不同的子系统或者微服务,这样系统之间就会常常通过http方式来请求,并且会设置每次请求的超时时间,当请求在请求时间内所调用的上游服务无返回,则会主动关闭连接,上游服务日志中会记录一条499。

  • 复现路径
    • php-fpm.conf
      request_terminate_timeout=30
    • nginx
      fastcgi_read_timeout 5;
    • php
    <?php
        sleep(7); 
        echo 'hello world';
        error_log("hello", 3, "/tmp/hello.log");
    ?>
    
    我们在linux终端使用curl命令来请求,-m 表示超时时间,单位为秒
    curl -i -m 3 http://127.0.0.1/hello.php
    返回:
    curl: (28) Operation timed out after 3004 milliseconds with 0 bytes received
    nginx的access日志的code为499,如下:
    "HEAD /hello.php HTTP/1.1" 499 0

500

500, Internal Server Error , 服务器内部错误,服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。

日常开发中500错误几乎都是由于php脚本语法出现错误导致php-fpm无法正常执行。

  • 复现路径

    • php
    <?php
    
        echo 'hello world'
    ?>
    

    由于php代码语法错误,php-fpm执行失败,然后告诉nginx这一结果,nginx则返回500。

    php错误日志:
    PHP Parse error: syntax error, unexpected 'echo' (T_ECHO), expecting ',' or ';' in hello.php on line 2

502

502,Bad Gateway,网关错误,它往往表示网关从上游服务器中接收到的响应是无效的。

先来了解一下网关是什么含义,从宏观定义上来说只要连接两个不同的网络的设备都可以叫网关,其实具体到应用层Http请求这一领域,网关就是指是转发其他服务器通信数据的服务器,对于本文的复现环境而言,当客户端请求数据到达nginx,nginx负责把请求转交给fastcgi(即php-fpm)进行处理,那么在这个场景中Nginx就是网关。

502并不是指网关本身出了问题,而是从上游接收响应出了问题,比如由于上游服务自身超时导致不能产生响应数据,或者上游不按照协议约定来返回数据导致网关不能正常解析。

  • 复现路径1
    关闭php-fpm进程,返回502。
    这个比较容易理解,参照上面的定义,因为php-fpm进程关闭,nginx连接不上php-fpm,即nginx不能收从上层接收到响应数据。

    nginx 错误日志如下:
    connect() to unix:/tmp/php-cgi.sock failed (2: No such file or directory) while connecting to upstream

  • 复现路径2
    启动php-fpm进程,修改php-fpm.conf的request_terminate_timeout和php代码的sleep时间来复现。

    php

    <?php
    
      sleep(7); 
      echo 'hello world';
    ?>
    

    php-fpm.conf
    request_terminate_timeout=5
    nginx
    fastcgi_read_timeout 10;
    php-fpm.conf设置的最大执行时间是5s,但是php脚本需要的执行时间大于7s,所以php-fpm进程执行5s时就回退出,此时php脚本没有正常执行完成,所以返回给网关Nginx的数据异常,于是导致502。

    php-fpm错误日志如下:
    script '/webroot/hello.php' (request: "GET /hello.php") execution timed out (5.161544 sec), terminating
    nginx错误日志
    recv() failed (104: Connection reset by peer) while reading response header from upstream

504

504,Gateway Timeout,网关超时。

它表示网关没有从上游及时获取响应数据。注意它和502在超时场景下的区别,502是指上游php-fpm因为超过自身允许的执行时间而不能正常生成响应数据,而504是指在php-fpm还未执行完成的某一时刻,由于超过了nginx自身的超时时间,nginx则以为上游php-fpm没有按照设置时间返回响应数据就会返回504, 此时对于php-fpm而言还会继续执行下去,直到执行完成。

  • 复现路径
    php

    <?php
    
      sleep(7); 
      echo 'hello world';
      error_log("hello", 3, "/tmp/hello.log");
    ?>
    

    php-fpm.conf
    request_terminate_timeout=30
    nginx
    fastcgi_read_timeout 5;
    hello.php脚本执行时间需要7s,远小于php-fpm的一次请求的最大请求时间30s,所以php脚本可以正常完成执行,这个可以查看/tmp/hello.log文件内容来得到证明。

    由于nginx从php-fpm读取数据的超时时间为5s,所以在5s的时科,nginx还未从php-fpm获取到响应数据,于是返回504。

    nginx错误日志
    upstream timed out (110: Connection timed out) while reading response header from upstream

总结

499是由于超过客户端设置的请求超时时间,客户端主动关闭连接,服务器code为499。

500多是由于代码语法错误,导致CGI执行错误并且会把错误结果通知服务器,服务器则报500。

502是由于CGI由于在自身的执行时间要求内无法按时完成,则无法返回给服务器正常响应,此时服务器会返回502。

504是CGI在服务器设置的超时时间内无法按时返回响应,服务器则返回504。

499,502,504都会因为超时而产生,区别是超时超了谁的时,499是超了客户端本身的连接时间,502是超了CGI的执行时间,504是超了服务器本身的最大允许读取时间。

推荐阅读更多精彩内容