HTTP 协议

一、什么是 HTTP 协议?

  • HTTP 是一个用在计算机世界里的协议。它使用计算机能够理解的语言确立了一种计算机之间交流通信的规范(两个以上的参与者),以及相关的各种控制和错误处理方式(行为约定和规范)。

  • HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。

二、HTTP 常见的状态码

  1. 1XX 类状态码属于提示信息,是协议处理中的一种中间状态,实际用到的比较少。

  2. 2XX 类状态码表示服务器成功处理了客户端的请求,也是我们最愿意看到的状态。

    • 「200 OK」是最常见的成功状态码,表示一切正常。如果是非 HEAD 请求,服务器返回的响应头都会有 body 数据。
    • 「204 No Content」也是常见的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。
    • 「206 Partial Content」是应用于 HTTP 分块下载或断电续传,表示响应返回的 body 数据并不是资源的全部,而是其中的一部分,也是服务器处理成功的状态。
  3. 3XX 类状态码表示客户端请求的资源发生了变动,需要客户端用新的 URL 重新发送请求,也就是重定向

    • 「301 Moved Permanently」表示永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。
    • 「302 Moved Temporary」表示临时重定向,说明请求的资源还在,但暂时需要用另一个 URL 来访问。
    • 301 和 302 都会在响应头里使用字段 Location,指明后续要跳转的 URL,浏览器会自动重定向新的 URL。
    • 「304 Not Modified」不具有跳转的含义,表示资源未修改,重定向已存在的缓冲文件,也称缓存重定向,用于缓存控制。
  4. 4XX 类状态码表示客户端发送的报文有误,服务器无法处理,错误码

    • 「400 Bad Request」表示客户端请求的报文有错误,但只是个笼统的错误。
    • 「403 Forbidden」表示服务器禁止访问资源,并不是客户端的请求出错。
    • 「404 Not Found」表示请求的资源在服务器上不存在或未找到,所以无法提供给客户端。
  5. 5XX 类状态码表示客户端请求报文正确,但是服务器处理时内部发生了错误,属于服务端的错误码

    • 「500 Internal Server Error」与 400 类型,是个笼统通用的错误码,服务器发生了什么错误,我们并不知道。

    • 「501 Not Implemented」表示客户端请求的功能还不支持,类似“即将开业,敬请期待”的意思。

    • 「502 Bad Gateway」通常是服务器作为网关或代理时返回的错误码,表示服务器自身工作正常,访问后端服务器发生了错误。

    • 「503 Service Unavailable」表示服务器当前很忙,暂时无法响应服务器,类似“网络服务正忙,请稍后重试”的意思。

三、HTTP 常见的字段

  1. Host 字段,客户端发送请求时,用来指定服务端的域名

  2. Content-Length 字段,服务器在返回数据时,会有 Content-Length 字段,表明本次回应的数据长度。

  3. Content-Type 字段,用于服务器回应客户端时,告诉客户端当前数据是什么格式的。

    • Content-Type: application/json; charset=utf-8
    • Content-Type: text/html; charset=utf-8
    • 客户端请求的时候,可以使用 Accept 字段声明自己可以接受哪些数据格式。
    • Accept: _ / _ 表示可以接受任意格式的数据
  4. Connection 字段,常用于客户端要求服务端使用 TCP 持久连接,以便其他请求复用。

    • Connection: keep-alive
  5. Content-Encoding 字段

    • Content-Encoding 字段说明数据的压缩方法。表示服务器返回的数据使用了什么压缩格式

    • Content-Encoding: gzip. 表示服务器返回的数据采用了 gzip 方式压缩,告知客户端需要用此方式解压。

    • 客户端在请求时,用 Accept-Encoding 字段说明自己可以接受哪些压缩方法。

    • Accept-Encoding: gzip, deflate

四、HTTP/1.1 的性能

  • HTTP 协议是基于 TCP/IP,并且使用了「请求 - 应答」的通信模式,所以性能的关键就在这两点里。
  • 长连接
    1. 早期 HTTP/1.0 性能上有一个很大的问题,就是每发起一次请求,都要新建立一次 TCP 连接(三次握手),而且是串行通信,做了无畏的连接建立和断开,增加了通信开销。
    2. 为了解决上述 TCP 连接问题,HTTP/1.1 提出了长连接的通信方式,也叫持久连接。这种方式的好处在于减少了 TCP 连接的重复建立和断开所造成的额外开销,减轻了服务器端的负载。
    3. 持久连接的特点是,只要任意一端没有明确提出断开连接,则保持 TCP 连接状态。

五、HTTP 与 HTTPS 的区别

  1. HTTP 是超文本传输协议,信息是明文传输,存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文能够加密传输。

  2. HTTP 连接建立相对简单, TCP 三次握手之后便可进行 HTTP 的报文传输。而 HTTPS 在 TCP 三次握手之后,还需进行 SSL/TLS 的握手过程,才可进入加密报文传输。

  3. HTTP 的端口号是 80,HTTPS 的端口号是 443。

  4. HTTPS 协议需要向 CA(证书权威机构)申请数字证书,来保证服务器的身份是可信的。


​ HTTP 与 HTTPS 的区别


​ HTTP/1.1 与 HTTPS 与 HTTP/2 的区别


​ HTTP/1.1 与 HTTPS 与 HTTP/2 与 HTTP/3 的区别