# 第4章 返回结果的HTTP状态码
# 状态码告知从服务器端返回的请求结果
HTTP状态码负责表示客户端HTTP请求的返回结果、标记服务器端的处理是否正常、通知出现的错误等工作。
# 常用状态码
# 2XX 成功
2XX的响应结果表明请求被正常处理了。
# 200 OK
表示从客户端发来的请求在服务器端被正常处理了。
# 204 No Content
该状态码代表服务器接收的请求已经成功处理,但在返回的响应报文中不含实体的主体部分。也不允许返回任何实体的主体。一般在只需要从客户端往服务器发送信息,而对客户端不需要发送新信息内容的情况下使用。
# 206 Partial Content(部分内容)
该状态码表示客户端进行了范围请求,而服务器成功执行了这部分的GET请求。响应报文中包含由Content-Range指定范围的实体内容。
# 3XX 重定向
3XX响应结果表明浏览器需要执行某些特殊的处理以正确处理请求。
重定向状态码用来告诉浏览器客户端,它们访问的资源已被移动, Web服务器发送一个重定向状态码和一个可选的Location Header, 告诉客户端新的资源地址在哪。
浏览器客户端会自动用Location中提供的地址,重新发送新的Request。 这个过程对用户来说是透明的。
# 301 Moved Permanently(永久移除)
永久性重定向。该状态码表示请求的资源已经被分配了新的URI,以后应该使用资源现在所指的URI。也就是说,如果已经报资源对应的URI保存为书签了,这时应该按Location首部字段提示的URI重新保存。
场景: (一般是资源位置永久更改)
- 域名到期不想续费(或者发现了更适合网站的域名),想换个域名。
- 在搜索引擎的搜索结果中出现了不带www的域名,而带www的域名却没有收录,这个时候可以用301重定向来告诉搜索引擎我们目标的域名是哪一个。
- 空间服务器不稳定,换空间的时候。
注:另外,返回301请求码进行跳转被谷歌认为是将网站地址由 HTTP 迁移到 HTTPS的最佳方法(然而大家都用302。。。。)
# 302 Found
临时性重定向。该状态码表示请求的资源已被分配了新的URI,希望用户(本次)能使用新的URI访问。比如,用户把URI保存为书签,但不会像301状态码出现时那样去更新书签,而是仍旧保留返回302状态码的页面对应的URI。
场景:(一般是普通的重定向需求:临时跳转)
未登录前先使用302重定向到登录页面,登录成功后再跳回到原来请求的页面
比如未登录京东前我就访问京东的个人界面https://home.jd.com/,然后就会重定向到登录界面。
可以发现响应的状态码为302,并且返回了location为登录界面的url,并且附带了ReturnUrl方便我们登录后跳回到https://home.jd.com/。然后再次请求location返回url的页面。请求成功返回200。有时候需要自动刷新页面,比如5秒后回到订单详细页面之类。
有时系统进行升级或者切换某些功能时,需要临时更换地址。
像微博之类的使用短域名,用户浏览后需要重定向到真实的地址之类。
电脑端与移动端的转换
# 302 重定向和网址劫持(URL hijacking)
因为301与302的区别,所以导致产生302网址劫持,故不建议使用302重定向(然而浏览器默认是使用302重定向)。
从网址A 做一个302 重定向到网址B 时,主机服务器的隐含意思是网址A 随时有可能改主意,重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下,当收到302重定向时,一般只要去抓取目标网址就可以了,也就是说网址B。如果搜索引擎在遇到302 转向时,百分之百的都抓取目标网址B 的话,就不用担心网址URL 劫持了。
问题就在于,有的时候搜索引擎,尤其是Google,并不能总是抓取目标网址。比如说,有的时候A 网址很短,但是它做了一个302重定向到B网址,而B网址是一个很长的乱七八糟的URL网址,甚至还有可能包含一些问号之类的参数。很自然的,A网址更加用户友好,而B网址既难看,又不用户友好。这时Google很有可能会仍然显示网址A。由于搜索引擎排名算法只是程序而不是人,在遇到302重定向的时候,并不能像人一样的去准确判定哪一个网址更适当,这就造成了网址URL劫持的可能性。
也就是说,一个不道德的人在他自己的网址A做一个302重定向到你的网址B,出于某种原因, Google搜索结果所显示的仍然是网址A,但是所用的网页内容却是你的网址B上的内容,这种情况就叫做网址URL 劫持。你辛辛苦苦所写的内容就这样被别人偷走了。302重定向所造成的网址URL劫持现象,已经存在一段时间了。不过到目前为止,似乎也没有什么更好的解决方法。在正在进行的谷歌大爸爸数据中心转换中,302 重定向问题也是要被解决的目标之一。从一些搜索结果来看,网址劫持现象有所改善,但是并没有完全解决。
# 303 See Other
该状态码表示由于请求对应的资源存在着另一个URI,应使用GET方法定向获取请求的资源。
303和302有着相同的功能,但303状态码明确表示客户端应当采用GET方法获取资源。
当301、302、303响应状态码返回时,几乎所有的浏览器都会把POST改为GET,并删除请求报文内的主体,之后请求会自动再次发送。
301、302标准是禁止将POST方法改为GET方法的,但实际使用时大家都会这么做。
# 304 Not Modified(未修改)
该状态码表示客户端发送附带条件的请求(GET方法的请求报文中包含If-Match,If-Modified-Since,If-None-Match,If-Range,If-Unmodified-Since中任一首部)时,服务器端允许请求访问资源,但因发生请求未满足条件的情况后,直接返回304(服务器端资源未改变,可直接使用客户端未过期的缓存)。304状态码返回时,不包含任何响应的主体部分。
# 307 Temporary Redirect
临时重定向。该状态码和302有相同的含义。尽管302标准禁止POST变换为GET,但实际使用时大家并不遵守。
307会遵照浏览器标准,不会将POST变为GET。但是对于处理响应时的行为,每种浏览器有可能会出现不同的情况。
# 4XX 客户端错误
4XX的响应结果表明客户端是发生错误的原因所在。
# 400 Bad Request
该状态码表示请求报文中存在语法错误。
# 401 Unauthorized
该状态码表示发送的请求需要有通过HTTP认证的认证信息。
返回含有401的响应必须包含一个适用于被请求资源的WWW-Authenticate首部用以质询(challenge)用户信息。当浏览器初次接收到401响应,会弹出认证用的对话窗口。
# 403 Forbidden
该状态码表明对请求资源的访问被服务器拒绝了。服务器理解客户端的请求,但拒绝处理它,通常由于服务器上文件或目录的权限设置导致,比如IIS或者apache设置了访问权限不当。服务器端没必要给出拒绝的详细理由,可在实体的主体部分对原因进行描述,这样用户就看到了。
未获得文件系统的访问授权,访问权限出现某些问题(从未授权的发送源IP地址试图访问)等都可能是发生403的原因。
# 404 Not Found
该状态码表明服务器上无法找到请求的资源。也可以在服务器端拒绝请求且不想说明理由时使用。
# 5XX 服务器错误
5XX的响应结果表明服务器本身发生错误。
# 500 Internal Server Error
该状态码表明服务器端在执行请求时发生了错误。也可能是web端存在bug。
# 503 Service Unavailable
该状态码表明服务器暂时处于超负载或正在进行停机维护,现在无法处理请求。
# 状态码和状态的不一致
不少返回的状态码响应都是错误的,但是用户可能察觉不到这一点。比如web应用程序内部发生错误,状态码依然返回200 OK,这种情况也经常遇到。