host缓存,浏览器缓存---解决host缓存带来的伤

host缓存,浏览器缓存---解决host缓存带来的伤

1.缓存

缓存,对应工程师来讲简直太熟悉了,太方便了,省略到资源或数据的获取方式,直接缓存到离用户访问最快的地方,也降低服务器的压力,比如:

(1)静态文件获取

服务器->cdn->本地磁盘->本地内存

(2)数据获取

数据库->内存型数据库

(3)host 缓存

主域名服务器->顶级域名服务器->根域名服务器->网络服务提供商缓存->路由器缓存->系统缓存->浏览器缓存

缓存的好处不言而喻,提升用户的访问速度,降低服务端的压力,问题就是:多份数据放在不同的地方,缓存数据一致性问题很关键。本次主要就host缓存中最常用的浏览器缓存讲讲。

2.说说浏览器缓存

名词解析:

(1)expires 和 cache-control 的区别:

相同:都是用来判断该资源的本地缓存的过期时间

expires:是绝对时间,所以如果服务器和本地时间不一致,可能都会有问题

cache-control:是相对时间,兼容性更好

2.1 浏览器缓存分类

浏览器缓存分为强缓存和协商缓存,匹配缓存的流程:

(1)浏览器发送请求前,根据请求头的 expires 和 cache-control 判断是否命中强缓存策略,如果命中,直接从缓存获取资源,并不会发送请求,响应码为:200(from memory cache 或者 from disk cache),如果没有命中,则进入下一步。

(2)没有命中强缓存规则,浏览器会发送请求,根据请求头的 last-modified 或 etag 判断是否命中协商缓存,如果命中,服务器并不会返回这个资源,而是返回一个 httpCode(304),浏览器根据这个 httpCode 从本地缓存加载文件。

(3)如果前两步都没有命中,则直接从服务端获取资源,并缓存在本地

2.2强缓存

2.2.1强缓存原理:

强缓存需要服务端设置 expires 和 cache-control。

(1)第一次从服务器请求资源,服务器返回资源时,在 respone 的 header 加上 cache-control

(2)接收到资源后,会把资源连同所有 response header 一起缓存下来(所以缓存命中的请求返回的header是来自缓存的header)

(3)再次访问这个资源时,先从缓存中找,找到后如果请求时间在缓存中设置的 cache-control 之前,则直接从缓存中加载文件

(4)如果缓存没有命中,浏览器直接从服务器加载资源时,Cache-Control 在重新加载的时候会被更新

2.2.2 强缓存分类

(1)from disk cache:缓存在硬盘,浏览器关闭,缓存还在

(2)from memory cache:缓存在内存,浏览器关闭,缓存清除

2.3协商缓存

浏览器没有命中强缓存,就会发送请求到服务器,验证是否命中协商缓存,如果命中,则服务其不会返回文件,返回 httpCode(304 not modified),浏览器从本地缓存加载文件

2.3.1 协商缓存管理

协商缓存是利用的是【Last-Modified,If-Modified-Since】和【ETag、If-None-Match】这两对Header来管理的。

(1)发送请求服务器文件后,response header 里面增加了 Last-Modified,表示最新修改时间

(2)当重新发送请求获取此文件时,request header 带上 If-Modified-Since,表示 上次请求缓存在本地文件里面的 response header 里面 Last-Modified

(3)服务器收到请求后,根据请求头 If-Modified-Since 跟服务器文件的最新修改时间做对比,没有变化,返回 httpCode(304 not modified),response header 中不会再添加 Last-Modified 的header,这就表示命中了协商缓存

(4)如果协商缓存没有命中,浏览器直接从服务器加载资源时,Last-Modified Header 在重新加载的时候会被更新,下次请求时,If-Modified-Since 会变成上次返回的 Last-Modified 值。

改进:存在服务器文件内容发生修改,但是修改时间却没有改变,所以产生了 etag,根据文件内容生成一个字符串,文件内容发生变化,etag就会改变,不再依赖于修改时间。

3.host缓存带来的问题和原因

1.网站换机器了,缓存的 ip 和 域名 未及时发生变更,导致网站访问不了

reason: dns缓存有一定的失效时间,如果dns缓存的是你的服务器的真实ip和域名映射,如果服务器不可用了,上面看到的host缓存链路,基本上都不会失效缓存,就导致访问不了

resolve: 直接缓存 域名 和 服务器,就必须保证 服务器永远可用,否则就会导致部分用户用不了,所以我们一般将 域名 绑定到代理服务器,代理服务器只负责接受、转发请求和负载均衡,不负责应用发布、升级等,所以代理服务器几乎不会挂,所以大大解决了 dns 缓存带来的不可访问的问题

2.修改了host,用浏览器访问依旧访问到改之前的ip上

reason:这个一般就是 浏览器缓存 或者 系统缓存。

resolve:清除浏览器缓存或者系统缓存即可

3.修改了host,访问部分资源是旧的资源,部分资源是新的资源

reason:新版本浏览器,很多都开启了内存缓存,会将部分数据或者文件缓存到本地内存中,但修改了host 还是访问的是缓存到内存的数据

resolve:清除掉浏览器内存和内存缓存。

4.一招清理浏览器缓存

4.1 chrome浏览器

(1)访问: chrome://net-internals/#dns

(2)点击右上角倒三角:clear cache ,即可清除掉 域名 和 ip的缓存

(3)点击右上角倒三角:flush sockets,即可关闭掉已经打开的sockets

(4)再次访问域名,即可访问到正确的ip和资源

如何根治关闭掉浏览器缓存:

(1)打开浏览器 “检查”

(2)检查框右上角三个点,选择 more tools

(3)选择 network condition

(4)选择 disable cache

4.2 safari 浏览器

关闭浏览器缓存:

原理:发送请求时,请求头带上了 no-cache

推荐阅读