作为前端er,辛辛苦苦搬完砖,好不容易上线之后,正准备告一声万事大吉,回家吃鸡。忽然qa/pm/老板问,为什么我这里还是没有更新?只能是弱弱的回一声,清个缓存看看?或者还有那么一天,发现大部分区域都是好的,只有某些区域是旧的,这就要讨论一个叫CDN的东西了。
说个最经典的结论,无论什么东西,传输都需要时间。这个应该都不会有疑问。
我们的网络而言,有两个用户,一个在海角天边,一个就用内网坐在你跟前,你说他们的体验会不会有差别。这里就不说结论了,应该比较清晰。
关键在于如何解决这个问题,最理想化的,海角天边的跟前要是也有个相同服务器不就完了。
就是这么朴素的道理,这样就引出了CDN。
CDN的全称是Content Delivery Network,即内容分发网络。
能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。
已达到一下三点:
从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,解决用户访问网站的响应速度慢的根本原因。
在看CDN如何解决之前,先回头看下经典的问题,用户输入url回车之后会发生什么。
对于未使用CDN之前,如下图所示:
注:本图来源见水印,比较经典的图就不自己瞎画了
大概有这么几个步骤:
这样来看,有这么几个地方需要考虑:
请求直接到达服务器上,存在传输距离的问题。
每次直接请求服务器,响应速度可以优化。
流量直接打到服务器上,存在超负荷的可能。
引入cdn之后整个流程如下:
提供内容的原始站点,也就是我们的服务器
包括CDN网管中心和全局负载均衡DNS重定向解析系统,负责整个CDN网络的分发及管理。
主要作为内容分发和边缘未命中时的服务点
主要指异地分发节点,由负载均衡设备、高速缓存服务器两部分组成。
简单概括就是离用户最近的节点。主要作为直接向用户提供服务的节点。
CDN边缘节点缓存策略因服务商不同而不同,但一般都会遵循http标准协议,通过http响应头中的 Cache-control: max-age的字段来设置CDN边缘节点数据缓存时间。
当用户向CDN发出请求时,CDN阶段会判断资源是否过期,未过期直接使用缓存(这也就提升了响应速度)。如果认为资源过期,那么就会向实际服务器去请求新的资源,即发生回源。
CDN从源站获取最新资源的过程即为回源,该过程会同时更新本地缓存资源,并将新的资源返回给用户。
当然对于回源我们是要不推荐的,搭建CDN除了必要情况下,当然希望都走节点缓存。如果回源率过高可以参考这里看看CDN 命中率、回源率常见问题
对于新资源上线,为了确保所有节点都能访问最新资源,需要主动失效CDN缓存。CDN运营商都会暴露主动刷新的接口,一般公司运维也会暴露出刷新CDN的接口的,已解决CDN缓存不主动更新问题。
什么叫流量劫持,比较笼统的说只要是对请求及数据进行篡改、转发的都可以认为是流量劫持。
其实CDN也是一种流量劫持,其通过DNS解析将域名匹配到最近的服务器上。
不过这是一种主动已知的劫持,目的为更好的用户体验。
恶意的劫持一般分为两类:
又称域名劫持,是指在劫持的网络范围内拦截域名解析的请求,分析请求的域名,把审查范围以外的请求放行,否则返回假的IP地址或者什么都不做使请求失去响应,其效果就是对特定的网络不能反应或访问的是假网址。
常见实现也是通过污染路由器等中间链路,将解析请求进行篡改。
数据劫持是指针对明文传输的内容发生。
用户发起HTTP请求,服务器返回页面内容时,经过中间的运营商网络,页面内容被篡改或加塞内容,强行插入弹窗或者广告。
如何预防?
行业内解决的办法即是对内容进行HTTPS加密,实现密文传输,彻底避免劫持问题。
理想情况下,CDN 的安全性应该和我们的服务器一致,但如果,CDN 和用户之间、CDN服务器之间,走明文的htttp协议也是会出现数据劫持的现象。
http://book.51cto.com/art/201205/338756.htm
https://www.zhihu.com/question/36514327?rf=37353035
http://hpoenixf.com/DNS%E4%B8%8ECDN%E7%9F%A5%E8%AF%86%E6%B1%87%E6%80%BB.html
https://segmentfault.com/a/1190000010631404
https://zhuanlan.zhihu.com/p/40682772
本着学习的态度,从上面各种大神的文章中受益匪浅,再次感谢上述文章作者。汇总一下作为自己的解惑笔记,希望也能对其他人有所帮助。
原文:https://www.cnblogs.com/pqjwyn/p/10682550.html