《大型网站技术架构》-- 大型网站架构模式

分层

最常见的架构模式,将系统在横向维度上切分成几个部分,每个部分单一职责。网站一般分为三个层次:应用层服务层数据层,其具体结构如下图所示:

通过分层,一个庞大系统切分成不同部分,`便于分工合作和维护`。但是,分层架构也有一些挑战:
  1. 必须合理规划层次边界和接口;
  2. 禁止跨层次的调用及逆向调用。

分割

分割是在纵向方面对软件进行切分->将不同的功能和服务分割开来,包装成高内聚低耦合的模块单元,有助于软件开发和维护,还便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。

分布式

  1. 分布式应用和服务:应用和服务模块分布式部署,便于业务功能扩展;
  2. 分布式静态资源:JS、CSS、LOGO图片等资源独立部署,采用独立域名->动静分离;
  3. 分布式数据和存储:传统RDBMS分布式部署和NoSQL产品;
  4. 分布式计算:Hadoop及其MapReduce分布式计算框架,其特点是移动计算而不是移动数据。

集群

多台服务器部署相同应用构成一个集群,通过负载均衡设备共同对外提供服务。当某台服务器发生故障,负载均衡设备或者系统的失效转移机制将请求转发到集群中的其他服务器上,提高系统的可用性,即所谓的HA(高可用性)。

所以,在网站应用中,即使是访问量很小的分布式应用和服务,也至少要部署两台服务器构成一个小集群。

缓存

缓存是改善软件性能的第一手段。在复杂的软件设计中,缓存几乎无处不在。

  1. CDN:内容分发网络,缓存网站的一些静态资源;
  2. 反向代理:部署在网站的前端,最先访问到的就是反向代理服务器;
  3. 本地缓存:在应用服务器本地缓存热点数据,无需访问数据库;
  4. 分布式缓存:应用程序通过网络通信访问缓存数据;

网站应用中,缓存除了可以加快数据访问速度,还可以减轻后端应用和数据存储的负载压力

异步

业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步执行进行协作。

异步架构是典型的生产者消费者模式,两者不存在直接调用,只要保持数据结构不变,彼此功能实现可以随意变化而不互相影响,这对网站扩展新功能非常便利。

异步消息队列可以提高系统可用性、加快网站响应速度,消除并发访问高峰。

冗余

要想保证在服务器宕机的情况下网站依然可以继续服务,不丢失数据,就需要一定程度的服务器冗余运行,数据冗余备份,这样当某台服务器宕机时,可以将其上的服务和数据访问转移到其他机器上。

数据库除了定期备份存档保存实现冷备份之外,为了保证在线业务高可用,还需要对数据库进行主从分离,实时同步实现热备份

自动化

在无人值守的情况下,网站可以正常运行,一切都可以自动化是网站的理想状态。目前大型网站的自动化架构设计主要集中在发布运维方面。 

  1. 发布部署过程自动化;
  2. 自动化代码管理;
  3. 自动化测试;
  4. 自动化安全监测;

安全

  1. 通过密码手机校验码进行身份验证;
  2. 对登录、交易等操作进行加密
  3. 使用验证码进行识别;
  4. 对于常见的XSS攻击SQL注入编码转换等进行防范;
  5. 对垃圾或敏感信息进行过滤
  6. 对交易转账等操作进行风险控制

总结

好的设计绝对不是模仿,不是生搬硬套某个模式,而是对问题深刻理解之上的创造与创新,即使是“微创新”,也是让人耳目一新的似曾相识。山寨与创新的最大区别不在于是否抄袭,是否模仿,而在于对问题和需求是否真正理解与把握