概述
故障域是网络的一部分(例如数据中心的机架或整个数据中心),该部分容易在关键设备或系统出现故障时遭到损坏。故障域中的所有实例都有类似的故障和延迟特性。相同故障域中的实例都受到域内故障事件的影响。在多个故障域中放置实例可降低故障影响所有实例的风险。
DC/OS 现在支持树立故障域感知。利用故障域意识使您的服务高度可用,并能在需要时增加容量。
DC/OS 目前支持 Mesos 的 2 级分层故障域:分区和分域。
分区故障域
分区故障域共用同一分域,所以提供中度故障隔离。然而,同一分域内分区之间的网络延迟较低(通常 < 10ms)。
对于本地部署而言,一个分区就是一个实体数据中心机架。
对于公共云部署而言,分区就是大多数云提供商规定的“可用区”概念。
如果您的目标是高可用性,且/或您的服务具有延迟敏感性,请将您的实例放在同一个分域,并将它们均衡分配到各个分区。
分域故障域
分域故障域提供最高故障隔离,尽管分域间网络延迟较高。
对于本地部署而言,一个分域可能是一个数据中心。
对于公共云部署而言,大多数云提供商都会提出“分域”概念。
可以根据可用容量在特定分域部署实例。