DC/OS 群集由 管理节点 和 代理节点 这两种节点组成。代理节点可以是 公共代理节点 或 专用代理节点。公共代理节点通过负载均衡器为群集中的服务提供北南(外部向内部)的访问。专用代理主机托管集群上部署的容器和服务。除管理和代理群集节点以外,每个 DC/OS 安装还包括一个用于 DC/OS 安装和升级文件的独立 ** bootstrap 节点**。一些硬件和软件要求适用于所有节点。其他要求特定于要部署的节点类型。
硬件前提条件
硬件前提条件是单个 bootstrap 节点、Mesos 管理节点和 Mesos 代理节点。
bootstrap 节点
- DC/OS 装置在一个 bootstrap 节点 上运行,该节点带有两个核心、16 GB RAM 和 60 GB HDD。
- bootstrap 节点仅在安装和升级过程中使用,因此没有针对高性能存储或分离挂载点的具体建议。
群集中的所有管理节点和代理节点
在安装期间,DC/OS 群集节点是指定的 Mesos 管理节点和代理节点。支持的操作系统和环境列于 版本政策页面.
在群集节点上安装 DC/OS 时,所需文件安装在 /opt/mesosphere
目录中。您可以安装 DC/OS 之前创建 /opt/mesosphere
目录,但它必须是空目录或指向空目录的链接。DC/OS 可以通过在挂载卷上创建空目录,在 /opt/mesosphere
处创建指向空目录的链接来安装在单独的卷挂载上。
应当验证对群集中所有管理节点和代理节点的以下要求:
- 每个节点都必须拥有对公共 Docker 存储库或内部 Docker 注册表的网络访问权限。
- 如果节点操作系统为 RHEL 7 或 CentOS 7,则必须停止并禁用
firewalld
守护程序。如需更多信息,请参见 禁用 RedHat 或 CentOS 上的防火墙守护程序。 - 必须停止并禁用 DNSmasq 进程,DC/OS 才能访问端口 53。如需更多信息,请参见 停止 DNSmasq 进程。
- 您未使用
noexec
将/tmp
目录安装在您打算使用 DC/OS CLI 的任何系统上。 - 您有足够的磁盘将群集的信息存储在
var/lib/mesos
目录中。 - 您不应远程挂载
/var/lib/mesos
或 Docker 存储/var/lib/docker
目录。
禁用 Red Hat 或 CentOS 上的防火墙守护程序
这是一个已知的 Docker 问题,firewalld
进程与 Docker 的交互不佳。有关此问题的更多信息,请参阅 Docker CentOS firewalld 文档。
要停止并禁用 firewalld
,请运行以下命令:
sudo systemctl stop firewalld && sudo systemctl disable firewalld
停止 DNSmasq 进程
DC/OS 群集需要访问端口 53。为防止端口冲突,应运行以下命令来停止并禁用 dnsmasq
进程:
sudo systemctl stop dnsmasq && sudo systemctl disable dnsmasq.service
管理节点要求
下表列出了管理节点的硬件要求:
最低 | 推荐 | |
---|---|---|
节点数 | 1* | 3 或 5 |
处理器 | 4 核 | 4 核 |
内存 | 32 GB RAM | 32 GB RAM |
硬盘 | 120 GB | 120 GB |
* 对于业务关键部署,需要三个管理节点,而不是一个管理节点。
管理节点上有许多混合工作负载。预计持续可用或被视为业务关键的工作负载只能在具有至少三个管理节点的 DC/OS 群集上运行。有关高可用性要求的更多信息,请参阅 高可用性文档。
管理节点上混合工作负载的示例是 Mesos 复制日志和 ZooKeeper。某些情况下,混合工作负载定期需要与 fsync
同步,这可以生成许多昂贵的随机 I/O。我们建议如下:
-
使用固态硬盘 (SSD) 或非易失性快速存储器 (NVMe) 设备进行快速、本地连接的存储。为降低 I/O 延迟问题的可能性,固态硬盘应当尽可能本地连接到物理机。您还应确保将固态硬盘 (SSD) 或非易失性快速存储器 (NVMe) 设备用于托管管理节点重复日志的文件系统。
在规划存储要求时,请记住,应避免使用单个存储区域网络 (SAN) 设备和 NFS 来连接群集中的节点。这种类型的架构引入延迟的可能性比使用本地存储的可能性要高,还会在原本应该是分布式系统的系统中引入单一故障点。网络延迟和带宽问题可能导致客户端会话超时,并且不利地影响 [DC/OS] 群集性能和可靠性。
-
带备用电池备用单元 (BBU) 的 RAID 控制器。
-
在回写模式下配置的 RAID 控制器缓存。
-
如果可以分离存储挂载点,则建议在管理节点上使用以下存储挂载点。这些建议将通过隔离各种服务的 I/O 来优化繁忙 DC/OS 群集的性能。
目录路径 描述 /var/lib/dcos 管理节点上的大部分 I/O 将出现在此目录结构中。如果计划一个拥有数百个节点的群集或打算以较高速度部署和删除工作负载,则建议将此目录隔离到单独设备上的专用固态硬盘存储。 -
对于会发展到数千个节点的群集,建议将此目录结构进一步分解为具体服务的单个挂载点。
目录路径 描述 /var/lib/dcos/mesos/master 日志记录目录 /var/lib/dcos/cockroach CockroachDB Enterprise /var/lib/dcos/navstar 对于 Mnesia 数据库 /var/lib/dcos/secrets 密钥保管库 Enterprise /var/lib/dcos/exec 各种 DC/OS 服务所需的临时文件。/var/lib/dcos/exec 目录不得在装载有 noexec
选项的卷上。/var/lib/dcos/exhibitor Zookeeper 数据库 /var/lib/dcos/exhibitor/zookeeper/transactions ZooKeeper 事务日志对磁盘写入延迟非常敏感。如果只能提供有限的固态硬盘空间,则这是要放置的目录。这些日志至少必须要有 2 GB 空间。
代理节点要求
下表显示了代理节点的硬件要求。
最低 | 推荐 | |
---|---|---|
节点数 | 1 | 6 或更多 |
处理器 | 2 核 | 2 核 |
内存 | 16 GB RAM | 16 GB RAM |
硬盘 | 60 GB | 60 GB |
在规划代理节点的内存要求时,应确保代理已配置成可最式程序减少交换空间的使用。建议的最佳实践是优化群集性能并减少潜在资源消耗问题,以尽可能禁用群集中所有代理的内存交换。
除 [群集中所有管理节点和代理节点] 中所述的要求以外(#CommonReqs),代理节点必须:
-
带 20 GB 或更多可用空间的
/var
目录。此目录由沙盒用于 Docker 和 DC/OS 通用容器运行时. -
请勿在您打算使用 DC/OS CLI 的系统上使用
noexec
来挂载/tmp
目录,除非 TMPDIR 环境变量设置为/tmp/
. 以外的其他值。使用/tmp
选项来挂载noexec
可能会破坏 CLI 功能。 -
如果计划一个拥有数百个代理节点的群集或打算以较高速度部署和删除服务,则建议将此目录隔离到专用固态硬盘存储。
目录路径 描述 /var/lib/mesos/ -
对于会发展到数千个节点的群集,建议将此目录结构进一步分解为具体服务的单个挂载点。
目录路径 描述 /var/lib/mesos/slave/slaves /var/lib/mesos/slave/volumes /var/lib/mesos/docker/store /var/lib/docker
端口和协议配置
- 必须在所有节点上启用安全外壳 (SSH)。
- 必须在所有节点上启用互联网控制消息协议 (ICMP)。
- 所有主机名(FQDN 和简短主机名)在 DNS 中必须可解析;正向和反向查找必须成功。Enterprise
- 所有 DC/OS 节点主机名均应解析为本地可绑定 IP 地址。大多数应用程序都必需通过绑定到本地 IP 地址来解析主机名才能正常运行。无法通过绑定到本地 IP 地址来解析节点主机名的应用程序可能无法以非常规方式运行或行事。Enterprise
- 每个节点均可从 bootstrap 节点访问网络。
- 每个节点均具有从本身到 DC/OS 群集中所有节点的不受限制 IP 至 IP 连接。
- 所有端口都应打开,以进行从管理节点到代理节点的通信,反之亦然。Enterprise
- UDP 必须打开才能进入管理节点上的端口 53。为连接到群集,Mesos 代理节点服务 (
dcos-mesos-slave
) 使用此端口查找leader.mesos
.
DC/OS 用户与管理节点之间的中介(例如,执行 SSL 终止的反向代理)要求:
- 在向客户端发送任何数据之前,中介不必缓冲整个回复。
- 检测到客户端消失时,中介还应该关闭相应的上游 TCP 连接(即,中介 不应重复使用上游 HTTP 连接)。
高速互联网访问
建议为 DC/OS 安装使用高速互联网连接。DC/OS 服务需要每秒至少 10 MBit。如果工件下载时间超过文件 中 MESOS_EXECUTOR_REGISTRATION_TIMEOUT 的值,某些 DC/OS 服务的安装将失败。/opt/mesosphere/etc/mesos-slave-common
. MESOS_EXECUTOR_REGISTRATION_TIMEOUT 的默认值为 10 分钟。
软件前提条件
-
请参阅 install_preeqs.sh 脚本,了解如何在 CentOS 7 主机上安装 DC/OS 管理节点和代理节点的软件要求的示例。Enterprise
-
在 XFS 使用 OverlayFS 时,应使用 -n ftype=1 标记创建 XFS 卷。请参阅 Red Hat 以及 mesos 文档,以了解更多详情。
Docker 要求
Docker 必须安装在所有 bootstrap 和群集节点上。支持的 Docker 版本列于 版本策略页面.
建议
-
不要在
devicemapper
模式下使用 Dockerloop-lvm
存储驱动。如需更多信息,请参阅 Docker 和 Device Mapper 存储驱动. -
在选择生产存储驱动时,最好是
OverlayFS
模式下的devicemapper
或direct-lvm
如需更多信息,请参阅 Docker 的 选择存储驱动. -
使用 管理 CentOS 上的 Docker。
systemd
.systemd
将启动 Docker 并在它崩溃时帮助重启 Dcoker。 -
以根用户(带
sudo
)或 docker 用户组.中用户的身份,运行 Docker 命令。
分配特定的安装
每个 Linux 系统分发都需要以特定方式安装 Docker:
- CentOS/RHEL - 从 Docker 的 Yum 存储库安装 Docker。
- CoreOS - 提供时 Docker 已预先安装和配置。
如需更多信息,请参阅 Docker 的分发特定的安装说明.
禁用 sudo 密码提示
要禁用 sudo
密码提示,必须将以下行添加到 /etc/sudoers
文件。
%wheel ALL=(ALL) NOPASSWD: ALL
或者,您也可以作为 root
用户执行 SSH。
同步群集中所有节点的时间
网络时间协议 (NTP) 必须在群集中的所有节点上启用,以便时钟同步。默认情况下,在 DC/OS 启动期间,如果未启用,将会出现错误。您可以通过运行以下一个命令来检查 NTP 是否启用,具体取决于操作系统和配置:
ntptime
adjtimex -p
timedatectl
bootstrap 节点
在安装 DC/OS 之前,您必须确保 bootstrap 节点具备以下前提条件。
- bootstrap 节点必须与群集节点分开。
DC/OS 配置文件
-
下载 dcos_generate_config 文件 并将其保存到 bootstrap 节点。此文件用于创建自定义的 DC/OS 构建文件。请联系销售代表或 sales@mesosphere.com 以访问此文件。Enterprise
-
下载 dcos_generate_config 文件 并将其保存到 bootstrap 节点。此文件用于创建自定义的 DC/OS 构建文件。Open Source
Docker NGINX(生产安装)
仅用于生产安装,使用此命令安装 Docker NGINX 镜像:
sudo docker pull nginx
群集节点
仅对于生产安装,群集节点必须具备以下前提条件。在安装期间,群集节点被指定为 Mesos 管理节点和代理节点。
数据压缩(生产安装)
您必须在群集节点上安装 UnZip、GNU tar 和 XZ Utils 数据压缩实用程序。
在 CentOS7 和 RHEL7 上安装此类实用程序:
sudo yum install -y tar xz unzip curl ipset
群集权限(生产安装)
在每个群集节点上,遵循以下说明:
-
确保 SELinux 属于受支持的模式之一。
要检查当前 SELinux 状态和配置,请运行以下命令:
sudo sestatus
DC/OS 支持以下 SELinux 配置:
- 当前模式:
disabled
- 当前模式:
permissive
- 当前模式:
enforcing
,鉴于Loaded policy name
是targeted
此模式在 CoreOS 上不受支持。
要将模式从
enforcing
更改为permissive
,请运行以下命令:sudo sed -i 's/SELINUX=enforcing/SELINUX=permissive/g' /etc/selinux/config
或者,如果
sestatus
显示“当前模式”为enforcing
,但Loaded policy name
不是targeted
,请运行以下命令,将Loaded policy name
更改为targeted
:sudo sed -i 's/SELINUXTYPE=.*/SELINUXTYPE=targeted/g' /etc/selinux/config
- 当前模式:
-
添加
nogroup
和docker
组:sudo groupadd nogroup && sudo groupadd docker
-
重新启动群集,以使更改生效。
sudo reboot
区域设置要求
您必须将 LC_ALL
和 LANG
环境变量设置为 en_US.utf-8
.
-
有关如何在 Red Hat 中设置这些变量的信息,请参阅 如何在 RHEL 上更改系统区域设置
-
在 Linux 系统上:
localectl set-locale LANG=en_US.utf8
- 有关如何在 CentOS7 中设置这些变量的信息,请参阅 如何在 CentOS7 上设定系统区域设置.