您可以使用维护窗口或通过手动终止代理来更新活动 DC/OS 群集中的代理节点。维护窗口是首选方法,因为这通常更稳定,不容易出错。
如果您正在缩小群集、重新配置代理节点或将节点移动到新 IP,这些步骤非常有用。更改 Mesos 属性(/var/lib/dcos/mesos-slave-common
) 或资源(/var/lib/dcos/mesos-resources
)时,您必须删除代理节点,并以新的 UUID 在管理节点上重新注册它。然后,管理节点将识别新的属性和资源规范。
先决条件:
- 已安装和配置 SSH。这是通过手动终止代理来删除节点所需的。
- 可访问 Admin Router 权限。
使用维护窗口
使用维护窗口,您可以从群集外部同时排放多个节点。无需 SSH 访问。
您可以定义维护计划以在更改代理属性或资源之前撤退您的任务。
-
定义维护计划。例如,此处是已经指定示例机器 (
machine_ids
) 和维护窗口(unavailability
)的基本维护计划 JSON 文件:{ "windows" : [ { "machine_ids" : [ { "hostname" : "10.0.2.107", "ip" : "10.0.2.107" }, { "hostname" : "10.0.2.5", "ip" : "10.0.2.5" } ], "unavailability" : { "start" : { "nanoseconds" : 1 }, "duration" : { "nanoseconds" : 3600000000000 } } } ] }
如需更复杂的示例,请参阅 maintain-agents.sh 脚本。
-
指定机器 JSON 定义之后调用
machine/down
端点。例如,此处 是一个调用/machine/down/
.的脚本。 -
执行维护。
-
通过使用指定的添加代理 JSON 定义,调用
machine/up
端点来添加代理到您的群集中。例如:[ { "hostname" : "10.0.2.107", "ip" : "10.0.2.107" }, { "hostname" : "10.0.2.5", "ip" : "10.0.2.5" } ]
手动终止代理
使用终止信号 SIGUSR1 排空节点,这易于与可在节点上平行地执行任务的自动化工具集成,例如,Ansible、Chef 和 Puppet。
-
在代理节点上打开安全外壳 SSH
-
运行相应命令终止代理。
- 专用代理 运行:
sudo sh -c 'systemctl kill -s SIGUSR1 dcos-mesos-slave && systemctl stop dcos-mesos-slave'
- 公用代理 运行:
sudo sh -c 'systemctl kill -s SIGUSR1 dcos-mesos-slave-public && systemctl stop dcos-mesos-slave-public'
-
执行维护。
-
如需将节点重新添加到您的集群,可通过重新加载
systemd
配置。sudo systemctl daemon-reload
如果在不更改代理属性或资源的情况下执行代理维护,请在重新加载
systemd
配置后继续执行下一步骤。但是,如果要在更新节点时更改代理属性或资源,则应删除代理节点上的latest
符号链接。要删除代理节点上的
latest
元数据指针,请在要更改代理设置的专用和公用代理节点上运行以下命令:sudo rm /var/lib/mesos/slave/meta/slaves/latest
删除
latest
元数据符号链接后继续下一步骤。 -
通过运行相应命令重新启动代理。
- 专用代理 运行:
sudo systemctl start dcos-mesos-slave
- 公用代理 运行:
sudo systemctl start dcos-mesos-slave-public
-
运行以下命令检查变更状态:
sudo systemctl status dcos-mesos-slave