Документация находится в разработке, может содержать неполную информацию.
Добавление статического узла в кластер
Добавление статического узла можно выполнить вручную или с помощью Cluster API Provider Static.
Добавление статического узла вручную
Чтобы добавить bare-metal сервер в кластер как статический узел, выполните следующие шаги:
-
Используйте существующий custom resource NodeGroup или создайте новый, задав для параметра
nodeType
значениеStatic
илиCloudStatic
.Пример ресурса NodeGroup с именем
worker
:apiVersion: deckhouse.io/v1 kind: NodeGroup metadata: name: worker spec: nodeType: Static
-
Получите код скрипта в кодировке Base64 для добавления и настройки узла.
Пример получения кода скрипта в кодировке Base64 для добавления узла в NodeGroup
worker
:NODE_GROUP=worker d8 k -n d8-cloud-instance-manager get secret manual-bootstrap-for-${NODE_GROUP} -o json | jq '.data."bootstrap.sh"' -r
-
Выполните предварительную настройку нового узла в соответствии с особенностями вашего окружения:
- добавьте необходимые точки монтирования в файл
/etc/fstab
(NFS, Ceph и т. д.); - установите необходимые пакеты (например,
ceph-common
); - настройте сетевую связность между новым узлом и остальными узлами кластера.
-
Подключитесь на новый узел по SSH и выполните следующую команду, вставив полученную в п.2 Base64-строку:
echo <Base64-КОД-СКРИПТА> | base64 -d | bash
Добавление статического узла с помощью CAPS
Чтобы узнать об инструменте Cluster API Provider Static (CAPS) подробнее, обратитесь к разделу Настройка узла через CAPS.
Пример добавления статического узла в кластер с помощью CAPS:
-
Выделите сервер с установленной операционной системой (ОС) и настройте сетевую связность. При необходимости установите специфические для ОС пакеты и добавьте точки монтирования, которые потребуются на узле.
-
Создайте пользователя (в примере —
caps
) с возможностью выполнятьsudo
, выполнив на сервере следующую команду:useradd -m -s /bin/bash caps usermod -aG sudo caps
-
Разрешите пользователю выполнять команды через
sudo
без пароля. Для этого на сервере внесите следующую строку в конфигурациюsudo
(отредактировав файл/etc/sudoers
, выполнив командуsudo visudo
или другим способом):caps ALL=(ALL) NOPASSWD: ALL
-
Сгенерируйте на сервере пару SSH-ключей с пустой парольной фразой:
ssh-keygen -t rsa -f caps-id -C "" -N ""
Публичный и приватный ключи пользователя
caps
будут сохранены в файлахcaps-id.pub
иcaps-id
в текущей директории на сервере. -
Добавьте полученный публичный ключ в файл
/home/caps/.ssh/authorized_keys
пользователяcaps
, выполнив в директории с ключами на сервере следующие команды:mkdir -p /home/caps/.ssh cat caps-id.pub >> /home/caps/.ssh/authorized_keys chmod 700 /home/caps/.ssh chmod 600 /home/caps/.ssh/authorized_keys chown -R caps:caps /home/caps/
-
В операционных системах семейства Astra Linux, при использовании модуля мандатного контроля целостности Parsec, сконфигурируйте максимальный уровень целостности для пользователя
caps
:pdpl-user -i 63 caps
-
-
Создайте в кластере ресурс SSHCredentials.
-
Для доступа к добавляемому серверу, компоненту CAPS необходим приватный ключ сервисного пользователя
caps
. Ключ в формате Base64 добавляется в ресурс SSHCredentials.В директории с ключами пользователя на сервере выполните следующую команду для получения закрытого ключа в формате Base64:
base64 -w0 caps-id
-
На любом компьютере, настроенном на управление кластером, создайте переменную окружения с приватным ключом в формате Base64, полученным на предыдущем шаге (в начале команды добавьте пробел, чтобы ключ не сохранился в истории команд):
CAPS_PRIVATE_KEY_BASE64=<ЗАКРЫТЫЙ_КЛЮЧ_В_BASE64>
-
Создайте ресурс SSHCredentials с именем сервисного пользователя и его приватным ключом:
d8 k create -f - <<EOF apiVersion: deckhouse.io/v1alpha1 kind: SSHCredentials metadata: name: static-0-access spec: user: caps privateSSHKey: "${CAPS_PRIVATE_KEY_BASE64}" EOF
-
-
Создайте в кластере ресурс StaticInstance:
Ресурс StaticInstance определяет IP-адрес сервера статического узла и данные для доступа к серверу:
d8 k create -f - <<EOF apiVersion: deckhouse.io/v1alpha1 kind: StaticInstance metadata: name: static-0 spec: # Укажите IP-адрес сервера статического узла. address: "<SERVER-IP>" credentialsRef: kind: SSHCredentials name: static-0-access EOF
-
Создайте в кластере ресурс NodeGroup:
d8 k create -f - <<EOF apiVersion: deckhouse.io/v1 kind: NodeGroup metadata: name: worker spec: nodeType: Static staticInstances: count: 1 EOF
-
Дождитесь, когда ресурс NodeGroup перейдёт в состояние
Ready
. Чтобы проверить состояние ресурса, выполните следующую команду:d8 k get ng worker
В статусе NodeGroup в колонке
READY
должен появиться 1 узел:NAME TYPE READY NODES UPTODATE INSTANCES DESIRED MIN MAX STANDBY STATUS AGE SYNCED worker Static 1 1 1 15m True
Добавление статического узла с помощью Cluster API Provider Static и фильтров в label selector
Чтобы подключить разные StaticInstance в разные NodeGroup можно использовать label selector, указываемый в NodeGroup и в метаданных StaticInstance.
Для примера разберём задачу распределения 3 статических узлов по 2 NodeGroup: 1 узел добавим в группу worker и 2 узла в группу front.
-
Подготовьте необходимые ресурсы (3 сервера) и создайте для них ресурсы SSHCredentials, аналогично п.1 и п.2 предыдущего примера.
-
Создайте в кластере два ресурса NodeGroup:
Укажите
labelSelector
, чтобы в NodeGroup подключались только сервера, совпадающие с ним.d8 k create -f - <<EOF apiVersion: deckhouse.io/v1 kind: NodeGroup metadata: name: front spec: nodeType: Static staticInstances: count: 2 labelSelector: matchLabels: role: front --- apiVersion: deckhouse.io/v1 kind: NodeGroup metadata: name: worker spec: nodeType: Static staticInstances: count: 1 labelSelector: matchLabels: role: worker EOF
-
Создайте в кластере ресурсы StaticInstance
Укажите актуальные IP-адреса серверов и задайте лейбл
role
в метаданных:d8 k create -f - <<EOF apiVersion: deckhouse.io/v1alpha1 kind: StaticInstance metadata: name: static-front-1 labels: role: front spec: address: "<SERVER-FRONT-IP1>" credentialsRef: kind: SSHCredentials name: front-1-credentials --- apiVersion: deckhouse.io/v1alpha1 kind: StaticInstance metadata: name: static-front-2 labels: role: front spec: address: "<SERVER-FRONT-IP2>" credentialsRef: kind: SSHCredentials name: front-2-credentials --- apiVersion: deckhouse.io/v1alpha1 kind: StaticInstance metadata: name: static-worker-1 labels: role: worker spec: address: "<SERVER-WORKER-IP>" credentialsRef: kind: SSHCredentials name: worker-1-credentials EOF
-
Чтобы проверить результат, выполните следующую команду:
d8 k get ng
В результате будет выведен список созданных ресурсов NodeGroup с распределенными между ними статическими узлами:
NAME TYPE READY NODES UPTODATE INSTANCES DESIRED MIN MAX STANDBY STATUS AGE SYNCED master Static 1 1 1 1h True front Static 2 2 2 1h True
Как понять, что что-то пошло не так?
Если узел в NodeGroup не обновляется (значение UPTODATE
при выполнении команды d8 k get nodegroup
меньше значения NODES
) или вы предполагаете какие-то другие проблемы, которые могут быть связаны с модулем node-manager
, нужно посмотреть логи сервиса bashible
. Сервис bashible
запускается на каждом узле, управляемом модулем node-manager
.
Чтобы посмотреть логи сервиса bashible
, выполните на узле следующую команду:
journalctl -fu bashible
Пример вывода, когда все необходимые действия выполнены:
May 25 04:39:16 kube-master-0 systemd[1]: Started Bashible service.
May 25 04:39:16 kube-master-0 bashible.sh[1976339]: Configuration is in sync, nothing to do.
May 25 04:39:16 kube-master-0 systemd[1]: bashible.service: Succeeded.
Удаление узла из кластера
Инструкция справедлива как для узла, настроенного вручную (с помощью bootstrap-скрипта), так и для узла, настроенного с помощью CAPS.
Чтобы вывести из кластера узел и очистить сервер (ВМ), выполните следующую команду на узле:
bash /var/lib/bashible/cleanup_static_node.sh --yes-i-am-sane-and-i-understand-what-i-am-doing
Как зачистить узел для последующего ввода в кластер?
Это необходимо только в том случае, если нужно переместить статический узел из одного кластера в другой. Имейте в виду, что эти операции удаляют данные локального хранилища. Если необходимо просто изменить NodeGroup, следуйте инструкции по смене NodeGroup.
Если на зачищаемом узле есть пулы хранения LINSTOR/DRBD, чтобы выгнать ресурсы с узла и удалить узел LINSTOR/DRBD, следуйте соответствующей инструкции модуля sds-replicated-volume
.
Чтобы зачистить узел для последующего ввода в кластер, выполните следующие шаги:
-
Удалите узел из кластера Kubernetes:
d8 k drain <node> --ignore-daemonsets --delete-local-data d8 k delete node <node>
-
Запустите на узле скрипт очистки:
bash /var/lib/bashible/cleanup_static_node.sh --yes-i-am-sane-and-i-understand-what-i-am-doing
-
После перезагрузки узел можно добавить в другой кластер.
FAQ
Можно ли удалить StaticInstance?
StaticInstance, находящийся в состоянии Pending
, можно удалять без каких-либо проблем.
Чтобы удалить StaticInstance находящийся в любом состоянии, отличном от Pending
(Running
, Cleaning
, Bootstrapping
):
- Добавьте лейбл
"node.deckhouse.io/allow-bootstrap": "false"
в StaticInstance. - Дождитесь, пока StaticInstance перейдет в статус
Pending
. - Удалите StaticInstance.
- Уменьшите значение параметра
NodeGroup.spec.staticInstances.count
на 1. - Дождитесь
Ready
состояния NodeGroup.
Как изменить IP-адрес StaticInstance?
Изменить IP-адрес в ресурсе StaticInstance нельзя. Если в StaticInstance указан ошибочный адрес, то нужно удалить StaticInstance и создать новый.
Как мигрировать статический узел, настроенный вручную, под управление CAPS?
Необходимо выполнить очистку узла, затем добавить узел под управление CAPS.
Как изменить NodeGroup у статического узла?
Если узел находится под управлением CAPS, то изменить принадлежность к NodeGroup у такого узла нельзя. Единственный вариант — удалить StaticInstance и создать новый.
Если статический узел был добавлен в кластер вручную, то для перемещения его в другую NodeGroup необходимо изменить лейбл с именем группы и удалить лейбл с ролью:
d8 k label node --overwrite <node_name> node.deckhouse.io/group=<new_node_group_name>
d8 k label node <node_name> node-role.kubernetes.io/<old_node_group_name>-
Применение изменений потребует некоторого времени.
Как посмотреть, что в данный момент выполняется на узле при его создании?
Если необходимо узнать, что происходит на узле (к примеру, он долго создается, завис в состоянии Pending
), можно посмотреть логи cloud-init
. Для этого выполните следующие шаги:
-
Найдите узел, который сейчас бутстрапится:
d8 k get instances | grep Pending
Пример вывода команды:
dev-worker-2a6158ff-6764d-nrtbj Pending 46s
-
Получите информацию о параметрах подключения для просмотра логов:
d8 k get instances dev-worker-2a6158ff-6764d-nrtbj -o yaml | grep 'bootstrapStatus' -B0 -A2
Пример вывода команды:
bootstrapStatus: description: Use 'nc 192.168.199.178 8000' to get bootstrap logs. logsEndpoint: 192.168.199.178:8000
-
Выполните полученную команду (в примере выше —
nc 192.168.199.178 8000
), чтобы получить логиcloud-init
для последующей диагностики.Логи первоначальной настройки узла находятся в
/var/log/cloud-init-output.log
.