Документация платформы

Администрирование
Настройка платформы
Хранилища
Программно-определяемые хранилища (SDS)
Реплицируемое хранилище на основе DRBD
Управление реплицируемым хранилищем на основе DRBD

Управление реплицируемым хранилищем на основе DRBD

Ссылки на связанную документацию и API:

Работоспособность гарантируется только при соблюдении системных требований. Использование в иных условиях возможно, однако стабильная работа не гарантируется.

Системные требования

Применимо как к однозональным кластерам, так и к кластерам с использованием нескольких зон доступности.

Используйте стоковые ядра, поставляемые вместе с поддерживаемыми дистрибутивами.
Для сетевого соединения используйте инфраструктуру с пропускной способностью 10 Gbps или выше.
Чтобы достичь максимальной производительности, сетевая задержка между узлами должна находиться в пределах 0,5–1 мс.
Не используйте другой SDS (Software defined storage) для предоставления дисков SDS Deckhouse.

Получение информации об использовании пространства

Доступно два способа получения информации:

Через дашборд Grafana:

Перейдите в раздел «Dashboards» → «Storage» → «LINSTOR/DRBD». В правом верхнем углу отображается текущий уровень занятости пространства кластера.

Внимание. Значение отражает состояние всего доступного пространства. При создании томов с двумя репликами полученные цифры следует делить на два, чтобы оценить, сколько томов реально можно разместить.
Через командный интерфейс:
```
d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor storage-pool list
```
Внимание. Значение отражает состояние всего доступного пространства. При создании томов с двумя репликами полученные цифры следует делить на два, чтобы оценить, сколько томов реально можно разместить.

Назначение StorageClass по умолчанию

Для назначения StorageClass по умолчанию необходимо в кастомном ресурсе ReplicatedStorageClass в поле spec.isDefault указать значение true.

Добавление существующей LVMVolumeGroup

Присвойте Volume Group LVM-тег storage.deckhouse.io/enabled=true:
```
vgchange myvg-0 --add-tag storage.deckhouse.io/enabled=true
```
После этого Volume Group будет автоматически обнаружена, и для неё будет создан ресурс LVMVolumeGroup.
Полученный ресурс укажите в параметрах ReplicatedStoragePool в поле spec.lvmVolumeGroups[].name. Если используется пул LVMThin, дополнительно задайте имя в spec.lvmVolumeGroups[].thinPoolName.

Изменение ограничений DRBD‑томов и портов кластера

Портовой диапазон по умолчанию для DRBD-ресурсов — TCP 7000–7999. Переопределить его можно с помощью настройки drbdPortRange, указав нужные значения minPort и maxPort.

После изменения параметров drbdPortRange перезапустите контроллер LINSTOR, чтобы новые настройки вступили в силу. При этом существующие DRBD-ресурсы сохранят назначенные им порты.

Корректная перезагрузка узла с DRBD‑ресурсами

Чтобы обеспечить стабильную работу модуля, не перезагружайте несколько узлов одновременно.

Выполните drain нужного узла:

d8 k drain test-node-1 --ignore-daemonsets --delete-emptydir-data

Убедитесь, что нет проблемных DRBD-ресурсов и ресурсов в состоянии SyncTarget. Чтобы проверить это, выполните следующую команду и проанализируйте вывод:
```
d8 k -n d8-sds-replicated-volume exec -t deploy/linstor-controller -- linstor r l --faulty
```
Если ресурсы в состоянии SyncTarget присутствуют, дождитесь завершения синхронизации или выполните корректирующие действия.

Пример вывода:
```
Defaulted container "linstor-controller" out of: linstor-controller, kube-rbac-proxy
+----------------------------------------------------------------+
| ResourceName | Node | Port | Usage | Conns | State | CreatedOn |
|================================================================|
+----------------------------------------------------------------+
```
Перезагрузите узел и дождитесь синхронизации всех DRBD-ресурсов, затем выполните uncordon:
```
d8 k uncordon test-node-1
node/test-node-1 uncordoned
```

При необходимости перезагрузки еще одного узла повторите алгоритм.

Перемещение ресурсов для освобождения места в Storage Pool

Просмотрите список Storage Pool на исходном узле, чтобы определить, в каком из них недостаточно свободного места:
```
d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor storage-pool list -n OLD_NODE
```
Определите, какие тома находятся в переполненном Storage Pool, чтобы понять, какие из них можно перенести:
```
d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor volume list -n OLD_NODE
```
Получите список ресурсов, к которым относятся эти тома, чтобы далее можно было инициировать их перенос:
```
d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor resource list-volumes
```

Создайте копии выбранных ресурсов на другом узле (не более 1–2 ресурсов одновременно):

d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor --yes-i-am-sane-and-i-understand-what-i-am-doing resource create NEW_NODE RESOURCE_NAME

Дождитесь завершения синхронизации ресурсов между узлами, чтобы убедиться в корректности переноса:
```
d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor resource-definition wait-sync RESOURCE_NAME
```

Удалите ресурсы с исходного узла, чтобы освободить место в переполненном Storage Pool:

d8 k exec -n d8-sds-replicated-volume deploy/linstor-controller -- linstor --yes-i-am-sane-and-i-understand-what-i-am-doing resource delete OLD_NODE RESOURCE_NAME

Автоматизированное управление репликами и мониторинг состояния LINSTOR

Управление репликами и мониторинг состояния автоматизированы в скрипте replicas_manager.sh. Он проверяет доступность контроллера LINSTOR, выявляет неисправные или поврежденные ресурсы, создает резервные копии базы данных и управляет дисковыми репликами, включая настройку TieBreaker для кворума.

Чтобы проверить существование скрипта replicas_manager.sh, выполните команду на любом из master-узлов:

   ls -l /opt/deckhouse/sbin/replicas_manager.sh

После запуска скрипт выполняет следующие действия:

проверяет доступность контроллера и соединение с сателлитами;
выявляет неисправные или поврежденные ресурсы;
создает резервную копию базы данных;
управляет количеством дисковых реплик, добавляя новые при необходимости;
настраивает TieBreaker для ресурсов с двумя репликами;
логирует все действия в файл linstor_replicas_manager_<дата_и_время>.log;
предоставляет рекомендации по устранению проблем, таких как застрявшие реплики.

Переменные для настройки replicas_manager.sh:

NON_INTERACTIVE — включает неинтерактивный режим;
TIMEOUT_SEC — таймаут между попытками, в секундах (по умолчанию: 10);
EXCLUDED_RESOURCES_FROM_CHECK — регулярное выражение для исключения ресурсов из проверок;
CHUNK_SIZE — размер чанка для обработки ресурсов (по умолчанию: 10);
NODE_FOR_EVICT — имя узла, исключаемого из создания реплик;
LINSTOR_NAMESPACE — пространство имен Kubernetes (по умолчанию: d8-sds-replicated-volume);
DISKLESS_STORAGE_POOL — пул для diskless-реплик (по умолчанию: DfltDisklessStorPool).

Вытеснение DRBD‑ресурсов с узла

Вытеснение DRBD-ресурсов с узла выполняется скриптом evict.sh. Он может работать в одном из двух режимов:

Удаление узла — создаются дополнительные реплики для каждого ресурса, после чего узел удаляется из LINSTOR и Kubernetes.
Удаление ресурсов — создаются реплики для ресурсов, затем сами ресурсы удаляются из LINSTOR (узел остаётся в кластере).

Подготовка и запуск скрипта

Перед выполнением вытеснения:

Убедитесь в наличии скрипта на master-узле:
```
ls -l /opt/deckhouse/sbin/evict.sh
```

Исправьте ошибочные ресурсы:

d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor resource list --faulty

Проверьте, что все поды в пространстве имён d8-sds-replicated-volume находятся в состоянии Running:
```
d8 k -n d8-sds-replicated-volume get pods | grep -v Running
```

Пример удаления узла из LINSTOR и Kubernetes

Запустите скрипт evict.sh на любом из master-узлов в интерактивном режиме, указав режим удаления --delete-node:

/opt/deckhouse/sbin/evict.sh --delete-node

Для неинтерактивного режима добавьте флаг --non-interactive и укажите имя узла. В этом режиме скрипт выполнит все действия без запроса подтверждения от пользователя:

/opt/deckhouse/sbin/evict.sh --non-interactive --delete-node --node-name "worker-1"

Пример удаления ресурсов с узла

Запустите скрипт evict.sh на любом из master-узлов в интерактивном режиме, указав режим удаления --delete-resources-only:

/opt/deckhouse/sbin/evict.sh --delete-resources-only

/opt/deckhouse/sbin/evict.sh --non-interactive --delete-resources-only --node-name "worker-1"

По окончании работы скрипта узел остаётся в статусе SchedulingDisabled, а в LINSTOR выставляется свойство AutoplaceTarget=false. Это блокирует автоматическое создание новых ресурсов на узле.

Чтобы вновь разрешить размещение ресурсов, выполните:

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor node set-property "worker-1" AutoplaceTarget
d8 k uncordon "worker-1"

Проверьте параметр AutoplaceTarget у всех узлов (поле AutoplaceTarget будет пустым у тех узлов, на которых разрешено размещать ресурсы LINSTOR):

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor node list -s AutoplaceTarget

Параметры скрипта evict.sh

--delete-node — удаление узла из LINSTOR и Kubernetes с предварительным созданием дополнительных реплик для всех ресурсов, размещенных на узле.
--delete-resources-only — удаление ресурсов с узла без удаления узла из LINSTOR и Kubernetes с предварительным созданием дополнительных реплик для всех ресурсов, размещенных на узле.
--non-interactive — запуск скрипта в неинтерактивном режиме.
--node-name — имя узла, с которого необходимо вытеснить ресурсы. Параметр обязателен для использования в режиме --non-interactive.
--skip-db-backup — пропустить создание резервной копии БД LINSTOR перед выполнением операций.
--ignore-advise — выполнить операции, несмотря на предупреждения команды linstor advise resource. Следует использовать, если скрипт был прерван и количество реплик у части ресурсов не соответствует указанному в ReplicatedStorageClass.
--exclude-resources-from-check — исключить из проверки ресурсы, перечисленные через символ |.

Диагностика проблем

Проблемы могут возникнуть на разных уровнях работы компонентов. Ниже приведена шпаргалка для диагностики неисправностей томов в LINSTOR.

Диагностика неисправностей томов в LINSTOR

Ошибка запуска linstor-node при загрузке DRBD‑модуля

Проверьте состояние подов linstor-node:

d8 k get pod -n d8-sds-replicated-volume -l app=linstor-node

Если некоторые поды находятся в состоянии Init, проверьте версию DRBD и логи bashible на узле:
```
cat /proc/drbd
journalctl -fu bashible
```

Наиболее вероятные причины:

Загружена версия DRBDv8 вместо требуемой DRBDv9. Проверьте версию:
```
cat /proc/drbd
```
Если файл /proc/drbd отсутствует, значит модуль не загружен и проблема не в этом.
Включён Secure Boot. Поскольку DRBD компилируется динамически (аналог dkms) без цифровой подписи, модуль не поддерживается при включённом Secure Boot.

Ошибка FailedMount при запуске пода

При зависании пода на стадии ContainerCreating

Если под завис на стадии ContainerCreating, а в выводе команды d8 k describe pod присутствуют ошибки аналогичные той, что представлена ниже, значит устройство смонтировано на одном из других узлов:

rpc error: code = Internal desc = NodePublishVolume failed for pvc-b3e51b8a-9733-4d9a-bf34-84e0fee3168d: checking
for exclusive open failed: wrong medium type, check device health

Проверьте, где используется устройство, с помощью следующей команды:

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor resource list -r pvc-b3e51b8a-9733-4d9a-bf34-84e0fee3168d

Флаг InUse покажет, на каком узле используется устройство. На этом узле потребуется вручную отмонтировать диск.

Ошибки Input/output error

Такие ошибки обычно возникают на этапе создания файловой системы (mkfs). Проверьте dmesg на узле, где запускается под:

dmesg | grep 'Remote failed to finish a request within'

Если вывод содержит сообщения вида Remote failed to finish a request within …, возможно, скорость дисковой подсистемы недостаточна для корректной работы DRBD.

После удаления ресурса ReplicatedStoragePool остаётся соответствующий ему Storage Pool

Это ожидаемое поведение. Модуль sds-replicated-volume не обрабатывает операции удаления ресурса ReplicatedStoragePool.

Ограничения на изменение spec ReplicatedStorageClass

Изменению подлежит только поле isDefault. Остальные параметры ресурса являются неизменяемыми — такое поведение является ожидаемым.

Удаление дочернего StorageClass при удалении ReplicatedStorageClass

Если StorageClass находится в статусе Created, его можно удалить. При наличии иных статусов потребуется восстановление ресурса или ручное удаление StorageClass.

Ошибки при создании Storage Pool или StorageClass

При временных внешних проблемах (например, при недоступности kube-apiserver) модуль автоматически повторит выполнение неудачной операции.

Ошибка “You’re not allowed to change state of linstor cluster manually”

Операции, которые требуют ручного вмешательства, в модуле sds-replicated-volume частично или полностью автоматизированы. Поэтому модуль sds-replicated-volume ограничивает список разрешенных команд в LINSTOR. Например, автоматизировано создание Tie-Breaker, — сам LINSTOR иногда их не создает для ресурсов с двумя репликами. Чтобы посмотреть список разрешённых команд, выполните:

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor --help

Восстановление БД из резервной копии

Резервные копии ресурсов бэкенда хранятся в секретах в виде YAML-файлов, сегментированных для удобства восстановления. Резервное копирование происходит автоматически по расписанию.

Пример корректно сформированной резервной копии выглядит следующим образом:

linstor-20240425074718-backup-0              Opaque                           1      28s     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-1              Opaque                           1      28s     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-2              Opaque                           1      28s     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-completed      Opaque                           0      28s     <none>

Резервная копия хранится закодированными сегментами в секретах вида linstor-%date_time%-backup-{0..2}. Секрет вида linstor-%date_time%-backup-completed не содержит данных, и служит маркером корректно отработавшего процесса резервного копирования.

Процесс восстановления резервной копии

Задайте переменные окружения:

NAMESPACE="d8-sds-replicated-volume"
BACKUP_NAME="linstor_db_backup"

Проверьте наличие резервных копий:

d8 k -n $NAMESPACE get secrets --show-labels

Пример вывода команды:

linstor-20240425072413-backup-0              Opaque                           1      33m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072413
linstor-20240425072413-backup-1              Opaque                           1      33m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072413
linstor-20240425072413-backup-2              Opaque                           1      33m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072413
linstor-20240425072413-backup-completed      Opaque                           0      33m     <none>
linstor-20240425072510-backup-0              Opaque                           1      32m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072510
linstor-20240425072510-backup-1              Opaque                           1      32m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072510
linstor-20240425072510-backup-2              Opaque                           1      32m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072510
linstor-20240425072510-backup-completed      Opaque                           0      32m     <none>
linstor-20240425072634-backup-0              Opaque                           1      31m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072634
linstor-20240425072634-backup-1              Opaque                           1      31m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072634
linstor-20240425072634-backup-2              Opaque                           1      31m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072634
linstor-20240425072634-backup-completed      Opaque                           0      31m     <none>
linstor-20240425072918-backup-0              Opaque                           1      28m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072918
linstor-20240425072918-backup-1              Opaque                           1      28m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072918
linstor-20240425072918-backup-2              Opaque                           1      28m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425072918
linstor-20240425072918-backup-completed      Opaque                           0      28m     <none>
linstor-20240425074718-backup-0              Opaque                           1      10m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-1              Opaque                           1      10m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-2              Opaque                           1      10m     sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718
linstor-20240425074718-backup-completed      Opaque                           0      10m     <none>

Каждая резервная копия имеет свой лейбл с временем создания. Выберите нужный и скопируйте лейбл в переменную окружения. В качестве примера используется лейбл самой актуальной копии из вывода выше:
```
LABEL_SELECTOR="sds-replicated-volume.deckhouse.io/linstor-db-backup=20240425074718"
```
Создайте временный каталог для хранения частей архива:
```
TMPDIR=$(mktemp -d)
echo "Временный каталог: $TMPDIR"
```
Создайте пустой архив и объедините данные секретов в один файл:
```
COMBINED="${BACKUP_NAME}_combined.tar"
> "$COMBINED"
```

Получите список секретов по лейблу, дешифруйте данные и поместите данные резервной копии в архив:

MOBJECTS=$(d8 k get rsmb -l "$LABEL_SELECTOR" --sort-by=.metadata.name -o jsonpath="{.items[*].metadata.name}")
   
for MOBJECT in $MOBJECTS; do
  echo "Process: $MOBJECT"
  d8 k get rsmb "$MOBJECT" -o jsonpath="{.data}" | base64 --decode >> "$COMBINED"
done

Распакуйте архив, получив файлы резервной копии:
```
mkdir -p "./backup"
tar -xf "$COMBINED" -C "./backup --strip-components=2
```

Проверьте содержимое резервной копии:

ls ./backup
TMPDIR=$(mktemp -d)
echo "Временный каталог: $TMPDIR"

Пример вывода:

ebsremotes.yaml                    layerdrbdvolumedefinitions.yaml        layerwritecachevolumes.yaml  propscontainers.yaml      satellitescapacity.yaml  secidrolemap.yaml         trackingdate.yaml
files.yaml                         layerdrbdvolumes.yaml                  linstorremotes.yaml          resourceconnections.yaml  schedules.yaml           secobjectprotection.yaml  volumeconnections.yaml
keyvaluestore.yaml                 layerluksvolumes.yaml                  linstorversion.yaml          resourcedefinitions.yaml  secaccesstypes.yaml      secroles.yaml             volumedefinitions.yaml
layerbcachevolumes.yaml            layeropenflexresourcedefinitions.yaml  nodeconnections.yaml         resourcegroups.yaml       secaclmap.yaml           sectyperules.yaml         volumegroups.yaml
layercachevolumes.yaml             layeropenflexvolumes.yaml              nodenetinterfaces.yaml       resources.yaml            secconfiguration.yaml    sectypes.yaml             volumes.yaml
layerdrbdresourcedefinitions.yaml  layerresourceids.yaml                  nodes.yaml                   rollback.yaml             secdfltroles.yaml        spacehistory.yaml
layerdrbdresources.yaml            layerstoragevolumes.yaml               nodestorpool.yaml            s3remotes.yaml            secidentities.yaml       storpooldefinitions.yaml

Восстановите необходимую сущность, применив соответствующий YAML-файл:
```
d8 k apply -f %something%.yaml
```
Либо примените bulk-apply, если нужно полное восстановление:
```
d8 k apply -f ./backup/
```

Отсутствие служебных подов sds-replicated-volume на выбранном узле

С высокой вероятностью проблемы связаны с лейблами на узлах.

Проверьте dataNodes.nodeSelector в настройках модуля:

d8 k get mc sds-replicated-volume -o=jsonpath={.spec.settings.dataNodes.nodeSelector}

Проверьте селекторы, используемые sds-replicated-volume-controller:

d8 k -n d8-sds-replicated-volume get secret d8-sds-replicated-volume-controller-config  -o jsonpath='{.data.config}' | base64 --decode

В секрете d8-sds-replicated-volume-controller-config должны быть селекторы, которые указаны в настройках модуля, а также дополнительно селектор kubernetes.io/os: linux.
Проверьте, что на нужном узле есть все указанные в секрете d8-sds-replicated-volume-controller-config лейблы:
```
d8 k get node worker-0 --show-labels
```
Если лейблов нет, их необходимо добавить через шаблоны в NodeGroup или на узел.
Если лейблы есть, необходимо проверить, есть ли на нужном узле лейбл storage.deckhouse.io/sds-replicated-volume-node=. Если его нет, проверьте, запущен ли sds-replicated-volume-controller и если запущен, то проверьте его логи:
```
d8 k -n d8-sds-replicated-volume get po -l app=sds-replicated-volume-controller
d8 k -n d8-sds-replicated-volume logs -l app=sds-replicated-volume-controller
```

Дополнительная поддержка

Информация о причинах неудачных операций отображается в поле status.reason ресурсов ReplicatedStoragePool и ReplicatedStorageClass. При недостатке информации для диагностики рекомендуется обращаться к логам sds-replicated-volume-controller.

Миграция с модуля linstor на sds-replicated-volume

При миграции временно недоступны control plane LINSTOR и его CSI, что может повлиять на операции с PV (создание, расширение или удаление).

Миграция не затрагивает пользовательские данные, поскольку происходит перенос в новое пространство имён с добавлением компонентов управления томами.

Порядок действий для миграции

Убедитесь, что в бэкенде отсутствуют неисправные ресурсы. Команда должна выводить пустой список:
```
alias linstor='d8 k -n d8-linstor exec -ti deploy/linstor-controller -- linstor'
linstor resource list --faulty
```
Внимание. Перед миграцией все ресурсы должны быть исправны.

Выключите модуль linstor:

d8 k patch moduleconfig linstor --type=merge -p '{"spec": {"enabled": false}}'

Дождитесь, когда пространство имён d8-linstor будет удалено:
```
d8 k get namespace d8-linstor
```

Создайте ресурс ModuleConfig для sds-node-configurator:

d8 k apply -f -<<EOF
apiVersion: deckhouse.io/v1alpha1
kind: ModuleConfig
metadata:
  name: sds-node-configurator
spec:
  enabled: true
  version: 1
EOF

Дождитесь, когда модуль sds-node-configurator перейдет в состояние Ready:
```
d8 k get moduleconfig sds-node-configurator
```
Создайте ресурс ModuleConfig для sds-replicated-volume:

Внимание. Если в настройках модуля sds-replicated-volume не будет указан параметр settings.dataNodes.nodeSelector, то значение для этого параметра при установке модуля sds-replicated-volume будет взято из модуля linstor. Если этот параметр не указан и там, то только в этом случае он останется пустым и все узлы кластера будут считаться узлами для хранения данных.
```
d8 k apply -f - <<EOF
apiVersion: deckhouse.io/v1alpha1
kind: ModuleConfig
metadata:
  name: sds-replicated-volume
spec:
  enabled: true
  version: 1
EOF
```
Дождитесь, когда модуль sds-replicated-volume перейдет в состояние Ready:
```
d8 k get moduleconfig sds-replicated-volume
```
Проверьте настройки модуля sds-replicated-volume:
```
d8 k get moduleconfig sds-replicated-volume -oyaml
```
Дождитесь, пока все поды в пространстве имён d8-sds-replicated-volume и d8-sds-node-configurator перейдут в состояние Ready или Completed:
```
d8 k get po -n d8-sds-node-configurator
d8 k get po -n d8-sds-replicated-volume
```

Измените алиас к команде linstor и проверьте ресурсы:

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor resource list --faulty

Если неисправные ресурсы не обнаружены, значит миграция была успешной.

Миграция на ReplicatedStorageClass

StorageClass в данном модуле управляются через ресурс ReplicatedStorageClass. Вручную StorageClass создаваться не должны.

При миграции с модуля LINSTOR удалите старые StorageClass и создайте новые через ресурс ReplicatedStorageClass в соответствии с таблицей, представленной ниже.

Обратите внимание, что в старых StorageClass нужно смотреть опцию из секции parameter самого StorageClass, а указывать соответствующую опцию при создании нового необходимо в ReplicatedStorageClass.

Параметр StorageClass	ReplicatedStorageClass	Параметр по умолчанию	Примечания
linstor.csi.linbit.com/placementCount: “1”	replication: “None”		Будет создаваться одна реплика тома с данными
linstor.csi.linbit.com/placementCount: “2”	replication: “Availability”		Будут создаваться две реплики тома с данными
linstor.csi.linbit.com/placementCount: “3”	replication: “ConsistencyAndAvailability”	Да	Будут создаваться три реплики тома с данными
linstor.csi.linbit.com/storagePool: “name”	storagePool: “name”		Название используемого storage pool для хранения
linstor.csi.linbit.com/allowRemoteVolumeAccess: “false”	volumeAccess: “Local”		Запрещен удаленный доступ пода к томам с данными (только локальный доступ к диску в пределах узла)

Дополнительно можно задавать параметры:

reclaimPolicy (Delete, Retain) — соответствует параметру reclaimPolicy у старого StorageClass;
zones — перечисление зон, которые нужно использовать для размещения ресурсов (прямое указание названия зон в облаке). Обратите внимание, что удаленный доступ пода к тому с данными возможен только в пределах одной зоны;
volumeAccess может принимать значения Local (доступ строго в пределах узла), EventuallyLocal (реплика данных будет синхронизироваться на узле с запущенным подом спустя некоторое время после запуска), PreferablyLocal (удаленный доступ пода к тому с данными разрешен, volumeBindingMode: WaitForFirstConsumer), Any (удаленный доступ пода к тому с данными разрешен, volumeBindingMode: Immediate);
при необходимости использовать volumeBindingMode: Immediate нужно выставлять параметр ReplicatedStorageClass volumeAccess равным Any.

Миграция на ReplicatedStoragePool

Ресурс ReplicatedStoragePool предназначен для создания Storage Pool в бэкенде модуля. Рекомендуется создать этот ресурс даже для уже существующих Storage Pool и указать в этом ресурсе существующие LVMVolumeGroup. В этом случае контроллер увидит, что соответствующие Storage Pool созданы, и оставит их без изменений, а в поле status.phase созданного ресурса будет отображено значение Created.

Миграция с модуля sds-drbd на sds-replicated-volume

В процессе миграции будет недоступен управляющий слой модуля и его CSI. Это приведет к невозможности создания, расширения или удаления PV и создания или удаления подов, использующих PV DRBD на время проведения миграции.

Миграция не затронет пользовательские данные, поскольку выполняется в новое пространство имён, а управление томами будет передано новым компонентам, которые заменят функциональность прежнего модуля.

Порядок действий для миграции

Убедитесь, что в кластере отсутствуют неисправные DRBD-ресурсы. Команда должна выводить пустой список:
```
alias linstor='d8 k -n d8-sds-drbd exec -ti deploy/linstor-controller -- linstor'
linstor resource list --faulty
```
Внимание. Перед миграцией все DRBD-ресурсы должны работать корректно.

Выключите модуль sds-drbd:

d8 k patch moduleconfig sds-drbd --type=merge -p '{"spec": {"enabled": false}}'

Дождитесь, когда пространство имён d8-sds-drbd будет удалено:
```
d8 k get namespace d8-sds-drbd
```
Создайте ресурс ModuleConfig для sds-replicated-volume:

Внимание. Если в настройках модуля sds-replicated-volume не будет указан параметр settings.dataNodes.nodeSelector, то значение для этого параметра при установке модуля sds-replicated-volume будет взято из модуля sds-drbd. Если этот параметр не указан и там, то только в этом случае он останется пустым и все узлы кластера будут считаться узлами для хранения данных.
```
d8 k apply -f - <<EOF
apiVersion: deckhouse.io/v1alpha1
kind: ModuleConfig
metadata:
  name: sds-replicated-volume
spec:
  enabled: true
  version: 1
EOF
```
Дождитесь, когда модуль sds-replicated-volume перейдет в состояние Ready:
```
d8 k get moduleconfig sds-replicated-volume
```
Проверьте настройки модуля sds-replicated-volume:
```
d8 k get moduleconfig sds-replicated-volume -oyaml
```
Дождитесь, пока все поды в пространстве имён d8-sds-replicated-volume перейдут в состояние Ready или Completed:
```
d8 k get po -n d8-sds-replicated-volume
```

Измените алиас к команде linstor и проверьте ресурсы DRBD:

alias linstor='d8 k -n d8-sds-replicated-volume exec -ti deploy/linstor-controller -- linstor'
linstor resource list --faulty

Если неисправные ресурсы не обнаружены, значит миграция была успешной.

Внимание. Ресурсы DRBDStoragePool и DRBDStorageClass в процессе будут автоматически мигрированы на ReplicatedStoragePool и ReplicatedStorageClass. Ручное вмешательство при этом не требуется.

Логика работы этих ресурсов не изменится. Однако, стоит проверить, не осталось ли в кластере ресурсов DRBDStoragePool или DRBDStorageClass. Если после миграции они существуют, обратитесь в техническую поддержку Deckhouse.

Причины отказа от RAID с sds-replicated-volume

Использование DRBD с более чем одной репликой уже обеспечивает функциональность сетевого RAID. Применение RAID локально может привести к следующим проблемам:

В несколько раз увеличивает дополнительное потребление используемого пространства в случае использования RAID с избыточностью. Например, используется ReplicatedStorageClass с replication, выставленном в ConsistencyAndAvailability. При таких настройках DRBD будет сохранять данные в трех репликах (по одной реплике на три разных узла). Если на этих узлах будет использоваться RAID1, то для хранения 1 ГБ данных потребуется суммарно 6 ГБ места на дисках. RAID с избыточностью есть смысл использовать для упрощения обслуживания серверов в том случае, когда цена хранения не имеет значения. RAID1 в таком случае позволит менять диски на серверах без необходимости перемещения реплик данных с “проблемного” диска.
В случае RAID0 прирост производительности будет незаметен, т. к. репликация данных будет осуществляться по сети и узким местом с высокой вероятностью будет именно сеть. Кроме того, уменьшение надежности хранилища на хосте потенциально будет приводить к недоступности данных, тк в DRBD переключение со сломавшейся реплики на здоровую происходит не мгновенно.

Ручной запуск процесса перевыпуска сертификатов

Несмотря на то, что процесс перевыпуска сертификатов автоматизирован, ручной перевыпуск всё ещё может понадобиться, так как его можно произвести в удобное временное окно, когда допустимо перезапустить объекты модуля. Автоматизированный перевыпуск не перезапускает объекты.

Чтобы вручную инициировать процесс продления сертификатов, создайте ConfigMap с именем manualcertrenewal-trigger:

apiVersion: v1
kind: ConfigMap
metadata:
  name: manualcertrenewal-trigger
  namespace: d8-sds-replicated-volume

Система остановит все необходимые объекты модуля, обновит сертификаты и затем снова их запустит.

Статус операции можно определить с помощью команды:

d8 k -n d8-sds-replicated-volume get cm manualcertrenewal-trigger -ojsonpath='{.data.step}'

Возможные статусы:

Prepared — проверки состояния успешно пройдены, начато время простоя;
TurnedOffAndRenewedCerts — система остановлена, сертификаты обновлены;
TurnedOn — система снова запущена;
Done — операция завершена и готова к повторению.

Сертификаты выдаются сроком на один год и помечаются как устаревающие за 30 дней до истечения срока действия. Система мониторинга оповещает о наличии устаревающих сертификатов с помощью алерта D8LinstorCertificateExpiringIn30d.

Чтобы повторить операцию, достаточно удалить лейбл с триггера с помощью команды:

d8 k -n d8-sds-replicated-volume label cm manualcertrenewal-trigger storage.deckhouse.io/sds-replicated-volume-manualcertrenewal-completed-

Была ли страница полезна?

Спасибо за оценку!

Ваш отклик обрабатыватся, внести изменения можно будет через 5 минут

Произошла ошибка

Пожалуйста, попробуйте позже

Расскажите, что не понравилось

Мало полезного Есть ошибки Непонятно написано Устаревшая информация Другое

Управление реплицируемым хранилищем на основе DRBD

Системные требования

Рекомендации

Получение информации об использовании пространства

Назначение StorageClass по умолчанию

Добавление существующей LVMVolumeGroup

Изменение ограничений DRBD‑томов и портов кластера

Корректная перезагрузка узла с DRBD‑ресурсами

Перемещение ресурсов для освобождения места в Storage Pool

Автоматизированное управление репликами и мониторинг состояния LINSTOR

Вытеснение DRBD‑ресурсов с узла

Подготовка и запуск скрипта

Пример удаления узла из LINSTOR и Kubernetes

Пример удаления ресурсов с узла

Параметры скрипта evict.sh

Диагностика проблем

Ошибка запуска linstor-node при загрузке DRBD‑модуля

Ошибка FailedMount при запуске пода

При зависании пода на стадии ContainerCreating

Ошибки Input/output error

После удаления ресурса ReplicatedStoragePool остаётся соответствующий ему Storage Pool

Ограничения на изменение spec ReplicatedStorageClass

Удаление дочернего StorageClass при удалении ReplicatedStorageClass

Ошибки при создании Storage Pool или StorageClass

Ошибка “You’re not allowed to change state of linstor cluster manually”

Восстановление БД из резервной копии

Процесс восстановления резервной копии

Отсутствие служебных подов sds-replicated-volume на выбранном узле

Дополнительная поддержка

Миграция с модуля linstor на sds-replicated-volume

Порядок действий для миграции

Миграция на ReplicatedStorageClass

Миграция на ReplicatedStoragePool

Миграция с модуля sds-drbd на sds-replicated-volume

Порядок действий для миграции

Причины отказа от RAID с sds-replicated-volume

Рекомендации по использованию локальных дисков

Ручной запуск процесса перевыпуска сертификатов

Произошла ошибка

Расскажите, что не понравилось

Управление реплицируемым хранилищем на основе DRBD

Системные требования

Рекомендации

Получение информации об использовании пространства

Назначение StorageClass по умолчанию

Добавление существующей LVMVolumeGroup

Изменение ограничений DRBD‑томов и портов кластера

Корректная перезагрузка узла с DRBD‑ресурсами

Перемещение ресурсов для освобождения места в Storage Pool

Автоматизированное управление репликами и мониторинг состояния LINSTOR

Вытеснение DRBD‑ресурсов с узла

Подготовка и запуск скрипта

Пример удаления узла из LINSTOR и Kubernetes

Пример удаления ресурсов с узла

Параметры скрипта evict.sh

Диагностика проблем

Ошибка запуска linstor-node при загрузке DRBD‑модуля

Ошибка FailedMount при запуске пода

При зависании пода на стадии ContainerCreating

Ошибки Input/output error

После удаления ресурса ReplicatedStoragePool остаётся соответствующий ему Storage Pool

Ограничения на изменение spec ReplicatedStorageClass

Удаление дочернего StorageClass при удалении ReplicatedStorageClass

Ошибки при создании Storage Pool или StorageClass

Ошибка “You’re not allowed to change state of linstor cluster manually”

Восстановление БД из резервной копии

Процесс восстановления резервной копии

Отсутствие служебных подов sds-replicated-volume на выбранном узле

Дополнительная поддержка

Миграция с модуля linstor на sds-replicated-volume

Порядок действий для миграции

Миграция на ReplicatedStorageClass

Миграция на ReplicatedStoragePool

Миграция с модуля sds-drbd на sds-replicated-volume

Порядок действий для миграции

Причины отказа от RAID с sds-replicated-volume

Рекомендации по использованию локальных дисков

Ручной запуск процесса перевыпуска сертификатов

Произошла ошибка

Расскажите, что не понравилось

Запросить пробный доступ

Запрос получен

Ошибка

Связаться со специалистом Deckhouse

Заявка отправлена

Возникла ошибка отправки формы

Запросить обучение

Запрос получен

Ошибка

Запросить демо

Запрос получен

Ошибка

Получите отчет о соответствии рекомендациям PCI SSC

Спасибо

Ошибка

Запросить подробности партнёрской программы

Запрос получен

Ошибка