Резервное копирование и восстановление

Ручное восстановление кластера

Восстановление кластера с одним control-plane узлом

Для корректного восстановления кластера выполните следующие шаги на master-узле:

Подготовьте утилиту etcdutl. Найдите и скопируйте исполняемый файл на узле:
```
cp $(find /var/lib/containerd/io.containerd.snapshotter.v1.overlayfs/snapshots/ \
-name etcdutl -print | tail -n 1) /usr/local/bin/etcdutl
```
Проверьте версию etcdutl:
```
etcdutl version
```
Убедитесь, что результат команды etcdutl version отображается без ошибок.

При отсутствии etcdutl скачайте исполняемый файл из официального репозитория etcd, выбрав версию, которая соответствует версии etcd в кластере:
```
wget "https://github.com/etcd-io/etcd/releases/download/v3.6.1/etcd-v3.6.1-linux-amd64.tar.gz"
tar -xzvf etcd-v3.6.1-linux-amd64.tar.gz && mv etcd-v3.6.1-linux-amd64/etcdutl /usr/local/bin/etcdutl
```
Проверьте версию etcd в кластере (при доступном Kubernetes API) выполнив команду:
```
d8 k -n kube-system exec -ti etcd-$(hostname) -- etcdutl version
```
Если команда выполнится успешно, вы увидите актуальную версию etcd.
Остановите etcd. Переместите манифест etcd, чтобы kubelet прекратил запуск соответствующего пода с помощью команды:
```
mv /etc/kubernetes/manifests/etcd.yaml ~/etcd.yaml
```
Убедитесь, что под etcd остановлен:
```
crictl ps | grep etcd
```
Если команда не возвращает данных о запущенном поде etcd, значит он успешно остановлен.
Сохраните текущие данные etcd. Создайте резервную копию текущего состояния каталога member:
```
cp -r /var/lib/etcd/member/ /var/lib/deckhouse-etcd-backup
```
В случае непредвиденных обстоятельств вы сможете вернуться к этим файлам.
Очистите директорию etcd. Удалите старые данные, чтобы подготовить etcd к восстановлению из резервной копии:
```
rm -rf /var/lib/etcd
```
Проверьте, что каталог /var/lib/etcd теперь пуст или отсутствует:
```
ls -la /var/lib/etcd
```
Переместите файл резервной копии etcd. Скопируйте или перенесите файл резервной копии etcd etcd-backup.snapshot в домашнюю директорию текущего пользователя (root):
```
cp /путь/до/резервной/копии/etcd-backup.snapshot ~/etcd-backup.snapshot
```
Убедитесь, что файл доступен для чтения:
```
ls -la ~/etcd-backup.snapshot
```
Восстановите базу данных etcd из резервной копии. Воспользуйтесь etcdutl для восстановления:
```
ETCDCTL_API=3 etcdutl snapshot restore ~/etcd-backup.snapshot --data-dir=/var/lib/etcd
```
После завершения команды проверьте, что в каталоге /var/lib/etcd/ появились файлы, соответствующие восстановленному состоянию.
Запустите etcd. Верните манифест etcd в рабочую директорию, чтобы kubelet вновь запустил под etcd:
```
mv ~/etcd.yaml /etc/kubernetes/manifests/etcd.yaml
```
Дождитесь, пока под будет создан и перейдёт в состояние Running. Убедитесь, что он действительно запущен:
```
crictl ps --label io.kubernetes.pod.name=etcd-$HOSTNAME
```
Процесс запуска может занять некоторое время. После успешного старта etcd кластер будет восстановлен из резервной копии.

Пример вывода:
```
CONTAINER        IMAGE            CREATED              STATE     NAME      ATTEMPT     POD ID          POD
4b11d6ea0338f    16d0a07aa1e26    About a minute ago   Running   etcd      0           ee3c8c7d7bba6   etcd-gs-test
```
Перезапустите master-узел.

Восстановление мультимастерного кластера

Для корректного восстановления мультимастерного кластера выполните следующие шаги:

Активируйте режим High Availability (HA). Это необходимо, чтобы сохранить хотя бы одну реплику Prometheus и его PVC, поскольку в кластере с одним master-узлом HA по умолчанию отключён.
Переведите кластер в режим с одним master-узлом:
- В статическом кластере удалите лишние master-узлы вручную.
Восстановите etcd из резервной копии на единственном оставшемся master-узле. Следуйте инструкции для кластера с одним control-plane узлом.
Когда работа etcd будет восстановлена, удалите из кластера информацию об уже удаленных в первом пункте master-узлах, воспользовавшись следующей командой (укажите название узла):
```
d8 k delete node <ИМЯ_MASTER_УЗЛА>
```
Перезапустите все узлы кластера. Убедитесь, что после перезагрузки все узлы доступны и работают корректно.
Дождитесь выполнения заданий из очереди Deckhouse:
```
d8 system queue main
```
Переведите кластер обратно в мультимастерный режим.

После этих шагов кластер будет успешно восстановлен в мультимастерной конфигурации.

Восстановление отдельных объектов

Восстановление объектов Kubernetes из резервной копии etcd

Чтобы восстановить отдельные объекты кластера (например, конкретные Deployment, Secret или ConfigMap) из резервной копии etcd, выполните следующие шаги:

Запустите временный экземпляр etcd. Создайте отдельную копию etcd, которая будет работать независимо от основного кластера.
Загрузите во временный экземпляр etcd данные из резервной копии. Используйте существующий файл резервной копии etcd, чтобы заполнить временный экземпляр нужными данными.
Выгрузите манифесты необходимых объектов в формате YAML.
Восстановите объекты кластера из выгруженных YAML-файлов.

Пример шагов по восстановлению объектов из резервной копии etcd

В следующем примере etcd-backup.snapshot — файл резервной копии etcd, infra-production — пространство имен, в котором нужно восстановить объекты.

Для выгрузки бинарных данных из etcd потребуется утилита auger. Соберите ее из исходного кода на любой машине с Docker (на узлах кластера это сделать невозможно) с помощью следующих команд:
```
git clone -b v1.0.1 --depth 1 https://github.com/etcd-io/auger
cd auger
make release
build/auger -h
```
Получившийся исполняемый файл build/auger, а также файл резервной копии etcd загрузите на master-узел, с которого будут выполняться дальнейшие действия.

Действия ниже выполняются на master-узле в кластере, на который предварительно был загружен файл резервной копии etcd и утилита auger:

Установите корректные права доступа для файла резервной копии etcd:
```
chmod 644 etcd-backup.snapshot
```
Установите полный путь до файла резервной копии etcd и до утилиты в переменных окружения:
```
SNAPSHOT=/root/etcd-restore/etcd-backup.snapshot
AUGER_BIN=/root/auger 
chmod +x $AUGER_BIN
```

Запустите под с временным экземпляром etcd:

Создайте манифест пода. Он будет запускаться именно на текущем master-узле, выбрав его по переменной $HOSTNAME, и смонтирует файл резервной копии etcd по пути $SNAPSHOT для загрузки во временный экземпляр etcd:

cat <<EOF >etcd.pod.yaml 
apiVersion: v1
kind: Pod
metadata:
  name: etcdrestore
  namespace: default
spec:
  nodeName: $HOSTNAME
  tolerations:
  - operator: Exists
  initContainers:
  - command:
    - etcdutl
    - snapshot
    - restore
    - "/tmp/etcd-snapshot"
    - --data-dir=/default.etcd
    image: $(kubectl -n kube-system get pod -l component=etcd -o jsonpath="{.items[*].spec.containers[*].image}" | cut -f 1 -d ' ')
    imagePullPolicy: IfNotPresent
    name: etcd-snapshot-restore
    # Раскоментируйте фрагмент ниже, чтобы задать лимиты для контейнера, если ресурсов узла недостаточно для его запуска.
    # resources:
    #   requests:
    #     ephemeral-storage: "200Mi"
    #   limits:
    #     ephemeral-storage: "500Mi"
    volumeMounts:
    - name: etcddir
      mountPath: /default.etcd
    - name: etcd-snapshot
      mountPath: /tmp/etcd-snapshot
      readOnly: true
  containers:
  - command:
    - etcd
    image: $(kubectl -n kube-system get pod -l component=etcd -o jsonpath="{.items[*].spec.containers[*].image}" | cut -f 1 -d ' ')
    imagePullPolicy: IfNotPresent
    name: etcd-temp
    volumeMounts:
    - name: etcddir
      mountPath: /default.etcd
  volumes:
  - name: etcddir
    emptyDir: {}
    # Используйте фрагмент ниже вместо emptyDir: {}, чтобы задать лимиты для контейнера, если ресурсов узла недостаточно для его запуска.
    # emptyDir:
    #  sizeLimit: 500Mi
  - name: etcd-snapshot
    hostPath:
      path: $SNAPSHOT
      type: File
EOF

Запустите под:
```
d8 k create -f etcd.pod.yaml
```

Установите нужные переменные. В текущем примере:
- infra-production — пространство имён, в пределах которого выполняется поиск ресурсов.
- /root/etcd-restore/output — каталог для восстановленных манифестов.
- /root/auger — путь до исполняемого файла утилиты auger:
```
FILTER=infra-production
BACKUP_OUTPUT_DIR=/root/etcd-restore/output
mkdir -p $BACKUP_OUTPUT_DIR && cd $BACKUP_OUTPUT_DIR
```

Выполните команды, которые отфильтруют список нужных ресурсов по переменной $FILTER и выгрузят их в каталог $BACKUP_OUTPUT_DIR:

files=($(kubectl -n default exec etcdrestore -c etcd-temp -- etcdctl  --endpoints=localhost:2379 get / --prefix --keys-only | grep "$FILTER"))
for file in "${files[@]}"
do
  OBJECT=$(kubectl -n default exec etcdrestore -c etcd-temp -- etcdctl  --endpoints=localhost:2379 get "$file" --print-value-only | $AUGER_BIN decode)
  FILENAME=$(echo $file | sed -e "s#/registry/##g;s#/#_#g")
  echo "$OBJECT" > "$BACKUP_OUTPUT_DIR/$FILENAME.yaml"
  echo $BACKUP_OUTPUT_DIR/$FILENAME.yaml
done

Восстановите объекты кластера из выгруженных YAML-файлов.
Удалите под с временным экземпляром etcd:
```
d8 k -n default delete pod etcdrestore
```

Восстановление объектов кластера из выгруженных YAML-файлов

Для восстановления объектов выполните следующие шаги:

Подготовьте YAML-файлы к восстановлению. Перед тем как загружать объекты обратно в кластер, удалите из их описаний технические поля, которые могли устареть или нарушить процесс восстановления:
- creationTimestamp;
- UID;
- status.
Редактирование можно выполнить вручную или с помощью утилит для обработки YAML/JSON (например, yq или jq).
Создайте объекты в кластере. Для восстановления ресурсов выполните команду:
```
d8 k create -f <ПУТЬ_К_ФАЙЛУ>.yaml
```
При необходимости можно указать путь к конкретному файлу или каталогу.
Если нужно массово восстановить сразу несколько объектов, воспользуйтесь утилитой find:
```
find $BACKUP_OUTPUT_DIR -type f -name "*.yaml" -exec d8 k create -f {} \;
```
Эта команда найдёт все .yaml-файлы в заданном каталоге $BACKUP_OUTPUT_DIR и поочерёдно применит к ним d8 k create.

После выполнения этих шагов выбранные объекты будут воссозданы в кластере согласно описаниям из YAML-файлов.

Восстановление объектов при смене IP-адреса master-узла

Этот раздел описывает ситуацию, когда меняется только IP-адрес master-узла, а все остальные объекты в резервной копии etcd (например, CA-сертификаты) остаются валидными. Предполагается, что восстановление выполняется в кластере с одним master-узлом.

Для восстановления объектов из резервной копии etcd при смене IP-адреса выполните шаги:

Восстановите etcd из резервной копии. Следуйте стандартной процедуре восстановления etcd с использованием файла резервной копии etcd. Убедитесь, что на этапе восстановления вы не изменяете никаких других параметров, кроме данных etcd.
Обновите IP-адрес в статичных конфигурационных файлах:
- Проверьте файлы манифестов компонентов Kubernetes, расположенные в /etc/kubernetes/manifests/.
- Проверьте системные настройки kubelet (файлы в /etc/systemd/system/kubelet.service.d/ или аналогичные директории).
- При необходимости измените IP-адрес и в других конфигурациях, если они ссылаются на старый адрес.
Перевыпустите сертификаты, выданные для старого IP. Удалите или переместите старые сертификаты, связанные с apiserver и, при необходимости, с etcd. Сгенерируйте новые сертификаты, указав в качестве SAN (Subject Alternative Name) новый IP-адрес master-узла.
Перезапустите все сервисы, использующие обновлённые конфигурации и сертификаты. Заставьте kubelet перезапустить манифесты control-plane (API-сервер, etcd и т.д.). Перезагрузите системные службы (например, systemctl restart kubelet) или убедитесь, что все нужные процессы перезапущены автоматически.
Дождитесь, пока kubelet обновит собственный сертификат.

Данные действия можно произвести как автоматизировано — с помощью скрипта, так и вручную — путем выполнения одиночных команд.

Автоматизированная выгрузка объектов при смене IP-адреса

Чтобы упростить процесс восстановления кластера при смене IP-адреса master-узла, воспользуйтесь готовым скриптом, представленным ниже. Перед запуском скрипта:

Укажите корректные пути и IP-адреса:
- ETCD_SNAPSHOT_PATH — путь до файла резервной копии etcd.
- OLD_IP — старый IP-адрес master-узла, под которым создавалась резервная копия.
- NEW_IP — новый IP-адрес master-узла.
Убедитесь, что версия Kubernetes (KUBERNETES_VERSION) совпадает с установленной в кластере. Это необходимо для корректной загрузки соответствующей версии kubeadm.
Скачайте утилиту etcdutl, если она не установлена.
После выполнения скрипта необходимо дождаться, пока kubelet обновит свой сертификат, учитывающий новый IP-адрес. Проверить это можно в директории /var/lib/kubelet/pki/, где должен появиться новый сертификат.

Скрипт для выгрузки объектов

          ETCD_SNAPSHOT_PATH="./etcd-backup.snapshot" # Путь до файла резервной копии etcd.
OLD_IP=10.242.32.34                         # IP-адрес старого master-узла.
NEW_IP=10.242.32.21                         # IP-адрес нового master-узла.
KUBERNETES_VERSION=1.28.0                   # Версия Kubernetes.

mv /etc/kubernetes/manifests/etcd.yaml ~/etcd.yaml 
mkdir ./etcd_old
mv /var/lib/etcd ~/etcd_old
ETCDUTL_PATH=$(find /var/lib/containerd/ -name etcdutl)

ETCDCTL_API=3 $ETCDUTL_PATH snapshot restore etcd-backup.snapshot --data-dir=/var/lib/etcd 

mv ~/etcd.yaml /etc/kubernetes/manifests/etcd.yaml

find /etc/kubernetes/ -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'
find /etc/systemd/system/kubelet.service.d -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'
find  /var/lib/bashible/ -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'

mkdir -p ./old_certs/etcd
mv /etc/kubernetes/pki/apiserver.* ./old_certs/
mv /etc/kubernetes/pki/etcd/server.* ./old_certs/etcd/
mv /etc/kubernetes/pki/etcd/peer.* ./old_certs/etcd/

curl -LO https://dl.k8s.io/v$KUBERNETES_VERSION/bin/linux/amd64/kubeadm
chmod +x kubeadm
./kubeadm init phase certs all --config /etc/kubernetes/deckhouse/kubeadm/config.yaml

crictl ps --name 'kube-apiserver' -o json | jq -r '.containers[0].id' | xargs crictl stop
crictl ps --name 'kubernetes-api-proxy' -o json | jq -r '.containers[0].id' | xargs crictl stop
crictl ps --name 'etcd' -o json | jq -r '.containers[].id' | xargs crictl stop

systemctl daemon-reload
systemctl restart kubelet.service

        

Ручное восстановление объектов при смене IP-адреса

Если вы хотите вручную внести изменения при восстановлении кластера с обновлённым IP-адресом master-узла, выполните следующие действия:

Восстановите etcd из резервной копии:
- Переместите манифест etcd так, чтобы kubelet остановил соответствующий под:
```
mv /etc/kubernetes/manifests/etcd.yaml ~/etcd.yaml
```
- Создайте директорию для резервного хранения прежних данных:
```
mkdir ./etcd_old
mv /var/lib/etcd ./etcd_old
```
- Найдите или скачайте утилиту etcdutl, если она не установлена, и выполните восстановление из снапшота:
```
ETCD_SNAPSHOT_PATH="./etcd-backup.snapshot" # Путь до файла резервной копии etcd.
ETCDUTL_PATH=$(find /var/lib/containerd/ -name etcdutl)

ETCDCTL_API=3 $ETCDUTL_PATH snapshot restore \
  etcd-backup.snapshot \
  --data-dir=/var/lib/etcd
```
- Верните манифест etcd на место, чтобы kubelet снова запустил под:
```
mv ~/etcd.yaml /etc/kubernetes/manifests/etcd.yaml
```
- Убедитесь, что etcd успешно запустился, проверив список подов с помощью crictl ps | grep etcd или просмотрев логи kubelet.

Обновите IP-адреса в статичных конфигурационных файлах. Если в манифестах или системных сервисах kubelet прописан старый IP-адрес, замените его на новый:

 OLD_IP=10.242.32.34                         # Старый IP-адрес master-узла.
 NEW_IP=10.242.32.21                         # Новый IP-адрес master-узла.

 find /etc/kubernetes/ -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'
 find /etc/systemd/system/kubelet.service.d -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'
 find  /var/lib/bashible/ -type f -exec sed -i "s/$OLD_IP/$NEW_IP/g" {} ';'

Перевыпустите сертификаты, выпущенные для старого IP-адреса:
- Подготовьте каталог для временного хранения старых сертификатов:
```
 mkdir -p ./old_certs/etcd
 mv /etc/kubernetes/pki/apiserver.* ./old_certs/
 mv /etc/kubernetes/pki/etcd/server.* ./old_certs/etcd/
 mv /etc/kubernetes/pki/etcd/peer.* ./old_certs/etcd/
```
- Установите или скачайте kubeadm в соответствии с текущей версией Kubernetes:
```
KUBERNETES_VERSION=1.28.0 # Версия Kubernetes.
curl -LO https://dl.k8s.io/v$KUBERNETES_VERSION/bin/linux/amd64/kubeadm
chmod +x kubeadm
```
- Сгенерируйте новые сертификаты:
```
./kubeadm init phase certs all --config /etc/kubernetes/deckhouse/kubeadm/config.yaml
```
  В созданных сертификатах будет учтён новый IP-адрес.
Перезапустите сервисы, использующие обновлённые конфигурации и сертификаты. Для немедленного прекращения работы запущенных контейнеров выполните:
```
 crictl ps --name 'kube-apiserver' -o json | jq -r '.containers[0].id' | xargs crictl stop
 crictl ps --name 'kubernetes-api-proxy' -o json | jq -r '.containers[0].id' | xargs crictl stop
 crictl ps --name 'etcd' -o json | jq -r '.containers[].id' | xargs crictl stop

 systemctl daemon-reload
 systemctl restart kubelet.service
```
Kubelet перезапустит соответствующие поды, а компоненты Kubernetes загрузят новые сертификаты.
Дождитесь, пока kubelet обновит собственный сертификат. Kubelet автоматически генерирует и обновляет свой сертификат, в котором будет прописан новый IP-адрес:
- Проверьте директорию /var/lib/kubelet/pki/.
- Убедитесь, что новый сертификат присутствует и валиден.

После выполнения всех вышеперечисленных шагов кластер будет успешно восстановлен и продолжит работу с новым IP-адресом master-узла.

Создание резервных копий с помощью Deckhouse CLI

Deckhouse CLI (d8) предоставляет команду backup для создания резервных копий различных компонентов кластера:

etcd — снимок ключевого хранилища данных Deckhouse;
cluster-config — архив с ключевыми конфигурационными объектами кластера;
loki — выгрузка логов из встроенного API Loki.

Резервное копирование etcd

Снимок etcd позволяет сохранить текущее состояние кластера на уровне key-value хранилища. Это полный дамп, который можно использовать для восстановления.

Для создания резервной копии выполните команду:

d8 backup etcd <путь-до-файла-резервной-копии-etcd> [флаги]

Флаги:

-p, --etcd-pod string — имя пода etcd, из которого необходимо создать файл резервной копии etcd;
-h, --help — показать справку по команде etcd;
--verbose — подробный (расширенный) вывод логов.

Пример:

d8 backup etcd etcd-backup.snapshot

Пример вывода команды:

2025/04/22 08:38:58 Trying to snapshot etcd-sandbox-master-0
2025/04/22 08:39:01 Snapshot successfully taken from etcd-sandbox-master-0

Автоматическое резервное копирование etcd

Deckhouse автоматически выполняет ежедневное резервное копирование etcd с помощью CronJob, запускаемого в поде d8-etcd-backup в пространстве имён kube-system. В рамках задания создаётся снимок базы данных, архивируется и сохраняется локально на узле в директории /var/lib/etcd/:

etcdctl snapshot save etcd-backup.snapshot
tar -czvf etcd-backup.tar.gz etcd-backup.snapshot
mv etcd-backup.tar.gz /var/lib/etcd/etcd-backup.tar.gz

Для настройки автоматического резервного копирования используется модуль control-plane-manager. Необходимые параметры задаются в его конфигурации:

Параметр	Описание
`etcd.backup.enabled`	Включает ежедневное резервное копирование etcd.
`etcd.backup.cronSchedule`	Расписание выполнения резервного копирования в формате cron. Используется локальное время `kube-controller-manager`.
`etcd.backup.hostPath`	Путь на мастер-узлах, где будут сохраняться архивы резервных копий etcd.

Пример фрагмента конфигурации:

apiVersion: deckhouse.io/v1
kind: ClusterConfiguration
spec:
  etcd:
    backup:
      enabled: true
      cronSchedule: "0 1 * * *"
      hostPath: "/var/lib/etcd"

Резервное копирование конфигурации кластера

Команда d8 backup cluster-config создаёт архив с набором ключевых ресурсов, относящихся к конфигурации кластера. Это не полная резервная копия всех объектов, а определённый whitelist.

Для создания резервной копии выполните команду:

d8 backup cluster-config <путь-до-резервной-копии>

Пример:

d8 backup cluster-config /backup/cluster-config-2025-04-21.tar

В архив включаются только те объекты, которые соответствуют следующим критериям:

Объекты CustomResource, чьи CRD помечены аннотацией:
```
backup.deckhouse.io/cluster-config=true
```
StorageClass’ы, имеющие лейбл:
```
heritage=deckhouse
```
Секреты и ConfigMap’ы, из пространств имён, начинающихся на d8- или kube-, если они явно перечислены в файле whitelist.
Роли и биндинги уровня кластера (ClusterRole и ClusterRoleBinding), если они не помечены меткой:
```
heritage=deckhouse
```

Резервная копия включает только объекты CR, но не сами определения CRD. Для полного восстановления кластера CRD должны быть заранее установлены (например, из манифестов модулей Deckhouse).

Пример содержимого whitelist:

Пространство имён	Объект	Название
`d8-system`	Secret	`d8-cluster-terraform-state`
		$regexp:^d8-node-terraform-state-(.*)$
		`deckhouse-registry`
	ConfigMap	`d8-deckhouse-version-info`
`kube-system`	ConfigMap	`d8-cluster-is-bootstraped`
		`d8-cluster-uuid`
		`extension-apiserver-authentication`
	Secret	`d8-cloud-provider-discovery-data`
		`d8-cluster-configuration`
		`d8-cni-configuration`
		`d8-control-plane-manager-config`
		`d8-node-manager-cloud-provider`
		`d8-pki`
		`d8-provider-cluster-configuration`
		`d8-static-cluster-configuration`
		`d8-secret-encryption-key`
`d8-cert-manager`	Secret	`cert-manager-letsencrypt-private-key`
		`selfsigned-ca-key-pair`

Выгрузка логов из Loki

Команда d8 backup loki предназначена для выгрузки логов из встроенного Loki. Это не полноценная резервная копия, а лишь диагностическая выгрузка: полученные данные нельзя восстановить обратно в Loki.

Для успешной выгрузки d8 обращается к Loki API от имени ServiceAccount loki в пространстве имён d8-monitoring, используя секрет с токеном.

ServiceAccount loki создаётся автоматически с версии Deckhouse v1.69.0. Однако для работы команды d8 backup loki необходимо вручную создать секрет и назначить Role и RoleBinding, если они ещё не заданы.

Примените манифесты перед запуском d8 backup loki, чтобы команда корректно получала токен и могла обращаться к Loki API.

Пример манифестов:

---
apiVersion: v1
kind: Secret
metadata:
  name: loki-api-token
  namespace: d8-monitoring
  annotations:
    kubernetes.io/service-account.name: loki
type: kubernetes.io/service-account-token
---
apiVersion: rbac.authorization.k8s.io/v1
kind: Role
metadata:
  name: access-to-loki-from-d8
  namespace: d8-monitoring
rules:
  - apiGroups: ["apps"]
    resources:
      - "statefulsets/http"
    resourceNames: ["loki"]
    verbs: ["create", "get"]
---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: access-to-loki-from-d8
  namespace: d8-monitoring
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: access-to-loki-from-d8
subjects:
  - kind: ServiceAccount
    name: loki
    namespace: d8-monitoring

Для создания резервной копии выполните команду:

d8 backup loki [флаги]

Пример:

d8 backup loki --days 1 > ./loki.log

Флаги:

--start, --end — временные метки в формате “YYYY-MM-DD HH:MM:SS”;
--days — ширина временного окна выгрузки (по умолчанию 5 дней);
--limit — максимум строк в одном запросе (по умолчанию 5000).

Список доступных флагов можно получить через следующую команду:

d8 backup loki --help

Резервное копирование и восстановление

Ручное восстановление кластера

Восстановление кластера с одним control-plane узлом

Восстановление мультимастерного кластера

Восстановление отдельных объектов

Восстановление объектов Kubernetes из резервной копии etcd

Пример шагов по восстановлению объектов из резервной копии etcd

Восстановление объектов кластера из выгруженных YAML-файлов

Восстановление объектов при смене IP-адреса master-узла

Автоматизированная выгрузка объектов при смене IP-адреса

Ручное восстановление объектов при смене IP-адреса

Создание резервных копий с помощью Deckhouse CLI

Резервное копирование etcd

Автоматическое резервное копирование etcd

Резервное копирование конфигурации кластера

Выгрузка логов из Loki

Произошла ошибка

Расскажите, что не понравилось

Резервное копирование и восстановление

Ручное восстановление кластера

Восстановление кластера с одним control-plane узлом

Восстановление мультимастерного кластера

Восстановление отдельных объектов

Восстановление объектов Kubernetes из резервной копии etcd

Пример шагов по восстановлению объектов из резервной копии etcd

Восстановление объектов кластера из выгруженных YAML-файлов

Восстановление объектов при смене IP-адреса master-узла

Автоматизированная выгрузка объектов при смене IP-адреса

Ручное восстановление объектов при смене IP-адреса

Создание резервных копий с помощью Deckhouse CLI

Резервное копирование etcd

Автоматическое резервное копирование etcd

Резервное копирование конфигурации кластера

Выгрузка логов из Loki

Произошла ошибка

Расскажите, что не понравилось

Запросить пробный доступ

Запрос получен

Ошибка

Связаться со специалистом Deckhouse

Заявка отправлена

Возникла ошибка отправки формы

Запросить обучение

Запрос получен

Ошибка

Запросить демо

Запрос получен

Ошибка

Получите отчет о соответствии рекомендациям PCI SSC

Спасибо

Ошибка

Запросить подробности партнёрской программы

Запрос получен

Ошибка