Гайды

Резервное копирование и восстановление PostgreSQL

RPO/RTO, pg_dump и pg_basebackup, WAL-архивация, PITR, pgBackRest, Barman, WAL-G и чек-лист проверки бэкапов.

~18 мин чтения

Базы данных PostgreSQL Резервное копирование Администрирование

Резервное копирование и восстановление PostgreSQL

Резервное копирование окупается в первую секунду реальной аварии. Ниже — логические и физические стратегии, PITR, промышленные инструменты и чек-лист проверки.

Золотое правило

Бэкап, который никогда не восстанавливали, — слабое подстрахование.

Планируйте регулярные тестовые восстановления на отдельный стенд: целостность, время (RTO), актуальность данных (RPO).

Метрика	Смысл
RPO	Сколько данных можно потерять (например, 5 минут → нужна непрерывная архивация WAL)
RTO	За какое время сервис должен подняться после сбоя

Два семейства бэкапов

	Логический (`pg_dump`, `pg_dumpall`)	Физический (`pg_basebackup` + WAL)
Содержимое	SQL для воссоздания объектов	Побайтовая копия файлов кластера
Размер	Обычно меньше	Около размера данных на диске
Восстановление	Медленнее (воспроизведение SQL)	Быстрее (копирование файлов)
PITR	Нет	Да (с архивом WAL)
Версии	Перенос между мажорными версиями проще	Мажор должен совпадать
Когда	Миграции, небольшие БД, выборочные объекты	Крупный прод, жёсткие RPO/RTO

Практика: для критичных систем часто комбинируют физический бэкап + WAL (DR и PITR) и периодические логические дампы (миграции, юридический снимок схемы).

Логический бэкап: `pg_dump` и `pg_dumpall`

Одна база (формат custom)

bash

pg_dump -U postgres -h localhost -p 5432 -F c -b -v -f /backups/db_$(date +%Y%m%d).dump mydb

-F c — custom (сжатие, параллельное pg_restore -j)
-b — large objects
Путь к файлу — абсолютный, каталог заранее создайте и проверьте права

Весь кластер (роли, глобальные объекты)

bash

pg_dumpall -U postgres -f /backups/cluster_$(date +%Y%m%d).sql

Пример cron

cron

0 2 * * * /usr/bin/pg_dump -U postgres -F c -f /backups/db_$(date +\%Y\%m\%d).dump mydb 2>> /var/log/pg_backup.log
0 3 * * * find /backups -name "*.dump" -mtime +30 -delete

Логируйте время, размер, код возврата; при ошибке — алерт в мониторинг.

Физический бэкап и WAL-архивация

`postgresql.conf` (идея)

ini

wal_level = replica
archive_mode = on
archive_command = 'cp %p /backup/wal_archive/%f'

cp годится для демо; в проде — rsync, облако, wal-g и т.д. Команда должна возвращать 0 только при успехе, иначе PostgreSQL будет повторять архивацию.

Базовый снимок

bash

pg_basebackup \
  -h postgres.internal \
  -U backup_user \
  -D /backup/base/$(date +%Y%m%d_%H%M) \
  -Ft -z \
  --wal-method=stream \
  --checkpoint=fast \
  --progress

-Ft -z — tar + gzip; --wal-method=stream — WAL в потоке во время бэкапа.

PITR (точка во времени)

Сценарий: откатиться на секунду до ошибочного DELETE.

Остановить PostgreSQL:

bash

sudo systemctl stop postgresql

Очистить PGDATA и распаковать базовый бэкап (пути под вашу версию и layout):

bash

rm -rf /var/lib/postgresql/*/main/*
tar -xzf /backup/base/20250115_0200/base.tar.gz -C /var/lib/postgresql/16/main
tar -xzf /backup/base/20250115_0200/pg_wal.tar.gz -C /var/lib/postgresql/16/main/pg_wal

Восстановление (PostgreSQL 12+): restore_command и цель в postgresql.conf или auto.conf, плюс файл recovery.signal в PGDATA для запуска в режиме восстановления (в актуальных версиях см. документацию: для promote используется recovery_target_action и т.д.).

Пример параметров:

ini

restore_command = 'cp /backup/wal_archive/%f %p'
recovery_target_time = '2025-12-28 14:31:59'
recovery_target_action = 'promote'

bash

touch /var/lib/postgresql/16/main/recovery.signal
sudo systemctl start postgresql

Кластер применит WAL до цели и выйдет в нормальный режим согласно recovery_target_action.

Промышленные инструменты

pgBackRest

Полные / дифференциальные / инкрементальные бэкапы, параллельность, сжатие, --archive-async, шифрование, облака. Частый выбор для крупных инсталляций без отдельного «backup-сервера приложения».

Barman

Централизованно несколько серверов; RPO≈0 возможен через поток pg_receivewal вместо только archive_command на завершённые 16 МБ сегменты. Популярен в enterprise-окружении.

WAL-G

Поток в S3 / GCS / Azure, инкременты для больших баз — типичный cloud-native вариант.

Что выбрать (очень грубо)

Мало серверов, руками: pg_basebackup + cron + вынос копий offsite
До нескольких ТБ: pgBackRest
Нужна «коробка» и много инстансов: Barman
Объектное хранилище как основной таргет: WAL-G

Правило 3-2-1 и чек-лист

3 копии, 2 типа носителя, 1 offsite.

Ежемесячно проверяйте:

Дамп/бэкап завершается с кодом 0
Подъём на тестовом хосте и smoke-SQL
Ключи шифрования и восстановление из шифра
RTO в пределах SLA
Retention и свободное место
Актуальная runbook в wiki
Алерты на сбои бэкапа доходят до дежурных

Типичные ошибки

Ошибка	Риск	Что делать
Никогда не тестировали restore	«Бэкап» бесполезен в кризис	Плановые тесты восстановления
Бэкапы на том же диске, что БД	Один отказ — потеря всего	Отдельный диск / NAS / облако
Только один тип бэкапа	Нет PITR или нет переносимости	Комбинация стратегий
Нет retention	Переполнение, новые бэкапы падают	Политика ротации + мониторинг места
Нет offsite	Пожар / ransomware	Внешняя копия

Итог

Определите RPO/RTO, выберите связку логический + физический + WAL, автоматизируйте и проверяйте восстановление чаще, чем раз в год.

Резервное копирование и восстановление PostgreSQL

Золотое правило

Два семейства бэкапов

Логический бэкап: pg_dump и pg_dumpall

Одна база (формат custom)

Весь кластер (роли, глобальные объекты)

Пример cron

Физический бэкап и WAL-архивация

postgresql.conf (идея)

Базовый снимок

PITR (точка во времени)

Промышленные инструменты

pgBackRest

Barman

WAL-G

Что выбрать (очень грубо)

Правило 3-2-1 и чек-лист

Типичные ошибки

Итог

Логический бэкап: `pg_dump` и `pg_dumpall`

`postgresql.conf` (идея)