Virtualizing Linux: § PostgreSQL Streaming Replication Setup. Updated.

четверг, 6 марта 2014 г.

§ PostgreSQL Streaming Replication Setup. Updated.

Настройка потоковой репликации в PostgreSQL.

Как-то я уже писал о настройке потоковой репликации. Пришло время слегка переписать статью, т.к. теперь процесс изменился в лучшую сторону. Настроить потоковую репликацию стало еще проще.
Пара слов, для тех кто сталкивается с этим впервые. Потоковая (Streaming) репликация в PostgreSQL это master-slave репликация при которой подчиненный slave-сервер работает в hot-standby режиме. Hot Standby это режим работы при котором существует возможность подключаться к серверу и выполнять запросы на чтение. Более того в случае аварии на master-сервере, запасной hot-standby сервер может быть оперативно переключен в режим мастера.

Для начала определимся с участниками мероприятия.
master = 172.16.90.51, он же мастер, главный сервер.

slave = 172.16.90.52, он же слэйв, stand-by, подчиненный и т.п.

Перед тем как начать, добавлю что все файлы конфигурации находятся в /var/lib/postgresql/db/. В зависимости от дистрибутива каталог может отличаться.
Итак, поехали. Первое что мы делаем это настраиваем доступы. Редактируем pg_hba.conf на мастере, разрешаем доверенные обращения со слэйва по протоколу репликации.

master # vi /var/lib/postgresql/db/pg_hba.conf
host replication postgres 172.16.90.52/32 trust

Дальше, следует перезапустить мастер с поддержкой репликации. Суть настройки сводится к включению режима hot_standby для WAL (wal_level), определению максимального количества процессов участвующих в пересылке WAL-логов на standby-сервер (max_wal_senders) и количество сегментов WAL-журналов (wal_keep_segments). Настройка wal_keep_segments играет роль в случае когда слэйв потерял связь с мастером. В этом случае мастер начинает копить WAL сегменты, чтобы отдать их слэйву когда восстановится связь. Таким образом чем больше wal_keep_segments, тем больше вероятность того что слейв сможет восстановиться после возобновления связи. Архивирование WAL сегментов можно не настраивать. Опции архивирования, не играют первостепенной роли при потоковой репликации.

master # vi /var/lib/postgresql/db/postgresql.conf
listen_addresses = '172.16.90.51'
wal_level = hot_standby
max_wal_senders = 3
wal_keep_segments = 64
# hot_standby = on
master # /etc/init.d/postgresql-9.3 restart

Переносим все файлы БД на слэйв. В прошлой статье это делалось с помощью rsync. Теперь будем делать это через pg_basebackup. Этот инструмент предназначен для создания т.н. base бэкапов. При использовании pg_basebackup не нужно запускать функции для перевода БД в режиме бэкапа (pg_start_backup()). Однако в pg_basebackup пока нет возможности ограничивать поток (такая возможность есть у rsync).
Итак переносить будем со слейва. Каталог /var/lib/postgresql/db должен быть пуст, иметь права 700 и принадлежать аккаунту от имени которого будет запущен сервис postrges (как правило это postgres или pgsql).

standby # su - postgres
standby $ mkdir /var/lib/postgresql/db/
standby $ chmod 700 /var/lib/postgresql/db/
standby $ pg_basebackup -P -R -X stream -c fast -h 172.16.90.51 -U postgres -D /var/lib/postgresql/db/

В результате pg_basebackup выполнит два подключения к мастеру по протоколу репликации, одно подключение для переноса данных, второе (-X stream) для переноса WAL журналов. Затем выполнит checkpoint (-c fast) - аналог pg_start_backup, после чего начнет переносить данные в каталог /var/lib/postrgesql/db. По завершению будет создан рабочий прототип recovery.conf (-R) который будет вполне пригоден для использования.
После завершения pg_basebackup редактируем postgresql.conf слэйва. Оставляем там все неизменным за исключением двух опций: включаем режим hot_standby, это позволит выполнять к нему запросы на чтение, и меняем listen_address.

standby # vi /var/lib/postgresql/db/postgresql.conf
listen_addresses = '172.16.90.52'
hot_standby = on

Проверяем конфигурацию репликации в созданном recovery.conf.
По большей части нас должно интересовать значение опции trigger_file (по умолчанию оно не добавляется в recovery.conf) - файл наличие которого будет означать что postgres должен переключиться на работу в режиме мастера.

standby # vi /var/lib/postgresql/db/recovery.conf
standby_mode = 'on'
primary_conninfo = 'host=172.16.90.51 port=5432 user=postgres'
trigger_file = '/var/lib/postgresql/db/trigger'

Все готово для запуска. Запускаем слэйв и проверяем работоспособность.

standby # /etc/init.d/postgresql-9.3 start
standby # tail -f /var/lib/postgresql/db/postmaster.log
LOG: entering standby mode
LOG: redo starts at 4/8D225FB0
LOG: consistent recovery state reached at 4/8D2260C0
LOG: record with zero length at 4/8D2260C0
LOG: database system is ready to accept read only connections
LOG: started streaming WAL from primary at 4/8D000000 on timeline 1
standby # ps aux |grep receiver
postgres 13211 0.0 0.1 349052 4088 ? Ss 17:30 0:00 postgres: wal receiver process

На стороне мастера проверка выполняется с помощью pg_stat_replication:

Еще вариант, создать что-либо на стороне мастера и проверить наличие на стороне слэйва. Например можно создать простенькую таблицу:

postgres@master # CREATE TABLE t1 AS SELECT generate_series(1,100);
SELECT 100
postgres@standby # SELECT count(*) from t1;
count
-------
100
(1 row)

Как видим данные реплицируются успешно.

И напоследок привожу команду которую можно использовать для мониторинга лага репликации. Команду следует выполнить на слэйве (через psql), результатом будет время отставания слэйва от мастера.

postgres@standby # psql -U postgres -c "select now() - pg_last_xact_replay_timestamp();"
?column?
----------------
00:00:02.15845
(1 row)

В идеальном лаг должен стремится к нулю и его увеличение говорит о наличии проблем (нагрузка на сеть или на сервера).

Upd. и небольшое видео как это делается.

На главную "Virtualizing Linux"

29 комментариев:

Анонимный8 октября 2014 г. в 20:04
допиленный вариант:
https://github.com/lesovsky/zabbix-extensions/blob/master/files/postgresql/scripts/pgsql.streaming.lag.sh
Ошибка 404
ОтветитьУдалить
Ответы
Анонимный8 октября 2014 г. в 20:14
bingo)))
psql -qAtX -h $2 $1 -c "select greatest(extract(epoch from now() - pg_last_xact_replay_timestamp()))"
ОтветитьУдалить
Ответы
Анонимный15 ноября 2014 г. в 18:53
Добрый день, с вами уже много где списывались в различное время. И где то вы мне очень сильно помогли. Подскажите пожалуйста что в этот раз не так. Уже 3 сервера так пробовал сделать. Везде одно и тоже, делал и через старт-стоп бэкап, и то как у вас показано в статье.

http://joxi.ru/l2ZVMwNhwdzP2J

вот такие ошибки. В логе все тоже самое.

2014-11-15 15:44:07 UTC ОТМЕТКА: работа системы БД была прервана; последний момент работы: 2014-11-15 13:22:44 UTC
2014-11-15 15:44:07 UTC ОТМЕТКА: создаётся отсутствующий каталог WAL "pg_xlog/archive_status"
2014-11-15 15:44:07 UTC ОТМЕТКА: переход в режим резервного сервера
2014-11-15 15:44:07 UTC ОТМЕТКА: запись REDO начинается со смещения 137/6B000028
2014-11-15 15:44:07 UTC ОТМЕТКА: согласованное состояние восстановления достигнуто по смещению 137/6B000EB0
2014-11-15 15:44:07 UTC ОТМЕТКА: начало передачи журнала с главного сервера, с позиции 137/6C000000 на линии времени 1
2014-11-15 15:44:07 UTC ОТМЕТКА: неполный стартовый пакет
2014-11-15 15:44:08 UTC ВАЖНО: система баз данных запускается
2014-11-15 15:44:08 UTC ВАЖНО: система баз данных запускается
2014-11-15 15:44:09 UTC ВАЖНО: система баз данных запускается
2014-11-15 15:44:10 UTC ВАЖНО: система баз данных запускается
ОтветитьУдалить
Ответы
Анонимный16 января 2015 г. в 03:14
а как быть если перед репликацией на базе было расширение PostGIS ?
ОтветитьУдалить
Ответы
Анонимный16 февраля 2015 г. в 12:55
Добрый день,
а возможно как-нибудь настроить slave таким образом, чтобы он начал принимать запросы чтения, только после того, как он подключится к master в режиме streaming replication?

ОтветитьУдалить
Ответы
Анонимный14 августа 2015 г. в 17:10
Добрый день.
Подскажите - не могу войти в psql со slave. В терминале:
psql: ВАЖНО: система баз данных запускается
В лог периодически валится:
ВАЖНО: не удалось подключиться к главному серверу: fe_sendauth: no password supplied
ОтветитьУдалить
Ответы
Alexey16 августа 2015 г. в 16:31
Этот комментарий был удален автором.
ОтветитьУдалить
Ответы
Unknown20 октября 2015 г. в 19:24
Алексей, правильно ли я понимаю, что если прописан параметр на slave сервере "trigger_file = '/var/lib/postgresql/db/trigger'" то при наличии данного файла, slave сервер становится master сервером и кнему можно осущетсвлять CRUD функции?!
ОтветитьУдалить
Ответы
Unknown28 сентября 2016 г. в 02:17
Hi Alex,
First of all thank you for this knowledge sharing. I have couple of questions. It would great if you consider to answer.

I am novice in PGDB but got a task to create PGDB in streaming replication setup.
I am now following your repo: https://github.com/lesovsky/ansible-postgresql-sr-on-el6. I am creating this on AWS/RHEL7.2

1. I am currently trying to create PGDB with 1 master and 2 slaves. Does this mean, if the master is failed, out of two slaves, one of the slaves will become master on it's own? or the application that was connected to master or connected to master via cluster, need to take care?

2. In this git repo, the versions are not getting validated. It means, - postgresql{{ postgresql_version |replace('.', '') }}-server in install_rhel.yml is not able to install from the repo (/defaults/repo.yml) that I updated with latest value: postgresql_repo_RedHat:
- { version: "9.5", repo: "https://yum.postgresql.org/9.5/redhat/rhel-{{ ansible_lsb.major_release }}-x86_64/pgdg-redhat95-9.5-3.noarch.rpm" } that actually exists.

3. Indeed this version is an issue wherever, it appears. For example: /group_vars/os_RedHat.yml, the statement: postgresql_exec_dir: /usr/pgsql-{{ postgresql_version }}/bin is not getting validated.

If you can throw some light on to these issues, I should be able to proceed and come back to you again, for further issues, if any.

Thanks for your help in advance.

PS: I can't write/read anything other than English. That's my limitation. Please oblige.

Regards,
Kiran
ОтветитьУдалить
Ответы
Анонимный8 февраля 2017 г. в 13:42
Алексей, дайте совет, если я хочу делать запланированные бэкапы со слейва. То мне же нужно каким то образом проверить кто именно слейв (так как мог сработать файловер и тот кто я думала что слейв будет вовсе не слейв). Как рекомендуете поступать?
ОтветитьУдалить
Ответы
Анонимный20 марта 2017 г. в 18:32
За 2 наводку большое спасибо. Все получилось!)
ОтветитьУдалить
Ответы

Добавить комментарий

Virtualizing Linux

Страницы

Сохранить статью у себя в соцсети:

четверг, 6 марта 2014 г.

§ PostgreSQL Streaming Replication Setup. Updated.

Настройка потоковой репликации в PostgreSQL.

29 комментариев:

Популярные сообщения

Страницы

Сохранить статью у себя в соцсети:

четверг, 6 марта 2014 г.

§ PostgreSQL Streaming Replication Setup. Updated.

Настройка потоковой репликации в PostgreSQL.

29 комментариев:

Популярные сообщения

четверг, 6 марта 2014 г.