Архитектура

Общее устройство PostgreSQL

Авторские права

Авторы: Егор Рогов, Павел Лузанов, Илья Баштанов

Использование материалов курса

Некоммерческое использование материалов курса (презентации,

демонстрации) разрешается без ограничений. Коммерческое

использование возможно только с письменного разрешения компании

Postgres Professional. Запрещается внесение изменений в материалы

курса.

Обратная связь

Отзывы, замечания и предложения направляйте по адресу:

edu@postgrespro.ru

Отказ от ответственности

Компания Postgres Professional не несет никакой ответственности за

любые повреждения и убытки, включая потерю дохода, нанесенные

прямым или непрямым, специальным или случайным использованием

материалов курса. Компания Postgres Professional не предоставляет

каких-либо гарантий на материалы курса. Материалы курса

предоставляются на основе принципа «как есть» и компания Postgres

Professional не обязана предоставлять сопровождение, поддержку,

обновления, расширения и изменения.

Темы

Клиент-серверный протокол

Транзакционность и механизмы ее реализации

Схема обработки и способы выполнения запросов

Процессы и структуры памяти

Хранение данных на диске и работа с ними

Расширяемость системы

Клиент и сервер

подключение аутентификация

формирование запросов выполнение запросов

управление транзакциями поддержка транзакционности

протокол

PostgreSQL

клиент Python

psycopg2

клиент Java

JDBC

клиент SQL

libpq

Клиентское приложение — например, psql или любая другая

программа, написанная на любом языке программирования (ЯП), —

подключается к серверу и как-то «общается» с ним. Чтобы клиент и

сервер понимали друг друга, они должны использовать один и тот же

протокол взаимодействия. Обычно клиент используется драйвер,

реализующий протокол и предоставляющий набор функций для

использования в программе. Внутри драйвер может пользоваться

стандартной реализацией протокола (библиотекой libpq), либо может

реализовать протокол самостоятельно.

Не так важно, на каком ЯП написан клиент — за разным синтаксисом

будут возможности, определенные протоколом. Мы будем использовать

для примеров язык SQL с помощью клиента psql. Конечно, в реальной

жизни никто не пишет клиентскую часть на SQL, но для учебных целей

это удобно. Мы рассчитываем, что сопоставить команды SQL

с аналогичными возможностями вашего любимого языка

программирования не составит для вас большого труда.

Если говорить в самых общих чертах, то протокол позволяет клиенту

подключиться к одной из баз данных кластера. При этом сервер

выполняет аутентификацию — решает, можно ли разрешить

подключение, например, запросив пароль.

Далее клиент посылает серверу запросы на языке SQL, а сервер

выполняет их и возвращает результат. Наличие мощного и удобного

языка запросов — одна из особенностей реляционных СУБД.

Другая особенность — поддержка согласованной работы транзакций.

https://postgrespro.ru/docs/postgresql/13/protocol

Транзакции

клиентское

приложение

PostgreSQL

драйвер

атомарность — все или ничего

согласованность — ограничения целостности и пользовательские ограничения

изоляция — влияние параллельных процессов

долговечность — сохранность данных даже после сбоя

операции

COMMIT /

ROLLBACK;

BEGIN;

PostgreSQL

Под транзакцией понимается последовательность операций, которая

сохраняет согласованность данных при условии, что операции

выполнены полностью и без помех со стороны других транзакций.

От транзакций ожидают выполнения четырех свойств (ACID):

- Атомарность: транзакция либо выполняется полностью, либо не

выполняется вовсе. Для этого начало транзакции отмечается командой

BEGIN, а конец — либо COMMIT (фиксация изменений), либо

ROLLBACK (отмена изменений).

- Согласованность: транзакции переводит базу данных из одного

согласованного состояния в другое согласованное состояние (под

согласованностью понимается выполнение определенных

ограничений).

- Изоляция: другие транзакции, выполняющиеся одновременно

с данной, не должны оказывать на нее влияния.

- Долговечность: после того, как данные зафиксированы, они не

должны потеряться даже в случае сбоя.

За управление транзакциями (то есть за определение команд,

составляющих транзакцию, и за фиксацию или отмену транзакции)

в PostgreSQL, как правило, отвечает клиентское приложение.

Управлять транзакциями на стороне сервера могут хранимые

процедуры.

https://postgrespro.ru/docs/postgresql/13/sql-begin

https://postgrespro.ru/docs/postgresql/13/sql-savepoint

Выполнение запроса

клиентское

приложение

драйвер

разбор ← системный каталог

переписывание ← правила

планирование ← статистика

выполнение ← данные

запрос

результат

PostgreSQL

Выполнение запроса — довольно сложная задача. Запрос передается

от клиента серверу в виду текста. Текст надо разобрать — выполнить

синтаксический разбор (складываются ли буквы в слова, а слова

в команды) и семантический разбор (есть ли в базе данных таблицы

и другие объекты, на которые запрос ссылается по имени). Для этого

требуется информация о том, что вообще содержится в базе данных.

Такая мета-информация называется системным каталогом и

хранится в самой же базе данных в специальных таблицах.

Запрос может переписываться (трансформироваться) — например,

вместо имени представления подставляется текст запроса. Можно

придумать и свои трансформации, для чего есть механизм правил.

SQL — декларативный язык: запрос на нем говорит о том, какие

данные надо получить, но не говорит, как это сделать. Поэтому запрос

(уже разобранный и представленный в виде дерева), передается

планировщику, который разрабатывает план выполнения. Например,

планировщик решает, надо или не надо использовать индексы. Чтобы

качественно спланировать работу, планировщику нужна информация

о размере таблиц, о распределении данных — статистика.

Далее запрос выполняется в соответствии с планом и результат

возвращается клиенту — целиком и полностью.

Это удобный и простой способ для небольших выборок, однако при

большом объеме данных он может оказаться проблематичным.

Подготовка операторов

клиентское

приложение

драйвер

разбор

переписывание

привязка ← значения параметров

планирование

выполнение

привязка

результат

подготовка

PostgreSQL

Каждый запрос проходит перечисленные ранее шаги: разбор,

переписывание, планирование и выполнение. Но если один и тот же

запрос (с точностью до параметров) выполняется много раз, нет

смысла каждый раз разбирать его заново.

Поэтому кроме обычного выполнения запросов протокол PostgreSQL

предусматривает расширенный режим, который позволяет более

детально управлять выполнением операторов.

В качестве одной из возможностей расширенный режим позволяет

подготовить запрос — заранее выполнить разбор и переписывание

и запомнить дерево разбора.

При выполнении запроса выполняется привязка конкретных значений

параметров. Если необходимо, выполняется планирование

(в некоторых случаях PostgreSQL запоминает план запроса и не

выполняет повторно этот шаг). Затем запрос выполняется.

Еще одно преимущество подготовленных операторов — невозможность

внедрения SQL-кода.

https://postgrespro.ru/docs/postgresql/13/sql-prepare

https://postgrespro.ru/docs/postgresql/13/sql-execute

Курсоры

клиентское

приложение

PostgreSQL

драйвер

разбор

переписывание

привязка ← значения параметров

планирование

выполнение

получение результата

подготовка

результат

привязка

PostgreSQL

Не всегда клиенту бывает удобно получить все результаты сразу.

Данных может оказаться много, но не все они могут быть нужны.

Для этого расширенный режим предусматривает курсоры. Протокол

позволяет открыть курсор для какого-либо оператора, а затем получать

результирующие данные построчно по мере необходимости.

Курсор можно рассматривать как окно, в которое видно только часть из

множества результатов. При получении строки данных окно сдвигается.

Иными словами, курсоры позволяют работать с реляционными

данными (множествами) итеративно, строка за строкой.

Открытый курсор представлен на сервере так называемым порталом.

Это слово встречается в документации; в первом приближении можно

считать «курсор» и «портал» синонимами.

Запрос, используемый в курсоре, неявно подготавливается (то есть

сохраняется его дерево разбора и, возможно, план выполнения).

https://postgrespro.ru/docs/postgresql/13/sql-declare

https://postgrespro.ru/docs/postgresql/13/sql-fetch

backend

Процессы и память

клиентское

приложение

PostgreSQL

postmaster

backend

фоновые процессы

общая память

локальная

память

разобранные запросы,

состояние курсоров,

кеш системного каталога,

место для сортировок

и соединений и т. п.

Между обращениями клиента сервер должен хранить вспомогательную

информацию: разобранные запросы и их планы, состояние открытых

курсоров (порталы). Где и как он это делает?

Изнутри сервер PostgreSQL состоит из несколько взаимодействующих

процессов.

В первую очередь при старте сервера запускается процесс,

традиционно называемый postmaster. Он запускает все остальные

процессы (с помощью системного вызова fork в Unix) и

«присматривает» за ними — если какой-нибудь процесс завершится

аварийно, postmaster перезапустит его (или перезапустит весь сервер,

если сочтет, что процесс мог повредить общие данные).

Работу сервера обеспечивает ряд фоновых служебных процессов.

В следующих темах этого модуля мы поговорим об основных из них.

Чтобы процессы могли обмениваться информацией, postmaster

выделяет общую память, доступ к которой могут получить все

процессы. Кроме общей памяти, каждый процесс имеет и свою

локальную память, доступную только ему самому.

Postmaster слушает входящие соединения. При появлении клиента

postmaster порождает обслуживающий процесс (backend) и дальше

каждый клиент общается со своим процессом.

Место, необходимое для выполнения запроса (разобранные запросы

и их планы, состояние курсоров, кеш системного каталога, место для

сортировки данных и т. п.), выделяется в локальной памяти

обслуживающего процесса.

Много клиентов

клиентское

приложение

PostgreSQL

postmaster

backend

фоновые процессы

общая память

MVCC

блокировки

Когда к серверу подключается много клиентов, для каждого из них

порождается собственный обслуживающий процесс. Это не проблема,

пока клиентов не очень много, на всех хватает оперативной памяти,

а соединения не происходят слишком часто.

Тем не менее при одновременной работе с какими-либо объектами

приходится принимать меры, чтобы один процесс не поменял какие-

либо данные в то время, пока с ними работает другой процесс.

Для объектов в общей памяти используются короткоживущие

блокировки. PostgreSQL делает это достаточно аккуратно для того,

чтобы система хорошо масштабировалась при увеличении числа

процессоров (ядер).

С таблицами сложнее, поскольку блокировки придется удерживать до

конца транзакций (то есть потенциально в течение долгого времени),

из-за чего масштабируемость может пострадать. Поэтому PostgreSQL

использует механизм многоверсионности (MVCC, multiversion

concurrency control) и изоляцию на основе снимков данных: одни и те же

данные могут одновременно существовать в разных версиях, а каждый

процесс видит собственную (но всегда согласованную) картину данных.

Это позволяет блокировать только те процессы, которые пытаются

изменить данные, уже измененные, но еще не зафиксированные,

другими процессами.

Многоверсионность — тот основной механизм, который обеспечивает

первые три свойства транзакций (атомарность, согласованность,

изоляция). Про него мы будем говорить отдельно в теме «Изоляция и

многоверсионность».

Пул соединений

клиентское

приложение

PostgreSQL

postmaster

фоновые процессы

общая память

backend

пул

Если клиентов слишком много, или соединения устанавливаются

и разрываются слишком часто, стоит подумать о применении пула

соединений. Такую функцию обычно предоставляет сервер приложений

или можно воспользоваться сторонними менеджерами пула (наиболее

известен PgBouncer).

Клиенты подключаются не к серверу PostgreSQL, а к менеджеру пула.

Менеджер удерживает открытыми несколько соединений с сервером

баз данных и использует одно из свободных для того, чтобы выполнять

запросы клиента. Таким образом, с точки зрения сервера число

клиентов остается постоянным вне зависимости от того, сколько

клиентов обращаются к менеджеру пула.

Но при таком режиме работы несколько клиентов разделяют один и тот

же обслуживающий процесс, который — как мы говорили — в своей

локальной памяти хранит определенное состояние (в частности,

разобранные запросы для подготовленных операторов). Это

необходимо учитывать при разработке приложения.

Подробнее вопросы применения пула соединений рассматриваются

в курсе DEV2.

Хранение данных

заголовок

данные

буферный кеш

страница

(обычно 8 КБ)

файл

Данные хранятся на дисках в обычных файлах операционной системы.

Как именно данные распределены по файлам, рассмаривается в теме

«Низкий уровень».

Логически файлы разделены на страницы (иногда используется термин

блок). Страница обычно имеет размер 8 Кбайт. Его в некоторых

пределах можно поменять (16 или 32 Кбайта), но только при сборке.

Собранный и запущенный кластер может работать со страницами

только одного размера.

Каждая страница имеет внутреннюю разметку. Она содержит заголовок

и полезные данные; между ними может находиться свободное

пространство, если страница занята не полностью.

Из-за того, что диски работают значительно медленнее, чем

оперативная память (особенно HDD, но и SSD тоже), применяется

кеширование: в оперативной памяти отводится место под недавно

прочитанные страницы — буферный кеш. Расчет делается на то, что

одни и те же страницы понадобятся несколько раз и можно будет

сэкономить на повторном обращении к диску. Измененные данные

также записываются на диск не сразу, а через некоторое время.

Хранение данных

клиентское

приложение

ОС

журнал

WAL

PostgreSQL

postmaster

фоновые процессы

общая память

буферный кеш

кеш

backend

Буферный кеш PostgreSQL располагается в общей памяти, чтобы все

процессы имели к нему доступ.

PostgreSQL работает с дисками, на которых находятся данные, не

напрямую, а через операционную систему. У операционной системы

тоже имеется собственный кеш данных. Поэтому, если страница не

будет найдена в буферном кеше, остается шанс, что она есть в кеше

ОС и обращения к диску удастся избежать.

При сбое (например, питания) содержимое оперативной памяти

пропадает и данные, измененные, но еще не записанные на диск,

потеряются. Это недопустимо и противоречит свойству долговечности

транзакций. Поэтому в процессе работы PostgreSQL постоянно

записывает журнал, позволяющий повторно выполнить потерянные

операции и восстановить данные в согласованном состоянии. Про

буферный кеш и журнал мы будем говорить отдельно

в одноименной теме.

ОС

Расширяемость

клиентское

приложение

PostgreSQL

postmaster

фоновые процессы

backend

общая память

фоновые

рабочие

процессы

языки

программи-

рования

кеш

типы

индексов

типы

данных

функции,

операторы,

триггеры

FDW

PostgreSQL спроектирован с расчетом на расширяемость.

Для прикладного программиста есть возможность создавать

собственные типы данных на основе уже имеющихся (составные типы,

диапазоны, массивы, перечисления), писать хранимые функции для

обработки данных (в том числе триггеры, срабатывающие при

наступлении каких-либо событий).

Если владеть языком программирования Си, можно написать

расширение, которое добавляет необходимый функционал.

Большинство расширений можно устанавливать «на лету», без

перезагрузки сервера. Благодаря такой архитектуре, существует

большое количество расширений, которые:

- добавляют поддержку языков программирования (помимо

стандартных SQL, PL/pgSQL PL/Perl, PL/Python и PL/Tcl);

- вводят новые типы данных и операторы для работы с ними;

- создают новые типы индексов для эффективной работы

с разнообразными типами данных (помимо стандартных

B-деревьев, GiST, SP-GiST, GIN, BRIN, Bloom);

- подключают внешние системы с помощью оберток сторонних данных

(foreign data wrapper, FDW);

- запускают фоновые процессы для выполнения периодических

заданий.

Расширяемость всесторонне рассматривается в курсе DEV2.

Итоги

Сервер управляет кластером баз данных

Протокол позволяет клиентам подключаться к серверу,

выполнять запросы и управлять транзакциями

Каждый клиент обслуживается своим процессом

Данные хранятся в файлах, обращение происходит

через операционную систему

Кеширование как в локальной памяти (каталог,

разобранные запросы), так и в общей (буферный кеш)