Блокировки
Блокировки в оперативной памяти
13
Авторские права
© Postgres Professional, 2016–2022.
Авторы: Егор Рогов, Павел Лузанов, Илья Баштанов
Использование материалов курса
Некоммерческое использование материалов курса (презентации,
демонстрации) разрешается без ограничений. Коммерческое
использование возможно только с письменного разрешения компании
Postgres Professional. Запрещается внесение изменений в материалы
курса.
Обратная связь
Отзывы, замечания и предложения направляйте по адресу:
Отказ от ответственности
Компания Postgres Professional не несет никакой ответственности за
любые повреждения и убытки, включая потерю дохода, нанесенные
прямым или непрямым, специальным или случайным использованием
материалов курса. Компания Postgres Professional не предоставляет
каких-либо гарантий на материалы курса. Материалы курса
предоставляются на основе принципа «как есть» и компания Postgres
Professional не обязана предоставлять сопровождение, поддержку,
обновления, расширения и изменения.
2
Темы
Блокировки в памяти
Мониторинг ожиданий
3
Блокировки в памяти
блокировки
на уровне
строк
предикатные
блокировки
блокировки
на уровне
объектов
блокировки
на уровне
отношений
блокировки
в оперативной
памяти
4
Спин-блокировки
Устанавливаются на очень короткое время
несколько инструкций процессора
Исключительный режим
Нет возможности мониторинга
Нет обнаружения взаимоблокировок
Цикл активного ожидания
используются атомарные инструкции процессора
Мы уже рассмотрели «тяжелые» блокировки, действующие как правило
до конца транзакции и поддерживающие множество режимов. Для
защиты структур в оперативной памяти, разделяемой несколькими
процессами, используются более простые (и дешевые в смысле
накладных расходов) блокировки.
Самые простые из них — спин-блокировки или спинлоки (spinlock).
Они предназначены для захвата на очень короткое время (несколько
инструкций процессора) и защищают отдельные поля от
одновременного изменения.
Спин-блокировки реализуются на основе атомарных инструкций
процессора, например, compare-and-swap
Они захватываются только в исключительном режиме. Если блокировка
занята, выполняется цикл активного ожидания — команда повторяется
до тех пор, пока не выполнится успешно. Это имеет смысл, поскольку
спин-блокировки применяются только в тех случаях, когда вероятность
конфликта очень мала.
Спин-блокировки не обеспечивают обнаружения взаимоблокировок
(за этим следят разработчики PostgreSQL) и не предоставляют никаких
средств мониторинга. По большому счету, единственное, что мы можем
сделать со спин-блокировками — знать о их существовании.
5
Легкие блокировки
Устанавливаются на короткое время
обычно доли секунды
Исключительный и разделяемый режимы
Есть мониторинг
pg_stat_activity
Нет обнаружения взаимоблокировок
«Нечестная» очередь
разделяемая блокировка позволяет читающим процессам
проходять без очереди
Следом идут так называемые легкие блокировки (lightweight locks,
lwlocks).
Их захватывают на короткое время, которое требуется для работы
со структурой данных (например, с хеш-таблицей или списком
указателей). Как правило, легкая блокировка удерживается недолго,
но в процессе ее удержания могут выполняться операции ввода-
вывода, так что время может оказаться и значительным.
Используются два режима блокирования: исключительный (для записи)
и разделяемый (для чтения).
Поддерживается очередь ожидания. Однако, пока блокировка
удерживается в разделяемом режиме, другие читающие процессы
проходят вне очереди. В системах с высокой степенью параллельности
и большой нагрузкой это может приводить к непредсказуемо долгим
ожиданиям процессов, которым требуется менять данные
Проверка взаимоблокировок не выполняется, как и для спин-
блокировок.
Однако легкие блокировки имеют средства для мониторинга.
6
Закрепление буфера
Устанавливается на время работы с буфером
возможно, длительное
Разделяемый режим
Есть мониторинг
pg_stat_activity
pg_buffercache
Нет обнаружения взаимоблокировок
Пассивное ожидание
но обычно закрепленный буфер пропускается
Еще один вид блокировки, который мы уже рассматривали в теме
«Буферный кеш» модуля «Журналирование» — закрепление буфера
(buffer pin). Для каждого буфера ведется список работающих с ним
процессов.
Если буфер закреплен, в нем запрещены некоторые действия.
Например, в страницу можно вставить новую строку оторую
остальные процессы не увидят благодаря многоверсионности),
но нельзя заменить одну страницу на другую.
Как правило, процессы пропускают закрепленный буфер и выбирают
другой, чтобы не ждать снятия закрепления. Но в некоторых случаях,
когда требуется именно этот буфер, запрашивается легкая блокировка
в исключительном режиме. При необходимости процесс ждет, пока все
остальные процессы закончат работу с буфером. Ожидание при этом
пассивное: система «будит» ожидающий процесс, когда закрепление
снимается.
Взаимоблокировки невозможны, за этим следят разработчики
PostgreSQL.
Ожидания, связанные с закреплением, доступны для мониторинга
через представление pg_stat_activity. Текущее количество закреплений
буфера показывает расширение pg_buffercache.
7
Пример: буферный кеш
свободные
буферы
хеш-таблица
13 1 1
следующая
жертва
1 0
buffer strategy lock
buffer mapping lock
x 128
buffer header lock
buffer pin
IO in progress lockbuffer content lock
увеличение
счетчиков использует
атомарные операции
процессора
Чтобы получить некоторое (неполное) представление о том, как и где
используются блокировки, рассмотрим пример буферного кеша.
Чтобы обратиться к хеш-таблице, содержащей ссылки на буферы,
процесс должен захватить легкую блокировку buffer mapping lock
в разделяемом режиме, а если таблицу требуется изменять
то в исключительном режиме. Чтобы увеличить гранулярность, эта
блокировка устроена как транш, состоящий из 128 отдельных
блокировок, каждая из которых защищает свою часть хеш-таблицы.
Доступ к заголовку буфера процесс получает с помощью спин-
блокировки. Отдельные операции (такие, как увеличение счетчика)
могут выполняться и без явных блокировок, с помощью атомарных
инструкций процессора.
Чтобы прочитать содержимое буфера, требуется блокировка buffer
content lock. Обычно она захватывается только для чтения указателей
на версии строк, а дальше достаточно защиты, предоставляемой
закреплением буфера. Для изменения содержимого буфера эта
блокировка захватывается в исключительном режиме.
При чтении буфера с диска (или записи на диск) захватывается также
блокировка IO in progress, которая сигнализирует другим процессам,
что страница читается — они могут встать в очередь, если им тоже
нужна та же самая страница.
Указатели на свободные буферы и на следующую жертву защищены
одной спин-блокировкой buffer strategy lock.
8
Пример: буферы журнала
позиция
для вставки
хеш-таблица
insert position lock
WALBufMappingLock
WALWriteLock
wal insert lock
x 8
после
резервирования места
в буфере вставка идет
параллельно
Еще один пример: буферы журнала.
Для журнального кеша тоже используется хеш-таблица, содержащая
отображение страниц в буферы. В отличие от хеш-таблицы буферного
кеша, эта хеш-таблица защищена единственной легкой блокировкой
WALBufMappingLock, поскольку размер журнального кеша меньше
(обычно 1/32 от буферного кеша) и обращение к его буферам более
упорядочено.
Запись страниц на диск защищена легкой блокировкой WALWriteLock,
чтобы только один процесс одновременно мог выполнять эту операцию.
Чтобы создать журнальную запись, процесс должен сначала
зарезервировать место в странице. Для этого он захватывает спин-
блокировку insert position lock. После того, как место зарезервировано,
процесс копирует содержимое своей записи в отведенное место. Эта
операция может выполняться несколькими процессами одновременно,
для чего запись защищена траншем из 8 легких блокировок wal insert
lock.
Здесь представлены не все блокировки, имеющие отношение к журналу
предзаписи, но эта и предыдущая иллюстрации должны дать некоторое
представление об использовании блокировок в оперативной памяти.
9
Мониторинг ожиданий
Ожидания в pg_stat_activity и семплирование
Типы ожиданий
10
Семплирование ожиданий
Когда процесс ожидает чего-либо,
этот факт отражается в представлении pg_stat_activity
wait_event_type — тип ожидания
wait_event — имя конкретного ожидания
Информация может быть неполна
охвачены не все места в коде, в которых могут быть ожидания
Информация только на текущий момент
единственный способ получить картину во времени — семплирование
достоверная картина только при большом числе измерений
Для мониторинга ожиданий используется представление
pg_stat_activity. Когда процесс (системный или обслуживающий) не
может выполнять свою работу и ждет чего-либо, это ожидание можно
увидеть в представлении. Столбец wait_event_type показывает тип
ожидания, а столбец wait_event — имя конкретного ожидания.
Следует учитывать, что представление показывает только те ожидания,
которые соответствующим образом обрабатываются в исходном коде.
Если представление не показывает ожидание, это вообще говоря не
означает со 100-процентной вероятностью, что процесс действительно
ничего не ждет.
К сожалению, единственная доступная информация об ожиданиях —
информация на текущий момент. Никакой накопленной статистики не
ведется. Единственный способ получить картину ожиданий во
времени — семплирование состояния представления с определенным
интервалом. Встроенных средств для этого не предусмотрено, но
можно использовать расширения, например, pg_wait_sampling.
При семплировании надо учитывать его вероятностный характер.
Чтобы получить более или менее достоверную картину, число
измерений должно быть достаточно высоко. Поэтому семплирование
с низкой частотой не даст достоверной картины, а повышение частоты
приводит к увеличению накладных расходов. По той же причине
семплирование бесполезно для анализа короткоживущих сеансов.
11
Типы ожиданий
Блокировки
блокировки объектов Lock
легкие блокировки LWLock
закрепление буфера BufferPin
Другие ожидания
ввод-вывод IO
получение данных от другого процесса IPC
получение данных от клиента Client
активности в модуле расширения Extension
«безделье» Activity, Timeout
Все остальное — неучтенное время
pg_stat_activity.wait_event_type
Все ожидания можно разделить на несколько типов. Ожидания
рассмотренных блокировок составляют большую категорию: ожидание
блокировок объектов (значение Lock в столбце wait_event_type),
ожидание легких блокировок (LWLock) и ожидание закрепленного
буфера (BufferPin).
Но процессы могут ожидать и другие события. Ожидания ввода-вывода
(IO) возникают, когда процессу требуется записать или прочитать
данные. Процесс может ждать данные, необходимые для работы,
от клиента (Client) или от другого процесса (IPC).
Расширения могут регистрировать свои специфические ожидания
(Extension).
Бывают ситуации, когда процесс просто не выполняет полезной работы.
К этой категории относится ожидание фоновых процессов в своем
основном цикле (Activity), ожидание таймера (Timeout). Как правило,
такие ожидания «нормальны» и не говорят о каких-либо проблемах.
Тип ожидания сопровождается именем конкретного ожидания:
Если имя ожидания не определено, процесс не находится в состоянии
ожидания. Такое время следует считать неучтенным, так как на самом
деле неизвестно, что именно происходит в этот момент.
В следующей демонстрации мы используем файловую систему FUSE
(https://github.com/libfuse/libfuse) и проект slowfs, построенный с ее
13
Итоги
Блокировки в оперативной памяти реализуются по-разному
спин-блокировки, легкие блокировки, закрепление буфера
относительно короткое время и облегченная инфраструктура
Мониторинг текущих ожиданий с помощью
представления pg_stat_activity
семплирование для получения картины во времени
14
Практика
1. Открытый курсор удерживает закрепление буфера, чтобы
чтение следующей строки выполнялось быстрее.
Убедитесь в этом с помощью расширения pg_buffercache.
2. Откройте курсор по таблице и, не закрывая его, выполните
очистку таблицы (VACUUM). Будет ли очистка ждать
освобождения закрепления буфера?
3. Повторите эксперимент, выполнив очистку с заморозкой
(VACUUM FREEZE). Убедитесь, что в профиль ожиданий
обслуживающего процесса попало ожидание закрепления
буфера.
1. Расширение pg_buffercache было рассмотрено в модуле «Журнал»,
тема «Буферный кеш».
Представление pg_buffercache содержит столбец pinning_backends,
который показывает количество процессов, закрепивших этот буфер.
Нужный буфер можно найти по условию
relfilenode = pg_relation_filenode(имя_таблицы).
2. Для проверки удобно воспользоваться вариантом команды очистки
VACUUM VERBOSE.