Оптимизация запросов

Выполнение запросов

Авторские права

Авторы: Егор Рогов, Павел Лузанов, Павел Толмачев, Илья Баштанов

Использование материалов курса

Некоммерческое использование материалов курса (презентации,

демонстрации) разрешается без ограничений. Коммерческое

использование возможно только с письменного разрешения компании

Postgres Professional. Запрещается внесение изменений в материалы

курса.

Обратная связь

Отзывы, замечания и предложения направляйте по адресу:

edu@postgrespro.ru

Отказ от ответственности

Компания Postgres Professional не несет никакой ответственности за

любые повреждения и убытки, включая потерю дохода, нанесенные

прямым или непрямым, специальным или случайным использованием

материалов курса. Компания Postgres Professional не предоставляет

каких-либо гарантий на материалы курса. Материалы курса

предоставляются на основе принципа «как есть» и компания Postgres

Professional не обязана предоставлять сопровождение, поддержку,

обновления, расширения и изменения.

Темы

Общие подходы к оптимизации

Простой протокол и этапы обработки запросов

Расширенный протокол

Подробнее о планировании

Подходы к оптимизации

Настройка параметров

подстройка под имеющуюся нагрузку

глобальное влияние на всю систему

мониторинг

Оптимизация запросов

уменьшение нагрузки

локальное воздействие (запрос или несколько запросов)

профилирование

Эта тема начинает модуль, посвященный оптимизации запросов.

Вообще «оптимизация» — очень широкое понятие; задумываться об

оптимизации необходимо еще на этапе проектирования системы и

выбора архитектуры. Мы будем говорить только о тех работах, которые

выполняются при эксплуатации уже существующего приложения.

Можно выделить два основных подхода. Первый состоит в том, чтобы

отслеживать состояние системы и добиваться того, чтобы она

справлялась с имеющейся нагрузкой. Для этого можно настраивать

параметры СУБД (основные из которых рассматриваются в курсе DBA2

и отчасти в этом модуле), а также настраивать операционную систему.

Если настройки не помогают, при таком подходе остается только

модернизировать аппаратуру (что тоже помогает не всегда).

Другой подход, который в основном мы и будем рассматривать далее,

состоит в том, чтобы не приспосабливаться под нагрузку, а уменьшать

ее. «Полезная» нагрузка формируется запросами. Если удается найти

узкое место, то можно попробовать тем или иным способом повлиять

на выполнение запроса и получить тот же результат, потратив меньше

ресурсов. Такой способ действует более локально (на отдельный

запрос или ряд запросов), но уменьшение нагрузки благоприятно

сказывается и на работе всей системы.

Мы начнем с того, что в деталях разберем механизмы выполнения

запросов, а уже после этого поговорим о том, как распознать

неэффективную работу, и о конкретных способах воздействия.

Этапы обработки запроса

Разбор

Переписывание (трансформация)

Планирование (оптимизация)

Выполнение

Сначала рассмотрим, как выполняется запрос в простом случае –

например, если в psql написать команду SELECT.

Разбор

текст

запроса

дерево

запроса

разбор

(parse)

системный

каталог

Обработка обычного запроса выполняется в несколько этапов.

Во-первых, запрос разбирается (parse).

Сначала производится синтаксический разбор: текст запроса

представляется в виде дерева — так с ним удобнее работать.

Затем выполняется семантический анализ, в ходе которого

определяется, на какие объекты БД ссылается запрос и есть ли

у пользователя доступ к ним (для этого анализатор заглядывает

в системный каталог).

Синтаксический разбор

RTE

pg_tables

OPEXPR

tableowner = 'postgres'

QUERY

FROMEXPRTARGETENTRY SORTGROUPCLAUSE

SELECT schemaname, tablename

FROM pg_tables

WHERE tableowner = 'postgres'

ORDER BY tablename;

Рассмотрим простой пример: запрос, приведенный на слайде.

На этапе синтаксического разбора в памяти обслуживающего процесса

будет построено дерево, упрощенно показанное на рисунке ниже

запроса. Цветом показано примерное соответствие частей текста

запроса и узлов дерева.

(RTE — неочевидное сокращение от Range Table Entry. Этим именем

внутри PostgreSQL называются таблицы, подзапросы, результаты

соединений — иными словами, наборы строк, с которыми может

оперировать SQL.)

Если любопытно, то реальное дерево можно увидеть, установив

параметр debug_print_parse и заглянув в журнал сообщений сервера.

Практического смысла в этом нет (если, конечно, вы не разработчик

ядра PostgreSQL).

Семантический разбор

RTE

pg_tables

OPEXPR

tableowner = 'postgres'

QUERY

FROMEXPRTARGETENTRY SORTGROUPCLAUSE

SELECT schemaname, tablename

FROM pg_tables

WHERE tableowner = 'postgres'

ORDER BY tablename;

oid

pg_tables

контроль

доступа

На этапе семантического разбора анализатор сверяется с системным

каталогом и связывает имя «pg_tables» с представлением, имеющим

определенный идентификатор (oid) в системном каталоге. Также будут

проверены права доступа к этому представлению.

Переписывание

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

правила

Во-вторых, запрос переписывается, или трансформируется (rewrite)

с учетом правил.

Важный частный случай переписывания — подстановка текста запроса

вместо имени представления. Заметим, что текст представления опять

необходимо разобрать, поэтому мы несколько упрощаем, говоря, что

первые два этапа происходят друг за другом.

Переписывание

RTE

pg_tables

QUERY

RTE

pg_class

RTE

pg_namespace

RTE

pg_tablespace

FROMEXPR

JOINEXPR

OPEXPR

n.oid = c.relnamespace

OPEXPR

t.oid = c.reltablespace

OPEXPR

c.relkind = 'r'::"char"

TARGETENTRY

OPEXPR

tableowner = 'postgres'

QUERY

FROMEXPRTARGETENTRY SORTGROUPCLAUSE

SELECT schemaname, tablename

FROM (

SELECT ...

FROM pg_class c

LEFT JOIN pg_namespace n

ON n.oid = c.relnamespace

LEFT JOIN pg_tablespace t

ON t.oid = c.reltablespace

WHERE c.relkind = 'r'::"char"

)

WHERE tableowner = 'postgres'

ORDER BY tablename;

На слайде приведен запрос с подставленным текстом представления

(это условность: реально в таком виде запрос не существует — вся

работа по переписыванию происходит только с деревом запроса).

Родительский узел поддерева, соответствующего подзапросу, — тот

узел, который ссылается на это представление. На рисунке в этом

поддереве хорошо видна древовидная структура запроса.

Дерево после переписывания можно увидеть в журнале сообщений

сервера, установив параметр debug_print_rewritten.

Планирование

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

план

запроса

планирование

(plan)

статистика

В-третьих, запрос планируется (plan).

SQL — декларативный язык, и один запрос можно выполнить разными

способами. Планировщик (он же оптимизатор) перебирает различные

способы выполнения и оценивает их. Оценка дается на основе

некоторой математической модели исходя из информации об

обрабатываемых данных (статистики).

Тот способ выполнения, для которого прогнозируется минимальная

стоимость, представляется в виде дерева плана.

Планирование

NESTLOOP

SEQSCAN

pg_class

SEQSCAN

pg_namespace

OPEXPR

n.oid = c.relnamespace

OPEXPR

c.relkind = 'r'::"char"

pg_get_userbyid(relowner) = 'postgres'::name

TARGETENTRY

PLANNEDSTMT

SORT

TARGETENTRY

Sort (cost=19.59..19.59 rows=1 width=128)

Sort Key: c.relname

-> Nested Loop Left Join (cost=0.00..19.58 rows=1 width=128)

Join Filter: (n.oid = c.relnamespace)

-> Seq Scan on pg_class c (cost=0.00..18.44 rows=1 width=72)

Filter: ((relkind = 'r'::"char") AND

(pg_get_userbyid(relowner) = 'postgres'::name))

-> Seq Scan on pg_namespace n (cost=0.00..1.06 rows=6 width=68)

На слайде приведен пример дерева плана, которое представляет

способ выполнения запроса.

Здесь операции Seq Scan – это чтение соответствующих таблиц,

а Nested Loop – способ соединения двух таблиц. В виде текста на

слайде приведен план выполнения в том виде, как его показывает

команда EXPLAIN. Подробно о методах доступа к данным, о способах

соединения и об EXPLAIN мы будем говорить в следующих темах.

Пока имеет смысл обратить внимание на два момента:

- из трех таблиц осталось только две: планировщик сообразил, что одна

из таблиц не нужна для получения результата и ее можно

безболезненно удалить из дерева плана;

- каждый узел дерева снабжен информацией о предполагаемом числе

строк (rows) и о стоимости (cost).

Для интересующихся — увидеть «настоящее» дерево плана можно,

установив параметр debug_print_plan.

Выполнение

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

план

запроса

планирование

(plan)

результат

выполнение

(execute)

В-четвертых, запрос выполняется (execute) в соответствии

с выбранным планом, и результат возвращается клиенту.

https://postgrespro.ru/docs/postgresql/13/query-path

Выполнение

NESTLOOP

n.oid = c.relnamespace

SEQSCAN

pg_class

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

SEQSCAN

pg_namespace

SORT

c.relname

соединение

доступ

к данным

Конвейер

обход дерева от корня вниз

данные передаются наверх — по мере поступления или все сразу

Доступ к данным

чтение таблиц, индексов

Соединения

всегда попарно

важен порядок

Другие операции

c.relname

n.oid = c.relnamespace

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

На этапе выполнения дерево плана (на слайде оно перерисовано так,

чтобы показать только самое основное) работает как конвейер.

Выполнение начинается с корня дерева. Корневой узел (в нашем

случае это операция сортировки SORT) обращается за данными

к нижестоящему узлу; получив данные, он выполняет свою работу

(сортировку) и отдает данные наверх (то есть клиенту).

Некоторые узлы (как NESTLOOP на рисунке) соединяют данные,

полученные из разных источников. Здесь узел обращается по очереди

к двум дочерним узлам (соединение всегда осуществляется попарно)

и, получив от них строки, соединяет их и возвращает наверх (то есть

узлу сортировки).

Два нижних узла представляют обращение к таблице за данными. Они

читают строки из соответствующих таблиц и отдают наверх (то есть

узлу соединения).

Некоторые узлы могут вернуть результат, только получив от

нижестоящих узлов все данные. К таким узлам относится сортировка —

нельзя отсортировать неполную выборку. Другие узлы могут

возвращать данные по мере поступления. Например, доступ к данным

с помощью чтения таблицы может отдавать наверх данные по мере

чтения (это позволяет быстро получить первую часть результата —

например, для страничного отображения на веб-странице).

Чтобы разобраться с планами выполнения, нужно понять, какие

существуют методы доступа к данным, какие есть способы соединения

этих данных, и посмотреть некоторые другие операции.

JIT-компиляция

Компиляция части запросов в исходный код

вычисление выражений в предложении WHERE

вычисления целевого списка выражений (SELECT)

агрегаты и проекции

Преобразование версий строк

перенос версий строк с диска в развернутое представление в памяти

Динамическая компиляция JIT (just-in-time, «точно в нужное время»)

используется для компиляции кода или его фрагментов в момент

выполнения программы. Эта технология позволяет ускорить

выполнение интерпретируемого кода и используется во многих

системах.

В PostgreSQL с помощью JIT-компиляции можно скомпилировать часть

кода, который выполняется при работе запросов SQL. Для этого

PostgreSQL должен быть собран с поддержкой LLVM.

JIT-компиляция лучше подходит для длительных, нагружающих

процессор аналитических запросов. Для коротких OLTP-запросов

накладные расходы на JIT-компиляцию могут превышать время

выполнения самих запросов.

Влиять на JIT-компиляцию можно с помощью конфигурационных

параметров. Есть несколько оптимизаций, связанных с JIT; они

включаются, только если стоимость запроса превышает указанное в

соответствующих параметрах граничное значение.

https://postgrespro.ru/docs/postgresql/13/jit-reason

Расширенный протокол

Уточнение схемы обработки запроса

Подготовленные операторы

Курсоры

PostgreSQL также предусматривает расширенный протокол запросов.

На практике это означает возможность использования подготовленных

операторов и курсоров.

Простой протокол

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

план

запроса

планирование

(plan)

результат

выполнение

(execute)

системный

каталог

правила

статистика

SELECT …

На слайде повторно приведена полная схема обработки запросов по

простому протоколу, которую мы уже рассмотрели.

Расширенный протокол

параметри-

зованный

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

частный

план

запроса

планирование

(plan)

частичный

результат

выполнение

(execute)

выполнение

(execute)

системный

каталог

правила

статистика

привязка

параметров

курсоры

подготовленные операторы

PREPARE EXECUTE

Расширенный протокол позволяет более детально управлять

обработкой запроса.

Во-первых, запрос может быть подготовлен. Для этого клиент

передает запрос серверу (возможно, в параметризованном виде),

а сервер выполняет разбор и переписывание и сохраняет

подготовленное дерево запроса в локальную память обслуживающего

процесса.

Чтобы выполнить подготовленный запрос, клиент называет его имя и

указывает конкретные значения параметров. Сервер планирует запрос

исходя из переданных параметров и выполняет его.

За счет подготовки удается избежать повторного разбора и

переписывания одного и того же запроса, если он выполняется в одном

сеансе неоднократно.

Во-вторых, можно использовать курсоры. Механизм курсоров позволяет

получать результат выполнения запроса не весь сразу, а построчно.

Информация об открытом курсоре также хранится в локальной памяти

обслуживающего процесса.

https://postgrespro.ru/docs/postgresql/13/protocol-flow#PROTOCOL-FLOW-

EXT-QUERY

Расширенный протокол

параметри-

зованный

текст

запроса

дерево

запроса

дерево

запроса

разбор

(parse)

переписывание

(rewrite)

общий

план

запроса

планирование

(plan)

частичный

результат

выполнение

(execute)

выполнение

(execute)

системный

каталог

правила

статистика

привязка

параметров

курсоры

подготовленные операторы

PREPARE

EXECUTE

Если запрос не имеет параметров, серверу нет смысла

перепланировать запрос при каждом выполнении. В этом случае он

сразу запоминает общий (generic) план выполнения. Это позволяет еще

больше экономить ресурсы.

Если же запрос имеет параметры, то сервер может перейти на общий

план, если сочтет, что в среднем он получается не хуже частных

планов. Подробнее о том, в каких случаях происходит переключение,

говорится в теме «Статистика».

Есть и еще один повод использовать подготовленные операторы:

гарантировать безопасность от внедрения SQL-кода, если входные

данные для запроса получены из ненадежного источника (например,

из поля ввода на веб-форме).

Подробнее о планировании

Процесс планирования

Оценка кардинальности

Оценка стоимости

Выбор наилучшего плана

Планирование запроса – очень важный и достаточно сложный этап,

поэтому остановимся на нем подробнее.

Процесс планирования

Статистика

данные о размере таблиц и распределении данных

Оценка кардинальности

селективность условий — доля выбираемых строк,

кардинальность — итоговое число строк

для расчета требуется статистика

Оценка стоимости

в первую очередь зависит от типа узла и числа обрабатываемых строк

Перебор планов оптимизатором

выбирается план с наименьшей стоимостью

Оптимизатор перебирает всевозможные планы выполнения, оценивает

их и выбирает план с наименьшей стоимостью.

Чтобы оценить стоимость узла, нужно знать тип этого узла (понятно,

что стоимость чтения данных напрямую из таблицы или с помощью

индекса будет отличаться) и объем обрабатываемых этим узлом

данных.

Для оценки объема данных важны два понятия:

- кардинальность — общее число строк;

- селективность — доля строк, отбираемых условиями (предикатами).

Для оценки селективности и кардинальности надо, в свою очередь,

иметь сведения о данных: размер таблиц, распределение данных по

столбцам.

Таким образом, в итоге все сводится к статистике — информации,

собираемой и обновляемой процессом автоанализа или командой

ANALYZE.

Если кардинальность оценена правильно, то и стоимость обычно

рассчитывается довольно точно. Основные ошибки оптимизатора

связаны именно с неправильной оценкой кардинальности. Это может

происходить из-за неадекватной статистики, невозможности ее

использования или несовершенства моделей, лежащих в основе

оптимизатора. Об этом мы будем говорить подробнее.

Оценка кардинальности

Кардинальность метода доступа

rows

A where cond

= rows

· sel

cond

Кардинальность соединения

rows

A join B on cond

= rows

· rows

· sel

cond

NESTLOOP

n.oid = c.relnamespace

SEQSCAN

pg_class

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

SEQSCAN

pg_namespace

SORT

c.relname

n.oid = c.relnamespace

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

rows = 7

sel = 1

rows = 1

sel = 0.0025

rows = 1

sel = 0.1429

rows = 1

Оценку кардинальности удобно рассматривать как рекурсивный

процесс. Чтобы оценить кардинальность узла, надо сначала оценить

кардинальности дочерних узлов, а затем — зная тип узла — вычислить

на их основе кардинальность самого узла.

Таким образом, сначала можно рассчитать кардинальности листовых

узлов, в которых находятся методы доступа к данным. Для этого нам

нужно знать размер таблицы и селективность условий, наложенных

на нее. Как конкретно это делается, мы рассмотрим позже.

Пока отметим, что достаточно уметь оценивать селективность простых

условий, а селективность условий, составленных с помощью

логический операций, рассчитываются по простым формулам:

sel

x and y

= sel

· sel

; sel

x or y

= 1 – (1 – sel

) (1 – sel

)

Следует учитывать, что эти формулы предполагают независимость

предикатов. В случае коррелированных предикатов такая оценка будет

неточной (ее можно улучшить с помощью расширенной статистики).

Затем можно рассчитать кардинальности соединений. Кардинальности

соединяемых наборов данных нам уже известны, осталось оценить

селективность условий соединения. Пока будем просто считать, что это

как-то возможно.

Аналогично можно поступить и с другими узлами, например,

с сортировками или агрегациями.

Важно отметить, что ошибка расчета кардинальности, возникшая

в нижних узлах, будет распространяться выше, приводя в итоге

к неверной оценке и выбору неудачного плана.

Оценка стоимости

Вычисляется на основе математических моделей

cost = cost

+ ∑cost

дочерние узлы A

Две компоненты

подготовительная работа .. получение всех строк

NESTLOOP

n.oid = c.relnamespace

SEQSCAN

pg_class

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

SEQSCAN

pg_namespace

SORT

c.relnamec.relname

n.oid = c.relnamespace

c.relkind = 'r' AND

pg_get_userbyid(relowner) = 'postgres'

rows = 7

sel = 1

cost = 0.00 .. 1.10

rows = 1

sel = 0.0025

cost = 0.00 .. 17.65

rows = 1

sel = 0.1429

cost = 0.00 .. 18.86

rows = 1

cost = 18.87 .. 18.87

Теперь рассмотрим общий процесс оценки стоимости. Он также

рекурсивен по своей природе. Чтобы рассчитать стоимость поддерева,

сначала надо вычислить стоимости дочерних узлов и сложить их,

а затем добавить стоимость самого узла.

Стоимость работы узла определяется на основе математической

модели, заложенной в планировщик, с учетом оценки числа

обрабатываемых строк (которая уже рассчитана).

Стоимость состоит из двух компонент, оцениваемых отдельно.

Первая — стоимость подготовительной работы (начальная

стоимость), вторая — стоимость получения всех строк выборки

(полная стоимость).

Некоторые операции не требуют никакой подготовки; у таких узлов

начальная стоимость будет равна нулю.

Другие операции, наоборот, требуют выполнения предварительных

действий. Например, сортировка в приведенном примере должна

сначала получить от дочернего узла все данные, чтобы начать работу.

У таких узлов начальная стоимость будет отлична от нуля — эту

стоимость придется «заплатить» независимо от того, сколько строк

результата потребуется.

Важно понимать, что стоимость отражает оценку планировщика и

может не коррелировать с реальным временем выполнения. Можно

считать, что стоимость выражена в неких «условных единицах»,

которые сами по себе ни о чем не говорят. Стоимость нужна лишь для

того, чтобы планировщик мог сравнивать разные планы одного и того

же запроса.

Выбор лучшего плана

Перебор планов

порядок соединений, способы соединений, методы доступа

по возможности полный перебор,

при большом числе вариантов — сокращение пространства поиска

Простые запросы и подготовленные операторы

оптимизируется время получения всех строк

минимальная полная стоимость

Курсоры

оптимизируется время получения части первых строк

минимальная стоимость получения cursor_tuple_fraction строк

Оптимизатор старается перебрать все возможные планы выполнения

запроса, чтобы выбрать из них лучший.

Для сокращения перебора используется алгоритм динамического

программирования, но при большом количестве вариантов (в первую

очередь из-за числа соединяемых таблиц) точное решение задачи

оптимизации за разумное время становится невозможным. В таком

случае планировщик сокращает количество перебираемых планов,

либо рассматривая не все варианты попарных соединений, либо

переключаясь на генетический алгоритм оптимизации (GEQO —

Genetic Query Optimization). Это может привести к тому, что

оптимизатор выберет не лучший план не из-за ошибок в оценке, а

просто потому, что лучший план не рассматривался.

https://postgrespro.ru/docs/postgresql/13/geqo

Что же считается «лучшим планом»?

Для обычных запросов это план, минимизирующий время получения

всех строк, то есть план с минимальной полной стоимостью.

Однако при использовании курсоров может быть важно как можно

быстрее получить первые строки. Поэтому существует параметр

cursor_tuple_fraction (значение по умолчанию 0.1), задающий долю

строк, которую надо получить как можно быстрее. Чем меньше

значение этого параметра, тем больше на выбор плана влияет

начальная стоимость, а не полная.

Итоги

Обработка запроса состоит из нескольких шагов:

разбор и переписывание, планирование, выполнение

Имеется два протокола выполнения запросов

простой — непосредственное выполнение и получение результата

расширенный — подготовленные операторы и курсоры

Время выполнения зависит от качества планирования

План строится оптимизатором на основе стоимости

Практика

1. Влияние подготовки на выполнение долгого оператора.

Вычислите среднюю стоимость одного билета; посчитайте

среднее время выполнения этого запроса.

Подготовьте оператор для этого запроса; снова посчитайте

среднее время выполнения.

Во сколько раз ускорилось выполнение?

2. Влияние подготовки на выполнение коротких операторов.

Многократно запросите данные о бронировании с номером

0824C5; посчитайте среднее время выполнения.

Подготовьте оператор для этого запроса; снова посчитайте

среднее время выполнения.

Во сколько раз ускорилось выполнение в этом случае?

Время выполнения одного и того же запроса может отличаться, причем

довольно сильно (особенно время первого выполнения). Чтобы

сгладить разницу, время надо усреднить, выполнив запрос несколько

раз. Для этого удобно использовать язык PL/pgSQL, учитывая, что:

- динамический запрос, выполняемый командой PL/pgSQL EXECUTE

(не путать с командой SQL EXECUTE!), каждый раз проходит все этапы;

- запрос SQL, встроенный в PL/pgSQL-код, выполняется с помощью

подготовленных операторов.

Пример синтаксиса команды для обычного оператора:

DO $$

BEGIN

FOR i IN 1..10 LOOP

EXECUTE 'SELECT ... FROM ...';

END LOOP;

END;

$$ LANGUAGE plpgsql;

Для подготовленного оператора (здесь SELECT заменяется на

PERFORM, поскольку нас не интересует результат как таковой):

DO $$

BEGIN

FOR i IN 1..10 LOOP

PERFORM ... FROM ...;

END LOOP;

END;

$$ LANGUAGE plpgsql;