kznalp

Эксперименты по анализу и оптимизации производительности PostgreSQL. Вначале любая оригинальная теория признается абсурдной, потом — верной, потом — самоочевидной и незначительной, и, наконец, столь важной и самобытной, что бывшие критики присваивают ее себе. — Уильям Джеймс (1842–1910) Эксперименты по анализу и оптимизации производительности PostgreSQL. Оперативно-тактический комплекс мониторинга СУБД PostgreSQL - PG_HAZEL "Орешник". https://t.me/pg_hazel https://dzen.ru/kznalp

Пикабушник 8 месяцев 1 день

поставил 1422 плюса и 255 минусов

отредактировал 0 постов

проголосовал за 0 редактирований

в топе авторов на 326 месте

30К рейтинг 144 подписчика 16 подписок 426 постов 35 в горячем

Серии постов

Нейросеть рисует и пишет

19 постов

Клипы - послушать под настроение

16 постов

ITшное

110 постов

Разное, интересное - почитать, вспомнить.

40 постов

СУБД PostgreSQL

107 постов

IMHO

114 постов

Пикабу vs. Хабр

20 постов

Закреплено

kznalp

1 день назад

Postgres DBA

Серия СУБД PostgreSQL

PG_HAZEL "Орешник" - Революционный комплекс для анализа производительности СУБД PostgreSQL⁠⁠

Слон может немного отдохнуть в тени орешника.

📅 Дата публикации: 15 сентября 2025 года
📍 Место: Россия

Новая веха в мониторинге и диагностике производительности PostgreSQL

Комплекс PG_HAZEL представляет собой инновационное решение для глубокого анализа производительности СУБД PostgreSQL. Этот инструмент сочетает в себе методы статистического анализа, мониторинга в реальном времени и причинно-следственного моделирования, что позволяет точно определять корневые причины инцидентов производительности и прогнозировать потенциальные сбои.

PG_HAZEL использует методы корреляционного анализа для установления взаимосвязей между:

Метриками ОС (iostat, vmstat, использование CPU, памяти, дискового I/O).
Ожиданиями СУБД PostgreSQL (типы ожиданий IO, IPC, LWLock, и др.).
Показателями производительности СУБД (операционная скорость, ожидания СУБД, индикатор деградации производительности СУБД).

💡 Ключевые особенности PG_HAZEL

Тактический и оперативный анализ
PG_HAZEL работает на тактическом уровне, анализируя влияние отдельных SQL-запросов на производительность СУБД. Он идентифицирует запросы, которые оказывают наибольшее негативное воздействие, и связывает их с конкретными типами ожиданий (IO, IPC, LWLOCK).
Многомерный анализ производительности
PG_HAZEL интегрирует данные из различных источников, включая метрики ОС (iostat, vmstat), события ожидания PostgreSQL и статистику выполнения SQL-запросов. Это позволяет построить единую модель производительности и количественно оценить вклад каждого фактора в общую производительность СУБД.
Планируемое направление развития : причинно-следственный анализ и прогнозное моделирование, визуализация и интерактивные дашборды
Используя методы причинности по Грэнджеру и байесовские сети, комплекс поможет выявляет не просто корреляции, а реальные причинно-следственные связи между метриками. Например, он может определить, что рост времени отклика диска (await) вызывает увеличение времени ожидания ввода-вывода в PostgreSQL, что приводит к деградации производительности. Используя методы ARIMA и машинного обучения возможно будет прогнозировать инциденты производительности СУБД PostgreSQL , таких как исчерпание дискового пространства или достижение критической нагрузки на CPU. Это позволит администраторам СУБД заранее принимать превентивные меры.
Тепловые карты(heatmaps) корреляций и дашборды, позволят быстро выявлять аномалии и анализировать их в контексте всех метрик.

🚀 Практическое применение

PG_HAZEL уже успешно применяется для анализа инцидентов производительности в реальных условиях.

Кроме того, комплекс используется для нагрузочного тестирования, помогая определить предельные значения нагрузки, которые СУБД может выдержать без деградации производительности.
📈 Преимущества подхода

Раннее обнаружение проблем

Анализ метрик ОС позволяет выявлять потенциальные проблемы до их воздействия на производительность СУБД:

Прогнозирование исчерпания дискового пространства
Выявление растущей нагрузки на CPU и память
Обнаружение деградации производительности дисковых подсистем

Снижение времени восстановления

Точное определение корневой причины инцидентов значительно сокращает время восстановления:

Четкое разграничение проблем ОС и проблем СУБД
Возможность фокусирования на реальной причине, а не симптомах

📊 Примеры использования:

1.Рост ожиданий типа IO в PostgreSQL:

В ходе анализа инцидента производительности PG_HAZEL выявил, что наибольшая корреляция наблюдается между ожиданиями типа IPC и снижением операционной скорости СУБД. Это указало на проблему взаимодействия между процессами, что позволило администраторам быстро устранить причину.

2.Рост времени отклика дисков в iostat:

Начало инцидента: Рост утилизации CPU и значений iowait в метриках ОС
Корреляционный анализ: Выявление высокой корреляции между:
- Ростом времени ожидания записи для устройств хранения (/data и /wal)
- Снижением производительности СУБД
- Ростом ожиданий типа IO в PostgreSQL
Заключение: Первичной причиной являлись проблемы на уровне дисковых подсистем

💬 Цитата разработчика

«PG_HAZEL — это не просто инструмент мониторинга, а экспертная система, которая превращает разрозненные метрики в понятные и осуществимые предложения. Наша цель — сделать диагностику производительности PostgreSQL максимально автоматизированной и точной».

🔮 Планы развития

В ближайших планах развития PG_HAZEL — разработка и внедрение методов причинно-следственного анализа и прогнозного моделирования.

📌 О компании

Разработчик PG_HAZEL специализируется на создании решений для мониторинга и анализа производительности СУБД PostgreSQL.

Наша миссия — помогать компаниям поддерживать высокую производительность и надежность их баз данных.

📞 Контакты для СМИ

Для получения дополнительной информации обращайтесь:
Имя: Сунгатуллин Ринат Раисович
Телефон: +7 927 245 80 49
Email: kznalp@yandex.ru
Веб-сайт: https://dzen.ru/kznalp

💎 Заключение

PG_HAZEL устанавливает новый стандарт в мониторинге и диагностике производительности PostgreSQL. Его способность объединять данные из различных источников, выявлять корневые причины проблем и прогнозировать инциденты делает его незаменимым инструментом для администраторов баз данных и IT-специалистов.

Для получения более подробной информации посетите https://dzen.ru/kznalp.

PG_HAZEL : комплексное решение для мониторинга и анализа производительности СУБД PostgreSQL.

Показать полностью

kznalp

1 месяц назад

Серия ITшное

Иногда, нейросеть выдаёт вполне себе здравый, хотя и бесполезный текст⁠⁠

▌ Возможности применения рекомендаций нейронных сетей для повышения производительности СУБД PostgreSQL

В последние годы широкое распространение получили методы машинного обучения, применяемые для решения задач анализа данных и автоматизации процессов принятия решений. В частности, одним из перспективных направлений является использование нейронных сетей (НС) для автоматического поиска оптимальных настроек параметров баз данных с целью улучшения их производительности.

СУБД PostgreSQL обладает большим количеством настраиваемых параметров, от правильного выбора которых зависит эффективность работы системы. Традиционные подходы предполагают проведение экспериментов или применение эмпирических правил («best practices»), что требует значительных временных затрат и высокой квалификации специалистов.

Нейронные сети позволяют автоматически выявлять взаимосвязи между параметрами базы данных и показателями ее производительности. Для этого необходимо собрать достаточный объем обучающих данных, включающий различные комбинации значений параметров и соответствующие им показатели времени выполнения запросов, загрузки процессора, объема потребляемой памяти и т.д.

После обучения НС способна генерировать рекомендации по настройке параметров PostgreSQL, минимизируя при этом время отклика и максимизируя пропускную способность системы. Однако следует учитывать ряд ограничений данного подхода:

- зависимость результатов от качества исходных данных;
- сложность интерпретации полученных рекомендаций;
- необходимость регулярного обновления модели вследствие изменения структуры и нагрузки на базу данных.

Таким образом, хотя нейронные сети представляют собой мощный инструмент для оптимизации производительности PostgreSQL, они не могут полностью заменить опыт экспертов и требуют осторожного использования совместно с традиционными методами настройки баз данных.

-------
💫 Создано с помощью GigaChat

Показать полностью 1

Субд Postgresql Контент нейросетей Нейронные сети

353

kznalp

1 месяц назад

Серия Разное, интересное - почитать, вспомнить.

В гранит⁠⁠

Медведев рассказал в ответ на вопросы ТАСС, почему сформулированные для послевоенной Германии три "Д" актуальны для современной Украины:

▪️Демилитаризация для Украины — не наказание, а шанс перестать быть пешкой в чужих кровавых геополитических игрищах.

▪️Денацификация, или "дебандеризация", — не месть, а долгосрочная работа с общественным сознанием, с исторической памятью.

▪️Демократизация — не просто выборы, а восстановление правовых институтов, свободных медиа, партийной конкуренции, разделение ветвей власти.

▪️Нужно добавить и четвертое "Д" — депаразитизация или дезинсекция: Украина должна научиться жить самостоятельно, отвечая за свои поступки.

https://t.me/tass_agency/325675

Показать полностью

Украина Спецоперация Демилитаризация Денацификация Telegram Telegram (ссылка) Политика Дмитрий Медведев

kznalp

1 месяц назад

Серия IMHO

Железный конь идет на смену крестьянской лошадке(с)⁠⁠

В деле наливания воды в бумажки для закрытия годовых KPI - помощь нейросетей просто неоценима !

Вкалывают роботы - счастлив человек.

Робот за меня большой
Выдал документ с листа
И страниц там миллион
И там тексты неспроста
Робот мне его писал
Я же весело плясал
И в конце я выдал рок
Да, веселый был денёк.

Создано с помощью GigaChat

Показать полностью 1 1

[моё] Нейронные сети Юмор Чат-бот IT ИМХО IT юмор Видео Видео ВК

kznalp

1 месяц назад

Серия Нейросеть рисует и пишет

Проверенная житейская мудрость⁠⁠

В день, когда была я новичком,
Мне один наш опытный коллега
Объяснил, как лучше жить с "бочком":
" Перед тем, как выпустить проект,
Нагружай на стенд с такой же тачкой,
С той же нагружай его задачей ".

- Что за чушь! - воскликнула , - не бред?
- Да не будет лишним, - был ответ.

💫 Создано с помощью GigaChat

DBA терпеливо объясняет молодому разработчику, что перед запуском новой версии на продуктиве нужны нагрузочные испытания на тестовом стенде аналогичного размера и нагрузки.

Юмор IT юмор Контент нейросетей

kznalp

2 месяца назад

Серия Нейросеть рисует и пишет

Я поэт , зовусь Незнайка. От меня вам - балалайка (с)⁠⁠

Цикл вечной оптимизации

В попытках улучшить систему

Инфраструктуру зальём

И код приложения смело

Корректировкой снесём

Но выйдет назад деградация

И снова всё тот же подход

И код инженера и базы

Окрасит в печальный исход .

Я поэт , зовусь Незнайка. От меня вам - балалайка (с) Контент нейросетей, IT юмор, Арты нейросетей, Юмор

Создано с помощью GigaChat

Разработчики и менеджеры пытаются решить проблему деградации производительности информационной системы заливая инфраструктуру ресурсами не исправляя кривой код приложения. Инженер DBA грустит и печалится в сторонке.

Показать полностью 1

Контент нейросетей IT юмор Арты нейросетей Юмор

kznalp

2 месяца назад

Серия ITшное

Нейросети про ORM⁠⁠

Разработчик удивляется - почему СУБД тормозит при выполнении запросов , написанных ORM ?
-------
💫 Создано с помощью GigaChat

DeepSeek размышляет про ORM

Проблемы SQL-запросов, генерируемых ORM (Object-Relational Mapping), возникают из-за компромисса между удобством разработки и эффективностью работы с базой данных. Вот ключевые проблемы:
1. Проблема N+1 (Избыточные запросы)
- Суть: ORM лениво загружает связанные данные, вызывая множество мелких запросов вместо одного JOIN.
- Пример:
Загрузка 100 пользователей и их заказов:
SELECT * FROM users; -- 1 запрос
SELECT * FROM orders WHERE user_id = 1; -- запрос для каждого пользователя (100 запросов)

2. Неоптимальные JOIN-операции
- ORM может генерировать избыточные `JOIN` или `LEFT JOIN` даже для простых запросов, что замедляет выполнение.
- Риск: "Взрыв" количества строк при соединении таблиц (например, `JOIN` 3 таблицы по 1000 строк → 1 млрд промежуточных строк).

3. Избыточная выборка данных (Over-fetching)
- ORM загружает все поля объекта, даже если нужны 1-2 поля:
SELECT id, name, email, ... -- 20+ полей
FROM users;
- Последствие: Лишняя нагрузка на сеть и СУБД.

4. Сложности с оптимизацией
- ORM абстрагирует SQL, лишая разработчика контроля:
- Невозможно точно указать порядок JOIN.
- Трудно использовать расширенные функции СУБД (например, оконные функции, CTE).
- Ограниченная поддержка сложных условий (`FILTER`, `DISTINCT ON` в PostgreSQL).

5. Генерация монструозных запросов
- Сложные операции (например, агрегация с фильтрацией) могут порождать "мусорный" SQL:
SELECT * FROM (
SELECT *, ROW_NUMBER() OVER (ORDER BY id)
FROM users
WHERE ...
GROUP BY ...
) AS subquery WHERE ... LIMIT 10;

- Такие запросы сложно отлаживать и оптимизировать.

6. Проблемы с производительностью
- ORM не учитывает:
- Индексы: Может не использовать подходящие индексы.
- Кэширование запросов: Динамически генерируемый SQL сложно кэшировать.
- Пакетная вставка: Вместо `INSERT INTO ... VALUES (...), (...)` ORM может создать N одиночных запросов.

7. Импеданс-несоответствие (Object-Relational Impedance Mismatch)
- ORM пытается "натянуть" объектную модель на реляционную БД, что приводит к:
- Некорректной работе с наследованием (стратегии `single_table`, `joined`).
- Проблемам с транзакциями и блокировками.

8. Сложность отладки
- Сгенерированный SQL часто нечитаем (много подзапросов, алиасов).
- Логи ORM "засоряют" консоль, но не дают понимания реальной производительности.
---
Когда избегать ORM?
- Высоконагруженные системы (например, финансовые транзакции).
- Сложные аналитические запросы.
- Системы, где критична предсказуемость выполнения запросов.

Монструозный SQL запрос , сгенерированный ORM.
-------
💫 Создано с помощью GigaChat

YandexGPT размышляет по ORM

Хорошо, мне нужно разобраться с проблемами SQL-запросов, написанных с помощью ORM. Начну с анализа основных аспектов: производительность, сложность запросов, гибкость, оптимизация и безопасность.

Сначала рассмотрю производительность. ORM часто генерируют избыточные запросы или неоптимальные SQL-конструкции, что может привести к снижению производительности. Нужно упомянуть примеры, такие как N+1 проблема.

Далее проанализирую сложность запросов. ORM могут ограничивать возможность написания сложных запросов, требующих специфических SQL-фич, таких как оконные функции или сложные JOIN.

Затем рассмотрю гибкость. ORM абстрагируют работу с базой данных, что может ограничивать возможность тонкой настройки запросов под конкретные задачи.

Оптимизация также важна. ORM могут затруднять оптимизацию запросов, особенно в сложных сценариях, где требуется ручная настройка индексов или других аспектов.

Безопасность — ещё один аспект. Хотя современные ORM обеспечивают защиту от SQL-инъекций, неправильное использование ORM всё ещё может привести к уязвимостям.

Наконец, рассмотрю особенности конкретных ORM, таких как Django ORM и SQLAlchemy, чтобы показать различия в подходах к генерации запросов.

ORM (Object-Relational Mapping) упрощает работу с базами данных, но имеет ряд проблем, связанных с SQL-запросами.

Основные проблемы

Производительность:

ORM могут генерировать избыточные или неоптимальные SQL-запросы, что приводит к снижению производительности. Например, ORM часто используют паттерн N+1, когда для получения связанных данных выполняется множество дополнительных запросов вместо одного эффективного JOIN.

Пример: в Django ORM для получения списка пользователей с их профилями может потребоваться 1 запрос на пользователя, если не использовать select_related.

Сложность запросов:

Некоторые сложные запросы, требующие специфичных SQL-конструкций (например, оконные функции, сложные JOIN или CTE), могут быть трудно или невозможно выразить через ORM. Это ограничивает гибкость при работе с данными.

Гибкость:

ORM абстрагируют работу с базой данных, что может ограничивать возможность тонкой настройки запросов под конкретные задачи. Например, оптимизация запросов для конкретных СУБД (PostgreSQL, MySQL) может быть затруднена.

Оптимизация:

Оптимизация запросов, сгенерированных ORM, может быть сложной из-за отсутствия прямого контроля над SQL. Разработчикам приходится полагаться на встроенные механизмы оптимизации ORM, которые не всегда эффективны.

Безопасность:

Хотя современные ORM обеспечивают защиту от SQL-инъекций за счёт параметризованных запросов, неправильное использование ORM всё ещё может привести к уязвимостям. Например, динамическое построение запросов через конкатенацию строк может обойти встроенные механизмы безопасности.

Интересные факты

N+1 проблема: одна из самых распространённых проблем ORM. Например, в приложении на Django, отображающем список постов с авторами, без использования prefetch_related будет выполнен 1 запрос для списка постов и N запросов для получения авторов каждого поста.

ORM vs Raw SQL: по данным исследований, запросы, написанные вручную, могут быть на 30-50% эффективнее, чем сгенерированные ORM, особенно для сложных аналитических задач.

YandexGPT размышляет о проблемах SQL запросов, написанных ORM
-------
💫 Создано с помощью GigaChat

Показать полностью 2

Контент нейросетей Субд Orm Разработка Длиннопост

264

kznalp

2 месяца назад

Серия IMHO

Уже во втором городе - самокатчикам кирдык⁠⁠

В Елабуге запретили прокат электросамокатов. Движение по тротуарам мешает пешеходам, сообщили ТАСС в пресс-службе администрации Елабужского муниципального района Татарстана.

Ранее полный запрет на электросамокаты ввели в Благовещенске.
https://t.me/tass_agency/325440

Самокатчики Прокат самокатов Полезное Telegram Елабуга Текст Telegram (ссылка)

kznalp

2 месяца назад

Сделано у нас

Серия IMHO

Это хорошая новость - Max⁠⁠

✔ Платформа Max от VK получила статус национального мессенджера.
Главное о платформе:

▪Премьер-министр РФ Михаил Мишустин 15 июля подписал документ о создании национального мессенджера. Этим сервисом станет Мax, его разработала компания "Коммуникационная платформа", которая принадлежит холдингу VK.

▪Инфраструктура Max находится на территории РФ, что гарантирует надежное хранение данных и защиту пользователей.

▪Мессенджером пользуются уже более 2 миллионов человек. Он включен в реестр российского ПО и доступен в мобильной, веб- и ПК-версиях.

▪В Max доступны групповые видеозвонки и чаты, отправка файлов до 4 ГБ, денежные переводы, ИИ-помощник GigaChat 2.0, мини-приложения, а также информационные каналы.

▪В ближайшее время пользователям станет доступно подключение к "Госуслугам", использование "Цифрового ID" для подтверждения личности, сервис "Госключ" для подписания документов и образовательные сервисы.
https://t.me/tass_agency/325432

P.S. Самое примечательное в новости - очередной повод для раздражения желчегонов 😉

Показать полностью 1

Российское производство IT Мессенджер Текст Telegram (ссылка)

Отличная работа, все прочитано!

5 6 7 8 9 10 11 12 13 14 15 20 30 40 50