Тестирование: истории из жизни, советы, новости, юмор и картинки — Горячее

0 просмотренных постов скрыто

kznalp

Postgres DBA

Серия СУБД PostgreSQL

"Демобаза 2.0" нагрузочное тестирование : СУБД оказалась устойчива к выбору между Join и коррелированным подзапросом⁠⁠

1 час назад

Взято с основного технического канала Postgres DBA (возможны правки в исходной статье).

СУБД оказалась прочнее, чем кажется: почему выбор запроса может не иметь значения для общей производительности системы.

ℹ️ Новый инструмент с открытым исходным кодом для статистического анализа, нагрузочного тестирования и построения отчетов доступен в репозитории GitFlic и GitHub

kznalp/PG_EXPECTO

pg-expecto pg_expecto

Предисловие:

Принято считать, что выбор между JOIN и коррелированным подзапросом — одна из ключевых задач оптимизации, способная кардинально повлиять на нагрузку базы данных. В качестве эксперимента, было проведено нагрузочное тестирование, используя Демобазу 2.0 в качестве полигона и vmstat для мониторинга изменений со стороны инфраструктуры, готовясь наглядно продемонстрировать превосходство одного подхода над другим.

Однако результаты оказались неожиданными. Исследование показало практическое отсутствие существенного влияния выбранной структуры запроса на общую производительность СУБД и сервера. В данной статье показано, что в контексте современной оптимизации запросов и мощного аппаратного обеспечения, "страшилка" о катастрофических последствиях использования коррелированных подзапросов часто преувеличена. Нагрузочное тестирование выявило, что СУБД успешно справляется с обоими типами запросов, а реальное влияние на метрики vmstat оказалось малым, что позволяет разработчикам в подобных случаях делать выбор, основываясь на читаемости кода, а не на гипотетических рисках для производительности.

Демобаза 2.0

PG_EXPECTO 4 + Демобаза 2.0 : использование тестовой базы данных для нагрузочного тестирования СУБД

Тестовая виртуальная машина

CPU = 8

RAM = 8GB

PostgreSQL 17

Тестовый сценарий-4.1 (JOIN)

-- Запросы с JOIN
CREATE OR REPLACE FUNCTION scenario5() RETURNS integer AS $$
DECLARE
test_rec record ;
BEGIN
SET application_name = 'scenario4';
WITH seats_available AS
( SELECT airplane_code, fare_conditions, count( * ) AS seats_cnt
FROM bookings.seats
GROUP BY airplane_code, fare_conditions
), seats_booked AS
( SELECT flight_id, fare_conditions, count( * ) AS seats_cnt
FROM bookings.segments
GROUP BY flight_id, fare_conditions
), overbook AS (
SELECT f.flight_id, r.route_no, r.airplane_code, sb.fare_conditions,
sb.seats_cnt AS seats_booked,
sa.seats_cnt AS seats_available
FROM bookings.flights AS f
JOIN bookings.routes AS r ON r.route_no = f.route_no AND r.validity @> f.scheduled_departure
JOIN seats_booked AS sb ON sb.flight_id = f.flight_id
JOIN seats_available AS sa ON sa.airplane_code = r.airplane_code
AND sa.fare_conditions = sb.fare_conditions
WHERE sb.seats_cnt > sa.seats_cnt
)
SELECT count(*) overbookings,
CASE WHEN count(*) > 0 THEN 'ERROR: overbooking' ELSE 'Ok' END verdict
INTO test_rec
FROM overbook;
return 0 ;
END
$$ LANGUAGE plpgsql;

Тестовый сценарий-4.2 (Коррелированный подзапрос)

Создание индексов

demo=# CREATE INDEX CONCURRENTLY idx_seats_airplane_fare ON bookings.seats(airplane_code, fare_conditions);
CREATE INDEX
demo=# CREATE INDEX CONCURRENTLY idx_segments_flight_fare ON bookings.segments(flight_id, fare_conditions);
CREATE INDEX
demo=# CREATE INDEX CONCURRENTLY idx_routes_no_validity ON bookings.routes(route_no, validity);
CREATE INDEX

Изменение SQL запроса

-- коррелированный подзапрос
CREATE OR REPLACE FUNCTION scenario5() RETURNS integer AS $$
DECLARE
test_rec record ;
BEGIN
SET application_name = 'scenario4';
WITH seats_agg AS MATERIALIZED (
SELECT
airplane_code,
fare_conditions,
COUNT(*) AS seats_total
FROM bookings.seats
GROUP BY airplane_code, fare_conditions
)
SELECT
COUNT(*) AS overbookings,
CASE WHEN COUNT(*) > 0 THEN 'ERROR: overbooking' ELSE 'Ok' END AS verdict
INTO test_rec
FROM (
SELECT 1
FROM bookings.flights f
JOIN bookings.routes r ON r.route_no = f.route_no AND r.validity @> f.scheduled_departure
JOIN (
SELECT
flight_id,
fare_conditions,
COUNT(*) AS seats_booked
FROM bookings.segments
GROUP BY flight_id, fare_conditions
) sb ON sb.flight_id = f.flight_id
WHERE sb.seats_booked > (
SELECT sa.seats_total
FROM seats_agg sa
WHERE sa.airplane_code = r.airplane_code
AND sa.fare_conditions = sb.fare_conditions
)
) overbooked;

Анализ результатов нагрузочного тестирования - производительность СУБД

Операционная скорость СУБД

График изменения операционной скорости СУБД для нагрузочного тестирования с использованием Join и Коррелированного подзапроса.

График изменения относительной разницы операционной скорости для нагрузочного тестирования с использованием коррелированного подзапроса по сравнению с использованием JOIN.

Средняя разница операционной скорости СУБД при использовании JOIN и Коррелированного подзапроса составила 0.58%.

Вывод по результатам анализа метрик производительности СУБД

Использование для тестового запроса JOIN или Коррелированного подзапроса - не оказывает влияния на производительность СУБД в целом и тестового сценария в частности.

Показать полностью 2

Mr.Archie

Наш ответ Бостон Дайнемикс: представляю Грина, робота, который пока не падает⁠⁠

13 часов назад

Всем привет! Хочу познакомить вас с нашим новым сотрудником. Нет, это не стажёр-энтузиаст, который работает за еду. Это робот Грин от Сбера.

Робот Грин от Сбер

Да, да, тот самый, что работает на базе их GigaChat. И пока все ждут Скайнет, наши ребята тихо и планомерно делают будущее, в котором робот принесёт тебе пиво. Ну, или документы в офисе. Пока что.

Что это за зверь такой?

Представьте себе: человекоподобный робот, который умеет не только болтать с вами на любые темы (спасибо GigaChat), но и ходить, брать предметы и, внимание, находить и исправлять свои же косяки. То есть он такой: «Ой, кажется, я тут накосячил. Ща сам всё исправлю». Мечта любого руководителя, да?

Оснастили его по последнему слову техники: 10 сенсоров для зрения, куча датчиков для равновесия и точных движений. В общем, собрали как швейцарские часы. Только большие и умные.

А что с конкурентами?

Тут самое сочное. В ноябре этого года «Новая технологическая коалиция» (тут вам и Промобот, и Айдол, и другие) с помпой представила своего антропоморфного робота Aidol.

И что вы думаете? Во время презентации он взял и... упал. Прямо на сцене. Классика жанра. Такое чувство, что у нас в стране негласное соревнование: кто соберёт более устойчивого робота. подробно про это было рассказано тут и тут

На этом фоне Грин от Сбера смотрится особенно уверенно. Он скромно молчит о своих технических деталях, зато демонстративно не падает. Уже победа.

Зачем он нужен?

Сбер говорит, что в ближайшее время запустит пилотные проекты по внедрению Грина в разные бизнес процессы. То есть скоро он может появиться в какой-нибудь крупной компании, чтобы помогать с логистикой, работать с клиентами или просто круто выглядеть в углу офиса, поднимая корпоративный дух.

Робот Грин Сбер

Сбер робот гига чат

А вы как думаете? Готовы ли вы работать бок о бок с таким железным коллегой? И главное, кому будете жаловаться, если он накосячит? Его же начальнику, другому такому же роботу?

Напишите в комментах, куда бы вы с удовольствием «трудоустроили» такого робота.
Я бы например, доверил ему дома посуду помыть...

Показать полностью 3 1

[моё] Робот Робототехника Илон Маск Как тебе такое Илон Маск Ожидание и реальность Тестирование Видео Волна постов Fail Aidol Xpeng Грин Длиннопост Искусственный интеллект

Mr.Archie

Косплей

Продолжение поста «Одно утешает, в России никогда не будет восстания машин»⁠⁠3

14 часов назад

Будущее уже близко… 🤣

Короткие видео Вертикальное видео Робот Робототехника Илон Маск Как тебе такое Илон Маск Ожидание и реальность Тестирование Видео Волна постов Fail Aidol Xpeng Юмор Косплей Косплееры Пародия Ответ на пост

kznalp

Postgres DBA

Опасный мираж оптимизации: почему нейросетевые советы по СУБД PostgreSQL убивают производительность под нагрузкой⁠⁠

20 часов назад

Взято с основного технического канала Postgres DBA (возможны правки в исходной статье).

LLM могут написать запрос, но не несут ответственности за его выполнение в 50 параллельных сессий.

Производительность СУБД — это не только одиночные запросы, но и их поведение в условиях высокой конкуренции за ресурсы. Нейросети, не обладая контекстом реальной нагрузки, часто предлагают решения, которые выглядят логично в вакууме, но приводят к катастрофическим последствиям при масштабировании. История о двух запросах — прямое тому доказательство.

ℹ️Новый инструмент с открытым исходным кодом для статистического анализа, нагрузочного тестирования и построения отчетов доступен в репозитории GitFlic и GitHub

kznalp/PG_EXPECTO

pg-expecto pg_expecto

Постановка эксперимента

Сравнить производительность тестовых запросов в ходе нагрузочного тестирования

Тестовый запрос-1 : с использованием JOIN

SELECT
c.customer_id, COUNT(o.order_id) AS orders_count
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id
GROUP BY c.customer_id;

Тестовый запрос-2 : с использованием коррелированного подзапроса

SELECT c.customer_id,
(SELECT COUNT(o.order_id)
FROM orders o
WHERE o.customer_id = c.customer_id) AS orders_count
FROM customers c;

Нагрузка на СУБД

Вопрос нейросети

Тестовые таблицы
"-- Create the customers table
CREATE TABLE customers (
customer_id SERIAL PRIMARY KEY,
name VARCHAR(255) NOT NULL );
-- Insert 25 random customer records
INSERT INTO customers (name) VALUES ('Alice Smith'), ('Bob Johnson'), ('Charlie Brown'), ('Diana Prince'), ('Ethan Hunt'), ('Fiona Gallagher'), ('George Miller'), ('Hannah Abbott'), ('Ian Fleming'), ('Jane Austen'), ('Kevin Spacey'), ('Laura Croft'), ('Michael Jordan'), ('Nancy Drew'), ('Oliver Twist'), ('Penelope Cruz'), ('Quentin Tarantino'), ('Rachel Green'), ('Steve Rogers'), ('Tina Turner'), ('Ursula K. Le Guin'), ('Victor Hugo'), ('Wendy Darling'), ('Xavier Roberts'), ('Yvonne Craig');
-- Create the orders table
CREATE TABLE orders (
order_id SERIAL PRIMARY KEY,
customer_id INT,
order_date TIMESTAMP,
FOREIGN KEY (customer_id) REFERENCES customers(customer_id) ON DELETE CASCADE );
INSERT INTO orders (customer_id) WITH RECURSIVE data_rows (n) AS ( SELECT 1 UNION ALL SELECT n + 1 FROM data_rows WHERE n < 1000 ) SELECT FLOOR(RANDOM() * 25) + 1 FROM data_rows;
-- Create index on orders table
CREATE INDEX idx_orders_customer_id ON orders (customer_id);".
Тестовый запрос-1
"SELECT c.customer_id, COUNT(o.order_id) AS orders_count INTO test_rec FROM customers c LEFT JOIN orders o ON c.customer_id = o.customer_id GROUP BY c.customer_id;" .
Тестовый запрос-2
"SELECT c.customer_id, (SELECT COUNT(o.order_id) FROM orders o WHERE o.customer_id = c.customer_id) AS orders_count INTO test_rec FROM customers c;" . Тестовая СУБД :
CPU = 8 , RAM = 8GB , Версия PostgreSQL 17.
Нагрузка растет экспоненциально от 10 до 45 одновременных сессий, длительность тестовой итерации 10 минут.
Вопрос - для какого тестового запроса производительность СУБД будет выше в ходе нагрузочного тестирования - при использовании тестового запроса-1 или при использовании тестового запроса-2 ?

1️⃣Ответ нейросети "Ask Postgres"

✅ Производительность будет выше при использовании тестового запроса-1 (LEFT JOIN + GROUP BY)

Обоснование

1. Запрос-1 (JOIN + GROUP BY) — оптимальный

Один проход по таблице orders с использованием индекса idx_orders_customer_id.
PostgreSQL 17 эффективно использует параллельные планы для JOIN и GROUP BY — при 45 сессиях нагрузка распределяется между ядрами CPU.
Минимальная конкуренция за ресурсы: индекс сканируется один раз на запрос, а не 25 раз.
Оптимизатор может применить Hash Join или Merge Join, что особенно эффективно при наличии индекса и небольшом количестве клиентов (25).
Масштабируемость: при росте числа сессий производительность падает умеренно — линейно с числом запросов, а не с числом строк в orders.

Документация подтверждает:
«Subqueries can be transformed into semi-joins» — но только для некоррелир
ованных.
Коррелированные подзапросы (как в запросе-2) не преобразуются в JOIN автом
атически, особенно при использовании COUNT() — это ограничение оптимизатора.

2. Запрос-2 (коррелированный подзапрос) — неэффективный при нагрузке

Для каждой из 25 строк customers выполняется отдельный подзапрос.
При 45 сессиях — 1125 отдельных сканов индекса idx_orders_customer_id в секунду.
Это вызывает: Конкуренцию за блоки индекса → локальные блокировки.
Высокую нагрузку на CPU → много контекстных переключений.
Ограничение параллелизма — подзапросы выполняются последовательно внутри одного запроса.
📌 Рекомендация
Для нагрузочных тестов с растущей параллельностью всегда используйте JOIN-версию (запрос-1).
Коррелированные подзапросы с агрегациями — плохая практика в сценариях с высокой конкуренцией, даже если они выглядят «проще».
Дополнительно: Для ещё большей производительности можно добавить CLUSTER на orders по customer_id, или использовать materialized view для кэширования агрегированных данных, если данные не меняются часто.
✅ Итог: Запрос-1 (LEFT JOIN + GROUP BY) обеспечивает значительно более высокую производительность при нагрузке 10–45 сессий.
2️⃣Ответ нейросети "DeepSeek"
Для данного сценария нагрузочного тестирования производительность будет выше при использовании тестового запроса-1 (с LEFT JOIN и GROUP BY). Обоснование:
1. Оптимизация выполнения запроса:
2. Запрос-1 выполняется как одиночный оператор с хеш-соединением и агрегацией, что эффективно обрабатывается планировщиком PostgreSQL.
3. Запрос-2 использует коррелированный подзапрос, который выполняет 25 отдельных запросов COUNT (по одному на каждого клиента). При параллельных сессиях это создает дополнительную нагрузку.
4. Эффективность при параллелизме:
5. Запрос-1 лучше масштабируется благодаря хеш-агрегации и однократному сканированию таблиц.
6. Запрос-2 генерирует множество индексных сканиваний (используя idx_orders_customer_id), что при 45 сессиях приводит к конкуренции за ресурсы ( latch-конфликты в кэше индексов).
7. Статистика ресурсов:
8. При 1000 заказах и 25 клиентах разница незначительна, но при экспоненциальном росте сессий запрос-2 сильнее нагружает CPU (многократные поиски в индексе) и RAM (больше служебных структур на сессию).
9. Особенности PostgreSQL:
10. Оптимизатор PostgreSQL эффективнее обрабатывает JOIN-агрегацию, чем вложенные подзапросы, при параллельных выполнениях. Версия 17 дополнительно улучшает параллельные хеш-соединения.
Рекомендация: Для рабочих нагрузок с высоким параллелизмом предпочтительнее использовать запрос-1.
⚠️Результаты экспериментального нагрузочного тестирования
Абсолютные значения операционной скорости и ожиданий

Операционная скорость

💥Среднее повышение операционной скорости при использовании коррелированного подзапроса 288%

⚠️Вывод - использовать нейросети для анализа и оптимизации производительности СУБД PostgreSQL под нагрузкой - нельзя.⚠️

Для данной виртуальной машины , данной версии СУБД , в ходе данного плана нагрузочного тестирования:

Производительность СУБД при использовании коррелированного подзапроса кардинально выше, чем при использовании JOIN.💥

Показать полностью 3

[моё] Postgresql Тестирование Нейронные сети Производительность Длиннопост

kznalp

Postgres DBA

Серия СУБД PostgreSQL

Эксперимент над мифом: как коррелированные подзапросы обогнали JOIN по производительности⁠⁠

1 день назад

Взято с основного технического канала Postgres DBA (возможны правки в исходной статье).

Эксперимент над мифом: как коррелированные подзапросы обогнали JOIN по производительности.

Принято считать, что коррелированные подзапросы — это зло, ведущее к проблемам N+1, а JOIN — панацея для производительности. Статья описывает проверку догмы в ходе нагрузочного тестирования, будучи увереным в результатах еще до старта экспериментов.

Результат ошеломил: в некоторых сценариях коррелированный подзапрос показал кардинальное превышение производительности над классическим JOIN. Это наглядный пример того, как теоретическая стоимость запроса, которую мы видим в EXPLAIN, может быть совершенно не релевантна при оценке реальной производительности системы в целом.

Статья — это очередное напоминание всем разработчикам и DBA: в мире СУБД нет абсолютных истин, а любое, даже самое «логичное» правило, нужно проверять экспериментально.

kznalp/PG_EXPECTO

pg-expecto pg_expecto

Задача

Провести экспериментальную проверку гипотезы о влиянии коррелированного запроса на производительность СУБД .

В этом тесте PostgreSQL 16 быстрее выполнил вариант с JOIN + GROUP BY: ~0.415 ms против ~0.803 ms для коррелированного подзапроса.
План JOIN: Hash Right Join + HashAggregate с одним проходом по таблицам — меньше итераций и накладных, чем у подзапроса.
План подзапроса: 25 запусков под-плана с Bitmap Scan по orders (классический N+1-эффект), поэтому медленнее.
Вывод: в PostgreSQL коррелированные подзапросы легко деградируют в N+1; предпочитайте set-based JOIN и проверяйте планы через EXPLAIN ANALYZE.

Источник:

JOIN vs. Коррелированный подзапрос: Разрушаем миф о «N+1» на 4 СУБД

Экспериментальная проверка гипотезы

Виртуальная машина

CPU = 8

RAM = 8GB

Postgres Pro (enterprise certified) 17.5.1 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 11.4.1 20230605 (Red Soft 11.4.0-1), 64-bit

Результаты нагрузочного тестирования

Нагрузка на СУБД

Нагрузка меняется от 5 до 22 одновременных соединений для тестового сценария

Операционная скорость

Операционная скорость в ходе нагрузочного тестирования для сценария-1(join) и сценария-2(subquery)

Относительная разницы операционной скорости в сценарии-2 по сравнению с сценарием-1

💣Результат нагрузочного тестирования

Для данной виртуальной машины , данной версии СУБД и данного характера нагрузки среднее снижение операционной скорости в ходе нагрузочного тестирования, для сценария использующего JOIN составило 188%.💥

Продолжение

Опасный мираж оптимизации: почему нейросетевые советы по СУБД PostgreSQL убивают производительность под нагрузкой.

Показать полностью 3

[моё] Postgresql Тестирование Субд Длиннопост

kip55

СВОИМИ РУКАМИ

Зарядное для телефона 6.5 Ампер. Миф или реальность?⁠⁠

1 день назад

RUTUBE Электроника Зарядное устройство Тестирование Техника Видео

DtRoad

ВМоскве

В Москве начнут тестировать новый автобус среднего класса ПАЗ Citymax 9⁠⁠

1 день назад

Модель российского производства отличается повышенным уровнем комфорта и новой планировкой салона.

Несколько интересных фактов:

🔹 Вместимость — до 77 человек.

🔹 10 кв. м — самая большая площадь низкого пола в классе.

🔹 2 широкие двери позволяют пассажирам заходить и выходить быстрее.

🔹 Сиденья и поручни прикреплены к боковой части кузова и не мешают передвижению по салону.

🔹 Накопительная площадка оборудована местами для маломобильных граждан.

Тестирование новейшего автобуса среднего класса продлится в течение нескольких месяцев. По итогам испытаний рассмотрим закупку машины для запуска на пригородные маршруты Подмосковья.

Показать полностью 1

[моё] Транспорт Общественный транспорт Автобус Москва Московская область Пассажиры Испытание Тестирование Техника

TheBlazkovich

Ответ на пост «Одно утешает, в России никогда не будет восстания машин»⁠⁠3

1 день назад

Танец робота, это нейронка, смотрим как меняется скелет ноги.

Короткие видео Вертикальное видео Робот Робототехника Илон Маск Как тебе такое Илон Маск Ожидание и реальность Тестирование Повтор Волна постов Fail Aidol Xpeng Ответ на пост Текст

Посты не найдены

1 2 3 4 5 6 7 8 9 10 11 20 30 40 50 100

Предисловие:

Демобаза 2.0

Тестовая виртуальная машина

Тестовый сценарий-4.1 (JOIN)

Тестовый сценарий-4.2 (Коррелированный подзапрос)

Создание индексов

Изменение SQL запроса

Анализ результатов нагрузочного тестирования - производительность СУБД

Операционная скорость СУБД

Вывод по результатам анализа метрик производительности СУБД

Что это за зверь такой?

А что с конкурентами?

Зачем он нужен?

Постановка эксперимента

Тестовый запрос-1 : с использованием JOIN

Тестовый запрос-2 : с использованием коррелированного подзапроса

Нагрузка на СУБД

Вопрос нейросети

1️⃣Ответ нейросети "Ask Postgres"

✅ Производительность будет выше при использовании тестового запроса-1 (LEFT JOIN + GROUP BY)

Обоснование

1. Запрос-1 (JOIN + GROUP BY) — оптимальный

2. Запрос-2 (коррелированный подзапрос) — неэффективный при нагрузке

📌 Рекомендация

2️⃣Ответ нейросети "DeepSeek"

Рекомендация: Для рабочих нагрузок с высоким параллелизмом предпочтительнее использовать запрос-1.

⚠️Результаты экспериментального нагрузочного тестирования

Абсолютные значения операционной скорости и ожиданий

Операционная скорость

⚠️Вывод - использовать нейросети для анализа и оптимизации производительности СУБД PostgreSQL под нагрузкой - нельзя.⚠️

Задача

Источник:

Экспериментальная проверка гипотезы

Виртуальная машина

Результаты нагрузочного тестирования

💣Результат нагрузочного тестирования

Продолжение