У вас jpg: истории из жизни, советы, новости, юмор и картинки — Горячее, страница 12

6 лет назад

JPEG2000 на пальцах. Часть 2. Арифметическое кодирование⁠⁠

Доброй ночи, пикабушники!

Продолжаю серию статей про JPEG2000

Прошлый пост был про вейвлеты: http://pikabu.ru/story/jpeg2000_na_paltsakh_chast_1_veyvlety...

В этой статье будет описан алгоритм арифметического кодирования. В JPEG2000 вместо Хаффмана используется более эффективное арифметическое сжатие. Алгоритм Хаффмана хорошо сжимает, если частоты появления символов пропорциональны степени двойки. В реальности такая ситуация не всегда возможна — символы встречаются в различных пропорциях. Арифметическое кодирование решает эту проблему, так как коды присваиваются не символам, а их последовательностям.

Теперь немного о том, как это работает.

Есть строка: Пикабу—лучший_ресурс

(Пробел заменен на подчеркивание)

Подсчитаем количество букв и выделим частотные интервалы для них на промежутке [0;1].

JPEG2000 на пальцах. Часть 2. Арифметическое кодирование Сжатие, Зашакалено, Артефакт, JPEG, Jpeg2000, Длиннопост, Привет читающим теги

Пояснение: первая строка — буква, вторая — частота символа, третья — вероятность возникновения (частота / количество символов в строке), четвертая — граница интервала справа.

Попробуем закодировать слово “ПИКАБУ”. Возьмем первый символ “П” и принимаем его границы [0;0.05) за начало отсчета. Для кодирования следующего символа “И” нужно пересчитать границы по формулам:

Для слова “ПИКАБУ” получаем следующие результаты:

Теперь попробуем декодировать этот результат. Для этого будем использовать левую границу последнего символа — 0.0033033125. Обращаемся к исходной таблице и видим, что это число лежит в диапазоне [0;0.05), а значит это “П”.

Теперь попробуем получить следующий символ. Мы уже знаем, что первый символ — “П”, а значит знаем и его границы. Если подставить известные данные в формулу ниже, то будет известен новый интервал:

Новый интервал 0.06606625 лежит в пределах [0.05;0.15), что соответствует символу “И”. В таблице ниже результат для всего слова.

Теперь Вы владеете основами арифметического кодирования :)

За кадром, как всегда, осталась масса различных математических нюансов. Надеюсь, что Вам было интересно и Вы узнали что-то новое.

Показать полностью 5

11

ningaz17

6 лет назад

JPEG2000 на пальцах. Часть 1. Вейвлеты⁠⁠

Добрый день, пикабушники! По просьбе @SimplyFree, делаю серию постов про JPEG2000.

Для начала, поговорим об основных преимуществах этого формата сжатия

изображений в сравнении с JPEG:

1. Большая степень сжатия при том же качестве

2. Поддержка кодирования отдельных областей с лучшим качеством

3. Основной алгоритм сжатия заменен на вейвлет

4. Для повышения степени сжатия в алгоритме используется арифметическое сжатие

5. На уровне формата поддерживается прозрачность

JPEG2000 на пальцах. Часть 1. Вейвлеты Сжатие, Зашакалено, Артефакт, JPEG, Jpeg2000, Длиннопост

Описание начну с отдельных частей алгоритма, а потом уже приведу схему.

В данном посте будет рассказано о вейвлетах. Вейвлет — это

преобразование, которое позволяет разделить сигнал на высокие и низкие

частоты.

“Стоп. Что еще за сигнал?“ — возможно, спросите Вы.

Изображение, как и звук, является сигналом. Вообще, любая

информация может быть представлена сигналами, но об этом как-нибудь в

другой раз.

Алгоритмы сжатия любят длинные последовательности одинаковых чисел.

Почему? Их легко можно представить в виде последовательности нулей,

которые можно эффективно сжать.

Пример: 155, 155, 155, 155, 155, 155, 155, 155

При использовании дельта-кодирования: 154, 0, 0, 0, 0, 0, 0, 0

(дельта-кодирование — разность между соседними элементами)

Но в реальных изображениях (фотореалистичных) соседние пиксели

отличаются на небольшие значения, которые человеческий глаз уловить не в

силах, а вот эффективность алгоритма они снижают.

Пример: 154, 155, 156, 157, 157, 157, 158, 156

При использовании дельта-кодирования: 154, 1, 1, 1, 0, 0, 1, -2

Напрашивается вопрос, а почему бы не сгладить эти неровности? Для начала, разобьем все числа на пары:

(154, 155), (156, 157), (157, 157), (158, 156)

И вычислим полусуммы и полуразности:

(154.5, 0.5), (156.5, 0.5), (157, 0.0), (157, -1.0)

Из них с помощью простых операций можно вычислить оба значения в паре.

Как можно увидеть, второе число в новой паре маленькое, а значит, его можно сжать эффективнее.

Описанный метод называется преобразованием Хаара. Это преобразование как раз и разделяет сигнал на низкочастотную и высокочастотную части.

Эффективности сжатия при использовании вейвлетов добиваются при небольших потерях на высокочастотных составляющих (квантование), т.к. их человеческий глаз не способен определить.

Такой трюк с разделением на высокие и низкие частоты может повторяться много раз. В JPEG2000 он может проделываться до 32 раз.

Вообще, в самом алгоритме используется Преобразование Добеши, которое позволяет сжать изображение еще сильнее, при этом без видимых ~~шакалов~~ артефактов. Принцип его схож с преобразованием Хаара, только коэффициенты другие.

Конечно, в этой статье не были рассмотрены многие математические детали. Но нельзя объять необъятное. Да и многое сложно объяснить не повышая градус матана. Надеюсь, что и написанное оказалось кому-то полезным.

Спасибо за внимание!

Показать полностью

[моё] Сжатие Зашакалено Артефакт JPEG Jpeg2000 Длиннопост

5

ningaz17

6 лет назад

Как работает JPEG⁠⁠

В наше время трудно найти человека, который не знает про JPEG, но многие ли понимают, как он сжимает?

Начнем с основ, пока не будем переходить к схеме кодера JPEG. Наш глаз воспринимает оттенки трех цветов: красного (R), зеленого (G), синего (B). Отсюда и пошло название цветовой модели RGB. По этому же принципу работают дисплеи — каждый пиксель включает в себя три светодиода. ~~Иногда четыре и больше, но это не важно.~~

В эру черно-белого телевидения была придумана другая цветовая модель — YCbCr. В ней Y — это черно-белая составляющая изображения (яркость), а Cb и Cr — цветоразностные. Из YCbCr можно легко получить RGB практически без потерь в качестве. Справедливо и обратное. Формулы приводить не буду, оставлю ссылку в конце.

Для компонент Cb и Cr производится выборка с уменьшением числа передаваемых элементов изображения, так как человеческий глаз менее чувствителен к перепадам цвета. Это позволило экономить место уже на этапе представления изображения аж в 2 раза.

Итак, экономия места в JPEG начинается на этапе представления изображения. Вместо привычного RGB в нем используется YCbCr. Изображение разбивается на блоки 8х8 пикселей. Каждый блок подвергается Дискретному Косинусному Преобразованию (ДКП), которое переводит блок из пространственного в спектральный вид.

Визуальное представление есть в этом посте: http://pikabu.ru/story/naglyadnoe_obyasnenie_preobrazovaniya...

Спектр можно сжать эффективнее, чем отдельные пиксели. Дополнительно спектр подвергается квантованию (а точнее все коэффициенты, кроме левого верхнего угла), что увеличивает количество нулей в блоке.

Почему эти нули так важны? Все просто. Отквантованные спектральные коэффициенты сжимают сериями.

Например серия: 0, 0, 0, 0, 6, 0, 0, 0, 0, 0, 0, 0, 0, 19

Будет иметь вид: 4, 6, 8, 19

(первое число — количество нулей, второе — прерывающее серию)

Намного меньше чисел, неправда ли?

После сжатия серий результат подается на кодер Хаффмана, который делает сжатие еще более эффективным. Далее весь процесс повторяется для каждого блока изображения.

Многих наверное интересует момент, а что же так "жмет" изображения?

Во всем виновато квантование. Чем выше степень квантования, тем более сжатое изображение на выходе.

Сразу хочу сказать, я опустил подробности зигзагообразного обхода, ограничения длины серий и другие подробности для упрощения повествования.

Надеюсь, Вам было интересно!

Баянометр ругался на картинки.

Ссылки на материалы:

1) JPEG: http://rain.ifmo.ru/cat/view.php/theory/data-compression/jpe...

2) Квантование: https://traditio.wiki/Квантование_(обработка_сигналов)

3) YCbCr: https://ru.wikipedia.org/wiki/YCbCr

Показать полностью 3

[моё] JPEG Сжатие Шакалы Длиннопост

23

brainfunction

6 лет назад

Кто знает, кто такие фнорды?⁠⁠

Показать полностью 1

[моё] Цитаты JPEG Личное

4

jeyOjey

6 лет назад

Screen⁠⁠

JPEG Highscreen

0

ElmatadorRUS

7 лет назад

Баяны

Ветка..⁠⁠

Показать полностью 1

Анекдот Текст JPEG

8

DieHarderer

7 лет назад

Это произошло внезапно⁠⁠

Источник: https://www.reddit.com/r/oldpeoplefacebook/comments/6fyeuz/h...

Показать полностью 1

Facebook Скриншот Перевод JPEG Гадкий я

4

Партнёрский материал

specials

Поиграем в бизнесменов?⁠⁠

Одна вакансия, два кандидата. Сможете выбрать лучшего? ~~И так пять раз.~~

СДЕЛАТЬ ВЫБОР

Бизнес Игры Предпринимательство Работа Текст

Gluboky

7 лет назад

Не является изображением⁠⁠

Здравствуйте! Попытался ответить на комментарий и прикрепить нарисованную в паинте картинку, но сайт пишет, что это не является изображением)))) Чукча не художник конечно, но все таки хотелось бы узнать, отчего так получается))) пробовал грузить сначала бмп, потом жипег.

[моё] Bmp JPEG Картинки Текст

19