Сжатие скользящим окном, скалярное квантование, JFIF, JPEG, факсимильное сжатие

Метод LZ77 использует часть ранее полученного потока данных в качестве словаря. Кодер строит окно во входных данных, в которое задвигаются справа налево поступающие символы для кодирования. Этот метод основан на скользящем окне.
Символ. Наименьшая единица в сжимаемых данных. Обычно, символом служит один байт, но им может быть один бит, или элемент из множества {0,1,2}, или еще что-то.

Скалярное квантование. В словаре термин «квантование» определяется как «сокращение некоторой точной величины до ограниченного, дискретного множества значений». Если данные, которые необходимо сжать состоят из больших чисел, то при квантовании они переводятся в меньшие числа. Результатом является сжатие с потерей. Если необходимо сжать аналоговые данные (например, электрический сигнал переменного напряжения), то квантование означает оцифровывание. Такое квантование часто применяется в методах сжатия звука.

Словарное сжатие. Метод компрессии данных, которые сохраняют некоторые образцы данных в специальной структуре, называемой «словарем» (обычно, это дерево). Если строка новых данных на входе тождественна некоторому образцу из словаря, то в выходной поток или файл записывается указатель на этот образец.

Стандарт JFIF. Полное название этого метода - JPEG File Interchange Format (формат обмена файлами стандарта JPEG). Это формат графических файлов, который позволяет компьютерам обмениваться сжатыми изображениями стандарта JPEG. Главная особенность этого формата состоит в использовании трехбайтового цветового пространства YCbCr (или однобайтового для образов с градацией серого).
Кроме того в файл добавляются некоторые атрибуты, которых нет в формате JPEG, а именно, разрешение изображения, геометрический размер пиксела и некоторые другие параметры, специфические для конкретных приложений.

Стандарт JPEG. Весьма изощренный метод сжатия с потерями для компрессии цветных изображений (не анимации). Он отлично работает с непрерывно тоновыми изображениями, в которых соседние пикселы имеют близкие значения. Достоинство метода состоит в использовании большого числа легко настраиваемых параметров, которые дают пользователю возможность контролировать долю отбрасываемой информации (то есть, степень сжатия образа) в весьма широких пределах.

Имеется две основные моды: с потерей информации (базовая мода) и без потери информации (которая дает коэффициент сжатия порядка 2:1 и выше). Большинство популярных приложений поддерживают только базовую моду. Эта мода включает прогрессирующее кодирование и иерархическое кодирование. Главная идея стандарта JPEG состоит в том, что изображения создаются для того, чтобы люди на них смотрели, поэтому при сжатии допустимо отбрасывание части информации изображения, которое не заметно или не воспринимается глазом человека.

Аббревиатура JPEG означает Joint Photographic Experts Group (объединенная группа по фотографии). Проект JPEG был инициирован совместно комитетом CCITT и организацией ISO в июле 1987 года. Этот стандарт был признан во всем мире. Он широко используется в представлении графических образов, особенно на страницах всемирной паутины.

Стандарт JPEG-LS. Мода без потерь стандарта JPEG является неэффективной и поэтому ее редко реализуют в конкретных приложениях. Поэтому ISO приняло решение разработать новый стандарт для сжатия без потерь (или почти без потерь) непрерывно тоновых изображений. В результате появился известный стандарт JPEG-LS. Этот метод не является простым расширением или модификацией JPEG. Это новый метод, простой и быстрый. В нем не используется ни DCT, ни арифметическое кодирование, но зато применяется весьма ограниченное квантование (в моде с почти без потерями).

JPEG-LS проверяет несколько предыдущих соседей текущего пиксела и использует их в качестве контекста этого пиксела. С помощью контекста делается прогноз текущего пиксела и выбирается некоторое распределение вероятностей из имеющегося семейства распределений. На основе выбранного распределения определяется код ошибки прогноза с помощью специального кода Голомба. Существует также мода кодирования длины повторов, в которой кодируются длины повторяющихся последовательностей одинаковых пикселов.

Статистические методы.
Эти методы выполняют присвоение символам из потока данных кодов переменной длины, причем более короткие коды назначаются символам или группам символов, которые чаще встречаются во входном потоке (имеют большую вероятность появления).

Теория информации. Математическая теория, которая придает точный количественный смысл понятию информация. Она определяет, как измерить информацию и ответить на вопрос: сколько информации содержится в том или ином массиве данных? Ответом выступает точное число. Теория информация была создана в 1948 в работах Клода Шеннона.

Факсимильное сжатие. Передача типичной страницы между двумя факс-машинами по телефонным линиям связи без использования компрессии может занять от 10 до 11 минут. По этой причине комитет ITU разработал несколько стандартов сжатия факсимильных сообщений. Общепринятыми стандартами на сегодняшний день являются Т4 и Т6, которые еще называются Group 3 и Group 4, соответственно.

-----------------------------