Некоторые моменты процесса преобразования изображений
Легко показать, что полная дисперсия пикселов, которая определяется суммой, не меняется при повороте, поскольку матрица этого преобразования является ортогональной. Однако дисперсия новых координат у стала малой, поэтому возросла дисперсия коэффициентов х. Дисперсию иногда называют энергией распределения пикселов. Поэтому мы можем сказать, что поворот концентрирует энергию в координатах х, с помощью чего достигается сжатие изображения. Концентрирование энергии в одной координате имеет и другое преимущество. Можно делать квантование этой координаты более точным, чем квантование второй координаты. Такой способ квантования приводит к лучшему сжатию.
Следующий простой пример иллюстрирует возможности этого ортогонального преобразования. Разность энергий исходной и реконструированной точек будет равна той же малой величине.
Это простое преобразование легко обобщить на случай любого числа измерений. Вместо пар, можно выбирать тройки точек, триплеты. Каждый триплет становится точкой трехмерного пространства, а все точки образуют «облако» вокруг прямой, проходящей через начало координат под углом 45° к каждой координатной оси. Если эту прямую повернуть так, что она ляжет на ось х то координаты у точек «облака» станут малыми числами. Такое преобразование совершается с помощью умножения каждой точки на некоторую матрицу размера 3x3 , которая, конечно, является ортогональной. Вторая и третья компоненты координат преобразованных точек будут малыми числами, поэтому координаты всех точек следует разделить на три вектора коэффициентов. Для лучшего сжатия необходимо, чтобы квантование этих векторов коэффициентов делалось с разной степенью точности.
Этот метод легко распространить на более высокие размерности, с той лишь разницей, что получающиеся пространства уже нельзя будет представить зрительно. Однако, соответствующие матрицы преобразований легко выписываются. Единственно, что приходится учитывать, это то, что размерность не должна быть слишком большой, поскольку результат сжатия на основе поворота зависит от корреляции близких пикселов.
Например, если объединять по 24 соседних пиксела в одну точку 24-мерного пространства, то полученные точки, вообще говоря, не будут лежать в малой окрестности «прямой под углом 45° к осям координат», поскольку не будет корреляции между пикселом и его дальним соседом. Поэтому после поворота, последние 23 координаты преобразованных точек уже не будут малыми. Наблюдения показывают, что корреляция пикселов сохраняется до размерности восемь, но редко дальше. Метод JPEG делит изображение на блоки пикселов размера 8 х 8 и поворачивает каждый блок два раза с помощью уравнения. Это двойное вращение дает множества, состоящие из 64 преобразованных величин, из которых первая, называемая «коэффициент DC», — большая, а все остальные 63 («коэффициенты АС») — обычно маленькие. Таким образом, это преобразование концентрирует энергию в первой компоненте из 64. Далее множество коэффициентов DC и 63 множества коэффициентов АС следует квантовать раздельно (метод JPEG делает это немного иначе.
- RSS
Наши услуги: