Учебное пособие разработал



бет17/50
Дата17.05.2020
өлшемі6.68 Mb.
түріУчебное пособие
1   ...   13   14   15   16   17   18   19   20   ...   50
Рис. 1.26 — Метод преобразования 16-битовых кодовых слов

в 14-битовые (16/14) с плавающей запятой:



а — кодирование масштабных коэффициентов в зависимости

от уровня сигнала; б — схема кодирования отсчетов ЗС;



в — формат передачи по каналу
Масштабный коэффициент длиной 3 бита, добавляемый к каждому блоку из 64 отсчетов, указывает, сколько битов, следующих за знаковым Y1 во всех кодовых словах блока, имеют то же самое значение 0 или 1, что и знаковый (рис. 1.26, б). Назначение битов, пронумерованных от Z1 до Z5 (рис. 1.26, в), пока еще не определено. На приемном конце масштабный коэффициент используется для сдвига разрядов в кодовых словах блока в их первоначальное положение, и, таким образом, происходит восстановление исходных 16-битовых кодовых слов.

Редукция аудиоданных, обусловленная психоакустическими особенностями

Человек со своими органами чувств в состоянии принимать огромные потоки информации. Но сознательно он способен обрабатывать лишь около 100 бит/с информации. Поэтому можно говорить о присущей ЗС избыточности. Значительной проблемой при цифровом представлении ЗС является сокращение имеющейся в них статистической и психофизической избыточности. Это позволяет уменьшить скорость цифрового потока при кодировании ЗС до предельно возможной величины, при которой шумы, помехи и искажения остаются еще незаметными на слух даже для высококвалифицированных экспертов. Особенно важную роль играет сокращение психофизической избыточности ЗС, основанное на учете такого феномена слухового восприятия, как маскировка, и ряда динамических свойств слуха. Напомним наиболее основные для дальнейшего изложения свойства слуха.



Большое значение имеет такое понятие, как порог слышимости, ниже которого акустические сигналы не воспринимаются. Величина порога слышимости не постоянна, она согласуется со звуковыми событиями и зависит, во-первых, от частоты и, во-вторых, от уровня других сигналов, на фоне которых воспринимается данный звук. Например, вследствие маскировки громкий звук может сделать неслышимым тихое звучание. При этом значение имеют формы спектров ЗС, их уровни и временная последовательность. Важно и то, идет ли речь о тонах или звуках, имеющих широкополосные спектры. Достаточно полно исследовано, как изменяется (сдвигается) временно порог слышимости одного сигнала в присутствии другого, как тон и шум делают неслышимым звучание в соседних частотных полосах диапазона слышимых частот (см. кривые изменения относительного порога слышимости тона NaT в присутствии узкополосного мешающего шума Nа ш, показанные на рис. 1.27, а) и как громкое звуковое событие маскирует восприятие более тихих звуков, которые начинаются несколько раньше, т.е. опережают сигнал высокого уровня на интервал времени –30…20 мс (явление предмаскировки), или позже, т.е. запаздывают по времени на 0…120 мс (явление послемаскировки).


Рис. 1.27 — Зависимость изменения относительного порога слышимости тона при его маскировке узкополосным шумом со средней частотой

1000 Гц для разных уровней последнего (а) и структурная схема кодера MUSICAM с дополнительным спектральным анализом для оценки

относительного порога слышимости (б)


Если известно, какие доли (части) ЗС ухо воспринимает, а какие нет вследствие явления маскировки, то нужно вычленить и затем передать по каналу связи лишь те части сигнала, которые ухо способно воспринять, а неслышимые доли (части, составляющие сигнала) можно отбросить.

Кроме того, сигналы можно квантовать с возможно меньшим разрешением так, чтобы шумы квантования, изменяясь по величине с изменением уровня самого сигнала, еще не становились бы слышимыми.

Учет всех этих свойств слуха и связанных с ним особенностей восприятия позволяет сильно сократить общее число бит, требуемое для цифрового представления ЗС, т.е. сократить то количество информации, которое необходимо передать или запомнить без потери качества звучания. За счет устранения психофизической избыточности можно уменьшить требуемый объем для высококачественной передачи (записи) цифровых аудиоданных более чем в 10 раз.

Исследования, выполненные в данном направлении, позволили разработать два принципиально новых высокоэффективных метода цифрового представления ЗС: ASPEC — Audio Spectral Perceptual Entropics Coding (разработан фирмой AT&T, Thomson Brand und Fraunhofer Geselschaft) и MUSICAM — Masking Pattern Universal Subband Integrated Coding And Multiplexing (разработан Институтом техники радиовещания в Мюнхене, фирмой Филипс и ССЕТТ). Методы позволят в будущем использовать для передачи высококачественных сигналов ЗВ узкополосные каналы (телефон, сети ISDN). Рассмотренные методы предполагается использовать также в системах цифрового радиовещания (Digital Audio Broadcasting — DAB).

Кроме учета свойств слуха и связанным с этим сокращением объема цифровой информации, приняты во внимание также и экономические факторы. В частности, декодер должен быть максимально простым, что возможно, если алгоритм обработки сигналов при их декодировании четко определен (задан). Тогда декодер будет максимально дешевым при массовом производстве. Кодирование даже при минимизации всех затрат может оставаться сложным, а значит, и дорогим, особенно если учитывать свойства человеческого уха. Алгоритм обработки сигналов не должен быть жестким, ибо наши знания о механизмах слуха постоянно развиваются и уточняются, меняются и характеристики звукового материала. Поэтому должна иметься возможность изменения сигналов управления при кодировании, которые формируются на стороне передачи и затем доводятся до декодера. Такой подход открывает возможность улучшения качества передачи. При этом пользователям не нужно будет постоянно менять свои декодирующие устройства, что важно с потребительской точки зрения. В будущем изменения, по-видимому, коснутся методов кодирования на стороне передачи.

В идее MPEG (Moving Pictures Experts Group) содержатся две психоакустические модели, которые могут альтернативно служить в качестве основы для редукции аудиоданных при их обработке с целью сокращения избыточности передаваемых (консервируемых) цифровых ЗС. Возможная редукция аудиоданных в обоих моделях различна. Однако для декодирования этих сигналов используется один и тот же декодер.

В стандарте ISO/IEC 11172-3 (часть 3) предусмотрено несколько уровней (ступеней, слоев) компрессии цифровых аудиоданных, при этом декодеры более высокой ступени могут декодировать сигналы, подвергнутые меньшей компрессии на стороне передачи. Возможны три ступени компрессии, каждой из которых соответствуют своя скорость цифрового потока и своя рекомендуемая область применения. Перечислим основные характеристики ступеней:




Достарыңызбен бөлісу:
1   ...   13   14   15   16   17   18   19   20   ...   50


©netref.ru 2019
әкімшілігінің қараңыз

    Басты бет