Учебное пособие разработал



бет19/50
Дата17.05.2020
өлшемі14.65 Mb.
түріУчебное пособие
1   ...   15   16   17   18   19   20   21   22   ...   50
ео» с основным тоном, равным 200 Гц, и целым рядом сопутствующих ему обертонов. Штриховая линия представляет собой абсолютный порог слышимости тона в тишине (кривая 1). Не все части этого сложного сигнала, если они существуют одновременно, могут быть восприняты слухом, несмотря на то, что каждая спектральная компонента лежит выше абсолютного порога слышимости, полученного для тонального сигнала. Те части сигнала и шумы, которые находятся ниже относительного порога слышимости LT, неслышны.

Этот порог получается из учета уровней спектральных частей (основного тона и обертонов) сигнала, попадающих в каждую отдельную полосу частот. Для другого звука кривая порога LT очевидно будет выглядеть иначе. Все спектральные компоненты сигнала, оказавшиеся в одной полосе, обрабатываются в кодере MUSICAM совместно с одинаковым шагом квантования. В разных полосах величина шага квантования имеет свое значение и в соответствии с этим свой уровень шумов квантования (см. рис. 1.28, заштрихованная область). Уровень мешающего сигнала лежит всегда ниже относительного порога слышимости (кривая LT). Те спектральные компоненты, которые лежат по уровню ниже кривой LT, передавать не требуется.

Итак, для сокращения объема цифровой информации с учетом психоакустической модели необходимы следующие шаги и вычисления:


  1. Пересчет спектральных компонентов с помощью БПФ из временной области в частотную.

  2. Определение уровня интенсивности сигнала в каждой частотной полосе.

  3. Определение абсолютного порога слышимости.

  4. Выделение тональных (синусоподобных) и нетональных частей (шумоподобных) спектральных компонент.

  5. Редуцирование спектральных компонент.

  6. Вычисление индивидуальных кривых маскировки, оставшихся после редуцирования спектральных компонент.

  7. Вычисление (расчет) глобального порога маскировки.

  8. Вычисление наименьшего значения порога маскировки для каждой частотной субполосы.

  9. Расчет SNR (отношения сигнал/маска) для каждой субполосы.

Весь этот комплекс вычислений выполняется в психоаутенической модели MPEG-кодера. Последовательность операций, выполняемых в MPEG-кодере (ISO/ICE 11172-3), представлена на рис. 1.29.

Блоком полифазных фильтров (с оптимизированным окном) входной сигнал разделяется на 32 части (субполосы), в каждой из которых для совместной обработки используются 12 или 36 значений отсчетов, объединенных в группу. Субполосы имеют одинаковую ширину. Полосные сигналы дискретизируются с частотами, кратными 32 кГц. В слое 3 («Layer 3») в группы объединяются 6 или 18 значений отсчетов (6x32 или 18x32). Быстрое преобразование Фурье выполняется для 512 («Layer 1») или 1024 («Layer 2») значений отсчетов. Разрешение подсистемы при этом составляет fд/512 или соответственно fд/1024. В качестве частот дискретизации предусмотрены уже известные нам значения 48, 44,1 и 32 кГц.



Рис. 1.29 — Алгоритм кодирования ЗС в соответствии

со стандартом ISO/IEC 11172-3


После того, как в кодере определены уровни сигнала в отдельных частотных субполосах, определяется абсолютный порог слышимости и анализируется, идет ли речь о тональных (синусоподобных) или нетональных (шумовых) частях сигнала. На основе использованной психоакустической модели идентифицируются доли (части) сигнала, которые в значительной степени маскируются, и затем вычисляется отношение SNR, при котором шум еще маскируется полезным сигналом. Эти расчеты в слоях 1 и 2 выполняются для каждой субполосы, а в слое 3 — для групп частотных полос. С помощью вычисленных значений SNR и уровней сигнала для каждой субполосы рассчитываются шаги квантования и необходимое для кодирования число бит. Общее число бит распределяется между субполосами так, чтобы выполнялись требования, относящиеся как к скорости передачи сигнала, так и к маскировке шумов в каждой субполосе. При большой компрессии неизбежные слышимые искажения стараются оформить по возможности как «приятные».

Расчеты, выполняемые для слоя 3 («Layer 3»), более трудоемкие, поскольку обрабатываются несколько выборок исходного поворота ЗС одновременно. При форматировании цифровых данных объединяются информационные аудиоданные и данные управления. В слоях 1 и 2 для кодирования в каждой субполосе применяется обычная ИКМ с линейным квантованием, при этом в слое 2 квантованные значения могут быть объединены в группы. В случае слоя 3 применяются коды Хаффмена, длина которых переменная и тем самым адаптирована (по возможности) к низким скоростям передачи битов. Наверняка многим известен код Морзе, в котором часто встречающиеся буквы имеют мало битов, а редко встречающиеся — много битов. В кодере слоя 3 («Layer 3») использована и эта идея для получения большей компрессии данных.



Декодер сигналов (рис. 1.30), кодированных методом MUSICAM, проверяет входящие данные на ошибки, а также разделяет данные управления процессом декодирования и сжатые информационные аудиоданные. Прежде всего разделенные на отдельные полосы сигналы экспандируются с помощью информации управления, в результате происходит их обратное преобразование в исходную форму. В инверсном блоке фильтров различные спектральные части ЗС вновь объединяются в первоначальный сигнал. Результатом этого является цифровой поток аудиоданных на выходе декодера, который уже подготовлен для цифроаналогового преобразования.


Рис. 1.30 — Структура декодера системы кодирования MUSICAM
Поскольку при каждой передаче могут возникать ошибки, то для борьбы с ними (как об этом уже говорилось ранее) применяют коды с проверочными битами (см. разд. 1.7), которые служат для распознавания и коррекции ошибок. Затраты на эти операции должны быть как можно меньше. Поэтому есть смысл выяснить, какие погрешности передачи слышимы, менее слышимы и неслышимы вообще. Эффективная защита в соответствии с этой оценкой должна реализоваться с разной силой. В нормах MPEG ошибки по их слышимости классифицируются по пяти ступеням. Сильно заметными на слух (катастрофическими) являются ошибки в битах, определяющих место (позицию) отдельных частей данных и значение коэффициента масштаба. Заметными являются ошибки в трех старших битах коэффициента масштаба, менее мешающими — ошибки в младших низкозначимых битах коэффициента масштаба и в старших информационных битах субполосных составляющих ЗС, практически неслышимыми — ошибки в обоих самых младших низкозначимых информационных битах субполосных сигналов.

В настоящее время декодеры MUSICAM разработаны в виде интегральных микросхем, которые могут декодировать сигналы слоев 1, 2 и 3. Единый декодер, который может обрабатывать сигнал слоев 1, 2 и 3 одновременно, находится еще в стадии разработки. Не выясненной пока остается также и предельно допустимая степень сжатия D сигнала, при которой искажения остаются еще незаметными на слух, особенно это относится к передаче стереофонического сигнала, где при сжатии D могут возникать и другие искажения, связанные с пространственным демаскированием.






Достарыңызбен бөлісу:
1   ...   15   16   17   18   19   20   21   22   ...   50


©netref.ru 2019
әкімшілігінің қараңыз

    Басты бет