Сжатие аудиоинформации
Как мы уже видели, для передачи аудиоинформации, сравнимой по качеству с музыкальным компакт-диском, необходима пропускная способность 1,411 Мбит/с. Вполне очевидно, что для удобства ее передачи через Интернет необходимо применить эффективное сжатие. Для этой цели были разработаны различные алгоритмы сжатия аудиоинформации. Наверное, одним из наиболее популярных является
алгоритм MPEG-аудио, у которого есть три уровня (или варианта), из которых наиболее мощным и широко известным считается МРЗ (MPEG-аудио уровень 3). В Интернете имеется огромное количество музыки в формате МРЗ, но не вся музыка имеет легальное происхождение, что стало причиной многих судебных исков со стороны исполнителей и правообладателей. Формат МРЗ принадлежит к аудиосоставляющей стандарта сжатия видеоинформации MPEG.
Аудиосжатие может быть осуществлено одним из двух способов. При волновом кодировании (waveform coding) сигнал преобразуется в свои частотные компоненты за счет преобразования Фурье. Затем амплитуда каждого компонента кодируется минимальным образом. Цель состоит в том, чтобы в точности воспроизвести форму волны на другом конце линии, затратив на это минимально возможное количество битов.
Другой способ называется перцепционным кодированием (perceptual coding), или кодированием по восприятию, и использует определенные особенности человеческого слухового аппарата для кодирования сигнала таким образом, чтобы он звучал так же, как оригинал для слушателя, несмотря на его совершенно иное отображение на осциллографе. Перцепционное кодирование основано на науке под названием психоакустика, которая изучает восприятие звуков человеком. В основу формата МРЗ положено именно перцепционное кодирование.
Ключевым свойством перцепционного кодирования является тот факт, что некоторые звуки способны маскировать другие звуки. Представьте, что в теплый летний день по радио в прямом эфире идет передача концерта для флейты с оркестром, и вдруг где-то неподалеку бригада дорожных рабочих включает отбойные молотки и начинает вскрывать дорожное покрытие. И флейта уже не слышна. Ее звуки замаскировались звуками отбойных молотков. Теперь для передачи сигнала важно закодировать только частотный диапазон, издаваемый отбойными молотками,-поскольку флейту слушатели все равно уже не услышат. Этот эффект называется частотной маскировкой и подразумевает способность громкого звука в одном частотном диапазоне скрывать более тихий звук в другом частотном диапазоне, который будет слышен в отсутствие громкого звука. Фактически, даже после того как отбойные молотки будут остановлены, флейта будет неслышна еще какой-то небольшой период времени, поскольку ухо понизило свою чувствительность, как только они заработали, и нужно определенное время, чтобы вернуть чувствительность к прежнему уровню. Этот эффект называется временной маскировкой.
Чтобы придать этому эффекту некоторое количественное измерение, представим себе эксперимент № 1. Человек в тихой комнате надевает наушники, подключенные к компьютерной звуковой карте. Компьютер генерирует синусоидальную волну частотой 100 Гц небольшой, но постепенно нарастающей громкости. Человеку поставлена задача нажимать на кнопку, как только он услышит звук. Компьютер записывает текущую громкости звука, и эксперимент повторяется для 200 Гц, 300 Гц и всех остальных частот вплоть до предела восприятия человеческого уха.

