Приветствую Вас, Гость
Главная » 2010 » Октябрь » 19 » Мультимедиа тема3-основы зАПИСИ, СИНТЕЗА И ВОСПРОИЗВЕДЕНИЯ ЗВУКА
17:38
Мультимедиа тема3-основы зАПИСИ, СИНТЕЗА И ВОСПРОИЗВЕДЕНИЯ ЗВУКА
АПИСИ, СИНТЕЗА И ВОСПРОИЗВЕДЕНИЯ ЗВУКА

3.1. Методы преобразования информации при записи, синтезе и воспроизведении звука

Звук представляет собой колебания физической среды (обычно воздуха) частотой приблизительно 20-20000 Гц, все современные системы обработки звука основаны на преобразовании этих колебаний в электрический сигнал, последующей его (аналоговой или цифровой) обработки и вывода вновь в виде колебаний физической среды. Эффект стереофонии достигается временной разницей колебаний, легко улавливаемой благодаря наличию приблизительно 20-сантиметровой базы между приемниками аудиоинформации – ушами (разница порядка 7 10-4 сек).
В самом начале своей истории компьютер фирмы IBM был оснащен примитивным динамиком, позволявшем (посредством драйвера SPEAKER.DRV) воспроизводить звуки (одновременно) одного тона без регулировки уровня звука; именно в это время были разработаны основные принципы преобразования звука для бытовых компьютеров.
Первый шаг к более серьезной работе со звуком был сделан в 1987 году, когда фирма Creative Labs (www.creative.ru) разработала Creative Music System (C/MS), представлявший собой 12-голосный стереомузыкальный синтезатор, начавший распространяться в 1989 г. под маркой Game Blaster. Огромный коммерческий успех этой карты привел в скором времени к появлению других подобных карт, наиболее известной из которых является карта AdLib; в основе их функционирования лежит методё известный как нижеописанный ‘синтез путем частотной модуляции’ (FM Syntesis, см. ниже).
Запись произвольного звука осуществляется путем прямой оцифровки аналогового сигнала, представляющего собой электрическую копию звукового давления (преобразователем является датчик звукового давления - микрофон). Частота оцифровки (частота преобразования) называется частотой выборки сигнала и по известной теореме Котельникова-Найквиста должна быть не ниже удвоенного значения максимальной частоты преобразуемого сигнала (например, если спецификация MPC Level 1 определяет частоту преобразования 11 kГц, то верхний предел записываемой частоты составляет около 5 kГц).
Преобразование аналогового сигнала в цифровую форму выполняет аналого-цифровой преобразователь (АЦП), служащий для дискретизации сигнала по времени (частота оцифровки) и квантования по уровню (собственно цифровое представление сигнала). Обычно в АЦП применяется технология преобразования с импульсно-кодовой модуляцией (PCM, Pulse Code Modulation). Временные промежутки между моментами преобразования сигнала называют интервалами выборки (Sampling Interval); эта величина обратно пропорциональна частоте выборки, или сэмплингом (Sampling Rate). Амплитуда аналогового сигнала (Sample Value) при каждом преобразовании делится (квантуется) по уровню и кодируется в соответствующий параллельный цифровой код (Digital Sample), время преобразования аналогового сигнала в цифровой код именуется временем выборки (Sampling Time), рис. 3.1.
Разрешающей способностью АЦП называется наименьшее значение аналогового сигнала, которое приводит к изменению цифрового кода. Например, если АЦП выдает 8-разрядный код, разрешающая способность равна 1/(28)=1/256 от максимальной амплитуды аналогового сигнала (около 0,4% в относительных единицах), 16-разрядный АЦП имеет точность представления сигнала не хуже 1/(216)=1/65536 (0,0015%).


Рис. 3.1. Характеристики процесса преобразования между аналоговым и цифровым сигналами

С увеличением разрядности АЦП растет его динамический диапазон (каждый дополнительный бит соответствует увеличению приблизительно на 6 дБ). 8-разрядное преобразование обеспечивает динамический диапазон 48 дБ (качество кассетного магнитофона), 12-разрядное – 72 дБ (качественный катушечный магнитофон), 16-разрядное – 96 дБ (качество аудио компакт-диска).
Полученный с АЦП параллельный код разрядностью 8-16 последовательно (побитно) записывается с частотой сэмплинга в аудиофайл (при необходимости используется буфферизация), при этом поток несжатых цифровых аудиоданных велик (см. таблицу ниже); ниже будут приведены методы снижения потока данных и размеров аудиофайлов.

Частота (kГц) Разре-шение (бит)
Режим Качество
звучания Скорость передачи данных (kb/s) Размер файла
минутной
записи (Мбайт)
11,025 8 моно телефонная линия 10 0,66
11,025 8 стерео 21 1,3
11,025 16 моно 1,3
11,025 16 стерео 2,6
22,05 8 моно радио-
трансляция 21 1,3
22,05 8 стерео 43 2,6
22,05 16 моно 2,6
22,05 16 стерео 5,3
44,1 8 моно 2,6
44,1 8 стерео 5,3
44,1 16 моно 86 5,3
44,1 16 стерео запись на CD 172 10,5

В студийной работе происходит переход на стандарт 96 kГц/24 бита, который по теоретически достижимому качеству пока заметно перекрывает возможности существующих звуковых систем.
Заметим, что АЦП (также как и ЦАП - цифро-аналоговые преобразователи) выполняют свои функции аппаратно, не загружая ЦП (центральный процессор); последний управляет только режимами работы АЦП и ЦАП. Обобщенные схемы записи и воспроизведения звука приведены на рис.3.2 и 3.3; именно так создаются и воспроизводятся широкоизвестные WAV-файлы (вопросы сжатия и распаковки ‘на лету’ аудиоданных обсуждаются ниже).


Рис. 3.2. Аналого-цифровое преобразование при записи звука


Рис. 3.3. Цифро-аналоговое преобразование при воспроизведении звука

ЦАП выполняет обратное (цифро-аналоговое) преобразование, в результате работы ЦАП получается ступенчатый сигнал, представляющий собой исходный аналоговый сигнал плюс обусловленная сэмплингом высокочастотная составляющая (лежащая выше верхнего предела слышимых частот и поэтому легко фильтруемая), рис.4.4.


Рис. 3.4. Сглаживание ступенчатого сигнала после ЦАП при воспроизведении звука

Сказанное относится к записи и воспроизведению произвольного звука, во многих случаях возможно значительно сократить объем хранимых данных путем синтеза (создания) звука. При этом мы лишаемся возможности работы с произвольным звуком, остается лишь возможность обработки некоторого (моделируемого) подмножества звучаний. Достаточно широко применяются звуковые карты, оснащенные DSP (Digital Signal Processor), обладающие многими дополнительными возможностями обработки звука (распознавание речи, реверберация, спецэффекты типа 3-х мерного звучания и др.).
Наиболее часто применяют цифровой FM-синтез звука, основы которого заложены в конце 70-х годов студентом Стенфордского университета Джоном Чоунингом (John Chowning). Несколько десятилетий ранее Роберт Муг (Robert Moog) реализовал в серии своих всемирно известных синтезаторов аналоговый вариант FM-синтеза путем использования генераторов огибающей, управляющих амплитудой отдельных VOC-генераторов (Voltage-Controlled Oscillator).
В цифровом FM-синтезе каждый из описанных управляемых генераторов называется оператором. В операторе выявляются два базовых элемента: фазовый модулятор и генератор огибающей. Фазовый модулятор задает частоту (высоту) звука, а генератор огибающей - его амплитуду (громкость); см. общую схему рис. 3.5.

Категория: Предметы | Просмотров: 859 | Добавил: Shamaj | Рейтинг: 0.0/0


Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]