Мультимедиа на компьютере.
Компьютеры не задумывались своими создателями как устройства для занятий музыкой. Их изначальное предназначение типично для любой полезной машины — освободить человека от тяжелой и монотонной работы.
В данном случае речь идет об умственной деятельности рутинного характера, связанной с громоздкими вычислениями и сортировкой большого количества данных. Просто так уж случилось, что многие профессионалы в разных сферах, любящие и хорошо понимающие то, чем они занимаются, сумели воспользоваться присущей вычислительным машинам универсальностью и использовать ее для пользы своего дела. Легендарный Макс Мэтьюз из Bell Labratories начал заниматься машинным синтезом звука еще в 60-е годы, когда компьютер занимал целый этаж, и вряд ли вызывал у большинства музыкантов прилив творческого вдохновения.Видимо, создатель программы Music 4 достаточно хорошо представлял, что ему нужно от жизни и от вычислительной машины.
Попытавшись определить в нескольких словах сущность компьютера, продолжим со звуковой платой: это вспомогательное устройство, позволяющее компьютеру принимать, передавать и обрабатывать информацию — под информацией мы подразумеваем звук. Здесь есть входной и выходной потоки данных. Только для нас это звук, а для компьютера — данные, которые ему надлежит обработать. То, в каком виде здесь передается и принимается звук, — вопрос отдельный. Важно то, что внутри компьютера он существует только в цифровом виде.
Компьютеру, вообще говоря, все равно, что и как обрабатывать. Это в полной мере определяет человек, у которого возможностей сегодня побольше, чем в 60-е годы. Емкость оперативной памяти (RAM) и жестких дисков давно не является проблемой. Быстродействие? Сейчас все меньше задач, заставляющих оператора злоупотреблять кофе во время их обсчета. Принципиальный вопрос компьютерных звуковых технологий — способность системы пропускать большие объемы данных за минимальное время — тоже представляется решаемым.
Итак, представив данные, в том числе и звук, в виде набора чисел, мы получаем огромные возможности для их обработки. Набор инструкций, предписывающих компьютеру, что он должен делать с теми или иными данными (информацией), называется программой. Напомню, что набор данных, с которым работает программа, именуют файлом. Как только данные, в частности, оцифрованный звук, оказываются в компьютере в виде файла, записанного чаще всего на жестком диске, программы получают полную возможность работы с ними. Это важный момент, потому что в этом случае операции над звуковыми файлами могут производиться независимо от какого-либо звукового оборудования, включая звуковую плату! Так работают многие программы редактирования, в частности, знаменитые Sound Forge и WaveLab. Звуковая плата используется здесь в основном для прослушивания результатов работы.
Пожалуй, в первую очередь стоит осознать, для чего будет использоваться звуковая плата, а точнее — компьютер вообще. Перечислить варианты вряд ли возможно, достаточно сказать, что компьютерной студии по плечу все, что вообще можно делать на студиях, работающих с цифровым звуком, плюс еще некоторые специфические виды работ, например, создание мультимедийных приложений. Главными и неоспоримыми преимуществами компьютера являются наглядность и удобство при работе с материалом, а это положительно отражается на эффективности студии в целом.
На наших глазах звуковые компьютерные технологии постепенно переходят из разряда хитроумных игрушек в класс профессионального инструментария, использующегося в серьезных аудиотрактах. Первая область, которую вычислительная техника завоевала много лет назад, это — контроль сложных комплексов самого различного применения. Специализированное программное обеспечение управляет трансформацией сценического пространства, световыми и звуковыми инсталляциями, аппаратурой усиления и передачи сигналов, радио и телеэфирами, помогает архивировать ценнейшие материалы фонотек и видеотек. Однако, с наступлением эры цифрового звука программно реализованные алгоритмы вмешались в святая святых — в аудиозапись, обработку и микширование звука.
Чисто программным средствам в профессиональной студийной практике сегодня находится место отнюдь не на каждом технологическом этапе работы со звуком. Но, во-первых, многие программы поставляются в рамках специализированных аппаратно-программных комплексов, в сумме имеющих серьезные профессиональные возможности. А во-вторых, за технической стороной дела не стоит забывать о творчестве. Ибо сегодняшние цифровые технологии позволяют даже на не очень дорогих средствах порой создавать замечательные музыкальные произведения. И если в душе поет музыка, а образование позволяет понимать хотя бы нотную грамоту — пусть вас не пугает простенькая персоналка с несколькими волновыми треками.
На сегодняшний день выбор музыкального программного обеспечения достаточно велик, свою продукцию представляют фирмы из многих стран мира, и можно подобрать и универсальные и специализированные программы для работы со звуком.
Мультимедиа (multimedia) — это современная компьютерная информационная технология, позволяющая объединить в компьютерной системе текст, звук, видеоизображение, графическое изображение и анимацию(мультипликацию). Мультимедиа — это сумма технологий, позволяющих компьютеру вводить, обрабатывать, хранить, передавать и отображать (выводить) такие типы данных как текст, графика, анимация, оцифрованные неподвижные изображения, видео, звук и речь.
Для построения мультимедиа системы необходима дополнительная аппаратная поддержка: аналого-цифровые и цифро-аналоговые преобразователи для перевода аналоговых аудио и видео сигналов в цифровой эквивалент и обратно, видеопроцессоры для преобразования обычных телевизионных сигналов к виду, воспроизводимому электронно-лучевой трубкой дисплея, декодеры для взаимного преобразования телевизионных стандартов, специальные интегральные схемы для сжатия данных в файлы допустимых размеров и так далее. Все оборудование отвечающее за звук объединяются в так называемые звуковые карты, а за видео в видео карты. Дальше рассматривается подробно и в отдельности об устройстве и характеристиках звуковых карт, стандартах сжатия звука и некотором специализированном программном обеспечении.
С течением времени перечень задач выполняемых на ПК вышел за рамки просто использования электронных таблиц или текстовых редакторов. Компакт — диски со звуковыми файлами, подготовка мультимедиа презентаций, проведение видео конференций и телефонные средства, а также игры и прослушивание аудио CD для всего этого необходимо чтобы звук стал неотъемлемой частью ПК. Для этого необходима звуковая карта.
Мы все уже привыкли к тому, что современный персональный компьютер может издавать весьма разнообразные звуки. Вначале они могли только гудеть и пищать на разные лады, затем появились программы, произносящие вполне отчетливые слова и играющие отдаленное подобие музыки, слушаемой через водосточную трубу; компьютерные игры довольно быстро научились даже при помощи встроенного громкоговорителя издавать что-то вроде выстрелов и взрывов. А теперь повсеместное распространение недорогих звуковых карт позволило воспроизводить с их помощью любые теоретически возможные звуки. Однако в большинстве случаев мы с вами слышим только те звуки, которые были, как говорится, заложены при разработке той или иной программы, а между тем многим хочется гораздо большего. Все это вполне возможно — при наличии требуемых аппаратных средств и/или программ, а главное — знаний о способах извлечения нужных звуков из такого вроде бы немузыкального устройства, как компьютер, так как компьютер по первоначальному определению это устройство для хранения, обработки и передачи информации.
ЗВУКОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРА.
Возможности встроенного динамика (PC—Speaker)
Представим себе батарейку, которая через регулятор (для удобства — прямолинейный, а не круглый) подключена к динамику акустической системы. При перемещении регулятора диффузор динамика будет аналогично перемещаться между своим нейтральным положением и точкой максимального отклонения, в точности повторяя движения ползунка и изменение электрического тока в цепи. В таком случае говорят, что имеет место аналоговая передача звука, которая используется почти во всей звуковой аппаратуре. Таким образом, перемещая ползунок с нужной скоростью, мы можем заставить динамик издать любой нужный нам звук — вся проблема только в скорости перемещения ползунка.
В компьютерах, как известно, используется цифровой принцип передачи информации: электрические сигналы могут принимать только два состояния — 0 и 1, что соответствует минимальному и максимальному уровням напряжения. Графики электрических сигналов при этом даже отдаленно не напоминают, например, график изменения яркости картинки на мониторе или траекторию перемещения мыши, поскольку аналоговые сигналы закодированы в цифровых. Подключив динамик к выходу цифровой схемы, мы можем привести его диффузор только в одно из двух возможных положений; если теперь переключать цифровой сигнал со звуковой частотой — мы услышим знакомое гудение или писк разной высоты. Именно так и было реализовано управление встроенным динамиком в самых первых персональных компьютерах, таким же оно осталось и в их современных моделях — программа либо программирует генератор импульсов на их повторение с нужной частотой, либо сама переключает цифровой сигнал на динамике. Изменяя частоту следования импульсов, можно повышать или понижать тон звука, однако более приятных звуков таким способом извлечь невозможно. Такой способ управления называется частотной модуляцией (ЧМ/FM).
Однако кое-что все-таки можно сделать, вспомнив, что диффузор динамика имеет инерцию и из-за нее не может перемещаться со скоростью, сравнимой со скоростью изменения цифровых сигналов в компьютере. Если подать на него цифровой сигнал из равномерно меняющихся 0 и 1 с частотой более 20 килогерц — диффузор будет излучать неслышимый ультразвук, сила которого будет очень быстро падать с ростом частоты, и уже на нескольких десятках килогерц диффузор практически перестанет двигаться. Однако если изменение между 0 и 1 будет неравномерным, то диффузор уже не сможет оставаться на месте, однако и не будет колебаться в точном соответствии с цифровым сигналом. Можно сказать, что удержание одного из уровней на выходе схемы ускоряет движение диффузора в выбранном направлении, а смена уровня на противоположный — тормозит его, а при удержании нового уровня в течение длительного времени диффузор начнет двигаться в противоположном направлении. Этот способ управления называется широтно-импульсной модуляцией (ШИМ).
Таким образом, если достаточно искусно переключать цифровые уровни на схеме управления динамиком, то в принципе из него можно получить произвольные и чистые звуки. Однако на практике это возможно лишь при условии точного знания момента инерции диффузора, параметров усилителя мощности и очень высокой (в идеале — бесконечной) точности управления сменой уровней. Поэтому описанный метод получил довольно ограниченное применение — для имитации выстрелов и взрывов в играх, простейшего синтеза речи или воспроизведения очень низкокачественной музыки.
Преобразователи АЦП и ЦАП
Наиболее естественным способом «подружить» цифровой компьютер с его «рваной» импульсной системой передачи информации, и непрерывный реальный мир является использование преобразователей аналоговых сигналов в цифровые и обратно, которые и называются аналогово-цифровыми и цифро-аналоговыми преобразователями — АЦП и ЦАП. Первый получает непрерывный аналоговый сигнал и постоянно выдает поток цифровых сигналов, второй действует наоборот. При этом говорят, что АЦП кодирует аналоговый сигнал, а ЦАП — декодирует его. В англоязычной литературе используются обозначения ADC и DAC, а также codec (coder/decoder).
Для преобразования в цифровой код аналоговый сигнал приходится подвергать дискретизации — разбиению на фиксированные участки во времени и на ряд фиксированных величин — по уровню. Каждый элементарный участок сигнала кодируется одним числом, величина которого пропорциональна среднему уровню сигнала на этом участке; такое число называется отсчетом. Числа появляются на выходе АЦП синхронно с изменением сигнала на входе; точность преобразования будет тем выше, чем выше частота следования отсчетов и чем больше используется фиксированных значений уровня. Частота следования отсчетов называется частотой дискретизации, а диапазон значений отсчета определяется разрядностью его двоичного представления.
Выбор частоты дискретизации важен в первую очередь для передачи частотного диапазона сигнала — при слишком низкой частоте звук становится глухим и неразборчивым. Чаще всего для хорошей передачи звука достаточно частоты, вдвое большей максимальной частоты исходного сигнала, хотя для достижения высокого качества используется трех — пятикратное превышение. А разрядность влияет прежде всего на количество искажений и шумов, вносимых в звук — при недостаточной точности отсчетов звук становится резким и неприятным, как внутри металлической трубы.
В популярных сейчас бытовых проигрывателях компакт-дисков используется частота дискретизации 44.1 кГц и отсчеты в 16 двоичных разрядов (65536 фиксированных уровней). В цифровых телефонных линиях применяется 8-разрядная (256 уровней) оцифровка на 8 кГц, а в студийных системах обработки звука — 24-разрядная (16777216 уровней) с частотой 96 кГц. Понятно, что с ростом частоты дискретизации и разрядности отсчета растет и объем данных, занимаемый звуком. Например, один компакт-диск вмещает 74 минуты стереозвучания, однако при записи на нем звука в монофоническом телефонном формате время непрерывного звучания составит более суток.
Самый простой ЦАП делается при помощи так называемой резистивной матрицы, когда все разряды двоичного числа, представляющего отсчет, через резисторы с различным сопротивлением сводятся в одну точку, причем сопротивление резисторов падает с ростом старшинства разрядов двоичного числа. Таким образом, изменение старшего разряда из 0 в 1 и наоборот будет вносить в линию максимальное изменение напряжения, а то же самое в младшем разряде — минимальное, и в случае 8 разрядов разница составит в точности 256 раз. При последовательном переборе всех чисел от 0 до 255 сигнал на выходе будет ступенчато изменяться от нуля до максимума — в 256 раз более плавно, чем простой цифровой переход от 0 к 1.
Лет десять назад на компьютерах IBM PC подобные 8-разрядные ЦАП делались при помощи параллельного порта принтера, имеющего как раз 8 линий данных, а при использовании дополнительных линий управления — и более качественный 12-разрядный. Выводя из программы в порт отсчеты с нужной скоростью, можно получить достаточно чистый звук, сравнимый по качеству с телефоном или дешевым магнитофоном.
Сейчас выпускается широчайший ассортимент звуковых адаптеров, или карт, для всех видов персональных компьютеров, а во многих моделях они являются компонентом системной платы. Современный звуковой адаптер содержит 16-разрядные стереофонические ЦАП и АЦП, работающие на частоте 5..48 кГц, которые передают и получают цифровой звук по каналам прямого доступа к памяти (DMA), без прямого участия программ, которым остается только вовремя забирать готовый оцифрованный фрагмент с АЦП, или подавать очередной цифровой фрагмент на ЦАП. Многие адаптеры могут записывать и воспроизводить звук одновременно, и программа при должном быстродействии может синхронно воспроизводить записанный звук в уже обработанном виде.
Процессоры DSP (Digital Signal Processing)
В принципе DSP (Рис.3) нужен чтобы разгрузить центральный процессор (CPU) компьютера, да и вообще поменьше от него зависеть. Это делает работу платы устойчивей и позволяет избежать многих проблем совместимости с разными компьютерами.
Обработка цифрового звука — отдельная и весьма обширная область, которая, по сути, сводится к выполнению над числами-отсчетами тех же математических операций, которые в аналоговых устройствах
Рис.3.Процессор-DSP.
выполняются электронными схемами. Например, усилению или ослаблению соответствует умножение или деление отсчетов, смешиванию двух сигналов — попарное сложение их отсчетов, фазовому сдвигу — задержка одних отсчетов относительно других. Единственная проблема состоит в том, что для выполнения сложных преобразований вроде фильтрования или модуляции требуется очень большое число элементарных числовых операций, которое рядовой компьютер не в состоянии делать синхронно с поступающим сигналом (как говорят — в реальном времени). В таких случаях либо применяются специальные цифровые сигнальные процессоры (DSP), либо обработка проводится основным процессором, но после предварительной записи звука в память или на жесткий диск, с воспроизведением оттуда после окончания обработки. Эта так называемая нелинейная обработка занимает больше времени и не позволяет тут же слышать результат, однако никак не ограничена по сложности и глубине воздействия на звук.
Частным случаем обработки является простой монтаж фонограмм, с которым постоянно сталкиваются операторы самых различных звуковых студий. То, что на обычном магнитофоне делается за минуты, часы и дни путем многократной перезаписи с ленты на ленту, даже на самом простом компьютере занимает считанные секунды или часы, благодаря полному визуальному контролю и точности вплоть до одного цифрового отсчета (при 44.1 кГц — 23 мкс).
Однако компьютер способен не только сохранить и воспроизвести однажды записанный в него звук, даже после цифровой обработки — он может создавать совершенно новые звуки при помощи аппаратного или программного синтеза. Простейший метод синтеза состоит в генерации серии отсчетов и циклическом их воспроизведении, в результате чего получается периодический (тональный) звуковой сигнал. Например, при воспроизведении значений функции sin (x), вычисленных с некоторым шагом в границах периода, получается чистый синусоидальный звуковой сигнал с мягким звучанием и четкой музыкальной высотой; при усложнении вычислительной функции звуковые колебания будут повторять ее график — с точностью до параметров оцифровки и погрешностей ЦАП. График можно и нарисовать прямо на экране при помощи мыши; при этом плавному графику будут соответствовать более мягкие, глухие звуки, а крутому — более резкие, яркие и звонкие.
Если взять какой-либо физический процесс, приводящий к появлению звука — разряд молнии, шум ветра или колебания скрипичных струн — то всегда можно разработать достаточно точную математическую модель этого явления, которая сведется к системе уравнений. Решая эти уравнения, можно получить график звуковых колебаний, возникающих в этом процессе, и затем воспроизвести их. Подобным образом был получен предполагаемый звук московского Царь-Колокола при помощи только его наружных измерений и структурного анализа сплава. Этот метод физического моделирования — самый точный для имитации реальных звуков, однако он же — самый трудоемкий и длительный.
Частотная модуляция (FM)
Другой, более простой, метод синтеза состоит в генерации синусоидального сигнала, частота которого управляется другими генераторами таких же сигналов — это разновидность частотной модуляции (англ. FM). В результате получается сигнал весьма сложной структуры, тембр которого может меняться в чрезвычайно широких пределах. При достаточном количестве управляющих друг другом генераторов (так называемых операторов) и точном подборе их параметров можно не только синтезировать необычные звуки, но и достаточно точно имитировать звуки природы и музыкальных инструментов. Однако на практике количество операторов не превышает десяти, и разумное управление даже таким небольшим их числом сильно затруднено. В большинстве звуковых адаптеров есть аппаратный FM-синтезатор с двумя или четырьмя операторами, при помощи которого можно синтезировать различные шумы, стуки и звоны, однако для имитации музыкальных инструментов он в силу своей простоты совершенно непригоден.
Таблично-волновой метод синтеза звуков (Wave table)
Наиболее распространенный сейчас метод синтеза музыкальных звуков — таблично-волновой (wave table — WT). Он заключается в записи характерных фрагментов звучания реальных инструментов — начального и среднего по времени всего звучания ноты — и использования их для синтеза всех прочих звуков, издаваемых этими инструментами. Записанные фрагменты образуют основной тембр инструмента, а различные приемы обработки в реальном времени — изменение частоты, амплитуды, добавление гармоник или их фильтрация — придают тембру оттенки и динамику, свойственные различным приемам игры. Для повышения достоверности имитации берется больше образцов (англ. samples) звучания и выполняется больше работы по их обработке во время синтеза; в простейшем случае таблично-волновой метод вырождается в так называемый сэмплерный, при котором звучание инструмента записывается и воспроизводится целиком от начала до конца. Пионером в реализации WT-синтеза стала в 1984 году фирма Ensoning. Вскоре WT-синтезаторы стали производить такие известные фирмы, как Emu, Korg, Roland и Yamaha.
В качестве образцов звучаний в таблично-волновом и сэмплерном методах могут использоваться и результаты других методов синтеза или обработки. Например, многие модные сейчас «электронные» звучания получены путем сложной обработки различных ударных звуков, звука падения капель и даже скрежета ржавого железа. Путем намеренного огрубления, внесения искажений и дополнительных призвуков изначально мягкие звуки делаются более резкими и пронзительными (яркий пример — дисторшн или овердрайв для гитары), а изначально звонкие и яркие — смягчаются и выравниваются. При помощи даже сравнительно простых операций вроде суммирования сигналов с фазовым сдвигом можно получать совершенно не похожие на оригиналы звуки.
В последнее время все большее число звуковых адаптеров оснащается таблично-волновыми синтезаторами, возможности которых приближаются к профессиональным синтезаторам, используемым на музыкальной сцене. Все они содержат заранее заданный стандартный набор звуков мелодических и ударных инструментов, что позволяет им более-менее похоже исполнять одни и те же музыкальные произведения в нотной форме, а некоторые вдобавок позволяют использовать дополнительные — готовые или самостоятельно созданные — наборы звуков. Все синтезаторы предоставляют возможности по управлению артикуляцией, амплитудной и частотной модуляцией звучания, а наиболее развитые позволяют «на ходу» в широких пределах менять спектр звука, создавать эффекты реверберации, хорового звучания, вращения звука и т.п.
Управляются компьютерные синтезаторы, как и их «старшие братья», при помощи специального музыкального цифрового интерфейса MIDI. Внутри компьютера он представляет собой просто расширение нотной системы записи музыки с дополнительными командами для управления ее исполнением; вдобавок к этому большинство звуковых адаптеров содержит внешний MIDI-интерфейс, к которому можно подключить любое количество клавишных или модульных музыкальных синтезаторов, блоков обработки звука, датчиков, систем освещения и т.п. Компьютер в этом случае выступает в роли «мозгового центра», управляющего всем этим электронным зверинцем — как дома или на дискотеке, так и в профессиональной музыкальной, театральной студии или в концертном зале. В этих областях персональные компьютеры обосновались так же давно и прочно, как в лабораториях математиков и физиков; но самое главное состоит в том, что многие вещи, которые еще недавно были возможны лишь на очень сложной и дорогой аппаратуре, становятся доступны каждому, у кого есть современный персональный компьютер со звуковым адаптером — даже самым простым и дешевым. Достаточно научиться его правильно применять — и для вас уже не будет ничего принципиально невозможного в мире звука.
ПАРАМЕТРЫ ЗВУКОВЫХ КАРТ
Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. Число различных моделей звуковых карт составляет несколько десятков. А если учитывать еще и различные версии одних и тех же устройств, то при покупке карты приходится выбирать почти из сотни наименований. Не всякая звуковая карта способна на большее, чем озвучивание компьютерных игр. Конечно, принадлежность звуковой карты к продукции известных фирм является веской причиной того, что именно ее следует выбрать, это скажется в дальнейшем на надежности работы. К важнейшим параметрам относятся, в первую очередь:
> метод синтеза музыкальных звуков, реализованный в синтезаторе звуковой карты;
> разрядность АЦП/ЦАП звуковой карты;
> диапазон частот дискретизации;
> отношение сигнал/шум;
> динамический диапазон.
В современных звуковых картах по-прежнему применяется частотный синтез звуков (FM-синтез), но это делается в основном в целях обеспечения поддержки старых игр. Основным методом синтеза в настоящее время является волновой метод, или, как его еще называют, метод волновых таблиц (WT-синтез).
После первого же сравнения звучания MIDI-инструментов в FM и WT вариантах можно решить для себя, что FM-инструменты не стоят того, чтобы тратить на них время. Поэтому дальше речь пойдет только о WT-синтезаторах звуковых карт.
Разрядность звуковой карты
Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности АЦП и ЦАП. Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: WT-синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. В недавнем прошлом прямое указание на разрядность звуковой карты содержалось в ее названии в виде числа 16. Тем самым изготовители подчеркивали, что в их продукции качество цифрового звука как бы соответствует качеству звука лазерного проигрывателя, а не какой-нибудь там 8-битной карты. В дальнейшем 16 разрядов в ЦАП/АЦП стали нормой, а числа «32» или «64» в названиях стали означать совсем другое — максимальное количество одновременно звучащих голосов синтезатора звуковой карты (полифонию).
Некоторые высококачественные звуковые карты оборудованы 18-битными и даже 24-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.
Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования, в свою очередь, зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования. Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.
В случае превышения сигналом значения самого верхнего уровня квантования («старшего» кванта), а так же в случае, когда значение сигнала оказывается меньше нижнего уровня квантования («младшего» кванта), т. е. при ограничении сигнала, возникают искажения, более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам.
При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет ниже.
В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант. Разумеется, если при записи уже имело место ограничение амплитуды, то нормализация не избавит сигнал от искажения.
Приемлемым считается 16-разрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП нецелесообразно, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схем компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем —96дБ.
Однако увеличение разрядности АЦП обусловлено еще одним фактором — стремлением расширить его динамический диапазон. Динамический диапазон это максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Минимальный сигнал не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальный — не должен превышать величины напряжения, соответствующего N квантам. Поэтому динамический диапазон для 16-разрядного АЦП составляет 96 дБ, для 18-разрядного— 108 дБ, для 20-разрядного— 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого составляет 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.
В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука. Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно искажает его. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Владелец 16-битной звуковой карты может убедиться в отсутствии особых причин для расстройства: динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону такой звуковой карты. Кроме того, 18-битное или 20-битное представление сигнала применяется только на этапе обработки звука. Конечная аудиопродукция (CD и DAT) реализуется в 16-битном формате.
После того как мы немного разобрались с разрядностью звуковой карты, пришло время поговорить о частоте дискретизации.
Частота дискретизации
В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: если важные изменения сигнала произойдут не в те моменты, когда были взяты отсчеты, они могут быть «пропущены» преобразователем. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.
Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое в отечественной научно-технической литературе принято называть теоремой Котельникова [Котельников В.А. Теория потенциальной помехоустойчивости.— М., Госэнергоиздат, 1956].
Если поставить перед собой задачу обойтись без формул и использования серьезных научных терминов типа «система ортогональных функций», то суть теоремы Котельникова можно объяснить следующим образом. Сигнал, представленный последовательностью дискретных отсчетов, можно вновь преобразовать в исходный (непрерывный) вид без потери информации только в том случае, если интервал между соседними отсчетами не превышает половины периода самого высокочастотного колебания, содержащегося в спектре сигнала.
Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой F. Теоретически все реальные сигналы имеют бесконечные спектры. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax и лишь затем производят дискретизацию. Согласно теореме Котельникова частота, с которой следует брать отсчеты, составляет Fд = 2Fmax Теорема получена для идеализированных условий. Если учесть некоторые реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.
В стандарте CD частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации. Важно, чтобы максимальное значение частоты дискретизации было не менее 44,1 кГц, в противном случае качества звучания CD достичь не удастся. Следует различать частоту дискретизации в АЦП/ЦАП, предназначенных для оцифровки внешних сигналов, и частоту дискретизации в ЦАП WT-синтезатора звуковой карты. Значение последней может не совпадать с указанными стандартными значениями.
Дуплекс и наличие цифрового выхода
Довольно часто изготовители, доказывая преимущество своих звуковых карт, подчеркивают еще два обстоятельства:
> наличие у звуковой карты выхода, на котором информация представлена в цифровой форме;
> наличие дуплексного режима прямого доступа к памяти.
Действительно, если звуковая карта имеет выход, на который сигналы поступают не в аналоговой (после ЦАП), а в цифровой форме, то это позволяет уменьшить искажения, связанные с дополнительными преобразованиями при дальнейшей цифровой обработке сигнала вне звуковой карты. Это становится актуальным при записи композиции на CD или DAT.
Так, например, в звуковых картах SB AWE32, AWE64 имеется разъем интерфейса S/PDIF (Sony/Philips Digital Interface Format — формат цифрового интерфейса фирм Sony и Philips), который предназначен для передачи звуковых сигналов от WT-синтезатора в цифровой форме, Но не следует забывать, что S/PDIF представляет собой лишь упрощенный вариант профессионального студийного интерфейса AES/EBU (Audio Engineers Society/European Broadcast Union), разработанного Европейским радиовещательным союзом.
Для разгрузки центрального процессора работа АЦП/ЦАП звуковых карт организуется в режиме прямого доступа к памяти [Direct Memory Access — DMA). Полный дуплекс [Full-Duplex) означает способность звуковой карты одновременно воспроизводить и записывать звук. Для этого требуется поддержка звуковой картой одновременно двух каналов DMA. Для звуковых карт семейства AWE возможна организация одного 16-ти разрядного и одного 8-ми разрядного каналов. По одному из них возможна запись, а по другому воспроизведение. Это ограничение затрудняет работу с программами многоканального монтажа и сведения, а также подготовку материала для записи CD на том же компьютере, на котором установлена звуковая карта.
В следующих стаьях я расскажу — как выбрать звуковую карту,как её настроить в системе,возможные причины неработоспосбности звуковых карт.А так же рассмотерим звуковые редакотры наиболее часто применяемые для обработки звука.