Учимся работать со звуком для видео.

Многие сталкивались с тем,что в фильмах сжатых DivX звук сильно сжат и в результате получаються настолько высокие искажения, что фильм нельзя нормально смотреть. Или наложение перевода было настолько плохим, что не понятно ни оригинала, ни перевода. Это может очень испортить ощущение от просмотра фильма.

В этой статье я хочу затронуть тему сжатие звука для видео.В качестве обзора немного затрону форматы, которые не применяются в видео.

MP3
Начну с самого распространённого на данный момент аудио формата — MP3. Мнигие уверены в том, что это MPEG 3, но это не так, MP3 это MPEG1 Layer III, но обо всём по порядку.

MPEG расшифровывается как «Moving Picture Coding Experts Group», дословно — «Группа экспертов по кодированию подвижных изображений». MPEG ведет свою историю с января 1988 года. Точнее, группа MPEG была создана Международной организацией стандартов (International Standards Organization или сокращенно ISO) и Международной электротехнической комиссией (International Electro-Technical Commission или сокращенно IEC). Группа была образована для создания стандартов кодирования подвижных изображений и аудио информации. Начиная с первого собрания в мае 1988 года, группа начала расти и выросла до необычайно плотной группы специалистов. Обычно, в собрании MPEG принимают участие около 350 специалистов из более чем 200 компаний. Встречи проводятся около трех раз в году. Большая часть участников MPEG — это индивидуальные специалисты, занятые в тех или иных научных и академических учреждениях. На сегодняшний день MPEG разработаны следующие стандарты и алгоритмы:

MPEG1 — (ноябрь 1992) — стандарт кодирования, хранения и декодирования подвижных изображений и аудио информации;
MPEG2 — (ноябрь 1994) — стандарт кодирования для цифрового телевидения;
MPEG2.5 — сжатие аудио с пониженным разрешением (аудио 16,22.05,24 килогерц);
MPEG3 — многоканальный MPEG1+MPEG2, этот стандарт практически умер
MPEG4 — стандарт для мультимедиа приложений: версия 1 (октябрь 1998) и версия 2 (декабрь 1999);
Итак ,всё по порядку :
1) Рассмотрим комплект MPEG1: Layer (уровень) I, Layer II и Layer III. Общая структура процесса кодирования одинакова для всех уровней. Для каждого уровня определен свой формат записи бит-потока и свой алгоритм декодирования.

Алгоритмы MPEG основаны в целом на изученных свойствах восприятия звуковых сигналов слуховым аппаратом человека (то есть кодирование производится с использованием так называемой «психоакустической модели»). То есть, человеческий слух не идеален и восприимчивость слуха на разных частотах, в разных композициях — разная. Этим и пользуются при построении «психоакустической модели», которая учитывает, какие звуки, частоты, можно вырезать не нанося ущерба слушателю композиции.
Кратко об алгоритме кодирования. Входной цифровой сигнал сначала раскладывается на частотные составляющие спектра. Затем этот спектр очищается от заведомо неслышных составляющих — низкочастотных шумов и наивысших гармоник, то есть фактически фильтруется. На следующем этапе производится значительно более сложный психоакустический анализ слышимого спектра частот. Это делается в том числе с целью выявления и удаления «замаскированных» частот (частот, которые не воспринимаются слуховым аппаратом в виду их приглушения другими частотами). Затем, в зависимости от уровня сложности используемого алгоритма, может быть также произведен анализ предсказуемости сигнала. В довершение ко всему, проводится сжатие уже готового бит-потока упрощенным аналогом алгоритма Хаффмана (Huffman), что позволяет также значительно уменьшить занимаемый потоком объем.
Как было указано выше, комплект MPEG-1 имеет три уровня (Layer I, II и III). Эти уровни имеют различия в обеспечиваемом коэффициенте сжатия и качестве звучания получаемых потоков. Layer I позволяет сигналы 44.1 КГц / 16 бит хранить без ощутимых потерь качества при скорости потока 384 Кбит/с, что составляет 4-х кратный выигрыш в занимаемом объеме; Layer II обеспечивает такое же качество при 194 Кбит/с, а Layer III — при 128 (или 112). Выигрыш Layer III очевиден, но скорость компрессии при его использовании самая низкая (надо отметить, что при современных скоростях процессоров это ограничение уже не заметно). Так вот, MP3 ни что иное, как MPEG1 Layer III.

Стандарт MPEG-2 был специально разработан для кодирования ТВ сигналов вещательного телевидения, поэтому на рассмотрении MPEG-2 мы бы не останавливались, если бы в апреле 1997 этот комплект не получил «продолжение» в виде алгоритма MPEG-2 AAC (MPEG-2 Advanced Audio Coding — продвинутое аудио кодирование). Стандарт MPEG-2 AAC стал результатом кооперации усилий института Fraunhofer, компаний Sony, NEC и Dolby. MPEG-2 AAC является технологическим приемником MPEG-1.
Теперь поконкретнее об MP3. Так как этот формат довольно старый, за время его существования разные фирмы выпускали для него кодеры, которые тем или другим выли лучше своих конкурентов. Так, фирма Xing первая стала использовать VBR для mp3 файлов. Fraunhofer (родоначальник MP3) использовала Joint-Stereo. Lame был независимым проектом (что на западе очень ценится) и за его использование не надо было платить. Но прошло довольно много времени и остались сильнейшие. На данный момент это проект Lame и оригинальный кодер от Fraunhofer. На мой взгляд, Lame однозначно выигрывает у праотца по качеству и скорости кодирования (ведь он до сих пор развивается и поддерживает такие вещи, как ММХ). Дальнейший разговор пойдёт о нём.

Существует несколько режимов работы кодера LAME: CBR, ABR, VBR.Начну с самого простого режима — CBR. CBR (Constant Bit Rate — постоянный битрейт) — это такой способ кодирования исходного аудио потока, при котором все его блоки (фреймы) кодируются с одинаковым битрейтом. Иными словами, битрейт на всей протяженности (всех фреймов) результирующего потока является постоянным. Т.Е. Размер файла будет равен продолжительность помножить на битрейт (он измеряется в килобайт/секунда)
ABR и VBR можно записать под одним названием — VBR, разница в их алгоритмах выбора битрейта.
VBR (Variable Bit Rate — переменный битрейт) — это такой способ кодирования исходного аудио потока, при котором каждый отдельный блок (фрейм) кодируется со своим битрейтом. Выбор битрейта, оптимально подходящего для кодирования данного фрейма, осуществляется самим кодером путем анализа «сложности сигнала» в каждом отдельном фрейме.

А в чём же разница ABR и VBR?В алгоритме выбора битрейта.
ABR (Average Bit Rate — средний битрейт) — при работе с ABR мы задаём средний битрейт, который мы хотели бы получить, а кодер пользуясь своим механизмом оценки сложности композиции изменяет битрейт каждого отдельного фрейма. В результате, мы получаем почти прогнозируемый объём файла и качество, немного лучшее, чем CBR.
VBR (Variable Bit Rate — переменный битрейт) — при работе с VBR мы задаём не битрейт, а качество, которое желаем получить. Показатель качества задаётся значением от 9 (самое низкое качество) до 0 (самое высокое качество). При этом мы не можем прогнозировать битрейт и размер файла, который получатся после кодирования. Битрейт определяет сам кодер в зависимости от сложности композиции и от уровня качества. Единственное что мы можем сделать в этом режиме, это ограничить битрейт сверху и снизу (соответствующими префиксами командной строки).

Чем вам пользоваться, выбирайте сами, на мой взгляд менее проблемно пользоваться ABR, я заранее знаю, какой размер файла я получу. У VBR тоже есть свои плюсы: он не стеснён в выдерживании битрейта и меняет его не стесняясь во всём заданном диапазоне, отчего качество получаемой композиции заметно выше, по сравнению с ABR на том же среднем битрейте.

AAC

Этот формат изначально позиционировался разработчиками как преемник MP3, так как обладал по сравнению с последним рядом несомненных достоинств. Как и в MP3 в основе алгоритма AAC лежит психоакустическая модель кодирования, то есть при сжатии какая-то часть звукового спектра удаляется. При этом алгоритм AAC содержит большое количество усовершенствований, направленных именно на улучшение качества выходного аудиосигнала. В MPEG-2 AAC используются другие алгоритмы преобразований, улучшенные обработчики шумов и новый банк фильтров. Из специальных возможностей можно назвать, так называемые «водяные знаки» (watermarks) — информацию об авторских правах, которую AAC позволяет хранить в теле аудиокомпозиции, причем удалить эту информацию не разрушив целостность аудиоданных невозможно.

При этом MPEG-2 AAC обладает высочайшим качеством звучания и очень хорошей степенью компрессии аудиокомпозиций. Так, например, аудиокомпозиция в формате AAC с bitrate 96 kbs обеспечивает качество звучания, аналогичное потоку MPEG-1 Layer III bitrate128 kbs. При сравнении же файлов AAC с bitrate 128 kbs, качество звучания ощутимо превосходит MPEG-1 Layer III с такой же степенью сжатия.

И вполне возможно этот формат заменил бы устаревающий MP3 если бы не одно но… Сразу же после окончания работ над MPEG-2 AAC некоторые из компаний соучредителей забрали причитающиеся им исходные коды стандарта и на их базе создали собственные форматы, коммерческие и не совместимые друг с другом. Вот таким образом и появилась та мешанина несовместимых форматов, которые называют «семейство форматов аудиосжатия AAC».

На данный момент существуют четыре разновидности формата AAC: Homeboy AAC, AT&T a2b AAC, Liquifier PRO AAC (LQT), Astrid/Quartex AAC

Все эти модификации несовместимы между собой, имеют собственные кодеры/ декодеры и неодинаковы по качеству. Так, последние две модификации по ряду параметров превосходят первую пару. Самым высоким качеством обладает Liquifier PRO AAC (LQT), этот формат является коммерческим, это его главный минус. Это значит, что в этот формат можно зажать свою домашнюю коллекцию музыки и слушать только их проигрывателем, не отредактировать, не дать соседу послушать, не вмонтировать звук в фильм в этом формате не получится. Не так давно я прочитал новость о кончине фирмы Liquid Audio. Очень жаль… На проверку это был, пожалуй, самый лучший кодер.

Eщё одна интересная новость: Для формата MPEG-4 собираются внедрить аудио кодер AAC Plus с технологией SBR (о ней абзацем ниже).Судя по SBR здесь присутствует Fraunhofer, это их разработка.Что из этого получится в дальнейшем увидим ,а вернее услышим.

MP3Pro
Кодек MP3 Pro анонсирован в июле 2001 года компанией Coding Technologies вместе с Tomson Mulimedia и институтом Fraunhofer. Формат MP3Pro является продолжением, или, точнее, развитием старого MP3. MP3Pro является совместимым с MP3 назад (полностью) и вперед (частично). То есть файлы, закодированные с помощью MP3Pro, можно воспроизводить в обычных проигрывателях, однако качество звучания при этом заметно хуже, чем при воспроизведении в специальном проигрывателе. Это связано с тем, что файлы MP3Pro имеют два потока аудио, в то время как обычные проигрыватели распознают в них только один поток, то есть обычный MPEG-1 Layer 3.

В MP3Pro использована новая технология — SBR (Spectral Band Replication). Эта технология предназначена для передачи верхнего частотного диапазона. Идея технологии и предпосылки таковы. Дело в том, что технологии использования психоакустических моделей имеют один общий недостаток: все они работают качественно до битрейта 128 Kbps. На более низких битрейтах начинаются различные проблемы: либо для передачи аудио необходимо обрезать частотный диапазон, либо кодирование приводит к появлению различных артефактов. Этот ключевой момент показывает, что использования психоакустической модели не достаточно при работе с битрейтами ниже 128 Kbps. Новая технология SBR дополняет использование психоакустических моделей. Работает это так: в файле передается (кодируется) чуть более узкий диапазон частот чем обычно (то есть с обрезанными «верхами»), а верхние частоты воссоздаются (восстанавливаются) уже самим декодером на основе информации о более низких частотных составляющих. Таким образом, технология SBR применяется фактически не столько на стадии сжатия, сколько на стадии декодирования. «Загадочный» второй «параллельный» поток данных, о котором говорилось выше, как раз и есть та минимальная необходимая информация, которая используется при воспроизведении для восстановления верхних частот. Проведенные исследования показывают, что эта информация — есть усредненная мощность сигнала в верхнем (обрезанном) диапазоне частот. Точнее не одна усредненная мощность для всего диапазона вырезанных частот, а информация о средней мощности в нескольких полосах частот верхнего диапазона. Подробнее об SBR .
Качество звучания MP3Pro можно назвать субъективно очень хорошим даже на битрейте 64 Кбит/с . Субъективно, несложные композиции при таком битрейте воспринимаются не хуже чем MP3 128 Кбит/с. Однако, необходимо учитывать тот факт, что такое звучание достигается искусственным путем, и что слышимый сигнал представляет собой уже не столько оригинал, сколько синтезированную копию оригинала, что заставляет задуматься меломанов, обладателей высококачественной аудио аппаратуры, а также просто ценителей качественного оригинального звучания. Тесты показывают, что использованный в MP3 Pro искусственный прием критическим образом влияет на качество кодирования (и последующего воспроизведения) множества музыкальных композиций. Это означает, что использование кодека очень нецелесообразно и не рекомендуется при составлении фонотеки или для постоянного хранения аудио. С другой стороны, кодек может занимать выигрышные позиции в области потокового аудио.
Этот формат на данный момент является развивающимся и кодирование им в полной мере не освоено. Естественно, зажимать в него могут только энтузиасты, которые не боятся проблем, которые есть в бета версиях. В фильм его тоже (может быть пока) нельзя вмонтировать, значит, он не подходит для конкуренции с MP3. Тем, кому интересно больше почитать об MP3Pro.

TwinVQ (VQF)
Этот формат по праву считается старейшим конкурентом MP3. Алгоритм аудиокомпрессии TwinVQ (Transform-domain Weighted Interleave Vector Quanization — векторное квантование с преобразуемыми доменами и взвешенным чередованием) был разработан японской фирмой Nippon Telegraph and Telephone Corp. (NTT), точнее, ее подразделением Human Interface Laboratories. Патент на использование этого формата принадлежит фирме NTT, которая первой представила на рынке программного обеспечения проигрыватели и кодеки TwinVQ. Этот формат по основным концепциям, используемым при компрессии аудиоданных, сильно напоминает MP3, но при этом используется совершенно иная психоакустическая модель. Соответственно и выбор «нужных» и «ненужных» звуков осуществляется по совершенно иным критериям. Размер файлов VQF в среднем на 30-35% меньше, чем MP3, при примерно одинаковом качестве звука. Так, например, качество звучания потока TwinVQ при bitrate 96 Кбит/с практически идентично качеству звучания потока MPEG-1 Layer III (при bitrate 128 Кбит/с) и семейству MPEG-2 AAC (при bitrate 96 Кбит/с).
Лицензией на использование данного формата обладает так же всем известная фирма Yamaha, которая, собственно, и осуществляет на протяжении уже более чем двух лет основную поддержку и раскрутку формата VQF. Компания Yamaha, как всегда, подошла к делу очень добросовестно, и, можно сказать, что, предлагаемое ею программное обеспечение для создания и воспроизведения аудиокомпозиций VQF под торговой маркой SoundVQ, является лучшим для данного формата на текущий момент, как по дизайну, так и по качеству кодирования/декодирования звука.
Как показали тесты, как программные, так и акустические, с использованием живых тестеров, VQF превосходит МР3 по всем параметрам в нижней области звукового спектра, но проигрывает последнему в области верхних частот. На частотах выше 15 кГц, VQF на 2-3 дБ уступает MP3. При всем при этом, VQF вносит гораздо меньшее искажение формы сигнала в композициях с большим динамическим диапазоном (реальная музыка).
Этот формат так же подходит только для хранения музыки, пока нет редактора, который мог бы соединить видео и TwinVQ (VQF). Загрузка процессора при прослушивании TwinVQ (VQF) достаточно высока, поиск нужного фрагмента идёт долго, в связи с этим можно предположить, что TwinVQ (VQF) так и не будет интегрирован с видео.

Давайте рассмотрим реальных конкурентов формату MP3:OGG

OggVorbis — это совершенно новый универсальный формат аудиокомпрессии вышедший летом 2000 года. Этот самый молодой формат из всех конкурентов МР3 разработан группой Xiphophorus и является всего лишь небольшой частью из мультимедиа проекта OggSquish, в котором будет помимо форматов аудиосжатия еще и кодеки видеокомпрессии. Впрочем, это все в будущем, а пока OggVorbis — единственный реально существующий формат из этого семейства.У этого формата есть преимущество над всеми остальными форматами (Lame — MP3 не трогаем) — он бесплатен. То есть, за использование его в своих программах, программистам не надо будет платить. Это очень практичный шаг, ведь MP3 таким образом и захватил рынок. Сейчас, нужен очень хороший и бесплатный кодек, для того, чтобы свергнуть гегемона.
Как говорят руководители проекта, OGG использует оригинальный математический алгоритм и собственную психоакустическую модель. Это освобождает его от необходимости выплачивать какие-то лицензионные сборы и производить иные выплаты сторонним фирмам-изготовителям аудио форматов. Алгоритм Ogg Vorbis рассчитан на сжатие данных на всех возможных битрейтах без ограничений, то есть от 8 Kbps до 512 Kbps, а также на кодирование с переменным битрейтом (VBR). Алгоритм предусматривает хранение внутри файлов подробных комментариев об исполнителе и названии композиции, а также графической информации. В алгоритме предусматривается также возможность кодирования нескольких каналов аудио (более двух, теоретически до 255), возможность редактирования содержимого файлов, а также так называемый «масштабируемый битрейт» — возможность изменения битрейта потока без необходимости декодирования. Поддерживается потоковое воспроизведение (streaming). Для хранения данных используется собственный универсальный формат bitstream Ogg Squish, рассчитанный на хранение любой информации мультимедиа системы Ogg Squish. По качеству звука, OGG успешно конкурирует с MP3, но до таких монстров, как LQT ему далеко, поэтому его перспективность именно в бесплатности и поддержании новых спецификаций (битрейт до 512 Kbps, 255 каналов звука, поддержание многими энтузиастами…). Так же, я прочитал в пресс-релизе Vorbis, что они собираются к лету 2003 года выпустить видео кодек! Посмотрим, что из этого получится, забегая вперёд, скажу, что Ogg Vorbis мне больше всех понравился по качеству.
Формат постоянно развивается, что подтверждает выход финальной версии кодека v.1.0, который то же претерпевает постоянные изменения. Есть плагины для Winamp, которые проигрывают формат OGG (на данный момент они встроенные в Winamp) , появилась поддержка этого формата в фильмах. Если учесть молодость этого формата, то он очень быстро продвигается на рынок. Но, естественно не обходится и без но… Если взять и установить на систему DivX5 , и попытаться просмотреть фильм со звуком в OGG, то вы получите тишинуL. Кодеки для OGG нужно устанавливать отдельно. Естественно это будет сдерживать продвижение этого формата. Будем надеяться, что Microsoft будет включать поддержку этого формата на уровне ядра в следующих обновлениях и операционных системах. Пока же Microsoft заинтересована в продвижении собственного формата, о нём — ниже.

WMA
Есть такой аудио кодек Voxware Audio CODEC v4.0, работал достаточно не плохо, даже проходил испытания на некоторых высокоскоростных цифровых телефонных сетях США и Канады, был встроен в Media Player операционных систем Windods. В один прекрасный день он оказался купленным всем известной компанией Microsoft. С этого дня он стал по-другому назваться и работать на другого хозяина. Добро пожаловать в WMA! Разработка была полностью скуплена и программисты компании приступили к дальнейшей доработке и сопряжению ее с другими частями операционной системы Windows. Этот кодек хоть и вышел позднее других, зато обладал гораздо более высокими характеристиками и главное он бесплатен! Microsoft изобрела наиболее эффективный способ уничтожения конкурентов — cделать собственный продукт бесплатным, с поддержкой на уровне DirectX.
Новорожденный формат без потуг на оригинальность был назван WMA — Windows Media Audio. Этот формат позиционируется своими создателями, как преемник целой плеяде устаревающих аудиоформатов, начиная с Real Audio и заканчивая MPEG Layer III.

Microsoft обещает, что качество WMA будет не хуже качества LQT(AAC), а это уже претензия на качество. Опять же, фирма Microsoft решила быть оригинальной. Звук WMA невозможно будет использовать с обычными AVI файлами (читай — попытка протолкнуть свой формат WMV, который так же не поддерживает поток AVI). Для работы с WMA и WMV был введён новый транспортный протокол ASF.
Последняя, виданная мной версия Windows Media Codec — 8. Качество звука я не сравнил, а вот видео весьма посредственного качества, плюс большие проблемы с поиском нужного фрагмента, делают его не конкурентоспособным по сравнению с другими видео форматами. А значит и аудио останется не востребованное (ведь WMA работает только с WMV).

WMA — Весьма раскрученный формат (только за счёт продвижения вместе с Windows), не показал никаких выдающихся результатов, не смотря на заявленные характеристики. Плюс эта система защиты, встроенная в версии 8 и 9, тоже подрезает ему крылья (для некоторых это наоборот плюс — защита от несанкционированного прослушивания).

AC3
Используемая в Dolby Digital схема компрессии данных AC3 обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемые битрейты от 32 до 640 кбит/с, в кино используется 320 кбит/с) и при этом довольно высоким субъективным качеством звука.

AC3, как и все современные схемы сжатия данных звуковых потоков (в частности, MP3), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации. Для реализации этих схем входящий поток аудиоданных разбивается во времени (на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки) и по частоте (весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц).
Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке AC3 и затем могут использоваться декодером для восстановления исходного звучания.

Еще одним способом уменьшения потока данных является объединение данных из разных каналов (тоже самое используется в MP3 — Joint Stereo). В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот выше 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.
Весьма интересно ведёт себя формат AC3, сам собой напрашивается вывод, что на DVD получают качество за счёт большого битрейта. Можно с большой уверенностью сказать, что этого требуют невысокие вычислительные способности аппаратных проигрывателей DVD.

Теорию рассмотрели, но практика — это совершенно другое дело. Я решил сам прослушать все форматы и сравнить их качество. Я не искал лучшего музыкального формата, это будет AAC, я искал формат годный для фильмов.

MP3Pro и AAC не участвуют в связи с невысокой распространённостью этих форматов. Слушать их можно только в специальных проигрывателях. Меня это не устраивает. К тому же AAC довольно ресурсоёмок, что так же наложило бы свой отпечаток при просмотре фильма.

Сравнение буду производить на наиболее часто используемом (для фильмов) битрейте ~96 kbit/s в MP3, остальные форматы подгонялись под такой же размер файла.
Скрывать не буду, для MP3 я выставил особые параметры. т.к. при таком битрейте ему высокие однозначно не вытянуть, я решил ему помочь, частота дискретизации 32 Кгц, фильтр нижних частот 15 Кгц и режим Joint Stereo. При стандартных параметрах звук MP3 — отвратителен, что мы иногда наблюдаем в фильмах (битрейт 96 Kbit/s а звук …). Для остальных форматов эти настройки выставить было невозможно, т.к. ни один не поддерживает ФНЧ, а выставлять , частоту дискретизации 32 Кгц без ФНЧ нет смысла, можно только всё испортить.

OGG — слегка завышен уровень высоких частот; СЧ — норма; НЧ — норма
WMA — синтезированные высокие, неприятно слушать; СЧ — норма; НЧ — норма
MP3 — подискажены высокие частоты; СЧ — норма; НЧ — норма

AC3 — подискажены высокие частоты и завышен уровень; СЧ — несколько надрывные; НЧ — тяжеловат

Итак, конкурентов 2: OGG и MP3. Кого же выбрать? MP3 более распространён, OGG получше звук, делема. Для себя, я выбрал бы OGG, для всех рекомендую MP3. MP3 — уже практически вылизанный формат, поддерживаемый всеми и вся, но с небольшой оговоркой, параметры кодирования нужно подбирать. Звук, закодированный в OGG, приходится сливать с видео формаа OGM, о котором пока ещё мало кто знает, но у которонго есть свои преимущества над обычными AVI с MP3 звуком.
1) Какой битрейт нужен для видео DivX с разрешением 720х576, 25 fps, чтоб качество было хорошее (без квадратиков), но не слишком большой размер файла. 825 или 1025 может быть приемлемо или это слишком мало?
2) Почему при просмотре телепередач с ТВ-тюнера звук хороший, но записывается плохо(не то чтобы очень, но слегка похуже чем при просмотре вживую)? этот трабл есть у меня и еще у моего знакомого. Можно ли в VirtualDub или в другом видеоредакторе с помощью какого-нибудь фильтра или эффекта это исправить?

Ответы на такие вопросы читайте далее:
1.Битрейт зависит от длинны самого файла не меньше, чем от разрешения.. для хорошего качества вполне достаточно 1000-1200, особенно при таком разрешении…
2.Можно попробовать увеличить уровень записи на микшере.
Если надо подправить звук в готовом видеофайле можно поступить двояко. В VirtualDubMod — в меню звука поставить режим полной обработки и увеличить громкость при перезаписи.Загрузить и установить VirtualDubMod можно по следующей ссылке VirtualDubMod-1.5.10.2-RUS .

Рассмотрим ,что может делать VirtualDubMod 1.5.10.2.

VirtualDubMod 1.5.10.2 — отрезать, приклеить звук. Синхронизировать звук с видео. Уроки, разрезать, склеить видеофайлы AVI. Сделать скриншоты с видеофайла.
VirtualDubMod 1.5.10.2 — программы для захвата и обработки видео. Это усовершенствованный вариант популярной программы для обработки видео VirtualDub.Особенности этой программы заключаютcя в возможности работать с расширенным колличеством типов видео файлов и звука. В отличии от VirtualDub, VirtualDubMod может окрывать не только файлы AVI и MPEG -1, но и VOB , MPEG -2, OGM , Matroska -MKV, а так же поддерживает множество звуковых форматов: AC3, WAV, MP3, Ogg Vorbis , DTS , SRT files ( ASCII / Unicode ). Одним из самых главных отличиев от VirtualDub, является возможность работать со множеством аудио потоков, т.е. в AVI файл можно добавить несколько звуковых дорожек в разных форматах, так же поддерживается и открытие подобных файлов с DVD – VOB.
1)Открываем VirtualDubMod Настраиваем оции: Options => Prefernces => By default try processing VBR MPR streams like NunDub
2) Открываем видео файл: меню File => Open video file …
3) Открываем в меню Video, затем выбираем Direct Stream Copy
4) Идем в меню Streams, и заходим в Stream List и сохраняем аудио файлWAV
Ждём пару минут сохранения файла:
5) Теперь убираем существующую звуковую дорожку Disable
и загружаем новую Add
Если текущая звуковая дорожка была наложена со сдвигом, то щёлкаем правой кнопкой мыши по новой дорожке и выбираем Interleaving для синхронизации звука и изображения.
6) Теперь всё готово для сохранения видеофайла с новой звуковой дорожкой: В меню: File выбираем Save As… и указываем имя путь в папку где будет сохранён новый видео файл.
Ждём несколько минут, пока идёт сохранение …
Через несколько минут Вы получите видео файл с новой звуковой дорожкой.
Разрезать, склеить видеофайлы AVI- VirtualDubMod .
Сначала мы научимся делить видео файл на две или более частей.
Зачем нам это может понадобиться? Предположим, Вы скачали видео файл 1400 МБ, а записать хотите на два CD диска по 700 Мб. Или Вы хотите из фильма сделать рекламный ролик, а для этого Вам необходимо сначала получить несколько сегментов видео файла, чтобы потом склеить в один видео ролик..
На этом уроке мы поделим фильм пополам и потом соединим две части.
1) Открываем VirtualDubMod
2) Открываем видео файл: меню File => Open video file …
3) Открываемвменю Video, затем выбираем Direct Stream Copy
4) Выбираем конечную точку выделения ползунком (1), и закрепляем окончание сегмента (2). Если Вы отрезаете сигмент из середины видео файла, то сначала левой чёрной стрелкой закрепляем начало закрепления.
В помощь к ползунку мы можем использовать смещение по ключевым кадрам
6) Далее сохраняем первый сигмент как файл *.AVI
Ждём несколько минут, пока идёт сохранение …
Обратите внимание на то, что Ваш изначальный видео файл никак не изменяется, Вы получаете отдельный фрагмент, в отдельном видео файле (первый сегмент).
7) Теперь всё то же самое делаем с исходным видео файлом для сохранения второго сигмента.
Опять открываем окно VirtualDubMod и видим — ползунок в той точке, на которой закончили выделение первого сегмента, и закрепляем начало выделения. Затем двигаем, ползунок в конец видео файла, и закрепляем окончание выделения.
8) Сохраняем второй сигмент видео файла.
Ждём несколько минут, пока идёт сохранение …
Теперь Вы имеете два видео файла, полученные из одного. Исходный видео файл у Вас тоже останется.
Теперь мы научимся соединять два или более сегментов в один видео файл.
1) Открываем VirtualDubMod
2) Открываем первый сигмент видео файла.
3) Добавляем второй сигмент.
4) Сохраняем как новый AVI видео файл.

Вот собственно и всё.Приятной Вам работы и приятного звука в фильмах!! Но лучше установить программу Adobe Audition.Скачать БЕСПЛАТНО Adobe Audition 3.0 можно по следующей ссылке Adobe_Audition_3.0 . Русификатор и активатор находятся внутри архива.Как работать с Adobe Audition 3.0 подробнее Вы можете узнать скачав БЕСПЛАТНО архив по этой ссылке Audit30 .

P.P.S. Если у Вас есть вопросы, желание прокомментировать или поделиться опытом, напишите, пожалуйста, в комментариях ниже.