Аудио звуковые дороги.

Ответить на тему
 
Автор
Сообщение

scylla ®

Пол:

Стаж: 9 лет 3 месяца

Сообщений: 16

Репутация: 1 [+] [-]

Откуда: Из потустороннего мира

Пост 07-Ноя-2011 16:41

[Цитировать] 

Ну пожалуй начнем ab
В этой теме, я постараюсь рассказать все что можно сделать с аудиодорожкой.
И так содержание
Описание форматов
WAV
Несжатый звук. Именно с ним работают профессиональные аудио редакторы. Никаких потерь качества. Занимает кучу места.
AC3
Dolby Digital (AC-3, ATSC A/52) — система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.
Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.
Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.
В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, а так же обеспечивает абсолютную синхронность изображения и звука.
DTS
DTS — формат звука, созданный Digital Theater System, конкурирующий, но схожий с Dolby Digital. Формат DTS использует меньший уровень сжатия, чем Dolby, так что теоретически он звучит лучше, что доказывают на практике диски, на которых записаны дорожки и в DD, и в DTS. Формат DTS Stereo практически идентичен Dolby Surround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. Также называется DTS Surround Sound.
DTS в домашних театрах допускает полный битрейт full bitrate (1,536 kbit/s) при этом эксперты отмечают большую прозрачность и естественность звука, чем у AC-3 (Dolby Digital).
DTS — алгоритм кодирования, изначально предназначенный исключительно для многоканального звука в формате 5.1. В отличие от Dolby Digital, где в потоке некоторые каналы могут отсутствовать вообще, в потоке DTS место для всех шести каналов всегда зарезервировано, и, при отсутствии реальной информации в них, это место просто пропадает. То есть при одинаковом битрейте в DTS запись 4.0 будет того же объема, как и 5.1.
MP3
MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.
На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.
AAC
AAC (англ. Advanced Audio Coding) — собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).
Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.
-Редактирование ac3/dts без пересжатия
Сдвинуть/обрезать
Для того чтобы сдвинуть/обрезать дорожку или вставить тишины в начале/конце дорожки нужно воспользоваться программой delaycut.
Резать ac3 и dts без редактирования можно только на величины кратные 32мс для ac3 и 10.(6)мс для dts.
Склеить
Склеить две и более дорожек можно при помощи командной строки ("Пуск->Выполнить", ввести "cmd", нажать "enter"):
Код:
copy /b "c:\file1.ac3" + "c:\file2.ac3" "c:\result.ac3"
Склеивать желательно только звук с идентичными параметрами. Иначе можно получить файл, который будет не корректно воспроизводиться. Например, если склеить 2.0 (стерео) с 5.1 звуком, то большинство программ и проигрывателей будут видеть всю дорожку как стерео.
Если очень нужно такое сделать, то можно 2.0 преобразовать в 5.1 заменив отсутствующие каналы пустотой. В итоге получим идентичный по заголовку фремов файл для склеивания с полноценной дорожкой 5.1
Устранение рассинхронизацииПоиск причины
Для того, чтобы корректно устранить рассинхронизацию нужно точно знать причину рассинхрона. Самый простой способ - определить по видео. В качестве инструмента предлагаю использовать опять же VirtualDubMod. Программа открывает конечно не каждый формат, но победить эту проблему нам поможет AviSynth - многофункциональный фрейм-сервер.
1. Сравниваются оба видеопотока на предмет присутствия отличий в разных местах по несколько кадров. Поэтому подгонять чисто дорожку можно только в самом крайнем случае. Если есть видео, то подгон чисто дорожки - ересь.
2. Если различий нет, то все супер. Достаточно определить сдвиг (задержку). Если видео и дорожка принадлежат разным системам строчности , то сначала (перед сдвигом) понадобиться выровнять их скорости воспроизведения, т.е. применить операцию сжатия PAL-NTSC (с коэффициентами либо 25/23.976 либо 23.976/25, других не бывает, 29.970 - это тоже самое что и 23.976). Эти моменты подробно описаны в этой инструкции.
3. Если таки различия есть, то делаем все то же самое, но придется еще и кромсать дорожку при подгоне согласно временным меткам определенным при сравнении видеопотоков. В итоге может понадобиться либо удалить часть дорожки, либо что то вставить (иногда и тишина сойдет, обычно это соответствующий кусок другой - исходной для видео - дорожки). Так же не забываем что преобразование PAL/NTSC можно применять не обязательно сразу, а делать в самом конце. Например, редактировать PAL дорожку удобнее, т.к. продолжительность кадра там ровно 40мс и все расчеты имеют так же четкие цифры. Устранять несовпадения в видеопотоках у аудиодорожки удобно с конца, чтобы не нужно было постоянно пересчитывать время других подобных мест.
-Преобразование NTSC <-> PAL (прогрессирующая рассинхронизация)
Если точно известно, что аудиодорожки отличаются лишь скоростью воспроизведения (связанной с различием стандартов PAL и NTSC), то для устранения такого рассинхрона сначала дорожку надо либо растянуть по времени (если эта дорожка от PAL-версии фильма, которую хочется приделать к NTSC), либо ужать (если дорожку от NTSC требуется приделать к изданию PAL).
Adobe Audition
1. Открываем исходную дорожку.
2. Открываем пункт меню "Эффекты -> Время/Тон -> Stretch".

3. Выставляем коэффициент: (fps конечное / fps начальное) * 100

В большинстве случаев растягивать звук с сохранением тона не нужно! Т.е. выбираем режим "Resample"!
В этом случае коэффициент:
(fps начальное / fps конечное) * 100
Отличие режимов состоит в следующем:
Resample - это просто пересчет под новый темп (скорость воспроизведения). Аналогия с видео заключается в простом изменении частоты кадров. Т.е. чем больше/меньше кадров в секунду отображается, тем короче/длиннее становится запись. Т.е. исходный материал не страдает. Но в результате у нас запись ускоряется или замедляется. На звуковую дорожку это оказывает следующее влияние: при ускорении - голоса становятся выше (писклявее), при замедлении - ниже. Т.е. слышимый звук в итоге искажается.
Stretch - это пересчет под новый темп с учетом сохранения тона. Здесь можно провести аналогию с обычной картинкой. Имеем изображение 130 пикселей в ширину (исходный темп звучания дорожки), нам надо их запихнуть в 120 (темп звучания под новую продолжительность). В результате придется как то решать проблему "как три пикселя засунуть в два" и не исказить при этом общую картинку. В итоге чем качественнее работает алгоритм, тем меньше искажений мы получим в результате.
4. Нажимаем кнопку "OK".
5. Сохраняем результат.
Произвольная синхронизация (прогрессирующая рассинхронизация)] Самый лучший способ ab[spoiler Если в наличие имеются только сами аудио дорожки и точно известно, что соответствующее им видео не отличается по содержанию, то синхронизировать можно визуально по виду звуковой волны.[spoiler=Vegas (by Mikky72)]1) В настройках отключаем привязку к кадрам видео:

2) Отправляемся в Options-Preferences:

2) Отключаем режим "сохранение тона":

3) Вычисления удобнее проводить в десятичном масштабе. По этой причине советую изменить временную шкалу. Щелкаем правой кнопкой мышки по шкале времени (я щелкаю слева - там, где показана длительность дорожки) и выбираем масштаб "секунды":

4) Правой кнопкой мышки щелкаем на одной дорожке. Появится меню. Нам нужны Properties:

5) Выбираем в середине окна "Classic". Тогда снизу появятся дополнительные поля. Вводим новую длину звука (в секундах, с точностью до тысячных):
Новая длина определяется по формуле:
новая = старая * K, где K = 1001*25/24000 при перегоне из PAL в NTSC и K=24000/(1001*25) при перегоне NTSC->PAL.
В данном примере идет перегон PAL->NTSC, т.е. новая длительность больше старой.
6) Теперь одна дорожка длиннее остальных. Выделяем щелчками мыши при нажатом Ctrl оставшиеся 5 коротких дорожек и нажимаем клавишу "G" на клавиатуре (они привязываются друг к другу):
7) Подводим мышку к правому краю любой из этих 5-ти дорожек. Нажимаем и не отпускаем Сtrl. Курсор примет особый вид (квадратик с волной). И тянем вправо аккуратно. Когда 5 дорожек сравняются с первой произойдет "привязка" - появится вертикальная синяя полоса (смотрите - не проскочите).
Теперь все дорожки приобрели нужную продолжительность.
P.S. Если нужно разрезать все 6 дорожек одновременно (например, для удаления лишнего куска), то надо их выделить (щелкаем с нажатым Ctrl), поместить вертикальную черту в нужную позицию и нажать "S".-Микширование звука 5.1 в стерео (Downmix)
[spoiler=BeHappy]Скачиваем BeHappy.

Запускаем BeHappy и выбираем:
1. Источник. Например мультиканальный *.wav или *.avs скрипт, который может быть полезен в случае, если мультиканальный *.wav превышает размер в 4Гб и источником служит набор моно каналов. Этот способ описан разделом выше - "Сведение моно дорожек в один файл".
2. Сначала тип получаемого файла - "Wav Writer", затем имя получаемого файла.
3. В списке фильтров выбираем "Downmix".
4. Под списком фильтров появится кнопка "Configure", которая дает возможность выбрать схему микширования в стерео. Через знак дефис будет указан режим работы фильтра.

* Stereo - микширование в стерео.
* DPL I - микширование в стерео по схеме Pro Logic (получаем псевдо 3.1, т.к. при воспроизведении из стерео выделяются центральный и тыловой каналы).
* DPL II - микширование в стерео по схеме Pro Logic II (получаем псевдо 5.0 (3/1), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).
* DPL II (LFE) - микширование в стерео по схеме Pro Logic II с учетом низкочастотного канала LFE (получаем псевдо 5.1 (3/2), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).
5. Нажимаем кнопку "Enqueue" и добавляем задачу в очередь.
6. Программа автоматически переходит на вкладку "Queue".

1. Видим нашу задачу в очереди.
2. Запускаем процесс обработки кнопкой "Start".

Начнется процесс микширования в стерео по указанной схеме.
-Если для каждого канала отключать все динамики кроме одного, то абсолютно нет никакой разницы, если
1) оставить Add Channels (0db Center) (то, что стоит по умолчанию), при этом точку оставить в центре, или же
2) выставить пан Film, при этом подвести точку ко включенному динамику.
И в том, и в другом случае, в динамике будет -6 дБ, что, с точки зрения хитрозлобного Вегаса, означает сохранение громкости канала при кодировке в ac3. Ясно, что 1) вариант лучше, поскольку мы не делаем лишних телодвижений - не переключаем пан и не двигаем точку. Во 2-м варианте точку нужно двигать, поскольку иначе в канал попадает -13 дВ.
На эту статью http://kanst.mediatory.ru/index.files/ac3code.htm уже не первый раз вижу ссылку. После того, как я расхаял статью http://r7.org.ru/timestr.php, мне не хотелось бы выглядеть вечным хулителем, но ничего не могу поделать. Статья от Kanst просто наполнена глубокомысленными бессмыслицами, ложными постулатами, и при этом она обходит нужные вещи.
1) Кодировка стерео с помощью 5.1 проекта (клонирование дорожек) - полная бессмыслица.
2) Кодировка 5.1 с паном Фильм с точкой в центре "исходя из необходимости правильного распределения мощности" - ложный постулат, звук будет занижен на 7 дБ.
3) Раскладка ac3 на wav с -6ch -azid( --maximize ) - совершенно неправильно, они нормализуют дорожку (то есть, заведомо сильно повышают громкость) и раскладывают на 16 бит, а не 32 бит
4) "Dinamic Range Compression в положение None" - ерунда, у большинства фильмов это должно быть в положении Фильм.
При этом совершенно обойдены важнейшие вещи - занижение на 3 дБ и сдвиг фазы на 90 градусов в задних каналах (включено или выключено? при каких условиях?), а также уровень нормализации диалога.
Как вытащить звук из видео при помощи Vegas Pro 8.0 {Обновлено 7,11,2011 20:38}





Как оставить только одно видео без звуковых дорожек {Обновлено 7,11,2011 20:55}






_________________
Хочу творю,хочу вытворяю :}}
[Торрент-статистика]
[Профиль]  [ЛС] 
Показать сообщения:    
Ответить на тему

Текущее время: Сегодня 20:02

Часовой пояс: GMT + 4



Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы