В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.

Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных – digital: OGG, Mp3, Flac, Wav форматов.
Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье постараюсь рассказать о наиболее популярных расширениях audio files, с которыми Вы сталкиваетесь.
Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов? Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows.
Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки – достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 “метров” – это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.
AA (Audible Audio Book File) – формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов – digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.
AAC (Advanced Audio Coding) – формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC – семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) – это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: [.m4a],[.m4b],[.m4p].
Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.
На 2009 год распространён значительно меньше, чем MP3 и другие альтернативные решения. AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.
Преимущества AAC перед MP3:
– до 48 звуковых каналов;
– большая эффективность кодирования как при постоянном, так и при переменном битрейте;
– частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц — 48 кГц);
– более гибкий режим Joint stereo.
ADX – основанный на АДИКМ проприетарный формат сжатия с потерями и хранения звукозаписи, разработанный CRI Middleware специально для использования в видеоиграх. Наиболее характерная особенность — возможность зациклить звукозапись, что делает применение формата удобным для использования в качестве фоновой музыки в различных играх, поддерживающих этот медиаконтейнер. Его поддерживают множество игр для SEGA Dreamcast некоторые игры для PlayStation 2 и GameCube.
В отличие MP3, в нём не применяется психоакустическая модель уменьшения объёма данных о звуке (уменьшения его сложности). Вместо этого модель ADPCM использует для сохранения образцов запись данных относительной ошибки функции предсказания, что означает бо́льшую сохранность исходного сигнала после кодирования; по существу, сжатие ADPCM, вместо использования полных переразмерянных образцов звукозаписи, предоставляет образцы отклонения сигнала от предыдущего значения, которые имеют гораздо меньший размер, обычно — 4 бита. Для человеческого уха такое отклонение находится на уровне шума, что делает потерю качества едва заметной.
AIFF – это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Если вам когда-нибудь потребуется пересылать аудиофайлы между персональным компьютером и компьютером Macintosh, используйте именно этот формат. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. Файлы этого формата могут содержать заголовок Mac-Binary, а могут и не иметь его. Если файл данного типа не содержит заголовка Mac-Binary, он, скорее всего, имеет расширение aif. Если файл данного типа содержит заголовок Mac-Binary, то Sound Forge откроет его, но идентифицирует как файл формата Macintosh Resource (см. следующий раздел). В этом случае файл, скорее всего, имеет расширение snd. Замечание При сохранении файлов на компьютерах Macintosh к ним добавляется так называемый заголовок Mac-Binary. Это маленький фрагмент информации, записываемый в начале файла, идентифицирующий тип файла для операционной системы Mac OS и других приложений. Таким способом компьютеры Macintosh сообщают, что содержит файл: текст, графику или, например, аудиоданные.
AMR (Adaptive multi rate) [.amr] — адаптивное кодирование с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую ёмкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети, в любых условиях обеспечивая кристально чистую передачу голоса.
APE – (Monkey‘s Audio) [.ape] – разработчик Мэтью Т. Эшланд – формат цифрового звука без потерь качества (lossless). Кодек Monkey’s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey’s Audio используют следующие расширения: .ape – для хранения аудио и .apl – для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.
Apple Lossless [.m4a] – это аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных. Apple Lossless данные хранятся в контейнере MP4 с расширением .m4a. Хотя Apple Lossless имеет такое же расширение файла, как AAC, это не AAC, кодек схож с другими Lossless кодеками, такими как FLAC и др. Плеер iPod с док разъемом (не shuffle) и последней прошивкой может проигрывать файлы в формате Apple Lossless. Он не использует какие-либо управления цифровыми правами (DRM), но, с учётом характера контейнера, считается, что DRM может применяться к ALAC.
Тесты показали, что сжатые в ALAC файлы получаются примерно от 40 % до 60 % размера оригиналов в зависимости от вида музыки, подобно другим Lossless форматам. Кроме того, скорость, с которой он может быть декодирован, делает его полезным для устройств с ограниченной производительностью, такие как iPod.
Apple Lossless Encoder был представлен в качестве одного из компонентов QuickTime 6.5.1 28 апреля 2004 года и как функция iTunes 4.5. Кодек используется также в AirPort Express в AirTunes осуществления.
Декодер для Apple Lossless формата теперь есть в открытых источниках библиотеки libavcodec. Это означает, что любой мультимедийный проигрыватель на основе этой библиотеки, включая мультимедиа VLC и MPlayer, может иметь возможность играть Apple Lossless файлы.
CDDA (Compact Disc Digital Audio) — звуковой компакт-диск, международный стандарт хранения оцифрованного звука на компакт-дисках, представленный фирмами Philips и Sony. Звуковая информация представлена в импульсно-кодовой модуляции с частотой дискретизации 44,1 кГц и битрейтом 1411,2 кбит/с, 16 бит стерео.
Спецификация аудио в стандарте Red Book:
– максимальное время всех записей составляет 79,8 минут;
– минимальное время трека — 4 секунды (включая 2-секундную паузу);
– максимальное количество треков — 99;
– максимальное число точек отсчёта (разделов трека) — 99 без ограничений по времени;
– долженприсутствовать International Standard Recording Code (ISRC).
DTS – (Digital Theater System), по сути – это DolbyDigital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DDформате.
DTS это цифровая театральная система — семейство систем цифровой многоканальной звукозаписи, созданное компанией «Диджитал Тиэтер Систем» для демонстрации цифровых фонограмм в кинотеатрах синхронно с прокатными фильмокопиями. Кроме сопровождения плёночных фильмокопий, обе системы (DTS и DolbyDigital) в упрощённом виде используются на оптических видеодисках для домашнего просмотра. DTS использует меньший уровень сжатия, чем Dolby, но абсолютного превосходства нет ни у одной из систем. Споры о преимуществах DTS или DolbyDigital не прекращаются по сей день. Формат DTSStereo практически идентичен DolbySurround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. DTS в домашних театрах допускает полный битрейт (1509,75 кбит/с).
FLAC (свободный кодек из проекта Ogg) [.flac] – (англ. Free Lossless Audio Codec — свободный аудио-кодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, FLAC не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высокачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID3v1 и ID3v2, поэтому их можно свободно добавлять и редактировать.
MIDI (Musical Instrument Digital Interface) – цифровой интерфейс музыкальных инструментов. Это стандарт цифровой звукозаписи на формат обмена данными между электронными музыкальными инструментами.
Интерфейс позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т.п.
Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.
MP2 (MPEG-1 Audio Layer II или Musicam) [.mp2] – один из трёх форматов (уровень 2) сжатия звука с потерями, определённых в стандарте MPEG-1. Применяется в цифровом радиовещании DAB и устаревшем стандарте Video CD, который в 90-е годы использовался для распространения фильмов на оптических компакт-дисках и существовал до широкого распространения DVD.
Кодер MPEG-1 Audio Layer 2 развился из аудиокодека MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing — универсальное полосное кодирование и мультиплексирование с адаптацией к шаблону маскировки), разработанного CCETT, Philips и IRT в 1989 как часть исследований EUREKA 147 европейских межправительственных разработок для систем цифрового радиовещания для стационарных, портативных и мобильных приёмных устройств. Основные параметры MPEG-1 Audio были унаследованы из MUSICAM, включая банк фильтров, обработку во временной области, размер аудиокадра и т.д. Однако, после дополнительного усовершенствования, алгоритм MUSICAM не был использован в финальной версии стандарта MPEG-1 Layer II.
MP3 (MPEG Layer 3) [.mp3] – третий формат кодирования звуковой дорожки MPEG — лицензируемый формат файла для хранения аудио-информации. На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. Многие музыкальные гурманы, предпочитают сжимать музыку с максимальным качеством – 320 kbps, либо переходить на другие форматы, например FLAC, где битрейт в среднем ~1000 kbps.
MusePack [.mpc] – нелицензируемый формат файла для хранения аудиоинформации, распространяемый по GNUGeneralPublicLicense.
В Musepack’е применяется разбиение на полосы частот, поэтому он относится к так называемым subband-кодекам. Основная особенность — точная настройка психоакустики, что позволяет работать с чистым VBR-кодированием (кодирование с переменным битрейтом). Основной задачей Musepack является прозрачность звучания закодированной музыки.
В современных форматах, таких как: MP3, Vorbis, AAC, AC3, WMA производится второе dct-преобразование, что позволяет им добиться лучшего качества на средних и низких битрейтах, но не позволяет добиться высоких результатов на более высоких. MusePack не производит второго dct-п
Случайное видео по теме

