sonyps4.ru

Звуковой формат microsoft wave wav. Форматы хранения данных без сжатия: FLAC, ALAC, WAV и другие

Несжатые звуковые файлы в формате RAW (PCM) и в форматах WAV и Apple AIFF. Контейнер RIFF и структура файла WAV.

Читайте также:
  1. II. Структура Системы сертификации ГОСТ Р и функции ее участников
  2. PR в государственных структурах и ведомствах. PR в финансовой сфере. PR в коммерческих организациях социальной сферы (культуры, спорта, образования, здравоохранения)
  3. Активы таможенных органов: понятие, структура и особенности
  4. Анализ финансового положения предприятия. Структура и порядок формирования финансового результата.
  5. Анимационный сервис, его структура и роль в социально-культурном сервисе и туризме.
  6. Апарат вищого спеціалізованого суду: структура і повноваження.

RAW - формат данных, содержащий необработанные данные. В таких файлах содержится полная информация о хранимом сигнале. В случае обработки звука под RAW понимаются звуковые данные без сжатия и заголовков.

PCM расшифровывается как импульсно-кодовая модуляция (pulse code modulation) и обеспечивает цифровое представление аналогового сигнала, который дискретизируется (оцифровывается) через равные промежутки времени (с заданной в герцах частотой) и представляется в двоичном виде (с заданной точностью - разрядностью в битах). Помимо использования PCM для цифрового звука в компьютере и на аудио компакт-дисках, данный формат применяется также в некоторых цифровых телефонных системах и в ряде форматов цифрового видео.

В формате PCM значения амплитуды звука представлены с помощью разного числа битов (разрядности); звуковая дорожка, как правило, оцифровывается с разрядностью от 12 до 24 бит, но чаще всего при студийном кодировании PCM-аудио для записи на диски Blu-ray используются 16 бит.

WAV (WAVE) - формат файла-контейнера для хранения записи оцифрованного аудио-потока. Под Windows этот формат чаще всего используется в качестве оболочки для несжатого звука (PCM). В контейнер WAV можно поместить звук, сжатый почти любым кодеком (но с воспроизведением таких файлов могут возникать проблемы).

Структура: состоит из трёх заголовков, за которыми следуют данные самого звукового файла, т.е. последовательность байт самого звукового сигнала.

Первый - RIFF заголовок. Он занимает 8 байт с самого начала файла и содержит информацию о длине файла

Второй заголовок - WAV заголовок, содержит информацию о кол-ве каналов (моно или стерео)

Третий заголовок – информацию о кол-ве байт, отводящихся под сами WAV данные

Apple AIFF. Это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата.

Звуковые данные в стандартном файле формата AIFF представляют собой несжатую импульсно-кодовую модуляцию. Также существует и сжатая версия формата AIFF, которую называют AIFC (изредка AIFF-C), в которой для сжатия могут быть использованы различные кодеки.



AIFF, наряду с SDII и WAV, является одним из форматов используемых в профессиональных аудио и видео приложениях, так как в отличие от более популярного формата mp3 в нём звук не имеет потерь в качестве.

RIFF - один из форматов файлов-контейнеров для хранения потоковых мультимедиа-данных (видео, аудио, возможно текст). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки).

RIFF имеет ограничение размера данных в 2 ГБ.

Файл формата RIFF содержит вложенные фрагменты (chunk’и) с данными одного типа; внешний фрагмент состоит из заголовка и области данных.

Структура: Первое двойное слово заголовка идентифицирует хранящиеся во фрагменте данные. Второе двойное слово заголовка представляет собой размер области данных в байтах (без учета размера самого заголовка).

Область данных имеет переменную длину, однако она должна быть выравнена на границу слова (при необходимости дополняется в конце нулевым байтом до целого числа слов).

В первую очередь, говоря об этом формате, нужно отметить, что он является подразделением другого формата - RIFF (Resource Interchange File Format - Формат Файлов Обмена Ресурсами). По сути RIFF - это общая спецификация, под которой может быть объединено много разныx форматов файлов. Главное преимущество RIFF - расширяемость. Форматы файлов, базирующиеся на RIFF, могут быть впоследствии усовершенствованы, в то время, как "старое" программное обеспечение будет благополучно игнорировать все изменения формата.

Все RIFF-базированные файлы делятся на секции, каждая из которыx идентифицируется определенным "словом". На настоящий момент в WAV-файле такиx секций может быть до шести. Разрабатываемые программы должны ожидать (и игнорировать) все неизвестные (разработчику) секции данныx, используя только то, что необxодимо. Однако есть две обязательные для любого WAV-файла секции: "Формат" и "Данные", причем "Формат" должен быть объявлен до появления "Данныx".

Теперь покончим с лирическими отступлениями и займемся непосредственно битами и байтами.

Немного объясню семантику последующиx идентификаторов: здесь используется так называемая Венгерская нотация, которая состоит в том, что в начале имени каждой переменной ставятся буквы, поясняющие ее тип:

b - byte (1 байт);

w - word (2 байта);

dw - double word (4 байта), и т.п.

Итак, заголовок файла выглядит следующим образом:

"RIFF" - сигнатура RIFF.

dwFileLength - длина всего файла, без учета восьми уже прочитанныx байт.

Секция формата данныx:

"fmt " - 4 байта сигнатуры "format" (после "fmt" следует пробел).

dwFormatLength - длина секции формата данныx без учета этиx 4 байт.

wFormatTag - определяет категорию формата звуковыx данныx.

0101h - IBM mu-law;

0102h - IBM a-law;

0103h - IBM AVC ADPCM.

wChannels - число каналов: 1 (моно) или 2 (стерео).

dwSamplesPerSec - частота дискретизации (количество сэмплов, воспроизводимыx в секунду).

dwAvgBytesPerSec - число байт данныx,передаваемыx в секунду.

(Используя это значение, воспроизводящее ПО может рассчитывать размер буфера данныx)

wBlockAlign - длина блока данныx, выравненная на границу байта

(Может быть использовано для выравнивания буфера данныx.)

В случае wFormatTag=1 (данные в формате PCM), добавляется одно поле:

wBitsPerSample - число бит для представления одного сэмпла.

При нестандартныx значенияx длины сэмпла следует иметь в виду правило: каждый сэмпл содержится в некотором целом числе байт, наименее значащий из которыx пишется первым. Если представить все байты сэмпла как единое число, то сама амплитуда содержится в старшиx битаx числа и длина ее определяется wBitsPerSample. Для пущей ясности приведу пример: длина сэмпла - 12 бит, тогда значение амплитуды сигнала содержится в двуx байтаx, причем младшие 4 бита младшего (первого по счету) байта равны нулю.

Секция представления данныx:

"data" - сигнатура секции.

dwDataLength - длина данныx, представляющиx форму сигнала

(фактически, длина оставшейся части секции "data").

Секция "FACT" (необязательная):

dwFactLength - длина данной секции.

dwSamples - число сэмплов в файле.

Секция "FACT" в принципе актуальна для форматов представления звука, использующиx сжатие. В обычныx PCM-кодированныx файлаx она, в описанном виде, не привносит никакой дополнительной информации. Другое дело, что со временем в секцию могут быть внесены дополнения, которые на сегодняшний день тоже должны быть учтены разработчиками ПО.

Описанные три секции представляют, конечно, далеко не исчерпывающее описание формата WAVE. Копаясь в WAV"аx, можно найти кучу другиx сигнатур. Например, "slnt" (описание тишины), "cue" (разбиение файла на части), "plst" (установление порядка проигрывания частей, определенныx в "cue") и т.п. В эти и другие секции, равно как и в саму структуру WAVЕ-файла, могут вноситься разные дополнения и модификации. В такой расширяемости и состоит суть RIFF. Но, повторюсь еще раз, мыслящий программист учитывает и игнорирует неизвестные ему места формата.

И в заключение предлагаю рассмотреть реальный файл. Возьмем, к примеру, стандартный звук Windows - "chimes.wav". Вот его структура.

Объявление

Формат файлов WAV Audio

Файлы WAV (WAVE) были созданы компанией IBM и Microsoft. Они содержат различные аудиоданные - звуки, звуковые эффекты, музыку, а также записи голоса. Программы проигрывания медиафайлов (Windows Media Player, QuickTime и т.п.) могут воспроизводить и открывать такие файлы. Файлы WAV значительно больше файлов MP3, и именно поэтому они не пользуются популярностью. Отличительная черта файлов WAV - их технология сжатия звука без потерь. Полученные файлы отличаются высоким качеством и большими размерами, что значительно вредит их популярности. Отправка и загрузка таких файлов требует много времени и дискового пространства.

Технические сведения о файлах WAV

Файлы WAV используют формат файлов для обмена ресурсами, с помощью которого происходит сохранение данных. Данные хранятся в кластерах, которые содержат тег из 4 символов, а также кол-во байт в кластере. Аналог данного формата для ОС Mac - файлы AIFF. Файлы WAV могут иметь семплы от 8 до 16 бит при частотах от 11 025 до 44 100 Гц. Максимальное качество файлов WAV - 16 бит, 44 100 Гц, и именно такой частотой дискретизации обладают дорожки на компакт-дисках, на которых секунда звука "весит" 88 кБ. При кодировании цифрового потока обычно используется формат линейной-импульсно-кодовой модуляции. Системные звуки в ОС Windows при запуске ОС, нажатии на ярлыки, при выдаче ошибок, выключении компьютера и т.п. представляют собой несжатые файлы WAV.

Дополнительная информация о формате WAV

WAVE или WAV является короткой формой Wave Audio File Format (реже именуемой как Аудио для Windows). Этот формат является стандартом для хранения аудио потока на ПК. Он является сферой приложения формата RIFF для хранения аудио в «цепочках», это очень напоминает форматы 8SVX и AIFF, используемые компьютерами Amiga и Macintosh соответственно. Это также основной формат на системах Windows для хранения обычного несжатого звука. Как правило, для этого применяется кодирование методом линейной импульсно-кодовой модуляции.

Описание

Как WAV , так и AIFF совместимы с операционными системами Windows, Macintosh или Linux. Формат также учитывает некоторые отличия процессоров Intel, такие как порядок байтов от младшего к старшему. RIFF формат выполняет роль обертки для различных кодеков аудио сжатия.

Несмотря на то, что WAV файл может содержать сжатое аудио, наиболее обычным его применением является хранение как раз несжатого аудио в формате линейной импульсно-кодовой модуляции (LPCM). Стандартным форматом Audio-CD, например, является аудио в формате LPCM, с 2 каналами, частотой дискретизации 44 100 Гц и 16 бит на сэмпл. Так как формат LPCM хранит несжатое аудио, которое абсолютно идентично оригиналу, это позволяет использовать его профессиональным пользователям и аудио экспертам для получения максимального качества звучания. WAV аудио файл также может быть изменен практически в любом аудио редакторе. WAV формат работает со сжатым звуком в системах семейства Windows через Audio Compression Manager (ACM) . Любой ACM кодек может быть использован для сжатия WAV файла. Пользовательский интерфейс для ACM может быть доступен через множество программ, включая и стандартную программу для записи звука в некоторых версиях Windows.

Начиная с Windows 2000, появился заголовок WAVE_FORMAT_EXTENSIBLE, который позволял хранить многоканальные аудио данные, учитывал расположение динамиков, исключал неоднозначности в плане типов сэмпла и размеров контейнера в стандартном WAV формате. Также он поддерживал произвольные расширения формата чанка.

Также существует много несоответствий в формате WAV : например, 8-битные данные являются беззнаковыми, в то время как 16-битные – знаковыми.

WAV файлы могут содержать встроенные IFF «списки», которые могут содержать несколько «подчанков».

Метаданные

Будучи форматом, производным от Resource Interchange File Format (RIFF), WAV -файлы могут быть иметь метаданные (тэги) в чанке INFO. В дополнение к этом, в WAV файлы может быть встроены метаданные стандарта Extensible Metadata Platform (XMP).

Популярность

WAV файлы достаточно большие, что делает этот формат неудобным для обмена по сети Интернет, и это сильно подрывает его популярность. Однако, этот формат – как правило, чаще всего используется для сохранения первозданного вида для файлов высокого качества в таких случаях, где размер свободного дискового пространства не является ограничением. Он также используется в программах для редактирования аудио, где экономят время на сжатии и распаковке данных.

Более часто данные сжимаются с помощью форматов с потерями, такими как Ogg Vorbis , MP3 , ATRAC , AAC , Musepack и WMA , которые используются для хранения и обмена музыки (например, среди пользователей Интернета). Небольшой размер файла и возможность быстро скачивать их также является существенным плюсом наряду с тем, что такие аудио данные занимают намного меньше места. Но форматы с потерями жертвуют качеством ради размера, поэтому их алгоритмы не сохраняют первозданное качество звука во всех деталях. Но существуют и кодеки без потерь, такие как FLAC , Shorten, Monkey’s Audio , ATRAC Advanced Lossless , Apple Lossless , WMA Lossless , TTA, WavPack , но ни один из этих кодеков нельзя назвать общепринятым.

Использование формата WAV является общепринятым, благодаря его простоте и простой структуре, которая в большой степени основана на формате файлов RIFF. Благодаря этому, формат WAV не испытывает притеснения среди различного программного обеспечения или аппаратных плееров, он поддерживает практически везде.

Назло огромному размеру данных несжатого WAV , этот формат иногда используется для радиовещания, особенно для адаптированных безкассетных систем. Радио BBC (BBC Radio) в Соединенном Королевстве использует 44.1 кГц, 16 бит, стерео аудио данные как стандарт в их системе VCS. Система ABC “D-Cart”, которая разработана Австралийским радиовещателем, использует 48 кГц, 16 бит, стерео аудио данные, что идентично цифровым аудио кассетам (DAT).

Файловые форматы MP3 и WAV - в числе самых популярных, что используются для цифровой записи звука. Насколько они схожи друг с другом?

Факты об MP3

MP3 - это мультимедийный файловый формат записи звука. Характеризуется большой универсальностью: его поддерживают практически все современные операционные системы ПК, мобильных девайсов, многие традиционные устройства для проигрывания музыки - MP3- и CD-плееры, проигрыватели, музыкальные центры.

Формат MP3 предназначен для записи аудиоданных со сжатием - намеренным снижением качества звука с целью уменьшения размера файлов. Но если осуществить соответствующую оптимизацию аудиоданных корректно, снижение качества звука будет в большинстве случаев малозаметным для человека.

Формат MP3, возможно, самый популярный в онлайн-пространстве. Но даже до того как интернет приобрел всеобщую распространенность, аудиофайлы соответствующего типа были вполне востребованы: они размещались, благодаря небольшому размеру, на флеш-памяти MP3-плееров или на дисках в большом количестве, часто формируя тематические коллекции аудиозаписей.

Факты о WAV

Формат WAV также используется для цифровой записи звука. В универсальности не уступает MP3 и поддерживается основными типами современных девайсов.

Данный формат предназначен, в свою очередь, для записи аудиоданных без сжатия. Таким образом, размер WAV-файлов практически всегда намного больше, чем MP3 с аналогичным содержимым. По уровню качества WAV-звук приближен к оригинальному - при условии, что он будет воспроизводиться на высокотехнологичном оборудовании.

Формат WAV востребован главным образом в сфере услуг по профессиональной обработке аудио: для фильмов, студийных альбомов, в игровой индустрии - везде, где предполагается работа с высококачественным звуком. Также файлы WAV популярны в среде меломанов, которые, к слову, в большинстве случаев очень легко определяют на слух разницу между мелодиями, записанными в MP3 и WAV.

Сравнение

Итак, основное отличие MP3 от WAV в том, что первый файловый формат предполагает запись звука со сжатием. При этом оно может иметь разную степень и «битрейт» (интенсивность воспроизведения звукового потока). Которые, в свою очередь, во всех случаях одинаковы для WAV-файлов.

Считается, что несжатый звук в формате WAV имеет битрейт порядка 1400 Кбит/сек. По качеству он примерно соответствует аудио, записанному на CD. В свою очередь, битрейт MP3-файлов может варьироваться: максимальный показатель составляет 320 Кбит/сек, минимальный - около 8-16 Кбит/сек. Те значения, что ниже, как правило, обеспечивают неприемлемый уровень качества звука - человек с трудом способен различать ноты в мелодиях, которые записаны в подобном битрейте.

Насколько могут различаться размеры файлов, записанных в формате MP3 и WAV?

Запись звука в MP3 длительностью в 1 минуту при максимальном качестве - 320 Кбит/сек - имеет объем порядка 2 мегабайт. Соответственно, 1 минута аудиопотока в формате WAV сформирует файл величиной около 9 мегабайт.

Таблица

Итак, теперь мы знаем, в чем разница между MP3 и WAV. Зафиксируем основные критерии, предопределяющие соответствующие различия, в небольшой таблице.



Загрузка...
Расширение файла .wav
Категория файлов
Файл-пример (6,1 MiB)
(1,5 MiB)
Связанные программы CyberLink PowerDirector
Microsoft Windows Media Player
Roxio Creator 2009