Formaty audio: rodzaje, miejsca docelowe, różnice

Formaty audio to odmiany plików przeznaczonych do przechowywania cyfrowych danych dźwiękowych w systemie komputerowym. Układ strumienia danych audio (z wyjątkiem metadanych) nazywany jest formatem kodowania audio i może być nieskompresowany lub skompresowany. Kompresja służy do zmniejszania rozmiaru pliku, co często łączy się z utratą jakości dźwięku. Dźwięk może być również nieprzetworzonym strumieniem bitów w formacie kodowania dźwięku, ale zazwyczaj jest osadzony w formacie danych dźwiękowych z określoną warstwą pamięci.

Co reprezentują?

Plik dźwiękowy to zbiór informacji, który składa się z danych dotyczących częstotliwości i amplitudy dźwięku zapisanego do kolejnego odtwarzania. Formaty audio mogą pełnić rolę kontenera dla surowych danych, a także korzystać z kodeków audio. Często te pojęcia są zdezorientowane i zdezorientowane. Kodek wykonuje kodowanie i dekodowanie nieprzetworzonych danych dźwiękowych, podczas gdy te zakodowane dane są zwykle przechowywane w pliku kontenera. Chociaż większość formatów plików audio obsługuje tylko jeden typ danych kodowania audio (utworzonych za pomocą kodera audio), format kontenera multimediów (na przykład Matroska lub AVI) może obsługiwać kilka typów danych audio i wideo.

Odmiany według objętości i jakości

Można wybrać następujące grupy formatów plików audio: 1. Skompresowane - takie jak WAV, AIFF, AU lub niezarządzany PCM bez nagłówków. 2. Bezstratne formaty kompresji - na przykład FLAC, AudioMonkey (rozszerzenie pliku .ape), WavPack(Rozszerzenie pliku .wv), TTA, ATRAC AdvancedLossless, ALAC (nazwa pliku rozszerzenie .m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA bezstratny) i skrócić (SHN). 3. formaty skompresowane stratnej jakości - np Opus, MP3 Vorbis, Musepack, AAC, ATRAC i Windows Media Audio stratna (skompresowany WMA).

Typ podstawowy

Jednym z głównych nieskompresowanych formatów audio jest LPCM. Z natury jest to rodzaj PCM i podobny do Digital Audio (format audio CD). Jest to rodzaj najczęściej używanych API niskiego poziomu i przetworników cyfrowo-analogowych. Chociaż LPCM mogą być przechowywane na komputerze w postaci surowej formacie audio, to zwykle w pliku WAV w systemie Windows lub .aiff na MacOS.

WAV i AIFF 13] [cyfrowy format pliku audio AIFF opiera się na wymianie (IFF), i WAV - w podobnych typów zasobów udostępniania plików (RIFF). WAV i AIFF są zaprojektowane do przechowywania szerokiej gamy formatów audio, bez utraty jakości lub utraty. Dodają po prostu mały nagłówek metadanych przed komponentem audio, aby wskazać format audio (na przykład LPCM z określoną częstotliwością próbkowania, głębokością bitową, numerami seryjnymi i liczbą kanałów). Ponieważ WAV i AIFF są szeroko obsługiwane i mogą przechowywać LPCM, są one odpowiednimi formatami plików do przechowywania i archiwizowania oryginalnego rekordu.

BWF nowej generacji

to standardowy dźwięk stworzony przez Europejską Unię Nadawców jako następca WAV. Ma wiele usprawnień, w tym możliwość przechowywania bardziej wiarygodnych metadanych w pliku. To jest główny formatpłyta używana przez wiele profesjonalnych stacji roboczych w branży telewizyjnej i filmowej. Pliki BWF zawierają standaryzowany znacznik czasu, który umożliwia łatwą synchronizację dźwięku z pojedynczym elementem obrazu. Samodzielne nagrywarki wielościeżkowe AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton i TASCAM zawsze stosują BWF jako preferowany format.

Formaty audio z kompresją i bez

Ten rodzaj danych przechowuje mniej danych bez utraty informacji. Dane wyjściowe można odtworzyć z takiej wersji. Nieistniejące formaty audio kodują dźwięk i ciszę z taką samą liczbą bitów na jednostkę czasu. Kodowanie minut absolutnej ciszy tworzy plik o tym samym rozmiarze co minuty muzyki. Jednak w skompresowanym formacie muzyka zajmie mniejszy plik niż oryginalne nagranie, a cisza prawie nie zajmie miejsca.
Formaty plików audio tego typu obejmują FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Zapewniają współczynnik kompresji około 2: 1 (czyli pliki zajmują połowę przestrzeni PCM). Opracowywanie bezstratnych formatów kompresji ma na celu skrócenie czasu przetwarzania przy zachowaniu dobrej jakości dźwięku.

Utrata skompresowanego formatu audio

Pozwala to na dalszą redukcję rozmiaru pliku poprzez usunięcie niektórych informacji audio i uproszczenie danych. To oczywiście prowadzi do tego, że jakość formatów audio staje się znacznie gorsza. Stosowane są różne metody (częściej za pomocą psychoakustyki w celu usunięcia części dźwięku, które mają najmniejszy wpływ na postrzeganą jakość i zminimalizowaćilość słyszalnego hałasu dodanego podczas procesu kompresji. Popularny format MP3, jak widać, jest najbardziej znanym przykładem. Ponadto popularny jest także AAC, który można znaleźć w iTunesMusicStore. Większość formatów oferuje inny zakres współczynników kompresji, zwykle mierzony z szybkością bitową. Im niższa prędkość, tym mniejszy plik i większa utrata jakości.

Jakie formaty są obecnie znane?

.3GP to format kontenera multimedialnego, który może zawierać własne formaty AMR, AMR-WB lub AMR-WB +, a także niektóre otwarte odmiany. .AAC (Advanced Audio Coding) - w oparciu o standardy MPEG-2 i MPEG-4. Pliki AAC są zwykle kontenerami ADTS lub ADIF. .AAX (Audible.com) to format audiobooka będący bogatym w jakość plikiem M4B (wysokiej jakości) zaszyfrowanym przy pomocy DRM. MPB zawiera audio kodowane AAC lub ALAC w pojemniku MPEG-4.
.AIFF to standardowy format plików dźwiękowych używany przez firmę Apple. Można go uznać za równoważny WAV. .AMR (AMR-NB) - rodzaj dźwięku wykorzystywanego głównie do pisania mowy. .APE (małpy Ashlanda) - format kompresji audio bez utraty jakości. .M4A audio w MPEG-4 jest używane przez firmę Apple do niechronionej muzyki pobranej ze sklepu iTunes Music Store. Dźwięk w pliku M4A jest zwykle kodowany przez AAC, chociaż ALAC może być również używany bez utraty jakości. .M4P - licencjonowany przez Apple patent AAC z zarządzaniem prawami cyfrowymi, opracowany przez firmę Apple do użytku w muzyce pobranej ze sklepu iTunes Music Store. .MMF to rodzaj dźwięku Samsung używanego w dzwonku. Został opracowany przez Yamaha i jest formatem danych multimedialnych..MP3 format MPEG Layer III Audio. Jest to najczęściej używany plik audio używany dzisiaj. Jest również znany jako MPEG-1 lub MPEG-2 i jest osobliwym formatem kodowania audio dla cyfrowego dźwięku. Wykorzystuje on kompresję utraty danych do kodowania informacji z niedokładnym przybliżeniem i odrzucaniem częściowych danych. Wszystko po to, aby zmniejszyć rozmiar pliku, zwykle 10 razy, w porównaniu z CD. Pozwala to zaoszczędzić jakość dźwięku porównywalną z nieskompresowaną. W porównaniu z płytami CD o jakości cyfrowej audio, jakość kompresji MP3 zwykle sięga 75-95%. Zatem pliki tego typu stanowią od 1/4 do 1/20 rozmiaru wyjściowego strumienia cyfrowego audio. Jest to ważne dla zapewnienia transferu i przechowywania plików, zwłaszcza dzisiaj, gdy wymiana informacji jest powszechna. Podstawą takiego porównania jest format cyfrowej płyty audio CD, która wymaga 1411200 bps. Powszechnie używanym ustawieniem kodowania MP3 jest 128 kb /s CBR, co daje plik 1/11 (= 9%) rozmiaru pliku wyjściowego jakości CD, czyli z kompresją 91%. Kompresja strat MP3 działa poprzez zmniejszenie (lub przybliżenie) dokładności niektórych części ciągłego dźwięku, które są uważane za niedostępne dla pozwolenia słuchowego większości ludzi. Ta metoda jest zwykle nazywana kodowaniem percepcyjnym lub "psychoakustycznym". Używa modeli psychoakustycznych, aby odrzucić lub zmniejszyć dokładność elementów, które są mniej słyszalne dla ludzkiego słuchu, a następnie zarejestrować pozostałą część informacji w skuteczny sposób.
.MPC (poprzednioznany jako MPEGplus, MPEG + lub MP +) to kodek audio open source specjalnie zoptymalizowany do przezroczystego kompresowania dźwięku stereo /audio z szybkością bitową 160-180 Kb /s. .OGG, .OGA, MOGG to wolny typ otwartego kontenera, który obsługuje wiele innych typów, z których najpopularniejszym jest format audio Vorbis. Oferuje kompresję podobną do MP3, ale mniej popularną. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) jest wielokanałowym lub wielościeżkowym formatem OGG. .WAV to standardowy format plików audio używany głównie na komputerze z systemem Windows. Zwykle używane do przechowywania nieskompresowanych (PCM) płyt CD o jakości audio, co oznacza, że ​​mogą być większe - około 10 MB na minutę. Pliki te mogą zawierać dane zakodowane za pomocą różnych kodeków, aby zmniejszyć rozmiar (na przykład, można przesłać do formatu GSM lub MP3). Pliki WAV wykorzystują strukturę RIFF. Ten format najlepiej oszczędza jakość pliku. .WMA to format Microsoft Windows Media Audio. Opracowany z funkcjami zarządzania prawami cyfrowymi (DRM) w celu ochrony przed kopiowaniem. Był wcześniej dystrybuowany tak szeroko, jak format OGG lub MP3. .WV - format stworzony dla wideo HTML5.

Audiobook

.AOT Audible.com to kontener audiobooka o jakości DRM, który zawiera kodowany dźwięk w postaci kodeków MP3 lub ACELP. .M4B - rozszerzenie Audiobook /podcast z kodowaniem AAC lub ALAC w kontenerze MPEG-4. Oba formaty mogą zawierać metadane, w tym znaczniki nagłówków, obrazy i hiperłącza. Ponadto M4B umożliwia zakładki (pamięć ostatniego miejscasłuchanie), podczas gdy M4A tego nie robi.

Opracowany dla określonego celu.

.ACT to skompresowany format audio ADPCM o wielkości do 8 kb /s. Nagrywa z większości chińskich odtwarzaczy MP3 i MP4 oraz nagrywarek. .AU to standardowy format plików dźwiękowych używany przez firmę Sun, Unix i Java. Pliki audio AU mogą być w formie PCM lub skompresowane przy użyciu kodeków -Law, law-law lub G729. .AWB (AMR-WB) - dźwięk, używany głównie do wymowy, podobny do ITU-T G. 722.2. .DCT - używa oprogramowania NCH. Jest to format zmiennych kodeków przeznaczonych do dyktowania. Ma informacje o nagłówkach dyktowania i może być zaszyfrowane (zgodnie z wymogami prawa dotyczącego prywatności w medycynie). Można również powiedzieć, że jest to zastrzeżony format oprogramowania NCH. .DSS - Pliki DSS Olympus są w swoich własnych formatach Olympus. To jest dość stary i zły kodek. GSM lub MP3 jest zwykle lepszy, jeśli mogą korzystać z nagrywarki. Pozwala to na przechowywanie dodatkowych danych w nagłówku pliku. .DVF to własny format Sony skompresowanych plików dźwiękowych, powszechnie używany przez firmowe dyktafony. .GSM - Zaprojektowany do użytku w telefonii w Europie. Jest to najlepszy format audio dla wysokiej jakości głosu przez telefon. Dobry kompromis między rozmiarem i jakością pliku. Warto również zauważyć, że pliki WAV można kodować za pomocą kodeku GSM. .MSV to własny format Sony skompresowanych plików dźwiękowych Memory Stick.

Internet Forms

. Format plików FLAC dla Free Lossless Audio Codec, kodek kompresji audio bez utraty jakości. .IKLAX to pojazd wielokierunkowycyfrowy dźwięk, który pozwala wykonywać różne akcje z danymi muzycznymi, na przykład podczas miksowania i komponowania woluminów. .IVS - wersja propryetarnaya Digital Rights Management, opracowany przez 3D Solar UK Ltd do stosowania w muzyce, który jest ładowany z TronMe sklepu muzycznego, jak również do muzyki on-line i odtwarzacz wideo. .OPUS (Internet Engineering Task Force) - format kompresji dźwięku z utratą jakości, opracowany przez grupę roboczą Internet Engineering Task Force (IETF) i został zaprojektowany specjalnie dla interaktywnych aplikacji za pośrednictwem Internetu. Prezentowany jako open source standaryzowany za pomocą RFC 6716, jego implementacja referencyjna jest dostarczana zgodnie z licencją BSD dla 3 sekcji. .RA, .RM - Real Audio Format, przeznaczony do przesyłania strumieniowego przez Internet. Dzięki temu .RA umożliwia zapisywanie plików offline na komputerze z wszystkimi danymi audio zawartymi w samym pliku. Aplikacje dla formatów audio tego typu są już nieaktualne.

prawie nie

.RAW surowego może zawierać plik dźwiękowy w dowolnym formacie, ale zazwyczaj korzysta z sygnału audio PCM. Jest rzadko używany, z wyjątkiem testów technicznych. .SLN - Zatwierdzony format liniowy PCM, używany przez Asterisk. Według wersji v.10 standardowymi typami audio były 16-bitowe Signed Linea. .Vox - najczęściej używa kodeku Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Podobnie jak inne formaty ADPCM, kompresuje dane do 4 bitów. Pliki w formacie Vox są podobne do plików wave, z tym, że nie zawierają informacji o samym pliku, a więc formatach odtwarzania audiomoże się różnić. Aby to zrobić, najpierw musisz określić częstotliwość próbkowania kodeków i liczbę kanałów.

Powiązane publikacje