Методи за съхраняване на звукови данни

- Секция Мултимедия
     Изборът на метод за съхраняване (кодиране) на звуковите данни е изключително важен при реализацията и азпространението на мултимедийните приложения. От правилния избор зависи не само качеството на звука, но и
успешното разпространение на крайния продукт. Изборът на неподходящили неподдържан при по-голяма част от
потребителите кодек би довело до компрометиране на ММПкато цяло. Методите за кодиране могат да се разделят
на две групи: за кодиране на аудио поток и за кодиране на MIDI информация.
  
   1. Методи за съхраняване на аудио поток
 
    За съхраняване на дискретизиран звуков сигнал съществуват различни методи.Цифровият звук представлява набор от стойности на амплитудата на сигнала в точно определени моменти от време.
  
    Възможни са няколко решения на задачата за съхраняване на цифровия звук:
    • без компресиране;
    • съхраняване с компресиране без загуба на информация;
    • съхраняване с компресиране със загуба на информация.
   
   Съхраняване без компресиране. Това е най-лесния начин за съхраняване, като се съхраняват числа, съответстващи на амплитудата без да се прилага компресиране на информацията. Най-често се използва PCM (Pulse Code Modulation
- импулсно-кодова модулация). Представлява метод за цифрово кодиране на сигнала с помощта на запис на абсолютните значения на амплитудата. Различава се знаково и беззнаково представяне на информацията. С този метод на кодиране се
записват всички аудио CD.
   
  Съхраняване с компресиране без загуба на информация се използва, когато е изключително важно да бъдат възстановени всички данни. Съществуващите днес специални алгоритми за компресиране на звук без загуба (Monkeys Audio) позволяват обема, заеман от данните да бъде намален до 50%, като осигуряват 100% възстановяване на оригиналните данни.
   
   Съхраняване с компресиране със загуба на информация. Един от първите алгоритми е ADPCM (Adaptive Delta PCM - адаптивна импулсно-кодова модулация). Стойностите на сигнала се записват не в абсолютни стойности, а като относително
изменение спрямо предходната стойност на амплитудата. Това дава възможност да се намали разрядността до 2-4 бита, като с това се намалява и общия размер на файла. Степента на компресиране може да достигне от 2 до 4 пъти. Този метод не
дава добри резултати при сигнали с бързо променяща се амплитуда.
   
   При всички съвременни методи се използва т.нар. психоакустичен модел, при което от оригиналния сигнал се премахват честоти, които би трябвало човек да не различава. Най-често се използва т.нар. ефект на маскировка - тихият звук не се
чува, ако е след висок. Като краен резултат се получава сигнал, чийто данни заемат 10-12 пъти по-малко място от данните на оригиналния сигнал. Звученето на сигнала след разкомпресиране наподобява оригинала, но не е идентичен с него.
В съвременните системи за кодиране със загуба на информация се използват няколко нови технологии:
   
    • Съхраняване с постоянен битрейт {CBR, Constant Bitrate). Представлява режим на запис, при който битрейта остава постоянен, независимо от характера на музиката. Основната задача на кодера е да бъде получено максимално високо
качество при неизменен поток информация.
   
    • Съхраняване с променлив битрейт (VBR, Variable Bitrate). Представлява режим на запис, при който на кодера се задава необходимото качество. При кодиране, кодерът сам избира необходимия битрейт за компресиране на всеки
фрагмент от записа. Диапазонът на използваните битрейти може да бъде в много широки граници. Тази технология дава възможност да се постигне максимално съотношение качество/размер. Недостатъци са невъзможността да бъде
предсказана големината на файла и невъзможността да се използва в Интернет среда при ниска скорост на обмен.
    • Съхраняване със среден битрейт (ABR, Average Bitrate). Представлява режим на кодиране, който е междинен по отношение на CBR и VBR. При кодиране се указва желаният среден битрейт. При необходимост кодерът може малко да повиши или да промени битрейта, с цел получаване на по- високо съотношение качество/размер. Недостатък на ABR е по-ниското качество спрямо VBR. Предимство е почти еднородният поток информация и лесното предсказване размера на файла.
 
    Фиг. 7. Действие на технологията SBR

    SBR (Spectral Band Replication). Тази технология дава възможност да бъдат възстановявани високите честоти като се използва информация, съдържаща се в други области на спектъра и неголям поток от допълнителни данни. Същността й се състои в следното: при компресията на звуковия поток (stream) се взима малко по-тесен участък от честотния спектър, за сметка на високите честоти, които се изрязват напълно (фиг. 7.). При възпроизвеждането декодиращият алгоритъм възстановява липсващите високи честоти, използвайки информацията, записана във файла.     По този начин, един звуков файл съдържа два потока: единият, съдържащ ниските и част от средните честоти се компресира по стандартен начин, а другия
поток съдържа информация за високочестотната част, която вече специализиран плейър може да декодира и възпроизведе, и която един обикновен плейър няма да може. С помощта на SBR се повишава качеството на файловете при използване на
ниски битрейти.
   
    • Joint Stereo. Тази технология се използва за кодиране на стерео сигнал като се отчита разликата в информацията за левия и десния канал. При правилно използване, техногията дава по-добри резултати, отколкото отделното кодиране на двата канала.
    Днес съществуват много методи и програми, реализиращи компресиране със загуба на информация. Най-известни са: MPEG 1 Layer I, II, III (известен като МРЗ), MPEG-2 AAC (Advanced Audio Coding), Ogg Vorbis (OGG), Windows Media Audio (WMA) и др.
   
   2. Метод за съхраняване на музика във вид на MIDI файлове
 
    MIDI файлът (с разширение MID) запазва електронната версия на музикално изпълнение. Файлът съдържа информация: коя нота да бъде изпълнена, от кой инструмент, каква е продължителността и тоналността на нотата и др. MIDI стандартът позволява в един MIDI файл да бъдат запазени до 16 писти, представящи 16 различни типа музикални инструменти.
   
    Когато се изпълнява MIDI файл, програмите изпращат файла към синтезатор (може да бъде малък синтезатор на звуковата карта или външен синтезатор), като използва софтуер наречен секуенсър (sequencer), който чете цифровото описание и
пресъздава музиката. Качеството на звука зависи от това, колко добре синтезаторът ще пресъздаде звуците, представени чрез MIDI файла. Един MIDI файл може да звучи по различен начин на компютри с различни звукови карти. Тъй като за  възпроизвеждане се използва синтезатор, MIDI файлове могат да се използват за запазване само на музика и определени звукови ефекти (не и за говор).

 

 


Коментирай свободно: