Кодиране на видео от данни - част 2

- Секция Мултимедия

 

    3. MPEG стандарти за компресиране на видео информация
 
    Стандартите за компресиране на видеоинформация MPEG се разработват от Експертна група по кинематография (Moving Picture Experts Group - MPEG). MPEG представлява набор от стандарти за компресиране на звукова и видео информация с цел по-малко заемано място от видеофайловете и по-лесно пренасяне в Internet. Технологията за компресиране включва премахване на излишната информация и кодиране на отделните изображения.
    Към настоящия момент съществуват следните MPEG стандарти: MPEG-1, MPEG-2, MPEG-4 и MPEG-7. В процес на разработване е и нов стандарт MPEG-21. Основният критерий при разработването на стандартите MPEG-1, MPEG-2 и MPEG-4 е количеството пренасяна нформация за единица време.
 
    3.1. MPEG-1
 
    Стандартът MPEG-1 (ISO 11172) е реализиран през 1992 г. Предназначен е за запис и възпроизвеждане на движещи се изображения и свързания с тях звук на цифров носител със скорост на трансфер до 1,5 Mbit/s. При това се осигурява качество на изображението както при обикновен VHS видеокасетофон със стереозвук. Пълнометражен филм, записан в този формат заема два компакт-диска в стандарта VideoCD (VCD). Стандартът се състои от 5 части, които описват системата, видеото, звука, методите за проверка за съответствие и програмите за кодера и декодера, написани на програмен език С. За да работи при ниски скорости се използва само един полукадър от изображението, а от всеки полукадър се вземат половината пиксели. Така полученият поток от кадри след това се кодира посредством съчетание на DCT и DPCM (Differential Pulse Code Modulation) c алгоритъм за компенсация на движението (подобен на този, използван в стандарта Н.263). MPEG-1 прилага линеен механизъм за кодиране, при който не се прави анализ на подвижните и неподвижните обекти в кадъра. Отстраняването на излишната информация се извършва с помощта на вътрешнокадрово и междукадрово компресиране.
 
    Алгоритъм на кодиране в MPEG-1
 
    MPEG кодирането използва цветова система YUV, т.е. информацията за яркостта и цветовете е разделена. При този стандарт за компресиране, яркостта не се подлага на компресиране, докато стойността за цвета се получава чрез усредняване на съседни пиксели. MPEG-1 прилага цветово описание 4:1:1. В процеса на компресиране, пикселите на всеки кадър се групират в блокове 8x8.
Всеки блок от яркостта съдържа данните за оригиналното изображение, докато блоковете за цветност при коефициент на компресиране 4:1 - данни за област 16x16, т.е. за четири блока яркост. След това върху всеки блок се прилагат преобразования, аналогични на стандарта Н.263. Като резултат се получава т.нар. /-кадър (Intra Frame), който може да бъде възпроизведен независимо от съседните кадри. Въпреки, че /-кадрите осигуряват най-високо качество на компресиране, то необходимата пропускателна способност и дискова памет при предаване остава много висока.
    За по-нататъшно намаляване на обема се използва вторият метод -междукадрово компресиране (фиг. 7.). За целта /-кадрите се използват само като ключови за група изображения (Group Of Picture – GOP).
 
                Фиг. 7. Примерна последователност на кадрите в GOP
 
    MPEG поддържа два типа кадри: Р (Predicated) и В (Bi-directional):
 
    • Р-кадрите съдържат само информация (пиксели), отличаваща ги от най-близкия предходен ключов кадър (може да бъде -кадър или Р-кадър).
    • 8-кадрите съдържат информация, която ги отличава от най-близките (предходен и следващ) ключови кадри. При В-кадрите се получава най-голяма степен на компресиране.
 
    GOP може да съдържа: 1) само I-кадри; 2) I-кадри и Р-кадри; 3) трите типа кадри. Най-често съдържа 12 или 15 кадъра, като задължително започва с /- кадър (фиг. 7.) и с определена периодичност съдържа Р-кадри. Обикновено GOP се описва като M/N, където М представлява общия брой кадри в групата, а N — интервала между Р-кадрите. Една типична за VCD и DVD група 15/3 има вида: IBBPBBPBBPBBPBB. Първият /-кадър се получава в резултат на вътрешнокадрово компресиране. След това се генерират Р-кадрите и накрая междинните В-кадри. При запис на носител подредбата на кадрите се променя, за да се минимизират изискванията към необходимата памет в декодера, а първоначалната им последователност се възстановява при възпроизвеждане.
 
    В MPEG-1 са дефинирани три нива (Layers) за компресиране на звука:
 
    • Ниво 1 (Layer 1) използва най-прост алгоритъм с минимална компресия и изискване за трансфер от 192 Kbit/s на канал.
    • Ниво 2 (Layer 2) използва по-сложен алгоритъм за компресиране (известен като МР2) и има изискване за пропускателна способност от 128 Kbit/s на канал.
    • Ниво 3 (Layer 3) използва мощен алгоритъм за компресиране на звук със CD-качество при скорост на предаване 64 Kbit/s на канал. Този метод е изключително популярен под името МРЗ (идва от съкращението на MPEG Layer 3).
 
    Предимства на MPEG-1:
 
    MPEG-1 е най-старият, най-надеждният и най-разпространеният кодек. Може да бъде използван на всеки компютър.
    Има стандартна скорост на трансфер - 1150 Kbit/s, размер на кадъра 352x288, скорост 25 кадъра в секунда (за PAL/SECAM) и кодек за звука - MPEG-1 Layer 2.
    Записаната на VCD видеоинформация освен на компютър, може да бъде гледана и на телевизор с използване на VCD или DVD устройства.
  
 Недостатъци на MPEG-1:
 
    MPEG-1 използва метод за компресиране на звука, който не е толкова ефективен, колкото при другите кодеци, даващи възможност за компресиране на звук с по-нисък битрейт във файл с по-малка големина.
    Качеството на MPEG-1 може да бъде подобрявано само посредством увеличаване на битрейта, но това води до по-голям файл и по-големи изисквания към компютърната система, където ще се възпроизвежда.
    Размерът на крайния видео файл е значително по-голям от този, получен с използване на други кодеци.
 
    3.2. MPEG-2
 
    Утвърден е като международен стандарт през 1995 г. и е обратно съвместим с MPEG-1. Стандартът осигурява студийно качество за HDTV (High Definition Television), кабелна и спътникова телевизия. MPEG-2 поддържа разделителни способности от 352x288 до 1920x1152 с честота 60 полукадъра в секунда. Притежава усъвършенстван алгоритъмът за компресиране като се поддържат две схеми за реализация. Схемите на компресиране се определят от изискванията на приложенията: променлива скорост на предаване за осигуряване на постоянно качество на видео информацията и постоянна скорост на предаване с различно качество. Скоростта на предаване може да се изменя в границите от 2 до 80 Mbit/s, което дава възможност за възпроизвеждане при различни нива на качество. Увеличаването на скоростта на пренос и използването на усъвършенстван алгоритъм за компресиране осигурява постигане на много по-високо качество в сравнение с MPEG-1.
    Той е основен формат при запис на DVD филмови дискове. Размерът на кадрите за DVD филмите в стандартите PAL/SECAM е 720x576 при скорост 25 кадъра за секунда (при NTSC е 640x480 при 30 кадъра за секунда).
    Друга отличителна особеност в сравнение с MPEG-1 е поддържането на технологията Transport Streams, предназначена за предаване на видео по мрежи с голямо ниво на грешки. Потоците (Streams) се състоят от малки пакети с фиксирана дължина (188 байта), което позволява по-лесен контрол на грешките. Технологията Transport Streams дава възможност MPEG-2 да бъде използван в кабелни телевизии и спътникови телевизии.
    MPEG-2 допуска 4 нива (Levels) на разделителна способност на кадрите и 5 основни профила (Profiles) за кодиране на сигналите за яркостта и цветността (табл. 3.)
 
    Видове нива при кодиране на видеосигнала в MPEG-2:
 
    •Ниско ниво (Low Level - LL) с разделителна способност 352x288 (както при MPEG-1) за яркостиия сигнал.
    •Основно ниво (Main Level- ML) c разделителна способност 720x576.
    •Високо ниво 1440 (High Level 1440 - HL 1440) с разделителна способност 1440x1152.
    • Високо ниво 1920 (HL-1920) с разделителна способност 1920x1152.
 
Последните две нива са предназначени за използване в телевизия с висока разделителна способност.
 
    Видове профили на MPEG-2:
 
    Обикновен профил (Simple Profile - SP) - в този профил се осъществява кодиране само посредством компенсиране на движението и предсказване по едно направление (Р-кадри).
    Основен профил (Main Profile - МР) - в този се използва кодиране с предсказване по две направления, т.е. има и В-кадри.
    Мащабируем по отношение сигнал-шум профил (SNR Scalable Profile). B този профил се осъществява разделяне по показателя "отношение сигнал/шум" на две части на цифровия поток от видеоданни. Първият поток (основен сигнал) съдържа информация с ниско отношение сигнал/шум, т.е. има по-груба дискретизация. За кодиране се използват по-шумозащитени при предаване алгоритми, използва се при силни смущаващи въздействия и позволява дори при неблагоприятни условия да бъде възстановено телевизионното изображение (с ниско качество). По-слабо защитената втора част (допълнителен сигнал) при неблагоприятни условия се игнорира, а при добри условия дава възможност за възстановяване на видеосигнала в изходния му вид.
     Пространствено мащабируем профил (Spatially Scalable Profile - SSP). При него схемата на кодиране е още по-сложна. Посредством използване на критерий за разделителна способност, видеопотокът се разделя на три части. Първата част (основен сигнал) осигурява качествено предаване на изображение със стандартна разделителна способност (576 линии). Втората част съдържа информация, даваща възможност за получаване на изображение с висока разделителна способност (1152 линии). Третият поток дава възможност за повишаване на отношението сигнал/шум.
     Висок профил {High Profile - HP). Включва всички функции на предходните профили, но за разлика от тях използва цветово кодиране YUV 4:2:2, а не 4:2:0, т.е. поддържа се два пъти повече информация за цветовите разлики.
 

   
 Таблица 3
 
     Звуковото кодиране в MPEG-2 представлява многоканално разширение на звуковия кодек на MPEG-1. В сравнение с MPEG-1 в аудио частта на стандарта е добавена поддръжка на многоканален звук (Dolby Digital 5.1, DTS и др.). Освен съвместимия с MPEG-1 аудио кодек, в MPEG-2 влиза и високотехнологичния кодек AAC (Advanced Audio Codec), който се използва и в професионалната аудиотехника.
 
     Предимства на MPEG-2:
 
     MPEG-2 е разработен за създаване на видео с висока разделителна способност и скорост на трансфер (битрейт), както е при DVD.
     Поддържа interlaced (презредово) видео, което го прави оптимален за създаване на видео с висока разделителна способност.
     Благодарение на високата скорост на трансфер, в MPEG-2 може да се създава висококачествено видео.
 
     Недостатъци на MPEG-2:
 
     Високият битрейт поставя високи изисквания към бързодействието на компютъра.
 
     3.3. MPEG-4
 
    Разработката на този стандарт е започната в първата половина на 90-те години на миналия век и е завършена през 1998 г. От 1999 г. е утвърден като международен стандарт. Първоначално е бил замислен като метод за предаване на поточни мултимедийни данни (например видео) с малък размер (176x144 пиксела (QCIF) при 10 кадъра в секунда) в нискоскоростни среди (трансфер между 4800 и 64000 bits/s).
    Днес в практически приложения MPEG-4 може да се използва както за ниска разделителна способност (128x96 пиксела - SQCIF), така и за висока - HDTV, a поддържаните скорости са от 5 Kbit/s до 10 Mbit/s.
    За разлика от MPEG-1 и MPEG-2, в които за кодиране се използва линеен подход, MPEG-4 е обектно ориентиран. Тази технология разглежда всеки аудио- визуален обект (Audio-Visual Objects — AVO) от изображението като независим от останалите, което позволява постигането на по-добро компресиране. Използването на обекти, които са свързани в някакво отношение в
пространството и времето води редица предимства. По този начин към различни обекти могат да бъдат прилагани различни методи за кодиране, което води до повишаване на качеството. Например, при генерация на движещи се обекти е най-добре да се прилага анимационна техника, докато изображенията е най- добре да се разглеждат като съвкупност от пиксели.
    В наши дни MPEG-4 има много голяма популярност, благодарение на мощните алгоритми за компресиране и възможността с негова помощ на един компакт-диск да бъде записан пълнометражен филм. От друга страна използването на нови и по-сложни алгоритми за компресиране повишава изискванията към използваните изчислителни ресурси в сравнение с
необходимите за възпроизвеждане на видео във формат MPEG-1 или MPEG-2. MPEG-4 се използва в .ASF и .WMV файлове (стандарти на Windows Media), както и в .AVI файлове, създадени с използване на кодеците Microsoft MPEG-4, DivX 5, XviD и др.
    Основните части на функционалната структура на MPEG-4 са:
 
      Системна част. Включва описание на отношението между аудиовизуалните обекти и сцената. Описанието на отношението съдържа две нива:
 
    • първото ниво представлява двоичен формат за сцената (Binary Format for Scenes - BIFS), който описва пространствено-временното разположение на обектите на сцената. Това дава възможност на крайния потребител да взаимодейства с обектите (например в игри).
    • второто ниво представляват дескрипторите на обектите (Object Descriptors), които определят отношението между елементарните потоци (Elementary Streams), принадлежащи на всеки обект. Например аудио и видеопотоците във видеоконференциите.
 
    Визуална част. Разглежда методите за компресиране на естествени и синтезирани визуални обекти.
    Звукова част. Разглежда методите за компресиране на естествени и синтезирани звукови обекти.
 
    Предимства:
 
    MPEG-4 е разработен за създаване на видео с високо качество и неголям битрейт, което дава възможност за възпроизвеждане на видео на повечето компютри, както и за публикуване в Internet.
    Може да компресира видео във всякаква разделителна способност при относително нисък битрейт.
    С помощта на кодеци като XviD и DivX 5, MPEG-4 може да бъде възпроизвеждан от всяка програма за видео.
 
    Недостатъци:
 
    В настоящият момент MPEG-4 може да бъде използван само на компютър. За възпроизвеждане на филми, кодирани с MPEG-4 на телевизор е необходима допълнителна приставка с телевизионен изход (TV-out).
 
    3.4. MPEG-7
 
    MPEG-7 е стандарт за описание на различни типове мултимедийна информация с цел осигуряване на ефективно и бързо търсене. Официалното име на MPEG-7 e "Multimedia Content Description Interface" - интерфейс за описание на мултимедийни данни. MPEG-7 определя стандартен набор от дескриптори за различна мултимедийна информация, както и начина за
определяне на собствените дескриптори и взаимните им връзки. За тази цел се използва специален език за описание на определения (Description Definition Language - DDL). MPEG-7 основно ще се използва за търсене на мултимедийна информация (подобно на търсенето на текст днес). Например:
 
    • търсене на графично изображение. По няколко нарисувани от потребителя фрагмента ще може да се получава информация за всички изображения съдържащи такъв фрагмент;
    • търсене на музика. Посредством изсвирване на кратка мелодия ще могатда се намират музикални произведения, които съдържат такава последователност;
    • търсене на видео. Чрез задаване на обект и движение ще се получава списък от видео или анимация.
 
    3.5. MPEG-21
 
    Разработването на спецификацията MPEG-21 е проект, наречен "Система от мултимедийни средства" (Multimedia Framework). Работата е започната през 2000 г. Предвижда се първоначално да се извърши разширяване, уеднаквяване и обединяване на форматите MPEG-4 и MPEG-7 в обща структура.
 
    4. MHEG (Multimedia and Hypermedia Expert Group)
 
    Експертна група по хипермедия и мултимедия (Multimedia & Hypermedia Expert Group - MHEG) разработва стандарт за обмен на мултимедийни обекти (звук, видео, текст и други произволни данни) между приложения и предаването им посредством различни методи (локална мрежа, телекомуникации, телевизия).
За целта ще се използват MHEG обектни класове. Счита се, че MHEG е бъдещ международен стандарт за интерактивна телевизия.
 

 

 


Коментирай свободно: