Мултимедийни обекти- Част 1

- Секция Мултимедия

 

      За разлика от другите технологични среди, опериращи с разнородни типове данни
(киното, телевизията, видеото), в мултимедия е възможно взаимодействие между елементите на средата и потребителя. В този смисъл, основните характеристични елементи на мултимедията са различните типове данни и средствата за взаимодействие На най-високо ниво, данните обработвани в мултимедия се разделят на две групи: статични и динамични (Фиг. 1).
     
                         Фигура 1. Данни в мултимедия
 
 Статичните данни имат дискретни, относително постоянни стойности. В тази група участват текстовите и графичните данни. Динамичните данни имат непрекъснати, зависещи от параметъра ‘време’ стойности. В тази група се включват разпределените във времето звук, видео и анимация.
 
Текст (хипертекст)
 
    Текстът е най-старата и най-широко разпространена медия, която се използва. За въвеждане на буквено-цифрови символи има различни видове програмни продукти и пакети, позволяващи както въвеждане, така и автоматична корекция на граматичните особености. Използват се и т. нар. компютърни речници, които са неразделна част от текстообработката. Освен стандартния начин за въвеждане на информация чрез клавиатура, (фиг.1.1) текстът може да се въведе с микрофон или скенер. Микрофонният вход задължително използва система за разпознаване на реч и говор. Тези системи на практика не са толкова ефективни и използвани в мултимедийните приложения, защото тембъра на звука и начина, по който се произнасят различните думи не
винаги може да си съвпадне с тоналността, която е заложена в самата система. Ето защо някои думи могат да бъдат сгрешени или неразпознати.
                              Фиг.1. Въвеждане на текст
 
     Когато към текста се приложат хипервръзки можем да говорим за понятието
хипертекст. С помощта на хипертекста е възможно по различни пътища да
достигнем до текстови файлове, които нямат логическа подреденост и
взаимовръзка. Ето защо един текстови файл може да се използва от различен брой
мултимедийни приложения.
     Въвеждането на текст с помощта на скенер е по-лесно и приложимо. За тази
цел се използва т. нар. система OCR (Optical Character Recognition), която оптично
чете символите и графично ги разпознава. Този подход облекчава създателите на
мултимедийните приложения и им дава възможност да редактират текстовата
страница, без да я въвеждат с помощта на клавиатурата.
 
 
Звук
 
Звукът е важен елемент на компютърните програми с мултимедия. Звукът се съхранява и обработва в компютъра в цифров код, генериран при преобразуване на аналоговия сигнал в дискретни величини. Широко прилагани в практиката по използване на мултимедия методи за кодиране на звукова информация са PCM (Pulse Code Modulation) и ADPCM (Adaptive Delta Pulse Code Modulation).
Приложенията, работещи в мултимедия на PC могат да съдържат различни видове звук: сигнали, говор или музика, записани в различни формати: WAVE, CD-DA и MIDI.

WAVE съдържа звуци с невисоко качество, генерирани от компютър или въведени посредством микрофон.
 
CD - DA Compact Disk Digital Audio е звук, записан във формата на музикалните
компакт-дискове, известен и като Red Book формат
 
MIDI Musical Instrument Digital Interface е програмен код на команди, необходими за възпроизвеждане на съхранявания звук, генериран от специализирани интерфейсни устройства.

  Таблица 5

Звуковите сигнали, съдържащи само говор се обработват по методи, които използват описания на структурата на сигнала, вместо цифровия му код.

  
 
   Психоакустика
   Предмет на психоакустиката са характеристиките на човешкото звуково възприятие.
 
  Честотен обхват на човешкия слух
 
   Човек започва да чува звук, когато честотата, с която се променя налягането на въздуха превиши 20Hz. Горната граница при новородени бебета е 20kHz и спада с напредване на възрастта. Важно е да се прави разлика между честотата, която е физическа мярка и височината на тона, която е субективно усещане. Съществува тясна, но не винаги точно определена връзка между честотата и височината на даден тон.
 
    Динамичен обхват на човешкия слух
 
    Долната граница на динамичния обхват на човешкия слух е т. нар. праг на чуване, а горната - праг на болката. Прагът на чуване за синусоидална вълна с честота 1kHz отговаря на звуково налягане 28.3mPa. Тук, също както пр височината, е важно да се прави разлика между амплитудата, която е физическа мярка и силата на звука (гръмкостта), която е субективно усещане. За достигане на прага на болката, амплитудата на звуковата вълна, съответстваща на прага на чуване, трябва да се увеличи около 1 000 000 пъти. При такъв широк обхват от
стойности се работи много по-удобно в децибели. Прагът на чуване при честота 1kHz отговаря на 0dB. При повечето хора прагът на болката отговаря на ниво на звуковото налягане между 100 и 120dB.
 
 Фиг.2. Зависимост на възприеманата гръмкост от амплитудата и честотата.
 
   Точките от всяка крива отговарят на една и съща гръмкост.
 
    Възприеманата от човешкия слух гръмкост на звука зависи не само от амплитудата, но и от честотата на акустичната вълна. Тази зависимост е показана на фиг.1.2 Най-долната крива отразява честотната зависимост на прага на чуване, а най-горната - на прага на болката.
 
    Спектрални характеристики и слух
 
    С помощта на трансформацията на Фурие всеки звуков сигнал може да се разложи на неговите спектрални съставящи. Спектърът на звука е свързан с усещането, наречено тембър. Възприемането на тембъра е сложно и все още не е добре изяснено. То може да се разглежда като идентифициране на източника на звука, например една и съща нота изсвирена с различни музикални инструменти звучи по различен начин. Друга страна на тембъра е субективната оценка на качеството на звука.
 
                                  Фиг. 3. Засенчване
 
    Засенчване

    Този ефект е аналогичен на заслепяването от фаровете на насрещно движеща се кола, когато човек не може да вижда обектите с по-малка яркост. По подобен начин един звук може да направи невъзможно чуването на друг или да промени неговата гръмкост.     Засенчването на даден звук може да бъде пълно или частично. Също така части от даден звук могат да засенчат части от друг звук, дори ако човек не може да осъзнае това при нормални обстоятелства.
 
    На фиг.1.3. е показан типичен случай на засенчване. Плътната линия показва прага на чуване. Спектралният компонент отляво предизвиква изместване нагор на прага на чуване (прекъснатата линия). Така вторият спектрален компонент (стрелката отдясно) се оказва засенчен.
 
    От графиката се вижда, че ниските честоти силно засенчват по-високите, докато високите честоти влияят по-слабо на по-ниските. Засенчване може да се получи, дори ако два тона не звучат едновременно, т. е. засенчващият тон е кратък, но се появява преди другия, който се оказва засенчен.

    Лабораторните изследвания на засенчването показват съществуването на критична честотна лента, в която се наблюдават множество подобни явления. Нека разгледаме гръмкостта при звученето на два тона с еднаква честота. При постепенно увеличаване на разликата в честотите на тоновете не се наблюдава увеличаване на гръмкостта, докато честотната разлика не превиши ширината на критичната честотна лента. Установено е, че тази ширина нараства с увеличаване
на честотата.
 
    Локализиране на източника на звука
 
    За определяне на посоката, от която идва звука, човешкият мозък използва
разликата между информацията, постъпваща от лявото и дясното ухо. Ако
интензитетът на звука е по-голям отляво, то и източникът се намира отляво. Ако
звукът достига първо дясното ухо, то и източникът е отдясно. Главата и външното
ухо изпълняват филтрираща функция, в резултат на което спектърът на звука се
променя в зависимост от това дали източникът е отпред, отзад, отгоре или отдолу
на слушателя.

Таблица 3           

Видео
                           
 
Подобно на анимацията, видеото се представя чрез серия от изображения, които се възпроизвеждат на компютърния екран в определена последователност. В мултимедия се използват два вида видео: аналогово и цифрово. Аналоговото видео е периодичен електрически сигнал, управляващ аналогови монитори, в който е кодирана визуална информация. Видео сигналът е разделен на кадри, съставени от хоризонтални растерни линии, които съдържат
информация за цветове. Цифрово видео е двоичен код на последователността от растерни изображения, съставящи филма и на техните времеви характеристики. Данните за цифрово видео се генерират при дискретизиране на извадки (samples) от аналогов видео сигнал.
Качеството на цифрово видео зависи от параметрите на възпроизвеждане върху компютърния екран: размер на прозореца, в който се изобразява; честота на смяна на кадрите; възможност за изобразяване на цветове. За намаляване на обема на необходимата памет, видео данните се компресират. Използват се различни методи за компресиране, които се основават на подобието
между последователни кадри (interframe) и излишъка на данни в един кадър. Всички елементи на данните, независимо от типа и техническите устройства, необходими за обработката им се разглеждат като обекти в единна среда. Обектите имат свойства и определено от програмите поведение и могат да се свързват в сложни логически структури. Структурирането на данните на
концептуално равнище определя методите на съхраняване и използване, структурирането на потребителско равнище определя начините на визуализация върху външните устройства. Обработката на динамични данни изисква синхронизация.
 
Възприемане на цветно изображение от човешкото зрение.
 
    Цветът на даден обект представлява субективно усещане, а не физическа характеристика на обекта. Едно и също усещане може да бъде предизвикано по няколко начина, които зрението не е в състояние да различи. Например впечатлението за жълт цвят може да бъде създадено както от монохроматичен източник на жълта светлина, така и от смесването на светлината от два източника - червен и зелен.
    В цветната телевизия се използва т. нар. адитивен синтез на цветовете. При него всеки цвят се получава от смесването в определено съотношение на три основни цвята. Съществува безкрайно множество от такива тройки, които могат да се използват при синтеза. Изборът на трите основни цвята в телевизията (червен - R, зелен - G и син - B) е технологичен и е повлиян от спектралните
характеристики на излъчване на известните луминофори.
 
    Стандарти за цветна телевизия

    Телевизионните камери генерират три изходни сигнала, съответно за червения, зеления и синия цвят (RGB сигнали). За да достигнат те до използващите ги устройства са необходими три канала за връзка работещи при пълен синхрон. Освен това, при този подход, съществуващите черно-бели телевизори няма да могат да се използват за гледане на цветни програми.
 
    За преодоляване на трудностите свързани със синхронното предаване на три сигнала и за осигуряване на съвместимост с черно-бялата телевизия са разработени няколко стандарта, които осигуряват предаването на цялата информация за цветното изображение по един "черно-бял" канал
 
    Всички стандарти за цветна телевизия преобразуват RGB сигналите в яркостен сигнал и сигнали на цветността. Преди предаването им по канала за връзка, в приемника се прави обратното преобразуване в RGB сигнали. Сигналите на цветността представлява два сигнала наречени сигнали на цветовата разлика. Яркостният сигнал и сигналите на цветовата разлика са линейни комбинации на входните RGB сигнали. Сигналът на яркостта се предава по същия начин, както и в чернобялата телевизия. Сигналите на цветността модулират високочестотно
носещо трептене, чиято честота е близка до горната гранична честота на канала за връзка. При подходящ избор на честотата на носещото трептене взаимното влияние между сигналите на яркостта и цветността, при предаването им по един канал, е пренебрежимо. Освен това чувствителността на окото към цвета е по- малка отколкото към яркостта. Това позволява да се намали честотната лента на сигналите на цветността от 2 до 4 пъти по-тясна в сравнение с тази на яркостния сигнал. Основната разлика между стандартите за цветна телевизия е в начина на
модулиране на носещото трептене на сигналите на цветността. Съществуват три основни стандарта за цветна телевизия - NTSC (National Television Systems Committee), PAL (Phase Alternating Line) и SECAM (Sequentiel Couleur avec Memoire).
 
    NTSC
    Системата NTSC се използва в Северна Америка, Япония и някои други страни. Яркостният сигнал и сигналите на цветовата разлика се означават съответно с Y, I и Q, и се получават от RGB сигналите по следния начин:
     Y = 0.30R + 0.59G + 0.11B
     I = 0.60R - 0.28G - 0.32B
     Q = 0.21R - 0.52G + 0.31B
 
    Носещото трептене на сигнала на цветността се модулира едновременно от
сигналите I и Q, като за целта се използва амплитудно-фазова модулация.
 
    PAL
    Системата PAL се използва в повечето страни от Западна Европа. Сигналите на яркостта и цветовата разлика се означават съответно с Y, U и V, и се получават от сигналите RGB по следния начин:
     Y = 0.30R + 0.59G + 0.11B
     U = 0.62R - 0.52G - 0.10B
     V = - 0.15R - 0.29G + 0.44B

    За предаване на сигналите на цветовата разлика се използва по-сложен вариант, в сравнение с NTSC, на амплитудно-фазовата модулация, който осигурява по-добра шумоустойчивост.
 
    SECAM
    Системата SECAM се използва във Франция, страните от Източна Европа и бившия Съветски Съюз. Сигналите на яркостта и цветовата разлика се означават съответно с Y, DR и DB, и се получават от RGB сигналите по следния начин:

     Y = 0.30R + 0.59G + 0.11B
     DR = - 1.33R + 1.11G + 0.22B
     DB = - 0.45R - 0.88G + 1.33B

    За предаване на сигналите на цветовата разлика се използва честотна модулация, честотата на носещото трептене е различна за сигналите DR и DB. Освен това двата сигнала не се предават непрекъснато - ако по време на даден ред от развивката се предава само DR, то по време на следващия ред се предава само DB. Това не се отразява съществено на качеството на изображението, тъй като не може да се забележи от човешкото зрение.
 
    Цифрова телевизия
    В цифровата телевизия аналоговите видеосигнали се преобразуват и се обработват, съхраняват и предават в цифрова форма. Обратното им превръщане в аналогови сигнали става непосредствено преди самото възпроизвеждане. Дигитализацията на видеосигнали е регламентирана в препоръка 601 на ITU-R (International Telecommunication Union – Radiocommunication Sector, това е новото име на CCIR - Comite Consultatif International de Radiocommunication).
 
    Първият принцип на ITU-R 601 гласи, че за всеки кадър, пространствените координати на всяко измерване не бива да се променят с течение на времето. Освен това координатите на всички отчетени стойности трябва да съвпадат с възлите на правоъгълна координатна мрежа. За да се удовлетвори това изискване е необходимо честотата на дискретизация да бъде кратна на честотата на редовата развивка и съответните сигнали да бъдат синхронизирани
 
    Вторият основен принцип при преобразуването на видео информацията гласи, че честотата на дискретизация трябва да бъде една и съща, независимо от телевизионния стандарт, на който отговаря входния сигнал. В Северна Америка и Япония се работи с кадрова честота 30Hz и 525 реда за кадър, а в Европа - с 25Hz и 625 реда за кадър. Като вземем предвид, че стойността 30 кадъра е закръглена (действителната честота е 29.970029), получаваме редова честота 525*29.970029 = 1.573426*104Hz, във втория случай имаме 625*25 = 15625Hz. Най-малката обща кратна честота е 2.25MHz, следователно честотата на дискретизация на видеосигнала трябва да бъде кратна на 2.25MHz. На практика яркостния сигнал се дискретизира с честота 6*2.25 = 13.5MHz, а сигналите на цветовата разлика, понеже са с по-тясна честотна лента, се дискретизират с честота 3*2.25 = 6.75MHz. Това означава, че при кадрова честота 30Hz и 525 реда за кадър се снемат 858 точки на ред, а при 25Hz и 625 реда за кадър - 864 точки на ред.
Посочените цифри се отнасят за яркостния сигнал, а за сигналите на цветовата разлика точките са два пъти по-малко.
 
    В горното изложение беше пренебрегнато времето за обратния ход на развивката по редове и кадри, през което се гаси сканиращия електронен лъч. По тази причина броят на активните редове в един кадър не е 525 или 625, а съответно 484 и 576. Броят на активните точки във всеки ред също е по-малък от 858 или 864. Стандартът определя този брой да бъде 720 точки на ред и в двата случая (за яркостния сигнал, за сигналите на цветовата разлика се използват 360
точки на ред).
    В ITU-R 601 цветоразликовите сигнали се различават от тези при аналоговите телевизионни стандарти. Те се означават съответно с Cr и Cb и се получават по следния начин:
 
     Cr = R - Y
     Cb = B - Y
    За представяне на амплитудата на сигнала след преобразуването се използват 8-битови кодови думи за всяка дискретна стойност, но част от 256-те стойности са резервирани за служебна информация. За кодиране на яркостния сигнал се използват стойностите от 16 (ниво черно) до 235 (ниво бяло), а за сигналите на цветовата разлика - от 16 до 240.
 
   При показването на видео на компютърен дисплей трябва да се има предвид, че в аналоговата телевизия се използва презредова развивка, а в компютърните дисплеи – прогресивна.
 
    Препоръка 601 на ITU-R се отнася за приложения изискващи качество еквивалентно на това в телевизионните студия. Някои приложения, например при видеоконференциите се допускат по-ниска разрешаващата способност с цел намаляване на изискванията към скоростта на предаване на данните. Препоръка H.261 на ITU-TS (International Telecommunication Union – Telecommunication Sector, това е новото име на CCITT - Comite Consultatif International de Telephonie et Telegraphie) дефинира формата CIF (common intermediate format). Той има следните характеристики – 30Hz кадрова честота, 288 реда за кадър и 352 точки на ред за яркостния сигнал и 144 реда за кадър и 176 точки на ред за сигналите на цветовата разлика. Ще отбележим, че при ITU-R 601 броят на редовете е еднакъв за яркостния и цветоразликовите сигнали
 
    H.261 дефинира и формат QCIF (quarter common intermediate format) използващ 144 реда за кадър и 176 точки на ред за яркостния сигнал. Разрешаващата способност е четири пъти по-ниска от тази на CIF.

    Съществува и формат Super-CIF - 576 реда за кадър и 704 точки на ред, чиято разрешаваща способност е много близка до тази на ITU-R 601.

    В рамките на стандарта MPEG (motion pictures expert group) също са дефинирани няколко формата за дигитализиране на видео. Най-общият от тях е SIF (standard interchange format), който е много близък, но все пак се различава от CIF. За яркостния сигнал се снемат 352 точки на ред и 240 (при 30 кадъра или 288 (при 25 кадъра) реда за кадър. За двата цветоразликови сигнала се снемат 176 точки на ред и 120 или 144 реда за кадър.

    В последните години, с цел доближаване на качеството на телевизионното изображение до това на стандартна кинолента, бяха разработени стандарти за телевизия с висока разделителна способност (HDTV - high definition television). Отношението на ширината към височината на кадъра при HDTV е 16:9, докато в традиционната телевизия то е 4:3. Увеличени са също броят на редовете за кадър и броят на точките на ред, а при някои формати и кадровата честота:

    - Висока разрешаваща способност и висока кадрова честота (1920х1080/60) - 1920 точки на ред, 1080 реда за кадър и 60 кадъра;
    - Висока разрешаваща способност и стандартна кадрова честота (1920х1080/30 или 25 кадъра);
    - Подобрена разрешаваща способност и стандартна кадрова честота (1280х720/30 или 25 кадъра).


Съдържание

Мултимедийни обекти- Част 1

Мултимедийни обекти- Част 2

 






Коментирай свободно: