Souhrnné informace tady: http://cmp.felk.cvut.cz/cmp/courses/DZO/Labs/
Tip na text MATLAB array manipulation tips and tricks : http://home.online.no/~pjacklam/matlab/doc/mtt/doc/mtt.pdf
Docela dobrý zdroj informací: Zpracování obrazu a jeho statistická analýza
Průběh zkoušky, požadavky ke zkoušce:
Na písemku se stačí připravit z materiálů zde a to naprosto dostatečně. Během ústní zkoušky se nediskutuje o článku samotném - Prof. Hlaváč v něm „prstem zapíchne“ nějaký pojem, který se váže k předmětu. Nemá tedy smysl moc článek pročítat na pochopení nových metod (článek si ale samozřejmě přečtěte kdyby se náhodou zeptal), ale spíš si najít článek, jehož průnik s předmětem vám nejvíc vyhovuje. Doporučuji články na segmentaci, příjde mi, že je to jedno z nejschůdnějších témat. Pozor, prof. Hlaváč umí chytat na pojmech - kolegovi nedal A, protože mu momentálně vypadl pojem „kriteriální funkce“. Je dobré jít ke zkoušce s obecným přehledem.
Pomozte s vypracováváním
Než začnete s psaním od nuly, podívejte se na:
33DIF na STM-wiki - otázky jsou však místy neúplné a seznam není 100% shodný.
Kdo nemá přístup na STM-wiki: Vypracované otázky z STM-wiki v pdf.
Další zdroje:
E-learning - Celkem schopný zdroj informací
http://webzam.fbmi.cvut.cz/hozman/Zprac_obr_prisp_kurz_UEM_3_2003.pdf - Zakladni metody predzpracovani/zpracovani obrazu (defakto celkovy postup jak se zpracovava/digitalizuje obraz krok za krokem, dobry cteni, srozumitelny a dost se to hodi)
Knížka od Hlaváče, leccos se tam dá dohledat pro upřesnění Hlaváč V., Šonka M.: Počítačové vidění, Grada, Praha, 1992
ZS 2019/20 Pozor, u zkoušky se zmínil, že nějaké otázky vyřadí. Tři otázky již byly přidány:
8. Kolik kvantizačních úrovní zhruba rozliší u monochromatického obrazu zdravý mladý člověk? Co je v obraze patrné, když je kvantizačních úrovní méně, než by mělo být?
Na přednášce prý zaznělo asi 60 odstínů šedi. Nicméně Novinky.cz píší o 500 . Méně úrovní = ostré kontrastní skoky.
15. Proč je algoritmus vzdálenostní transformace tak důležitý v analýze obrazu? Na co se vzdálenostní transformace používá v aplikacích?
Dá se s ním spočítat topologie binárního obrazu. (Případně se dá najít kostra obrázku?) Viz. přednáška na binární morfologii.
16. Vysvětlete tři pojmy: kontrast obrazu, nasycení barevného obrazu, ostrost obrazu.
Kontrast obrazu charakterizuje rozdíl (odlišení) mezi jasem/barvou objektů nebo oblastí v obraze. Například sněžná liška na sněhu má nízký kontrast a tmavý pes na sněhu má vysoký kontrast.
Barevná sytost obrazu je podobná vlastnost jako kontrast s tím, že místo zvětšování odlišnosti objektů/oblastí v šedotónové reprezentaci obrazu, se uvažuje odlišení objektů/oblastí v barevném vyjádření.
Ostrost obrazu je definovaná jako kontrast hran, tj. kontrast podél hran v obraze, tj. ve směru gradientu jasu obrazu. Když zvýšíme ostrost, zvýšíme kontrast jen blízko hran. V málo se měnících částech obrazu hodnotu obrazové funkce neměníme.
1. Jaké jsou rozdíly mezi analýzou obrazu (pocítacovým videním) na jedné strane a pocítacovou grafikou na druhé strane? Uvedte dva príklady, které rozdíly demonstrují.
Dobré vysvětlení: http://majdulenka.webzdarma.cz/UMI/videni.htm
Analýza obrazu
Počítačové vidění
Počítačová grafika
Příklady
2. Interpretace (porozumení) obrazu lze matematicky vyjádrit s využitím prístupu teorie formálních jazyku jako zobrazení: pozorovaná obrazová data → model teorie. Modelem teorie je konkrétní svet, v nemž “teorie” platí. Jedné “teorii” muže odpovídat více ruzných svetu. Interpretaci lze chápat také jako zobrazení: syntax → sémantika. Pri interpretaci je využívána sémantika, tj. znalost o konkrétním svete. V analýze obrazu pocítacem obvykle chápeme, že obrazy predstavují urcité objekty. Uvedte dva praktické príklady úloh zpracování obrazu, v nichž je interpretace využívána. Jak je interpretace v techto úlohách konkrétne využita?
Digitální zpracování obrazu – 2D statický svet, nevyužívá se interpretace obrazových dat (proto jsou do znacné
míry nezávislé na konkrétní aplikacní oblasti). Používají se techniky zpracování signálu.
Pokud ale zpracováváme obraz pro nějakou konkrétní úlohu, víme, co výskyt nějakého elementu nebo jeho tvar a barva znamená.
Interpretace:
- pozorování → model sveta
- syntax → sémantika
Příklady:
- Pohled z okna → {prší, neprší}.
- Jablko na bežícím pásu → {trída 1, trída 2, trída 3}.
- Dopravní scéna → vyhledávání císla auta.
3. Zpracování signálu a nižší úroven digitálního zpracování obrazu typicky neinterpretuje zpracovávaná data. Vysvětlete (nejlépe v matematickém vyjádrení), co to je interpretace. Co interpretace pri zpracování obrazu na jednu stranu prináší a cím použití metod omezuje?
Nižší úroveň = zpracování obrazu
Vyšší úroveň = porozumení obsahu obrazu, pocítacové videní
Porozumění obsahu (interpretace)
- Ve velmi jednoduchém případě můžeme za porozumění považovat klasifikaci objektů v obraze podle jejich
velikosti.
- V obecném případě představuje porozumění interpretaci obrazových dat, o kterých se předem nic
nepředpokládá.
- Porozumění obrazu je potom založeno na znalosti, cílech, tvorbě plánu k jejich dosažení a využití zpětných
vazeb mezi různými úrovněmi zpracování.
Interpretace (porozumění) obrazu lze matematicky vyjádřit s využitím přístupu teorie formálních jazyků jako zobrazení: pozorovaná obrazová data → model teorie. Modelem teorie je konkrétní svět, v němž “teorie” platí. Jedné “teorii” může odpovídat více různých světů. Interpretaci lze chápat také jako zobrazení: syntax → sémantika. Při interpretaci je využívána sémantika, tj. znalost o konkrétním světě. V analýze obrazů počítačem obvykle chápeme, že obrazy představují určité objekty.
4. Proc je porozumení obecným (trojrozmerným) scénám v pocítacovém videní težké? Uvedte nekolik duvodu se strucným komentárem. (V prednášce bylo uvádeno šest duvodu)
5. Lokální a globální zpracování. • Diskutujte strucne rozdíl mezi lokálním a globálním prístupem v analýze obrazu. Uvedte výhody a nevýhody obojího. • Uvedte se strucným komentárem dva príklady lokálních operací. • Uvedte se strucným komentárem dva príklady globálních operací.
Lokalni - Lokalne nejsme schopni vnimat kontext obrazove informace. ten je velmi dulezity. muze dojit ke spatne interpretaci. Nutnost zahrnout interpretaci (již bylo probráno výše). Lokální okno v kontrastu s potrebou globálního pohledu
Globální: známe interpretaci dat jako celku
pravdepodobne jde o slajdy 9-12 z http://cmp.felk.cvut.cz/~hlavac/TeachPresCz/11DigZprObr/01IntroAndDigImageCz.pdf
6. Vysvetlete pojem spojitá obrazová funkce f(x, y) nebo f(x, y, t). Vysvetlete, co jsou parametry x, y, t. Uvedte nekolik príkladu reálných obrazových funkcí sejmutých s pomocí ruzných fyzikálních principu. Hodnota funkce f tedy bude odpovídat ruzným fyzikálním velicinám.
Obraz je chápán intuitivně jako obraz na sítnici oka nebo snímacím čipu fotoaparátu či TV kamery.
Obrazová funkce f(x, y), f(x, y, t) je výsledkem perspektivního zobrazení.
Monochromatický (jednobarevný, mající jen jednu vlnovou délku) statický obraz f(x, y), kde (x, y) jsou souřadnice v rovině s definičním oborem:
R = {(x, y), 1 ≤ x ≤ xm, 1 ≤ y ≤ yn}
f je hodnota obrazové funkce jasu (příp. optické hustotě u průhledných předloh, vzdálenosti od pozorovatele, teplotě v termovizi, atd.).
Obrazová funkce tří proměnných se použije, když se obrazy mění v čase nebo v případě objemových obrazů, např. tomografu.
7. Co je to kvantování obrazu? Jak a v jakém zarízení se kvantování realizuje? Kolik kvantizacních úrovní zhruba rozliší u monochromatického obrazu clovek? Co je v obraze patrné, když je kvantizacních úrovní méne, než by melo být?
Při kvantování rozdělujeme obraz na jasové úrovně. Kvantování je metoda pro zjišťování amplitudy (jasu) jednotlivých vzorků, získaných při vzorkování. Clovek dokaze rozlisit cca 50 urovni kvant - jasu. Pri nedostatku kvantovych urovni jsou v obraze patrne ostre prechody mezi jasovymi urovnemi. V extremu vznikne obraz z cerne a bile barvy.
Kvantizace se provádí vždy, když chceme obraz digitalizovat
8. Uvažujte digitalizaci dvojrozmerného obrazu. Zde se stejne jako pri digitalizaci jednorozmerného signálu stanovuje vzdálenost ekvidistantních vzorku podle Shannonovy vety o vzorkování. Pro dvojrozmerné obrazy je potrebné navíc ke stanovení vzdálenosti mezi vzorky (což se reší podobne jako u jednorozmerného signálu) vyrešit další záležitost. Jakou? Jak se záležitost typicky reší a jaké výhody ci nevýhody tato rešení mají? Poznamenávám, že se neptám na kvantování.
Je potřeba rozhodnout, do jaké vzorkovací mřížky budou vzorky uspořádány.
9. Jaké výhody prináší použití hexagonální mrížky (podobné vcelí plástvi) pri vzorkování obrazu? Proc se taková mrížka nepoužívá ve vetšine digitalizacních karet?
Hexagonální mřížka odstraňuje paradox protínajících se úseček a má stejnou vzdálenost ke všem svým 6 sousedním pixelům.
Nepoužívá se protože je nad ní obtížné provést Fourierovu transformaci.
10. Relace souvislosti mezi dvema pixely binárního digitálního obrazu (tj. existuje mezi nimi cesta) definuje rozklad obrazu (tj. množiny) na trídy ekvivalence (tj. oblasti). Jaké tri vlastnosti musí relace splnovat, aby byla ekvivalencí. Overte platnost techto trí vlastností pro relaci souvislosti.
Aby byla relace souvislosti ekvivalencí musí být:
Reflexivní – jeden bod je vždy souvislý (existuje souvislá cesta délky 0)
Symetrická – pakliže existuje souvislá cesta z bodu A do bodu B, tak existuje samozřejmě i cesta opačná.
Tranzitivní – pokud existuje souvislá cesta z bodu A do bodu B a z bodu B do bodu C, pak můžeme říci že body A a C jsou také souvisle spojené
11. (a) Definujte (i) oblast a (ii) konvexní oblast ve dvojrozmerném obraze. Nakreslete príklad konvexní a nekonvexní oblasti. (b) Definujte konvexní obal. © Pro nekonvexní oblast z bodu (a) zakreslete konvexní obal.
Obrázek ukazuje nekonvexní množinu (R) a její konvexní obal:
Konvexní obal může zároveň posloužit jako příklad konvexní množiny.
12. Vysvetlete v souvislosti s obrazy význam pojmu (a) prostorové rozlišení; (b) spektrální rozlišení; © radiometrické rozlišení a (d) casové rozlišení.
Počet pixelů použitých při konstrukci digitálního obrazu. Je to jakási míra přesnosti nebo detailu. Určuje se v různých jednotkách: počet bodů na pixel, pixelů na řádek, řádků na milimetr. Udává minimální vzdálenost mezi 2 objekty v obrazu a určuje limit přesnosti.
zdroj: http://www.yourdictionary.com/computer/spatial-resolution http://micro.magnet.fsu.edu/primer/java/digitalimaging/processing/spatialresolution/
Barevné obrázky rozlišují světlo různých spekter. Multispektrální obrázky rozlišují jemnější odlišnosti spektra než je potřeba k reprodukci barev. To znamená že mají větší spektrální rozlišení. Spektrální rozlišení udává počet spektrálních pásem v kterých může senzor sbírat údaje o odraženém světle (každý předmět totiž vyzařuje světlo v různém spektrálním pásmu, podle toho pak rozlišujeme například materiál z kterého je předmět tvořen).
zdroj: http://www.gisdevelopment.net/tutorials/tuman005a.htm
Udává například kolik snímku za vteřinu je kamera schopna snímat. Běžné kamery snímají rychlostí 15-30 snímků za sekundu. Vysokorychlostní kamery 100-1000 snímků za sekundu.
zdroj: http://en.wikipedia.org/wiki/Image_resolution
Udává počet digitálních úrovní vyjádřujících data která byla sesbírána senzory. Běžně bývá vyjádřeno počtem bitů potřebných k uložení nejvyšší úrovně (8bit může vyjádřit 256 úrovní). Čím větší rozlišení, tím více jemných rozdílů v intenzitě může být zobrazeno (aspoň teoreticky).
zdroj: http://en.wikipedia.org/wiki/Image_resolution#Radiometric_resolution http://www.gisdevelopment.net/tutorials/tuman005a.htm
Druhá verze (snad nikomu nevadí angličtina, nechci to překládat kvůli možné ztrátě nějaké důležité informace).
spatial resolution is given by the proximity of image samples in the image plane;
spectral resolution is given by the bandwidth of the light frequencies captured by the sensor;
radiometric resolution corresponds to the number of distinguishable gray-levels;
time resolution is given by the interval between time samples at which images are captured.
13. Napište definicní vzorec Shannonovy (též informacní) entropie. Vysvetlete veliciny ve vzorci. K cemu se Shannonova entropie používá? Uvažujte šedotónový obraz. Uvedte alespon dve použití Shannonovy entropie v digitálním zpracování obrazu.
Vzorec a vysvetleni viz. dalsi otazky.
pouziti: napr. pro sledovani jak zavisi obsah informace v obrazu na svetetlnych podminkach, v kterych byly obrazy porizeny (udela se serie obrazu porizenych v ruznych podminkach a porovnava se jejich vypoctena entropie)
14. I když nic nevíme o interpretaci obrazových dat, mužeme merit informacní obsah obrazu Shannonovou entropií. Uvažujte šedotónový obraz. Ukažte, jak spocítat entropii jasových úrovní obrazy s 2b stupni šedi obrazu o rozmeru N × N z histogramu h(i), i = 0, . . . , 2b − 1. Pro jaký histogram bude entropie nejvetší?
Co je entropie? Entropie je intuitivní představa míry neurčitosti systému. Zatímco „ostrá“ rozdělení pravděpodobnosti mají entropii nízkou, naopak „neostrá“ či „rozmazaná“ rozložení pravděpodobnosti mají entropii vysokou. Nepřesně: entropie je veličina udávající „míru neuspořádanosti“.
Entropie bude největší pro histogram s rovnoměrným zastoupením všech odstínů (jejich pravděpodobnosti výskytu budou stejné).
15. Napište definicní vztah pro Shannovovu entropii. Uvažujte šedotónový obrázek. Spocítejte entropii na základe histogramu jasu hi, i = 0, . . . , 255. Ví se, že predzpracováním obrazu se entropie nezvetší. Co musíme udelat, když presto potrebujeme obraz s vetší entropií?
Abychom zvetsili entropii, musime ekvivalizovat (vyvážit) histogram.
16. Pri porizování obrazu trojrozmerného (3D) sveta kamerou se geometrie zobrazení reprezentuje modelem dírkové kamery (tj. perspektivní projekcí), ve kterém se 3D bod (x, y, z) promítne do obrazové roviny jako (x', y'). Nakreslete odpovídající obrázek (stací o dimenzi menší, tj. plošný). Predpokládejte, že znáte 3D souradnice (x, y, z), ohniskovou vzdálenost f, tj. vzdálenost obrazové roviny od stredu promítání. Odvodte vztah pro x'.
(Odvození vychází z podobných trojúhelníků:
17. K cemu slouží optická soustava (predevším objektiv) u fotoaparátu. Popište roli objektivu neformálne z fyzikálního hlediska.
Dírková komora: Sbírá jen málo fotonů (světla). Potíže díky ohybu světla na dírce. Nemá optické vady.
Čočka i fotografický objektiv: Sbírají více fotonů (světla). Musí být zaostřené. Trpí optickými vadami.
Optické soustavy (objektiv) se používají k odstranění optických vad (= aberací).
Hlavní vady: vinětace (přirozená, optická, mechanická), barevné (chromatické) vady, radiální zkreslení.
Radiální zkreslení - velký zoom-faktor objektivu nebo velmi malá ohnisková vzdálenost → výrazné radiální zkreslení, viditelné jako zahnutí přímek zejména na okrajích obrazu, mění se s ohniskovou vzdáleností i zaostřením, extrémní případ objektiv rybí oko.
Vinětace - vada optických soustav, projevující se nižším jasem na okrajích zobrazovaného obrazu. Nejčastěji je tato vada zmiňována v souvislosti s objektivy optických přístrojů.
Příčiny vinětace
Optická soustava (objektiv) soustreduje dopadající energii (fotony) a na snímaci se vytvárí obraz.
Objektiv by mel co nejverneji napodobovat ideální projektivní zobrazování (také perspektivní, stredové, model dírkové komory).
doporucuji procist: http://cs.wikipedia.org/wiki/Objektiv
18. Fungování objektivu fotoaparátu se obvykle na praktické úrovni vysvetluje teorií geometrické optiky. Za jakých predpokladu muže být zjednodušený model geometrické optiky použit? Podotýkám, že složitejší fyzikální model je model vlnové optiky.
Geometrická optika je částí optiky, která se zabývá studiem šíření světla v prostředí, jehož rozměry jsou velké ve srovnání s vlnovou délkou světla. Geometrická optika si tedy nevšímá vlnových vlastností světla.
Aproximace geometrickou optikou je jednou z několika možných aproximací.
Předpoklady:
Jde o hrubou aproximaci, ale geometrická optika je důležitá pro techniku a také je zajímavá z hlediska historického vývoje fyzikálního názoru.
19. Srovnejte na konceptuální úrovni z pohledu fotografování vlastnosti dírkové komory a objektivu složeného z čoček.
Dírková komora (camera obscura) - tmavy prostor s malym otvorem, pres nej vnika do prostoru světlo a obraz se vytvari na protilehle stene. Vetší dírka propustí více svetla, ale rozmaže obrázek. Sbírá jen málo fotonu (svetla). Kvůli ohybu světla na okrajích dírky nelze dosáhnout tak ostrého obrazu jako u čoček, protože i když budeme zmenšovat průměr dírky, od určité velikosti obraz už nebude ostřejší, ale naopak bude neostrý vlivem toho, že velikost dírky bude souměřitelná s vlnovou délkou světla a bude docházet k ohybu světla. Obraz vytvořený pomocí dírkové komory má dokonalé perspektivní podání, protože jde o skutečný středový průmět. U dírkové komory se nijak nezaostřuje, ostrost je prakticky v celém rozsahu vzdáleností stejná.
Více o dírkové komoře: Co je díková komora - Pinhole.cz
Čočky - Hlavní výhoda čoček je, že jsou mnohem světelnější (sbírají více fotonů) Lze pomocí nich také dosáhnout ostřejšího obrazu než pomocí dírkové komory. Ale jsou mnohem složitější, musí řešit mnohé problémy, například to, že světlo různé vlnové délky se láme trochu jinak, to se musí korigovat - více čoček které to vyrovnají. Musí mít antireflexní vrstvy, protože jinak se na každém přechodu sklo-vzduch 3% světla odrazí a to by způsobovalo odrazy a závoj v obraze. Musí být zaostrené.
20. Vysvetlete, co je prirozená vinetace. Projevuje se prirozená vinetace více u normálních objektivu nebo u širokoúhlých objektivu? Zduvodnete (v lepším prípade odvodte), proc k prirozené vinetaci dochází.
Cinitel cos^4 α popisuje systematickou optickou vadu zvanou prirozená vinetace. Figuruje v rovnici ozáření:
Popisuje jev, kdy jsou více zeslabovány paprsky lámající se s vetším úhlem α (dále od optické osy).
Tato chyba je více patrná u širokoúhlých objektivu než u teleobjektivu, protože mají nejširší zorný úhel a přijímají světlo s největšími úhly vůči optické ose.
Jelikož je prirozená vinetace systematickou chybou, lze ji pro radiometricky kalibrovanou kameru kompenzovat.
Dále pak: OPTICKÁ VINETACE
Jelikož optické soustavy mají tlouštku nekolika milimetru až centimetru, nemusí být pro paprsky vstupující do objektivu dostupný celý clonový otvor.
Jev se uplatnuje pri více otevrených clonových otvorech.
MECHANICKÁ VINETACE
Týká se jen nepozorných uživatelu. Vzniká například použitím nevhodné sluneční clony, která zastíní rohy zorného pole objektivu, nebo při použití filtrů s vysokou obroučkou na širokoúhlých objektivech.
21. Vysvetlete, co je to radiální zkreslení objektivu. Jak se v sejmutém obraze projevuje a jak se opravuje?
Radiální zkreslení objektivu je převládající geometrické zkreslení projevující se především u širokoúhlých objektivů. Zakřivení čočky má za následek jev, kdy objekty kolmé na optickou osu se promítnou na paraboloidní plochu (tzv. Petzvalova plocha). Rozlišujeme dva případy - polšrářkové zkreslení a soudkovité zkreslení.
Příčiny:
K odstranění ze sejmuteho obrazu se používá jednoduchá aproximace polynomem sudého stupně (často jen 2).
Odvození potřebných proměnných podává obrázek:
22. Vysvetlete princip telecentrického objektivu. K cemu se používá?
Charakteristickou vlastností telecentrického objektivu je, že průměr jeho vstupní čočky je stejný jako úhlopříčka zorného pole (jejíž velikost se z principu telecentricity se snímací vzdáleností nemění). Tím je docíleno toho, že u takového objektivu nedochází k perspektivnímu zkreslení.
Perspektivní zkreslení je chybou optické soustavy, která se projeví při promítání standardním objektivem. Nepříjemné je hlavně v úlohách měření, neboť velikost obrazu objektu na obrazovém senzoru se mění podle vzdálenosti objektu od kamery.
S výhodou se používá např. pro měření nějakých součástí strojů.
Viz. http://www.strojove-videni.cz/default.asp?inc=inc/tp_optika.htm&id=22 http://www.prumyslove-kamery.cz/clanky-a-aktuality/clanky?pg=441
23. Porovnejte vlastnosti analogových a digitálních kamer.
Analogove kamery
Digitalni kamery
Šum, zrno
Srovnání velikosti běžně používaných senzorů s velikostí filmu. Hrubě platí, že čím větší senzor, tím menší šum v obraze.
24. Vysvetlete pojem hloubka zaostrení u optického objektivu. Jaký (obvykle ovladatelný) parametr objektivu umožnuje menit hloubku zaostrení?
Hloubka ostrosti vysvetluje, proc je možné mírne posunout obrazovou rovinu (v obrazovém prostoru) ve smeru optické osy a mít stále dostatecne zaostrený obraz, a to díky konecné velikosti pixelu na senzoru nebo zrna fotocitlivého materiálu u filmu.
hloubku ostrosti ovlivňují následující faktory:
Hloubka pole udává rozsah vzdáleností od stredu promítání v predmetovém prostoru, v nemž se objekty zobrazují dostatecne zaostrené. Tento parametr je pro fotografa prakticky zajímavý.
Můžeme ji měnit (ovládat) aperturní clonou.
25. Predstavte si, že snímáme 3D scénu, jejíž elementární ploška odráží jistou zári L do CCD kamery. To na jejím svetlocitlivém cipu odpovídá ozárení E, které je prímo úmerné hodnote obrazové funkce f(x, y), tj. jasu (presneji zári). Na jakých vlastnostech elementární plošky a zdroju svetelné energie hodnota f(x, y) pro pevne zvolená x, y závisí?
Zavisi na odrazivosti a pohltivosti plošky, a taky na směru její normály (spekulární a difúzní složka + normála) dále na typu (bodove nebo plošné) a poloze světelného zdroje
Možná sem ještě patří součinitel propustnosti.
26. Vysvetlete pojem “dvojsmerová distribucní funkce obrazu” oznacovaná zkratkou BRDF. K cemu se BRDF používá?
BRDF udává pro urcitý materiál pomer mezi změřenou září L odraženou od povrchu v jistém směru při ozáření E. Vliv fáze záření je pro jednoduchost zanedbán.
Charakterizuje odrazové schopnosti povrchu materiálu v určitém bodě. Je to základní radiometrický koncept, používá se v počítačové grafice pro fotorealistické zobrazování a v počítačovém vidění k řadě inverzních problémů, např. rozpoznání objektů.
27. Jaké odrazivostní vlastnosti má lambertovský povrch? K cemu se zjednodušení odrazivostních vlastností daných lambertovským modelem používá? Uvedte alespon dva príklady použití.
Lambertovský povrch (také ideálně matný, ideálně difúzní povrch) odráží světelnou energii rovnoměrně do všech směrů. Proto je zář (a také jas) ze všech směrů konstantní,
Pro konstantní albedo ρ(λ) (koeficient odrazivosti: vyjadruje, jaký podíl dopadající energie je povrchem odražen zpet do poloprostoru.) lze odrazivost lambertovského povrchu vyjádřit ve tvaru kosinového zákona, z nehoz vychazi, ze pak funkce odrazivosti lambertovského povrchu nezávisí na směru pohledu V.
Lambertovský model odrazivosti je pro svou jednoduchost velmi oblíbený.
Příklady materiálů, jejichž odrazivost lze považovat za lambertovskou s hodnotami odrazivosti ρ(λ) pro λ odpovídající asi středu viditelného spektra.
Bílý piják 0,8. Bílý psací papír 0,68. Bílý strop nebo žlutý papír 0,6. Tmavě hnědý papír 0,14. Tmavý samet 0,004.
pouziti: zjednoduseni BRDF, pokud je povrch idealne zrcadlici, lambertovsky ci jejich kombinace
28. Co reší v radiometrii rovnice ozárení? Zkuste úlohu formulovat (asi Vám pomuže, když si nakreslíte obrázek a oznacíte v nem veliciny) a naznacit myšlenky odvození (vzorce nejsou nezbytne nutné).
udává, jaké je ozáření E obrazového senzoru vyvolané září L na povrchu pozorované scény
(d je průměr čočky) (Celé odvození je v přednášce Digitální zpracování obrazu nebo počítačové vidění, digitální obraz - http://cmp.felk.cvut.cz/~hlavac/TeachPresCz/11DigZprObr/02ImageFormationCz.pdf - na slajdech 12-16)
Případný obrázek by mohl vypadat nějak takhle:
Hledáme vztah mezi ozárením E dopadajícím na senzor v obrazové rovine v závislosti na zári L v pozorované scéne.
29. Charakterizujte predzpracování obrazu. Co je vstupem a výstupem predzpracování obrazu. K cemu predzpracování obrazu slouží? Uvedte tri príklady použití metod predzpracování.
Obrázky (fotografie), které vidíme jako výsledek po vyfocení na svém monitoru nebo fotografii, jsou obrazy fotografované scény na níž jsou aplikováné určité deformace díky nedokonalosti CCD čipů (ostatních snímacích zařízení), šumu prostředí, nežádoucího pootočení obrazu, či jeho prostorové deformace. To, jak nejlépe odstranit tyto nežádoucí efekty, souvisí s tím, jak dobře odhadneme operátor těchto degradací. Naším úkolem je tedy najít inverzní operaci, abychom zpětně z vyfocené fotky získali původní správný obraz.
Vstupem je obraz, výstupem je obraz.
Príklady použití metod predzpracování:
30. Charakterizujte dvojrozmernou konvoluci. K cemu se dvojrozmerná konvoluce používá v digitálním zpracováním obrazu?
Místo původní spojité obrazové funkce f(x, y) známe její vzorkovanou verzi g(x, y). Dvojrozměrná (2D) konvoluce mění hodnotu pixelu na daných souřadnicích (x,y) pomocí příspěvků jednotlivých pixelů v okolí O. Tyto příspěvky jsou váženy v lineární kombinaci koeficienty h podle rovnice:
h je konvoluční jádro, též konvoluční maska.
Pomocí konvolučních jader lze definovat filtry provádějící:
z wikipedie (vice „lidsky“ vysvetleni): V případě diskrétní konvoluce lze jádro chápat jako tabulku (konvoluční maska), kterou položíme na příslušné místo obrazu. Každý pixel překrytý tabulkou vynásobíme koeficientem v příslušné buňce a provedeme součet všech těchto hodnot. Tím dostaneme jeden nový pixel. Například mějme konvoluční masku o rozměru 3×3 (bude překryto 9 pixelů) a všechny buňky mají koeficient 0,11 (1/9). Nový pixel, který vypočteme po aplikaci na jedno místo v původním obraze, tedy bude průměrem z devíti okolních pixelů. Neudělali jsme totiž nic jiného, než že jsme sečetli hodnoty 9 pixelů a vydělili 9. Pokud aplikujeme konvoluci na celý obraz, pak dostaneme rozostřený obraz. Pokud použijeme větší konvoluční masku 5×5 s koeficienty 1/25, pak bude obraz rozostřen více. Koeficienty uvnitř konvoluční masky udávají vliv hodnoty pixelu pod nimi. Lze tak nadefinovat velké množství operací např. derivace obrazu (u diskrétního obrazu mluvíme o tzv. odhadu derivace), tedy zvýraznění hran. (viz detekce hran)
31. Zapište vztah pro vyhlazování histogramu hi, i = 0, . . . , 255 pomocí klouzavého prumeru pro okno o šírce 2K + 1 s reprezentativní hodnotou okna uprostred.
32. Jakými metodami predzpracování obrazu zvýšíte kontrast obrazu pro pozorovatele, máte-li k dispozici práve tento jediný obraz. Uvedte alespon dve možnosti.
kdyz barva lezi mimo rozsah …
1. Perceptuální metoda – pokouší se zachovat celkový barevný vjem. Vhodné pro obrazy, kde mnoho barev leží mimo barevný rozsah.
2. Metoda sytosti (saturation) – uprednostnuje živé barvy, aniž hledí na presnost. Hodí se pro umelé obrázky, obchodní grafiku, digitální modely terénu, atd.
3. Relativní kolorimetrická metoda – využívá skutecnosti, že lidské videní se vždy adaptuje na bílou. Zámer prevede zdrojovou bílou na cílovou bílou (napr. nažloutlou papíru), barvy uvnitr barevného rozsahu zobrazí presne a barvy vne zobrazí jako nejbližší odstín. Pro fotografie je lepší než “perceptuální”.
4. Absolutní kolorimetrická metoda – liší se od predchozího tím, ze se ve výstupním barevném prostoru snaží simulovat bílou vstupního prostoru. Hodí se pro overování budoucího tisku na jiném zarízení, napr. monitoru
No mne sa toto nezda, tieto metody suvisia s prevodom mdezi farebnymi profilmi a nie s upravou kontrastu. Ja by som tam napisal skor ako ekvalizacia histogramu, normalizacia histogramu alebo aplikacia S krivky.
33. Napište definicní vztah pro prímou a invezní jednorozmernou Fourierovu transformaci. Vyjádrete neformálne princip a význam Fourierovy transformace.
Fourierova transformace je vyjádření časově závislého signálu pomocí harmonických signálů, tj. funkcí sin a cos, obecně tedy funkce komplexní exponenciály. Slouží pro převod signálů z časové oblasti do oblasti frekvenční. Signál může být buď ve spojitém či diskrétním čase.
Každá 1D funkce se dá vyjádřit jako vážený součet (integrál) mnoha komplexních exponenciál (a díky Eulerově vztahu také jako suma sinusovek a kosinusovek).
Doporučuji pročíst: http://homepages.inf.ed.ac.uk/rbf/HIPR2/fourier.htm
34. Jaká je asymptotická výpocetní složitost jednorozmerné Fourierovy transformace. Použijte znacení ‘velké O’ v závislosti na délce n vstupního diskrétního signálu (posloupnosti).
Výpocetni složitost je O(N^2).
35. Vysvetlete, co je dvojrozmerná Fourierova transformace, její rozdíl od jednorozmerné (mužete definicním vzorcem nebo neformálne). Jak se dvojrozmerná Fourierova transformace používá ve zpracování obrazu.
Fourierova transformace lze zevšeobecnit do vyšších dimenzí. Například, mnoho signálů jsou funkce 2D prostoru vymezeného nad rovinou xy. 2-dimensionalni Fourierova transformace má také čtyři různé formy v závislosti na tom, zda 2D signálu je periodické a diskrétní. Myšlenka: Obrazová funkce f(x, y) se rozloží na lineární kombinaci harmonických (sínusovek, kosínusovek, obecneji ortonormálních) funkcí.
další definice: Dvojrozměrná Fourierova transformace umožňuje převést rozložení obrazových intenzit f(x, y) vyhodnocovaného obrazu na obraz prostorových frekvencí F(u, v).
Definice prímé transformace. u, v jsou prostorové frekvence:
2D FT se používá při zpracování obrazů, filtraci, rekonstrukci, kompresi atd…
36. Vztah mezi šírkou frekvencního spektra ve Fourierove transformaci a dobou trvání jednorozmerného signálu je dán (Heisenbergovým) principem nejistoty. Formulujte neformálne princip a vysvetlete jeho význam pro frekvencní analýzu ve zpracování signálu (obrazu).
Všechny dvojice (časový signál ↔ Fourierův obraz) jsou vázány principem nejistoty.
Znamená to, že signál o krátké době trvání má široké frekvenční spektrum a obráceně.
(trvání signálu) · (šířka spektra) >= 1 / π
Pozorování: Gaussián e^(−t^2) má nejmenší součin mezi trváním a šířkou spektra (optimum).
37. Fourierova transformace je definována pro periodické signály. Mnohé praktické signály, s nimiž bežne pracujeme, jsou neperiodické. Nazvete a neformálne vysvetlete dva prístupy, které se zde obvykle používají.
POZOR: Pouhé rozsekání signálu na obdélníková okna není dobré, protože na rozhraní oken jsou nespojitosti. Ty se ve spektru projeví nežádoucími vysokými frekvencemi. Proto se signál obvykle konvoluje s tlumící váhovou funkcí, obvykle Gaussián nebo Hammingova funkce, zajištující nulovou hodnotu signálu na okraji a vne okna.
38. Vyjádrete vetu o konvoluci, tj. jak je konvoluce vyjádrena ve Fourierove transformaci. Pro jednoduchost
uvažujte jednorozmerný prípad.
Spravna odpoved je:
Oznacme T(f) ze je Fourierova transformace.
Oznacme f x g ze je konvoluce.
Veta o konvoluci rika:
T(f x g) = T(f)T(g) a naopak T(fg) = T(f) x T(g)
neco o pouziti fourierovy transformace ke konvoluci tady http://www-structmed.cimr.cam.ac.uk/Course/Convolution/convolution.html
Konvoluce (ve funkcionální analýze) je operace na dvou funkcích f a h, která vytvorí tretí funkci (f * h), která
se používá jako modifikace jedné ze vstupních funkcí.
Konvoluce je integrál “míchající” hodnoty dvou funkcí, a to funkce h(t), která je posouvána a prekrývá se s
funkcí f(t) nebo obráceně.
Uvažujme nejdříve spojitý případ s obecnými nekonečnými mezemi:
Konvoluce se často používá při algoritmech zpracování dvourozměrného diskrétního obrazu v počítačové
grafice. V případě diskrétní konvoluce lze jádro chápat jako tabulku (konvoluční maska), kterou položíme na
příslušné místo obrazu. Každý pixel překrytý tabulkou vynásobíme koeficientem v příslušné buňce a provedeme
součet všech těchto hodnot. Tím dostaneme jeden nový pixel.
Princip diskrétní dvourozměrné konvoluce
Například mějme konvoluční masku o rozměru 3×3 (bude překryto 9 pixelů) a všechny buňky mají koeficient
0,11 (1/9). Nový pixel, který vypočteme po aplikaci na jedno místo v původním obraze, tedy bude průměrem z
devíti okolních pixelů. Neudělali jsme totiž nic jiného, než že jsme sečetli hodnoty 9 pixelů a vydělili 9. Pokud
aplikujeme konvoluci na celý obraz, pak dostaneme rozostřený obraz. Pokud použijeme větší konvoluční masku
5×5 s koeficienty 1/25, pak bude obraz rozostřen více.
Koeficienty uvnitř konvoluční masky udávají vliv hodnoty pixelu pod nimi. Lze tak nadefinovat velké množství operací např. derivace obrazu (u diskrétního obrazu mluvíme o tzv. odhadu derivace), tedy zvýraznění hran.
39. Jaká je výpocetní složitost diskrétní Fourierovy transformace pro dvojrozmerný obraz o velikosti N × N pokud byste v algoritmu použili prímo definicní vztah? Pripomínám, že asymptotický odhad algoritmické složitosti se zapisuje formou O(.), kde se v argumentu v našem prípade bude vyskytovat výraz obsahující N. Na multiplikativní a aditivní konstanty se nebude brát zretel.
O(N^2)
Já bych řekl, že pokud O(N^2) je složitost pro 1D, tak pro 2D transformaci to bude spíš O(N^4), ne?
Bohužel hoši, ani jeden z vás to nemá dobře… Je to totiž O(N^3). Vychází to z toho, že 2D DFT se dá přepsat jako součet přes všechny řádky z 1D DFT každého řádku, tedy N^2 za 1D DFT, která se provede N krát→obecně počet řádků se nemusí rovnat počet sloupců pak složitost je O(N^2*M) nebo O(M^2*N), co se nám bude víc hodit. Radek Svoboda
40. K urychlení diskrétní Fourierovy transformace byl pred více než padesáti lety navržen algoritmus rychlé Fourierovy transformace (FFT). Jaký je jeho princip? Jsou nejaká omezení na velikost vstupního 2D obrazu?
Rychlá Fourierova transformace (Fast Fourier transform, zkratkou FFT) je efektivní algoritmus pro spočtení diskrétní Fourierovy transformace (DFT) a její inverze. FFT je velmi důležitá v mnoha oblastech, od digitálního zpracování signálu a řešení parciálních diferenciálních rovnic až po rychlé násobení velkých celých čísel.
FFT naproti tomu poskytuje pouze O(N log N) operací. Obecně jsou FFT algoritmy založeny na faktorizaci N, nicméně existují i FFT algoritmy se složitostí O(N log N) pro všechna N, tedy i pro prvočísla.
Ze zdroje http://bartipan.net/zvi/fft.pdf : Princip urychlení spočívá v rozkladu posloupnosti na podposloupnosti s lichými a sudými prvky původní posloupnosti. Koeficienty Fourierovy transformace se vypočtou z Fourierových transformací vzniklých podposloupností. Tento rozklad posloupností na podposloupnosti lze provádět rekurzivně, dokud nezískáme podposloupnost obsahující jen jeden prvek. Koeficient Fourierovy transformace této podposloupnosti je sám tento prvek. Abychom bez problémů mohli rekurzivně rozkládat posloupnosti, je třeba, aby signál, který chceme transformovat, měl právě 2^n vzorků.
Motýlkový algoritmus Samotné skládání jednotlivých podposlouností provádí specializovaný algoritmus tzv. Motýlkový algoritmus. Ten provádí postupné skládání prvků z liché a sudé posloupnosti do dvou po sobě jdoucí prvků nové posloupnosti.
Omezení pro vstupní obraz Obrázek musí být před FFT transformován tak aby počet řádků a sloupců byl mocninou 2. A to například „scalováním“ obrázku do nejbližší mocniny 2.
41. Jaká je algoritmická složitost algoritmu FFT pro dvojrozmerný obraz o velikosti N × N?
O(n log2 n)
Bohužel opět špatně. Tentokrát se N-krát použije 1D FFT s O(NlogN), správná odpověď je tedy O(N^2logN). Radek Svoboda
42. Formulujte Shannonovu (též Nyquistovu, Kotelnikovu) vetu o vzorkování pro jednodušší prípad jednorozmerného signálu. Vysvetlete (stací neformálne, obrázek pomuže), jak se veta o vzorkování dokazuje (nápoveda: frekvencní spektra).
Přesná rekonstrukce spojitého, frekvenčně omezeného signálu z jeho vzorků je možná tehdy, pokud byl vzorkován frekvencí alespoň dvakrát vyšší než je maximální frekvence rekonstruovaného signálu.
V praxi se tedy vzorkovací frekvence volí dvakrát větší plus ještě nějaká rezerva než je maximální požadovaná přenášená frekvence. V telekomunikacích je to např. 8 kHz neboť je třeba přenášet pouze signály ve standardním telefonním pásmu (od 0,3 do 3,4 kHz zaokrouhleno směrem nahoru 4 kHz). Například u záznamu na CD je to zas 44,1 kHz neboť zdravé lidské ucho slyší maximálně cca do 20 kHz a tudíž vzorkovací frekvence 44,1 kHz byla zvolena s velkou rezervou.
V případě použití nižší vzorkovací frekvence může dojít k tzv. aliasingu, kdy rekonstruovaný signál je výrazně odlišný od původního vzorkovaného signálu.
Dokazuje je to napriklad tento obrázek, kde je v prvním případě vzorkovací frevence nižší.
http://apollo.lsc.vsc.edu/classes/remote/lecture_notes/radar/doppler/graphics/nyquist.free.gif
aliasing v pohledu spekter … viz. wikina http://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem
43. Proc analogové televizní normy jako evropská PAL nebo americká, japonská NTSC používají prokládané rádkování?
Luminofor katodovych obrazovek ma kratkou dobu dosvitu a kratce za paprskem pohasíná. Člověk tak při nízkých kmitočtech vnímá takový obraz jako nepříjemné blikání. Protože z různých důvodů (šířka pásma apod.) nebylo možné jednoduše zvýšit snímkovou frekvenci, bylo zavedeno prokládané řádkování. Obraz je snímán, přenášen a zobrazován po tzv. půlsnímcích (nejprve liché řádky, pak sudé). Tím se snímková frekvence „jakoby“ zdvojnásobí, celkový počet řádků na snímek (a tím celkové rozlišení ve svislém směru) se však nemění.
44. (a) Televizní signál o 50 pulsnímcích za sekundu je vzorkován do matice 500 × 500 pixelu ve 256 jasových úrovních. Vypoctete nejmenší vzorkovací frekvenci (v kHz), kterou musí být signál v digitalizacní karte (angl. frame grabber) vzorkován? (b) Jak se jmenuje veta, podle které jste výpocet realizovali? Naznacte myšlenku jejího odvození (stací úvaha, vzorce nejsou nezbytne nutné).
Mělo by to být něco jako: 2*500*500*50/2 = 12,5 * 10^6 Hz = 12,5 MHz
Na začátku je 2, protože Shannonův theorém říká: Vzorkovací frekvence > 2 krát maximální frekvence v signálu, 500*500 je velikost matice, 50/2 - 50 půlsnímků.
!!!!!!! Ale nevím, jestli je to dobře, pokud někdo víte líp, hoďte to sem !!!!!!!
45. Na obrázku je vlevo uveden vstupní intenzitní obraz a vpravo jeho Fourierovo frekvencní spektrum vyjádreno jako intenzitní obraz - tmavé pixely odpovídají vysokým spektrálním hodnotám. Ve spektru jsou patrné dva tmavé kríže. První výraznejší se kryje se svislým a vodorovným smerem. Druhý méne výrazný kríž je proti výraznému kríži mírne pootocen proti smeru hodinových rucicek. Vysvetlete, jakým jevum v intenzitním obrázku kríže odpovídají.
Obrázky ze zadání:
Kříže jsou způsobeny nespojitostí na okrajích obrázku, protože se předpokládá periodicita (rozložíme obrazky vedle sebe, aby na sebe navazovali, u obrázku hradčan je pak patrné, že na okrajích je nespojitost, u textury by to vypadalo jinak).
Muj nazor na krize: Ta vertikalni linka je IMO zpusobena vodorovnou linii ve spodni casti obrazku (okap a stin pod nim vytvareji vyraznou linku). Tu mene patrnou vodorovnou caru bych prirovnal ke tem vezim (jsou svysle, ale ne jako cary, spis se rozbihaji do trojuhelniku, proto ta odezva ve frekvencnim spektru neni tak tenka jako v pripade okapu). Tu mirne pootocenou caru bych prirovnal k te casti zhruba uprostred obrazku, je tam videt sikma linie tvorena stinem na strese, je tam dosti viditelny jasovy skok. - To co si napsal je uplná 3.14čovina…
Berte to s rezervou, jsou to moje postrehy po nastudovani a precteni mnoha clanku o fourierovce v obrazu (stale ji moc nerozumim btw :D).
46. Lineární ortogonální integrální transformace se s výhodou používají pro reprezentaci signálu a obrazu (napr. Fourierova, kosínová, metoda hlavních smeru) a pro jejich zpracování. Vysvetlete jaký je princip techto metod. Zminte dva príklady použití.
Princip spočívá v tom, že se při analýze obrazu nepracuje s jednotlivými pixely, ale s celým obrázkem najednou. Využívá se přitom integrálních transformací dat, kterým se přiřazují pomocí definované báze jiná data (tzv. spektrum), ve kterých jednotlivé pixely odrážejí různé vlastnosti (definované bází) celého původního obrazu. Pokud je transformace ortogonální, lze pomocí inverzní báze dat získat integrální transformací původní data. Velmi často tvoří bázi diskrétní periodické funkce (např. při 2D harmonické analýze) nebo diskrétní prostorově omezené funkce (tzv. wavelety).
Použití:
47. Pripustme, že chceme obnovit obraz zkreslený napr. rozmazáním pohybem metodami restaurace obrazu. Necht je degradace modelována konvolucí známou funkcí H(u, v), kde u, v jsou prostorové frekvence ve Fourierove transformaci. Za predpokladu, že umíme odhadnout statistické vlastnosti aditivního sumu lze pro obnovení obrazu použít inverzní nebo Wieneruv filtr. Formulujte obe metody, vysvetlete neformálne jejich princip a diskutujte podmínky pro jejich praktické použití.
Obecna degradace obrazku vypada takto:
kde G je degradovaný obrázek, F originální obrázek, H degradační funkce a N je frekvenční spektrum aditivniho šumu.
Inverzní filtrace se poté provádí takto:
coz je vyjádření F z původní rovnice.
Inverzní operace:
- Pracuje spolehlivě pro obrazy, které nejsou zatíženy šumem.
- Pokud šum není zanedbatelný, projeví se ve vztahu aditivní chyba, která se
uplatňuje pro frekvence, kde má inverzní filtr malou amplitudu.
- To většinou nastává pro vysoké frekvence, a proto obraz obnovený inverzním
filtrem má rozmazané ostré hrany.
- Také změny velikosti amplitudy šumu v obrazu se projeví negativně na
výsledku.
- Lékem bývá použít inverzní filtraci v takovém okolí počátku roviny u, v, kde
H(u, v) spolehlivě dominuje. Výsledek bývá obvykle použitelný.
Wierneruv filtr
- Pracuje pro nezanedbatelný šum, který má odhadnutelné statistické vlastnosti (nezávislost šumu na signálu, stacionarita v širším smyslu). - Nechť f je správný (ale nepozorovatelný) obraz, g je pozorovaný degradovaný obraz a f' je odhad správného obrazu. - Úloha se vyjádří jako optimalizace řešením přeurčené soustavy lineárních rovnic minimalizujících středněkvadratickou chybu
kde E (epsilon) označuje operátor střední hodnoty.
vice infa k: inverzni filtraci http://www.owlnet.rice.edu/~elec539/Projects99/BACH/proj2/inverse.html http://blogs.mathworks.com/steve/2007/08/13/image-deblurring-introduction/ wienerove filtraci http://www.owlnet.rice.edu/~elec539/Projects99/BACH/proj2/wiener.html http://blogs.mathworks.com/steve/2007/11/02/image-deblurring-wiener-filter/
48. Vysvetlete princip Wienerova filtru (stací slovne). Jaké charakteristiky šumu a signálu musí být odhadnutelné, abychom mohli Wieneruv filtr použít? * Je Wieneruv filtr lineární? * Necht N(u, v) je Fourieruv obraz aditivního šumu. Inverzní filtr, který je speciálním prípadem Wienerova filtru, restauruje vstupní degradovaný obraz G(u,v) podle vztahu F(u, v) = G(u, v)H^−1(u, v) − N(u, v)H^−1(u, v) . Clen odecítaný na pravé strane rovnice zpusobuje problémy, které nakonec v mnoha praktických prípadech nutí k použití obecnejšího Wienerova filtru. Vysvetlete, o jaké problémy se jedná.
Pro rovnici:
49. Metody obnovení (restaurace) obrazu pro specifické degradace (napr. rozmazání pohybem, rozostrení objektivu, turbulenci atmosféry) a aditivní šum se opírají o model poruchy popsatelný lineární integrální transformací. Porucha je vyjádrena jako konvolucní jádro h(x, y) pokrývající celý obrázek, kde x, y jsou souradnice v obraze. Po prevodu do prostoru frekvencí Fourierovu transformací poruše odpovídá filtr H(u, v), kde u, v jsou prostorové frekvence. Necht je G(u, v) Fourieruv obraz pozorovatelného obrazu zatíženého poruchami. Necht je F(u, v) je odhad obrazu bez poruch, který se má obnovením získat. Necht v(x, y) je aditivní šum statisticky nezávislý na obraze a jeho frekvencní spektrum je N(u, v). (a) Napište vztah pro výpocet F(u, v) inverzní filtrací ve frekvencní oblasti. (b) Za urcitých podmínek je s inverzní filtrací potíž. Za jaké situace nelze prímo použít inverzní filtraci a použije se složitejší statistická Wienerova filtrace?
50. Roztridte metody predzpracování obrazu do ctyr skupin podle velikosti zpracovávaného okolí práve zpracovávaného pixelu. U každé skupiny uvedte alespon jeden príklad.
Bodové okolí
Transformace jasové stupnice (stejné pro všechny pixely)
Jasové korekce (okamžitý pixel)
Geometrické transformace (teoreticky okamžitý pixel, ale prakticky malé okolí)
Lokální okolí
Lokální filtrace (malé okolí)
Globální okolí
Fourierova transformace (celý obraz)
Restaurace obrazu (celý obraz)
51. Vysvetlete princip jasových korekcí (obvykle se používají k odstranení systematických vad pri snímání obrazu), když se uvažuje multiplikativní model poruchy. Vyjádrete matematicky.
Správná hodnota jasu f (i,j) se odhaduje pro každý pixel obrazu z náhodné populace tvořené pixely v téže pozici ve všech vstupních obrazech gk (i, j) např. obyčejným průměrováním,
n .. pocet dostupnych obrazku g
http://cmp.felk.cvut.cz/~hlavac/TeachPresCz/11DigZprObr/18BrightGeomTxCz.pdf (slajd 13)
Odpovidate na jinou otazku, spravna odpoved by mela byt o etalonu, kdy pred vlastnim merenim si nasnimam obraz o znamem jasu a pak ten odecitam od testovanych snimku…
52. Pro vyjádrení afinních geometrických transformací obrazu se s výhodou využívají homogenní souradnice. Vysvetlete, co jsou homogenní souradnice. Jakou výhodu pro vyjádrení afinních geometrických transformací prinášejí. (nápoveda: vzpomente si na jazyk pro popis stránky PostScript).
Homogenní souřadnice umožnují reprezentovat veškeré grafické operace jako násobení matic.
Základní myšlenkou je reprezentovat bod ve vektorovém prostoru o jednu dimenzi vetším.
Poloha libovolného bodu uvnitř nějaké souřadné soustavy je v systému homogenních souřadnic charakterizována vektorem [x, y, z, 1]^T. Základní úlohou je zjištění polohy bodu ve dvou vzájemně pootočených a posunutých soustavách. Označíme-li polohu libovolného bodu v základní soustavě jako vektor r0, a polohu bodu v pootočené a posunuté soustavě jako vektor rv, platí následující vztah: r0 = T . rv , kde rv=[xv, yv, zv, 1]^T ; r0=[x0, y0, z0, 1]^T jsou vektory souřadnic daného bodu v posunutém a základním souřadnicovém systému. T je matice homogenní transformace.
Geometrické transformace - reprezentace pomocí homogenních souradnic ⇒ lineární transformace vyjádrená maticemi.
53. Vysvetlete myšlenku ekvalizace histogramu. K cemu se ekvalizace histogramu používá ve zpracování obrazu?
po ekvalizaci budou jednotlive hodnoty histogramu dal od sebe (vzniknou mezery)
Cílem je:
54. Vysvetlete, proc ekvalizovaný histogram diskrétního obrazu není obvykle plochý? V ideálním prípade bychom to ocekávali.
Není plochý, protože se počítá z diskretních hodnot (počítaný pomocí sum). Ideálně rovnoměrný by byl v případě spojitých dat (počítaný přes integrály).
55. Obecne formulovaná transformace jasové stupnice T nahradí vstupní jas p novým jasem q = T(p). Predpokládejme obvyklý 8 bitový šedotónový obraz. Bude pocet jasových úrovní ve výstupním obraze vždy stejný, jako ve vstupním obraze? Vysvetlete a uvedte príklady.
Jasova transformace funguje pomoci transformacni tabulky, kdy jedna hodnota jasu je nahrazena jinou.
Počet použitých jasových úrovní nemusí být shodný, jedním názorným příkladem je prahování, kdy do určité hodnoty jasu jsou pixeli nahrazeny např. nulou a zbylé jedničkou. Dalším příkladem tentokrát se zachováním počtu úrovní může být inverze jasu pixelů.
56. Uvažujte šedotónový obrázek. Ekvalizace histogramu se využívá pro zvýšení kontrastu lepším využitím jasové stupnice. Zvyšuje ekvalizace histogramu množství informace v obrazu, pokud bychom množství informace merili Shannonovou entropií? Vysvetlete a uvedte príklady.
Podle teorie informace, obraz s vyrovnaným histogramem by měl nést více informací než jakýkoliv jiný dosud vytvořený obrázek, protože obsahuje největší variaci (rozptyl) pro daný počet tříd.
–Tohle se mi silně nezdá, protože ekvalizaci zpravidla provádíme tak, že, velmi vágně formulováno, sloupce histogramu rozmístíme po celém rozsahu histogramu, ale jejich počet i výška zůstanou stejné. Podle mě se entropie ekvalizací histrogramu nezmění.
57. Necht je geometrická transformace (zahrnující zmenu merítka, rotaci, posun a zkosení) v rovine popsána afinním vztahem
a) Kolik nejméne vlícovacích bodu potrebujete znát, chcete-li spocítat koeficienty afinní transformace (1). b) V praxi se obvykle použije více vlícovacích bodu, což bude odpovídat preurcené soustave rovnic (1). Proc se používá nadbytecný pocet vlícovacích bodu? c) Jakou metodou se obvykle preurcená soustava rovnic reší?
INFO: Geometrické transformace jsou jedněmi z nejčastěji používaných operací v počítačové grafice. Mezi afinní operace patří posunutí, otáčení, změna měřítka, zkosení a operace vzniklé jejich skládáním.
58. Pri geometrických transformacích diskrétních obrazu je nutné aproximovat hodnotu obrazové funkce f(x, y). Proc? Uvedte alespon dve metody pro takovou aproximaci (nejlépe obrázkem, vzorcem . . . ).
Aproximace jasové funkce hledá celočíselnou hodnotu jasu na celočíselné pozici, která nejlépe odpovídá nově
vypocítané neceločíselné poloze x0, y0. Obvykle se x0 = Tx(x, y), y0 = Ty(x, y) aproximuje polynomem m-tého
stupne.
Aproximace jasové funkce - transformované souradnice x0, y0 leží mimo rastr. Máme jen informaci o vstupním
obraze f(x, y) v celocíselných vzorcích. Principiálně správnou odpověď poskytuje teorie aproximace. Ze vzorku
odhadneme spojitou funkci. Obvykle se aproximuje polynomem. Aproximuje se jas ve vstupním obraze, který
odpovídá jasu hledaného bodu x0, y0 ve výstupní mrížce. Souřadnice bodu (x, y) ve vstupním obraze lze
vypočítat invertováním vztahu (x0, y0) = T(x, y), tj. (x, y) = T−1 (x0, y0).
Metody:
59. Vysvetlete princip interpolace jasu po geometrické transformaci metodou nejbližšího souseda a lineární interpolací.
Po geometrické transformaci nemusí vycházet body ve místě odpovídajícím mřížce nového obrázku (jinak řečeno, po transformaci vyjdou souřadníce v reálných číslech, ale mřížku máme v celých číslech), poté k vyjádření hodnoty jasu v místě využíváme různé interpolační metody (popsány jen dvě):
60. Uvažujte filtraci náhodného aditivního šumu v obraze. Odhad správné hodnoty se muže pocítat jako aritmetický prumer n zašumených hodnot. Kolikrát se po filtraci zmenší hodnota šumu vyjádrená smerodatnou odchylkou o? Vysvetlete, jaký je statistický princip poklesu šumu (nápoveda: centrální limitní veta).
Statistický princip filtrace šumu - necht je každý pixel obrazu zatížen náhodným aditivním šumem:
Mejme i realizací, i = 1, … n. Odhad správné hodnoty je:
(g1 + … + gn)/n + (v1 + … + vn)/n
Výsledkem je náhodná velicina s μ' = 0 a sigma' = sigma/odmocnina(n).
Centrální limitní věta v teorii pravděpodobnosti označuje tvrzení, podle něhož se (za určitých podmínek diskutovaných níže) rozdělení výběrového průměru po vhodné normalizaci blíží k normálnímu rozdělení.
61. Lze filtrovat šum v obraze obycejným prumerováním z napr. 21 vzorku, aniž by byl obraz po filtraci rozmazaný? Pokud ano, jak?
Vyhlazování z více obrazu bez rozmazání - predpoklady: n obrazu téže nemenné scény, u nichž lze predpokládat náhodné poruchy nezávislé na signálu.
Správné hodnota jasu: f(i, j) se odhaduje pro každý pixel obrazu z náhodné populace tvorené pixely v téže pozici ve všech vstupních obrazech gk(i, j) napr. obycejným prumerováním. Príklad: Potlacení tepelného šumu kamery u presných merení. Typicky se správná hodnota odhaduje asi z 50 obrazu.
Pokud filtrujeme jen z jednoho obrazu, hodnotu jasu mužeme opravit na základe analýzy bodu v okolí. Použije se typický reprezentant z okolí nebo kombinace nekolika hodnot. Vzniká však problém rozmazávání na jasových prechodech.
doporucuji procist: http://www.cambridgeincolour.com/techniques/image-averaging-noise.htm
62. Obrázek sejmutý bežnou analogovou CCD kamerou v nižší cenové hladine bývá zatížen šumem, který lze zhruba modelovat jako aditivní a statisticky nezávislý na signálu. Jeho prícinou je cástecne tepelný šum na cipu, fluktuace v polovodici, indukované rušivé signály na kabelu, útlum vysokých frekvencí v kabelu, atd. Nekteré vlivy potlacují a jiné zduraznují vysoké frekvence. V praxi se tento šum casto odstranuje lineární filtrací. Jeden z techto vlivu je ovšem obvykle dominantní. Který to bude? Odstraní se poruchy filtrem typu (a) horní propust nebo (b) dolní propust? (vyberte jednu z možností)
Dominantní je tepelný šum na čipu a takto vzniklé poruchy lze odstranit použitím filtru typu dolní propust. Tedy béé je správně. Doufejme.
rozdily mezi dolni a horni propusti: http://local.wasp.uwa.edu.au/~pbourke/miscellaneous/imagefilter/
o pricinach sumu tady: http://www.fotoaparat.cz/article/7193/1
63. Na obrázku je výrez obrazové funkce. Tucne je ohraniceno okolí, ve kterém se má vypocítat filtrovaná hodnota, tj. filtracní maska. Vypoctete filtrované hodnoty (a) pri vyhlazování obycejným prumerováním a (b) mediánovou filtrací pro práve zpracovávaný pixel ležící ve stredu filtracní masky.
Tak asi (a) soucet / pocet pixelu = 52 / 13 (b) seradit a vybrat prostredni prvek = 1
neco o medianovem filtru: http://en.wikipedia.org/wiki/Median_filter
64. Uvažujte filtraci šumu v obraze realizovanou konvolucí s maskou rozmeru 11 x 11, která aproximuje gaussovský filtr. Jedná se o lineární operaci? Zkuste své rozhodnutí matematicky zduvodnit.
Ano, jedná se o lineární operaci.
http://en.wikipedia.org/wiki/Gaussian_filter (je v kategorii Linear filters, nicméně to není moc matematické zdůvodnění)
65. Použití rekurzivních filtru (IIR, nekonecná impulsní odezva) prináší pro 2D obrazy problémy, které se u 1D signálu nevyskytují. Proto se rekurzivní filtry pro obrazy témer nepoužívají. Vysvetlete, co je prícinou problému? (nápoveda: kauzalita).
Příčinnost (kauzalita) říká, že výskyt určitého předmětu či entity B zákonitě závisí na výskytu předmětu A jiné třídy. A nazýváme příčinou, B následkem.
Dvourozměrné IIR filtry se nepoužívají kvůli nestabilitě (není zaručena kauzalita).
!!! Možná někdo doplní !!!
66. Z jakého duvodu se používají separabilní filtry pri lokální lineární filtraci obrazu? Ukažte základní myšlenku separabilních filtru. Jaké podmínky musí splnovat filtr, aby mohl být realizován jako separabilní?
Používají se proto, že s jejich pomocí je výpočet mnohonásobně rychlejší. Čehož je dosaženo úsporou výpočtů.
Myšlenka je taková, že se filtrace rozdělí do dvou kroků - nejprve vertikální a poté horizontalní. Obecně jde o případ, kdy lze konvoluční masku v p-rozměrném okolí, obvykle p = 2; 3 rozložit na součin jednorozměrných masek. Jinak řečeno, lze rozložit vícerozměrný systém bázových ortogonálnich funkcí lineární integrální transformace na součin jednorozměrných ortogonálních funkcí.
Podmínkou tedy je, že konvoluční maska musí jít rozložit na součin jednorozměrných masek. Dále hodnost filtru musí být rovna 1.
67. Jakými metodami predzpracování obrazu zvýšíte kontrast obrazu pro pozorovatele, máte-li k dispozici práve tento jediný obraz. Uvedte alespon dve možnosti.
68. Co je a jak se matematicky popisuje hrana v obrazové funkci f(x, y)? Definicní vzorce pro hranu uvedte pro spojitý i digitalizovaný obraz.
Výsledky neurofyziologického a psychologického výzkumu ukazují, že pro zrakové vnímání vyšších organismu jsou duležitá místa v obraze, kde se náhle mení hodnota jasu (hrany).
Hrany vznikají díky nespojitostem v normále k povrchu, hloubce, odrazivosti povrchu (barve) nebo osvetlení.
Hrana (angl. edge)
neco o hranach: http://en.wikipedia.org/wiki/Edge_detection#Motivations
69. Co je to hranový element (angl. edgel)? K cemu se v analýze obrazu hranový element používá?
Hranový bod je bod s velkým modulem gradientu.
Slouží k identifikaci pixelu, jestli přísluší k hraně nebo nikoliv.
70. Pro hledání hran v obrazové funkci f(x, y) se nekdy používá Laplaceuv operátor r2 f(x, y). Napište vzorec, kterým je definován pro spojitou obrazovou funkci f(x, y). Jsou vlastnosti Laplaceova operátoru smerove závislé?
Laplaceův operator je směrově nezávislý.
71. Jakou výhodu prináší urcování polohy hrany jako pruchodu druhé derivace obrazové funkce nulovou hladinou? Napište, v jakých hranových detektorech se této výhody využívá a jak.
Extrém 1. derivace odpovídá průchodu 2. derivace nulou.
Pro 1D funkce je to přesně totéž, pro 2D funkce to vede na Laplaceův operátor LoG (Laplacian of Gaussian).
Využívá se např. v detektoru Marr-Hildreth (the Marr-Hildreth algorithm is a method of detecting edges in digital images)
Tato metoda je vhodna pri hledani jemnych detailu v obrazu. Tudiz i pri hledani jemnejsich hran.
72. Marruv prístup k detekci hran využívá hledání pruchodu druhé derivace obrazové funkce nulou. Pri výpoctu derivace se s výhodou pro potlacení vlivu šumu používá konvoluce (rozmazání) gaussovským filtrem g. Druhá derivace takové operace necht je oznacena r^2d = r^2(f * g) = r^2 f * g = … . Metoda využívá vtipný trik (obejde derivaci obrazové funkce f). Prosím, abyste ho použili a pokracovali v predchozím odvození. Díky jakým vlastnostem použitých operací lze trik použít?
zero-crossing detection - projíždíme třeba maskou 2×2 a hledáme jestli zde není velká změna z kladné na zápornou hodnotu a naopak. Pokud ano, řekneme, že to zde prochází nulou, i když tam bod s intenzitou nula být nemusí. Odpovědí tohoto detektoru je opět ano/ne hrana. Někdy nevýhodou, která ale v některých použití je naopak výhodou, je že se hrany uzavírají do sebe.
73. Predstavte si, že máte k dispozici již sejmutý digitální obraz. Vysvetlete princip ostrení obrazu (neptám se na globální úpravu jasové stupnice podle histogramu). Co je cílem ostrení? V jakých situacích se ostrení používá?
Cílem je:
ostreni pomoci laplacianu: http://www.dfanning.com/ip_tips/sharpen.html
dalsi info: http://www.dl-c.com/sharpen.pdf
74. Vysvetlete pojem paletový barevný obrázek. K cemu a proc se barevné paletové obrázky používají?
např. GIF - paletový = indexovaný existuje předem definovaný soubor barev, obrázek se skládá z odkazů do tohoto seznamu barev… (malý rozsah = úspora místa)
Paletove obrazky setri misto. Na druhou stranu ale dochazi k znacne redukci (v zavislosti na poctu barev v palete) mnozstvi barev, ktere mohou byt v obrazku zobrazeny.
neco o paletovych obrazcich tady: http://www.manifold.net/doc/image_types.htm
75. Charakterizujte, co je barva. Souhrou jakých trí jevu vzniká u cloveka barevný vjem.
Barva charakterizuje vjem pozorovatele na základě (viditelného) záření původně přicházejícího ze světelného zdroje (směs záření o různých vlnových délkách) a změněného díky vlastnostem pozorovaných objektů.
Barva - popisuje vjemy vznikající souhrou tří jevů:
76. Proc vidíme nekteré objekty barevne? Uvažujte napr. jednu cerstve ustriženou cervenou ruži. Vysvetlete, proc vidíme stonek zelene a kvet cervene.
Subjektivní vnímání barvy - vnímání barvy clovekem pridává subjektivní vrstvu nad objektivní fyzikální pozorování, tj. vlnovou délku elektromagnetického zárení. Barva tedy predstavuje psychofyzikální jev. Barvu vnímáme díky tomu, že některé materiály více a některé měně odrážejí/pohlcují dopadající světlo. Podle toho které vlnové délky více pohlcují/odrážejí takovou mají pro nás barvu.
77. Když charakterizujeme barvu z fyzikálního hlediska, predstavujeme si viditelnou cást barevného spektra vlnových délek elektromagnetického zárení získaného napr. rozkladem bílého svetla pomocí hranolu (pokus I. Newtona). Napište rozsah vlnových délek (od do) v nanometrech [nm], které lidské oko vidí. Uvedte ctyri barvy viditelného spektra usporádané vzestupne podle jejich vlnových délek. (Nápoveda: vzpomente si na barvy v duze).
Typicky lidské oko vidí vlnové délky od 400 do 700 nm. Je to však individuální, někdo může být chopen vidět např. rozsah od 380 do 780 nm.
Uspořádané barvy s rostoucí vlnovou délkou:
fialová, modrá, zelená, žlutá, oranžová, červená
78. Jaké senzory jsou v lidském oku pro barevné videní? Nakreslete zhruba citlivost jednotlivých senzoru grafem, kde na vodorovné ose bude vlnová délka kvantifikovaná v nanometrech [nm] a na svislé ose relativní citlivost v rozshu od 0 do 1.
79. Vysvetlete, co je barevný metamerismus. Jaký je jeho význam pro vnímání barev clovekem.
Metamerismus je obecně definován jako dva různé jevy, které jsou vnímány stejně.
Barevný metamerismus je tedy například fakt, že smícháním červené a zelené vznikne žlutá - lidské vnímání je klamáno, že směs červené a zelené je totéž jako fyzikálně vytvořená žlutá.
Dovoluje nám pomocí mechanismu jen tří receptorů vidět velké množství nespektrálních barev.
80. Co je barevný prostor? Jak je definován? Uvažujte pro jednoduchost barevný prostor barevných senzoru v lidském oku.
81. Jak a proc vznikl barevný prostor CIE XYZ? Vysvetlete, co je barevný trojúhelník a nakreslete ho. Jaký je význam souradných os barevného trojúhelníka x, y? Co jsou spektrální barvy a kde jsou umísteny v barevném trojúhelníku?
Barevný prostor XYZ vytvořila CIE jako matematickou abstrakci. XYZ odpovídají imaginárním barvám, jejichž složením podle funkcí vyrovnávajících barvy by vznikl vjem odpovídající spektrální barvě.
Jedná se o absolutní standard, protože je vztažen k vnímání standardního pozorovatele.
Spektrální nebo také sytá barva.
Souřadnice x, y:
Všechny viditelné spektrální barvy jsou na okraji „podkovy“, nepřesně též barevného trojúhelníku. Všechny viditelné barvy, které lze namíchat leží uvnitř podkovy.
82. Co znamená barevný rozsah urcitého snímacího nebo zobrazovacího zarízení? Jak barevný rozsah souvisí s barevným trojúhelníkem? Srovnejte barevný rozsah kvalitního barevného filmu a rozsah levné barevné pocítacové tiskárny.
Barevný rozsah (angl. gamut) všech člověkem vnímatelných barev je 3D podprostorem všech možných barev v X,Y,Z souřadnicích. Posléze zobrazen jako 2D trojúhleník - normalizace. Čim větší plocha barevného trojúhleníku, tím kvalitnějši. Tiskárna má cca 2x menši plochu (zobrazeni poctu barev) oproti filmu. Barevný rozsah tedy říká, kolik různých barev dokáže zařízení rozpoznat.
83. Komprese dat (vcetne obrazu) se muže opírat o snížení redundance dat a prípadne o snížení irelevance dat. Vysvetlete oba pojmy. Uvedte príklad na snížení redundance a snížení irelevance v kompresi obrazu.
Redundance (nadbytecnost) v kódování: Základní princip: častěji se opakující symbol se kóduje kratším kódovým slovem.
- řešení: Huffmanovo / aritmetické kódování
Redundance mezi pixely
• Pomocí lineárních integrálních transformací obrazu, např. Fourierovou, kosinovou či vlnkovou transformací. • Prediktivní komprese. • Úsporné algoritmy generování obrazu, např. fraktální.
Irelevance (nepodstatnost) z hlediska vnímání člověkem
• Nezobrazit např. všechny jasové úrovně nebo vysoké frekvence.
84. Vysvetlete, co je ztrátová a co bezeztrátová komprese obrazu s využitím pojmu redundance a irelevance dat.
Bezeztrátová komprese obrazu odstraňuje redundanci dat. To znamená, že se odstraňuje nadbytečná informace, kterou je možné přímo rekonstruovat, tedy nedochází ke ztrátě dat. [ GIF, PNG, TIFF, JPEG 2000 (zahrnuje bezeztratovou kompresni metodu) ]
Ztrátová komprese obrazu je založena na odstraňování irelevance dat. Je založena na pozorování vnímání člověka. Některé detaily je prakticky nemožné lidským okem vnímat, a proto je můžeme považovat za nadbytečné. Na rozdíl od bezeztrátové komprese nelze takto komprimovaný obraz přímo zrekonstruovat, část informace se nenávratně ztratí. [ JPEG, JPEG 2000, MPEG, MP3, WMA, AAC, VQF ]
neco o kompresich: http://www.comtel.cz/files/download.php?id=3373
85. Pro stanovení redundance pri kompresi obrazových dat se používá Shannonova (též informacní) entropie. Uvažujte monochromatický obraz s histogramem h(i), i = 1 . . . 255. Vypoctete odhad entropie. Jak spoctete redundanci, když je každý pixel obrazu reprezentován n bity?
Odhad entropie:
, kde k = 1..255 a P(k) je pravděpodobnost jasové úrovně k.
Informační redundance je r = b - He, kde b je nejmenší počet bitů, kterým lze reprezentovat počet kvantizačních úrovní.
86. Pro odstranení redundance pri kódování v kompresi dat se používá Huffmanovo kódování. Uvedte jeho myšlenku. Je Huffmanovo kódování optimální? Za jakých podmínek? K cemu se používá?
Vstup: symboly s pravdepodobností jejich výskytu; zpráva
Výstup: optimálně zakódovaná zpráva
Postup: podle pravdepodobností výskytu symbolu se zdola nahoru vytváří binární (Huffmanuv) strom. Tento strom potom slouží ke generování zakódované zprávy. Prefixový kód, tj. žádné kódové slovo nemuže být prefixem žádného jiného kódového slova. Umožňuje dekódování, aniž by se znala délka jednotlivých slov.
Huffmanův kód má dvě důležité vlastnosti. Jednak je kódem s minimální délkou, jednak je to prefixový kód a je tedy jednoznačně dekódovatelný. Jeho problémem je to, že musíme znát rozdělení pravděpodobnosti výskytu jednotlivých symbolů. To lze nahradit odhadem, případně je možné tento odhad v průběhu komprese upřesňovat.
Použití:
Přirozeně se teď nabízí otázka, zda je Shannon-Fanův kód optimální, zda někdy neexistuje prefixový strom, který by byl lepší. Odpověď na tuto otázku je ano. Shannon-Fanův kód nám skutečně nezajišťuje optimální řešení (tedy ani optimální kompresi) a jak vás už možná napadlo, tak algoritmus, který vždy vydá optimální prefixový strom je Huffmanův kód.
87. Pri kompresi dat se pro odstranení redundance v kódování používá Huffmanovo kódování, které je za urcitých podmínek optimální. Za jakých podmínek? Metodu kódování lze ješte vylepšit, když se místo Huffmanova kódování použije aritmetické kódování. Jak se musí podmínky zmenit? Cím se aritmetické kódování liší od Huffmanova kódování?
Hufmanovo kodovani dosahuje optimalnich vysledků, za předpokladu, že četnosti symbolů jsou mocninami dvou.
Aritmetické kódování reprezentuje zprávu jako podinterval intervalu <0,1). Na začátku uvažujeme celý tento interval. Jak se zpráva prodlužuje, zpřesňuje se i výsledný interval a jeho horní a dolní mez se k sobě přibližují. Čím je kódovaný znak pravděpodobnějsí, tím se interval zúzí méně a k zápisu delsího (to znamená hrubsího) intervalu stačí méně bitů. Na konec stačí zapsat libovolné číslo z výsledného intervalu.
88. (a) Vysvetlete princip dnes hojne používané ztrátové metody komprese obrazu podle standardu JPEG? (b) Pri velkých kompresních pomerech jsou ve výsledku patrné ctverecky rozmeru 8×8. Cím je tento tzv. blokovací efekt zpusoben? Proc se k takovému rešení pristoupilo?
doporucuji clanky na ROOT.cz : http://www.root.cz/clanky/programujeme-jpeg-diskretni-kosinova-transformace-dct/ http://www.root.cz/clanky/programujeme-jpeg-kvantizace-dct-koeficientu/
89. Jaký je rozdíl mezi ztrátovými a bezeztrátovými metodami komprese obrazu? Uvedte princip ztrátových i bezeztrátových metod. Uvedte jeden príklad bezeztrátové a ztrátové komprese.
Ztrátové komprese jsou založeny na irelevanci v datech. To znamená, že velikost dat je snížena na základě fyzických možností vnímání člověka, byť za cenu nemožnosti úplné zpětné rekonstrukce.
Příkladem budiž JPEG a jeho kvantování jasu.
Bezeztrátové komprese jsou založeny na redundanci v datech. To znamená, že použitím vhodnějšího kódování (např. Huffman, LZW, atd.) lze snížit velikost dat.
Příkladem budiž PNG.
90. Metody komprese se používají i pro jednorozmerné signály. I obraz je možné reprezentovat jako jednorozmerný signál, což napríklad udeláme, když obraz ‘zazipujeme’ (použije se algoritmus LZW pracující se slovníkem). U kompresních metod specializovaných na obrazy mužeme dosáhnout vyšší komprese. Proc? Pro vysvetlení použijte pojem redundance dat. (Odpoved dává také odpoved na prirozenou otázku: Cím se liší komprese obrázku od komprese signálu).
Rozdil mezi kompresemi 1D a 2D dat je ten, ze u 2D dat bereme ohled na okolní body ve 2D matici. Obrazova data jsou specificka a muzeme u nich vyuzivat nektere poznatky o nich. Proto jsou efektivnejsi algoritmy specialne pro jejich kompresi. Cim vice o datech vime, tim vice je dokazeme komprimovat.
Redundance - odstraneni nadbytecnych dat, ktere jsme pote schopni rekonstruovat.
Zvláštními postupy – kódováním, které je dané zvoleným kompresním algoritmem – se ze souboru odstraňují redundantní (nadbytečné) informace, zvyšuje se entropie dat.
91. Definujte kompresní pomer dvema zpusoby, a to na základe redundance a na základe úspory pameti.
Kompresní poměr je podíl velikosti původních dat ku velikosti komprimovaných dat. Například při kompresi 10MB souboru do 2MB je poměr 10/2 = 5 (tj. 5 : 1 – pět ku jedné, pětkrát zmenšeno). Kompresní poměr je ovlivněn volbou kompresního algoritmu i typem komprimovaných dat. Úspora místa je vyjádřena jako 1 − opačný poměr, v našem příkladě 1 − 2/10 = 0,8 (tj. 80% úspora).
Na základě redundance (měřené entropií) K = b / He = pocet bitu / entropie
Na základě úspory paměti K = n1 / n2 = delka zpravy pred / po kompresi
92. Vysvetlete princip ztrátové komprese obrázku pomocí lineárních integrálních transformací. Vyjmenujte dve takové metody a naznacte jejich princip. Proc se pro obrazy používají jiné metody komprese než pro posloupnosti?
2D DCT (typu II) v porovnání s DFT. DCT koncentruje nejvíce energie na nejnižších frekvencích.
Diskrétní kosinová transformace (anglicky discrete cosine transform, zkratka DCT) je diskrétní transformace podobná diskrétní Fourierově transformaci (DFT), ale produkující pouze reálné koeficienty.
93. Komprese JPEG využívá kosinovou transformaci. Necht má obraz n rádku a n sloupcu. Jaká je casová výpocetní složitost kosinové transformace z definice a v rychlé algoritmické úprave pro tento obraz (její princip se shoduje s FFT)? (Pro zápis složitosti použijte formalismus O(.)).
Z definice: O(n^2)
V rychlé úpravě: O(n log2 n)
94. Je eroze binárního obrázku komutativní operací? Proc (vyjdete z jedné z definic eroze)?
Není.
95. Napište vztah pro erozi binárních obrazu. Na co se eroze používá?
Pro každý bod obrazu p se ověřuje, zda pro všechna možná d + b leží výsledek v X. Pokud ano, je výsledek 1, jinak 0.
96. Príklad na binární matematickou morfologii. Na levém obrázku je bodová množina A a na pravém strukturní element B, jehož reprezentativní bod je oznacen krížkem. Nakreslete výsledek dilatace A+B.
viz: http://cmp.felk.cvut.cz/~hlavac/TeachPresCz/11DigZprObr/71-03BinMatMorfolCesky.pdf
97. Príklad na binární matematickou morfologii. Na levém obrázku je bodová množina A a na pravém strukturní element B, jehož reprezentativní bod je oznacen krížkem. Nakreslete výsledek eroze A-B.
98. Vysvetlete, co znamená, když se o operaci ríká, že je idempotentní. K cemu se idempotentnosti využívá v matematické morfologii?
Vyznam: (matematika, informatika) vlastnost operace taková, že vícenásobné provedení operace má vždy stejný výsledný efekt.
Zde: po jednom otevrení, resp. uzavrení, je množina již otevrena, resp. uzavrena. Další použití techto transformací již nic nezmení.
Využití: Ztenčování a ztlušťování je také idempotentní - po určitém počtu iterací již další ztenčení nebo ztluštění nemá efekt → dobrá ukončující podmínka.
99. Co je to idempotentnost? Je uzavrení (operace matematické morfologie) idempotentní?
Indempotentni operace je takova operace, kterou kdyz provedete podruhé (a víckrát), tak se její výsledek již nezmění.
Pokud by se ztencování nechalo bežet až do dosažení idempotence, zustaly by v obraze pouze uzavrené linie.
Ano, uzavreni je idempotentni.
100. Uvažujte spojitou obrazovou funkci (spojitý definicní obor). Nakreslete kostru oblasti odpovídající vnitrku rovnostranného trojúhelníka. O kostre (skeletu) jsme se ucili v matematické morfologii.
Měl by to být trojúhelník. kostra půjde ze všech rohů do středu trojúhelníku (do těžiště) - jak se budou sbíhat středy kružnic z jednotlivých rohů.
Na obrázku je kostra červeně, kruhy znázorňují postup sestavování kostry:
101. Uvažujte spojitou obrazovou funkci (spojitý definicní obor). Nakreslete kostru vnitrku dvou kruhu stejného prumeru, které se práve dotýkají. O kostre (skeletu) jsme se ucili v matematické morfologii.
102. Formulujte úlohu segmentace dvojrozmerného obrazu. Co je vstupem a co je výstupem? Uvedte dva príklady segmentacních úloh a metod pro ne vhodných.
Segmentace má za cíl rozdělit body obrazu do určitého počtu skupin nebo tříd. Souvislá množina bodů z jedné skupiny predstavuje jeden objekt z dané třídy. Bodům jedné třídy je přiřazeno číslo - identifikátor. V případěpaletových obrázku je to barva.
Vstup: obraz, počet tříd
Výstup: matice velikosti obrazu, který rozděluje body do tříd
Příklady:
Vytvoření paletového obrázku - k-means
Segmentace obrázku z tomografu (bílá hmota, šdá hmota, CSF) - mean shift
103. Vysvetlete v kontextu úloh segmentace dvojrozmerného obrazu pojem oblast a pojem objekt. Naznacte konkrétní segmentacní úlohu a napište, jaký je v ní vztah mezi temito dvema pojmy.
objekt - to je vsechno, co ma nejaky vyznam z pohledu interpretace
oblast - to je mnozina blizkych si reprezentantu, souvisla mnozina
104. Segmentace se opírá o sémantiku konkrétní úlohy, tedy o apriorní schopnost využít interpretace obrazu. Ukažte na príklade, jak konkrétne se tím zpracování obrazu zjednoduší.
105. Vysvetlete pojmy úplná a částečná segmentace. Použijte k tomu matematický formalismus. Uveďte jeden příklad na úplnou a jeden príklad na částečnou segmentaci.
Úplná segmentace - rozděluje obraz do nepřekrývajících oblastí, které odpovídají objektům z reálného světa.
Úplná segmentace rozděluje obraz R do konečného počtu S oblastí R_1, …, R_S, tak, že platí:
Příkladem úplné 2D segmentace je hledání kontrastních objektů na homogenním pozadí.
Částečná segmentace - je možné hledat pouze části se sémantickým významem v obraze, které povedou k interpretaci v další analýze.
106. Pro usnadnení segmentace se casto používá zadní osvetlení, a to zejména v prumyslových aplikacích, napr. v digitálních profilprojektorech. Zde je možné merit rozmery nebo odchylky od tvaru presneji, než vyplývá z Shannonovy vety o vzorkování. Lze dosáhnout podpixlové presnosti. Vysvetlete jak a ilustrujte myšlenku na príklade.
Podpixelova přesnost využiva toho, že známe tvar kontrolovaného objektu. Takže když víme, že to je třeba oblouk, tak pomocí pixelů které nám tvoří hranu můžeme metodou nejmenších čtverců zjistit s větší přesností velikost.
Viz příspěvek prof. Hlaváče v diskuzi na serveru automatizace.cz
U měřicích systémů je velmi důležitá relativní přesnost, vztažená k velikosti snímaného výrobku. Dnes je rozlišení kamerových systémů typicky 1 000 pixelů. Podle Shannonovy věty o vzorkování lze ale teoreticky měřit s relativní přesností 1 : 500. Pokud se o tvaru měřeného výrobku něco ví a lze využít podpixelová přesnost, tak by relativní přesnost mohla být 1 : 2 000 nebo i ke 3 000. V praxi jsem se setkal s úlohou u výrobce letadel, který chtěl měřit deformace draku letadla pro zalétávání. U letadla dlouhého zhruba 10 metrů mělo mít měření přesnost desetiny milimetru. Relativní přesnost tedy měla být 1 : 10 000. I tato úloha se nakonec ukázala řešitelná kamerovým systémem s využitím subpixelové přesnosti. Na první pohled se zdá, že měřit s přesností 1 : 10 000 optickými metodami nelze. A u této těžké, ale zajímavé úlohy se to povedlo.
107. Rozdelte metody segmentace do základních kategorií (napr. ctyr). Každou z nich pojmenujte a velmi strucne charakterizujte.
typy segmentace:
108. Pri segmentaci prahováním bychom rádi urcovali velikost prahu automaticky. Je to obvykle možné, když se hledané objekty ve scéne intenzitou výrazne liší od pozadí. Jak se v tomto prípade obvykle hledá nejlepší práh? Kdy metoda selhává?
109. Pri segmentaci prahováním (obecne více než jedním prahem) se nekdy se darí aproximovat pravdepodobnost výskytu urcitých jasových úrovní gaussovskými pravdepodobnostními rozdeleními a úlohu segmentace prevést na úlohu separace takové pravdepodobnostní smesi. Postupy takové separace se bežne používají ve statistickém rozpoznávání. Napište, jak se porídí príslušná pravdepodobnostní rozdelení, jakou metodou se separují. Pro ilustraci mužete použít príklad použitý na prednášce.
h_region - lokální histogram
h_model - aproximace histogramu pomocí n gaussovských rozložení
Optimální parametry gaussiánu jsou pak určeny minimalizací fitovací funkce F:
Práh se nastaví na nejbližší úroveň šedi odpovídající minimu pravděpodobnosti mezi maximy dvou nebo více normálních rozdělení, což zaručí segmentaci s minimální chybou.
110. Pro segmentaci (nalezení hranic oblastí) lze využít výstup detektoru hran. Popište myšlenku takového postupu. Jaké má tento prístup problémy a jakými postupy se jim celí?
Předpokládám, že je to myšleno tak, že se vezmou hrany a jednotlivé souvislé oblasti oddělené hranami budou výsledkem segmentaci. V tom případě by ale mohlo dojít k problémům s přetrhanými hranami. Vyřešit to jde detekcí hran s hysterezí, kdy tyto mezery (ang. gap) překlenou pomocí nižšího prahu.
Otazka je, jestli tu nemluvim uplne zcestne.
Doplneni:
Prahování
Poslední krok v detekci hran je vždy prahování, je třeba rozhodnout, jak silná odezva už znamená hranu. Dobré nastavení prahu rozhoduje o kvalitě detektoru, příliš nízká hodnota označí za hrany i šum, příliš vysoká zas zahodí i některé podstatné hrany. Jako řešení tohoto problému a protože často není možné určit jeden práh pro celý obrázek, používá se tzv. prahování s hysterezí. Pro prahování s hysterezí se nastaví dva prahy. Nejdřív se najdou pixely výrazných hran pomocí vysokého prahu a od těch se pokračuje v označování takových pixelů, v nichž odezva hranového detektoru je větší než nízký práh. Díky tomu se omezí šum a hrany zůstanou souvislé.
111. Pri hledání hranových bodu (významných hran, edgels) se nekdy pro lepší zpracování výstupu hranového detektoru používají dva postupy: (a) prahování s hysterezí, (b) potlacení lokálních maxim velikosti gradientu (angl. non-maximal suppression). Vysvetlete oba tyto postupy.
viz cviceni.
potlaceni lokalni maxima gradientu (ten ceskej preklad se mi nejak nezda): hleda pouze lokalni maxima gradientu, zbytek je 0 .. tzn. zbydou jenom tenké čáry.
prahování s hysterezí: vstupem jsou hrany nalezené z algoritmu popsaného výše. Hledá kde je gradient větší jak prah t1, tyto hrany jsou pak prohlášeny za hlavní hrany. Poté se hledají sousední, které jsou větší jak práh t2, tyto hrany jsou prohlášeny vedlejšími
… předpoklad t1>t2>0
112. Hranový detektor muže poskytnout významné hrany (edgels, hranové body), které jsou nespojité a zašumené. Jejich propojení do uzavrených hranic muže být nesnadné. Nekdy se používá krok dodatecného zpracování – relaxace hran. (Jde o jednoduchou pragmatickou variantu obecné optimalizacní úlohy s názvem relaxacní znackování).
Algoritmus: (viz přednáška 2D IMAGE SEGMENTATION BASED ON SPATIAL COHERENCE, slajd 19)
113. Pro spojování částečných hranic se nekdy využívají gestaltovské principy sdružování (Gestalt grouping principle). Vysvetlete jejich podstatu.
Gestalt je struktura, konfigurace nebo vzor fyzického, biologického nebo psychologického jevu obsaženého tak, že představuje funkční jednotku s vlastnostmi, které nejsou odvoditelné součtem jejích částí.
Jinými slovy „Celek je jiný než suma jeho částí.“
Gestalt grouping principles:
114. Vysvetlete princip metody k-prumeru (angl. k-means) a její základní vlastnosti. Jak se metoda použije pro segmentaci?
Algoritmus k-means hledá pro množinu dat X = {x1, . . . , xn} vektory μ1, . . . , μk (k < n), takové, že je minimalizována strední kvadratická odchylka množiny X od vektoru μ1, . . . , μk. Neformálne receno, algoritmus k-means hledá k vektoru, které dobre aproximují danou množinu dat, tedy hledá takové vektory, ke kterým je euklidovská vzdálenost všech dat co nejmenší.
Algoritmus k-means je skutecne jednoduchý. Jeho vstupem je množina dat X = {x1, . . . , xn} a císlo k udávající pocet vektoru μj . Na zacátku se inicializují vektory μj , j = 1, . . . , k na náhodne zvolenou hodnotu nebo použitím nejaké vhodne zvolené heuristiky (využívající napríklad apriorní znalosti o úloze). Po inicializaci ze zacnou iterativne opakovat následující dva kroky:
Klasifikace:
Všechna data xi, i = 1, . . . , n se klasifikují do tríd urcenýchvektory μj , j = 1, . . . , k podle minima euklidovské vzdálenosti
(klasifikace podle nejbližšího souseda, nearest-neighbour classification). Tedy vzor xi je prirazen do trídy
Učení
Vypocítají se nové hodnoty vektoru μj jako strední hodnoty dat xi, které byly klasifikovány do trídy urcené príslušným vektorem
μj . Tedy, nová hodnota μj se spocte podle vztahu
kde nj je pocet vzoru xi klasifikovaných v prvním kroku do trídy urcené vektorem μj.
Kroky 1 a 2 se opakují do té doby, dokud se alespon jeden vektor zklasifikuje do jiné trídy, než byl klasifikován v predcházejícím kroku.
Pro segmentaci je vstupní množinou X mnoužina bodů obrázku a k je počet barev, kterými má být výsledný obrázek po segmentaci interpretován.
115. Pro popis objektu v obrazech se používají globální a lokální metody. Porovnejte je a uvedte príklady dvou v každé kategorii.
globalni - Furierova transformace, PCA
- porovnání jednoho celého objektu
- jednoduché deskriptory
- potřeba přesná segmentace, citlivé na šum
lokální - možná koutková transformace, ale nejsem si jistej
- není potřeba segmentace
- porovnání založené na lokálních deskriptorech
- zajmavé body, rohy, lokální struktury,
116. Vysvetlete dva základní postupy barvení oblastí. Je to metoda, která z binárního obrazu, výsledku segmentace napr. prahováním, oznací jedinecnou znackou (napr. císlem, barvou) každou segmentovanou oblast.
Našel jsem dvě různé věci - v přednáškách je: Two passes algorithm a Recursive filling of regions, ale je tam popsaný jen jeden. Pak jsem našel další, ale tam jsou tři různé a Hlaváč chtěl jen 2, tak jsem vybral dva, co se od sebe nejvíc liší:
4-neighborhood and 8-neighborhood region identification
Quadtree(kvadrantový strom) region identification
117. K cemu konverguje plocha oblasti (v m2) a obvod oblasti (v m) v diskrétním obraze pri rostoucím rozlišení? Nápoveda: Predstavte si posloupnost družicových snímku povrchu Zeme o rostoucím rozlišení a konkrétní objekt s krivocarou hranicí (napr. skalnaté morské pobreží).
Plocha oblasti konverguje ke správné hodnotě
Obvod oblasti konverguje k ∞
118. Oblíbeným príznakem popisujícím tvar oblasti (napr. objektu ve 2D obraze po segmentaci) je kompaktnost (nekdy se jí ríká i nekompaktnost). Definujte, co je kompaktnost. Jak se kompaktnost mení pri zmene rozlišení? Proc?
Kompaktnost znamená - pevnost, masivnost, semknutost, hutnost.
Kompaktnost popředí Kp je příznakem zachycujícím složitost tvaru popředí. Lze očekávat, že popředí bude v případě textu rozděleno do většího počtu oblastí s řadou otvorů. Proto bude kompaktnost textu velmi malá. Kompaktnost můžeme vypočíst jako poměr plochy oblasti a kvadrátu délky její hranice.
Kde Pp je plocha popředí a Hp je délka hranice popředí, která se získá jako počet bodů z popředí sousedících s pozadím ve čtyřokolí. Pro klasifikaci používáme nelineární transformaci kompaktnosti, která vyjadřuje nekompaktní oblast číslem 1 a vyznačuje se rychlým poklesem při lineárním růstu kompaktnosti.
Pokud snižujeme rozlišení, mezi pixely popředí se zmenšují rozestupy a může docházet i k slívání bodů dohromady. V tom případě by se mohla kompaktnost zvětšovat.
119. Vysvetlete princip retezového kódu pro popis hranic oblasti. Nakreslete oblast neobdélníkového tvaru o nejméne sedmi pixelech ve ctvercovém rastru s definovaným osmiokolím. Napište odpovídající retezový kód a derivaci retezového kódu.
Princip: označíme si každý směr n-okolí určitým číslem, poté procházíme postupně hranici objektu, použité směry v každym kroku zapisujeme. viz:
120. Vysvetlete princip a použití momentových popisovacu pro popis oblastí v rovine. Jak se dosahuje invariantnosti k ruzným geometrickým transformacím?
Tak toto fakt nechápu. V přednáškách nic moc není a nikde jinde taky moc ne. Jsou u toho brutální vzorečky. Ale kdyby přece jen se to někdo učil, tak tady dávám, co jsem našel:
Region moment representations interpret a normalized gray-level image function as a probability density of a 2D random variable. Properties of this random variable can be described using statistical characteristics—moments [Papoulis, 1991]. Assuming that non-zero pixel values represent regions, moments can be used for binary or gray-level region description. A moment of order (p + q) is dependent on scaling, translation, rotation, and even on gray-level transformations and is given by:
where x,y,i,j are the region point co-ordinates (pixel co-ordinates in digitized images).
Translation invariance can be achieved if we use the central moments
where xc,yc are the co-ordinates of the region's center of gravity (centroid).
Scale-invariant features can also be found in scaled central moments rjpq (scale change xf = ax.y' = ay)
Rotation invariance can be achieved if the co-ordinate system is chosen such that yin =0 [Cash and Hatamian, 1987]. Many aspects of moment properties, normalization, descriptive power, sensitivity to noise, and computational cost are discussed in [Savini, 1988]. A less general form of invariance was given in [Hu, 1962] and is discussed in [Maitra, 1979; Jain, 1989; Pratt, 1991], in which seven rotation-, translation-, and scale-invariant moment characteristics are used.