Hirdetés

2008. január 14., hétfő

A tér és mozgás vizuális észlelése

8. A tér és mozgás vizuális észlelése

Alapkérdések:

- a retina kétdimenziós felszín, miért látunk mégis három dimenzióban?

- hogyan állapítjuk meg, hogy egy tárgy milyen távolságra van?

A tárgyak helyének meghatározását téri lokalizációnak nevezzük, ez a környezetünkben való tájékozódás eszköze. Az agyban külön felismerési és lokalizációs rendszer működik. A lokalizáció a látórendszer egy olyan ágához kötődik, mely az agy felső részéhez van közelebb, ha ez sérül, a térbeli viszonyok meghatározásában lesznek gondok.

A mélységészlelés automatikusan és erőfeszítés nélkül történik Helmholtz szerint a távolságra tudattalanul következtetünk. Gibson szerint viszont nem következtetünk, hanem közvetlenül észleljük azt. A mélységi információkat általában a talajon keressük, ilyen pl. a textúragradiens (ld. később). Az ebből érkező információ invariáns, mivel nagy felületre terjed ki. Ezért alkalmas a távolság észlelésére.

Távolsági jelzőmozzanantok

A mélységészlelés fajtái:

- abszolút távolság becslése: a megfigyelő és a tárgy távolságára vonatkozik

- relatív távolság becslése: két tárgy távolsága (vagy egy tárgy különböző részei közti távolság); a látórendszer ezt megbízhatóbban végzi, mint az előzőt

A távolsági jelzőmozzanatok két fajtája:

a) szemmozgásos (kinesztetikus): az izom-összehúzódás érzetéből származik

b) látási: a környezetből jövő jelek; lehet binokuláris (csak két szem használata esetén észlelhető), és monokuláris (egy szemmel is látható).

a) Szemmozgásos jelzések

Egy tárgy távolságát jelzi a két szem konvergenciája (a szemek összetartása; binokuláris parallaxis) és az akkomodáció mértéke (a szemlencse domborúságának változása). A szemizmok mozgásáról az agy visszajelentést kap.

Mindkét fajta jelzőmozzanat csak korlátozott szerepet játszik a mélységészlelésben: néhány méteres távolságon túl egyik sem differenciál kellőképpen (nem változik jelentősen a bezárt szög és a szemlencse alakja).

b) Látási jelzőmozzanatok

Fajtái: binokuláris és monokuláris

I. Binokuláris vizuális mélységinformáció

A binokuláris látással történő észlelés a sztereolátás (vagy sztereopszis). Az így létrejövő kép a sztereogram.

Retinális diszparitás

A két szem a tárgyakat kicsit eltérő nézőpontból mutatja. A két kép eltérését nevezzük retinális diszparitásnak.

A diszparitás nagyságát az oldalirányú eltéréssel (laterális szeparáció) lehet kifejezni. Nagyobb lesz az eltérés, ha az egyik tárgy jóval közelebb van a megfigyelőhöz, mint a másik.

Diszparitás típusa: keresztezett diszparitás, ha egy tárgy közelebb van hozzánk, mint az a tárgy, amit fixálunk. Keresztezetlen diszparitás: ha egy tárgy messzebb van tőlünk, mint a fixált tárgy.

A diszparitás csak a tárgyak közötti relatív távolságot határozza meg, az abszolút távolságról nem ad információt.

Ha két tárgy egyforma távolságra van a megfigyelőtől, nincs diszparitás. Horopter: a látómezőnek egy olyan síkja, ahol a rajta lévő tárgyak egyformán távolinak (vagy közelinek) látszanak. (Sekuler-Blake)

A diszparitás szerepét használja ki a sztereoszkóp, amit Wheatstone (1838) fedezte fel. Ennek lényege, hogy mindkét szem elé olyan képet kell helyezni, amit az látna, ha a kép 3D-s lenne. Wheatstone ezt tükrökkel oldotta meg. Brewster (1849) készített először lencsés sztereoszkópot.

Pszeudoszkóp: felcseréli a két szem elé kerülő képeket. Ekkor a mélység az ellentetjére fordul (domború képet homorúnak látunk) Vannak kivételek, pl. az arc, amit nem tudunk homorúnak látni. A homorú képeknél úgy tűnik, mintha a megfigyelő elmozdulásával együtt mozognának. (Gregory)

Hiperszkóp: a két szem távolságát változtatja. A relatív távolság és a tárgyak nagysága változik. (Varga-Dúll)

A két szembe vetülő látvány összeillesztése (sztereolátás)

Két lépése: a két szembe érkező kép összehasonlítása, majd a diszparitás nagyságának és irányának kiszámítása.

Képek összehasonlítása: feltételezhető lenne, hogy a képen megjelenő monokuláris formákat hasonlítja össze az agy. Ezt cáfolja a randompont-sztereogram észlelése (először Julesz Béla készített ilyet 1971-ben): két fekete-fehér pöttyökből álló kép, amelyek közt csak minimális eltérés van. Az agy még itt is képes a térlátásra.

Akkor hogyan történik a jegyillesztés? A szerzők szerint ez túl bonyolult, csak annyit mondanak, hogy a téri frekvenciákat nézi az agy (erről bővebben a 7. tételnél). Ezt bizonyítja a binokuláris versengés (Frisby és Mayhew); ha a két szem nagyon különböző ingereket néz, akkor a megfigyelő mindkét képből darabokat fog látni, és ezek időben váltakoznak egymással. (ld. Sekuler-Blake, 254. old. keretes írás).

Idegi háttér: binokuláris neuronok végzik a monokuláris jegyek összeillesztését (akkor válaszolnak legerősebben, ha a két szem ugyanazt az ingert nézi), és a diszparitás mérését (minden fajta diszparitásra van megfelelő neuron).

Téri vakság (sztereovakság): ha valaki nem tud retinális diszparitás alapján mélységet észlelni. Kísérleti úton macskáknál igazolta Blakemore: kölyökkorban nem hagyta őket két szemmel nézni, a binokuláris neuronok átalakultak monokulárissá. Embernél az agyban lévő kevés binokuláris neuron az oka (pl. gyerekkori kancsalság miatt); a népesség 5-10 százalékát érinti. (Sekuler-Blake)

II. Monokuláris vizuális mélységinformáció

Geometriai vagy légköri és megvilágítási viszonyokra épülő mozzanatok.

Lehet statikus vagy mozgásos.

1. Statikus jelzőmozzanatok

a) Takarás

A részben eltakart tárgyat automatikusan távolibbnak észleljük. 7 hónapos csecsemő már képes takarás alapján megbecsülni a relatív távolságot. Erősebb inger, mint a retinális diszparitás, de nem határozza meg, hogy az eltakart tárgy mennyivel van messzebb.

A takarás jelentőségét bizonyítják a Kanizsa-ábrák (Sekuler-Blake 41. és 259. old.): az illuzórikus takarást a látórendszer (a V2 terület neuronjai) valódinak észleli, ha az ábra megfelel a takarás elveinek, és ha egy egyszerű vonallal vagy görbével összeköthető az illuzórikus forma.

Amodális kiegészítés: az eltakart tárgyat is teljesnek észleljük. Ez összefügg a ``jó folytatás' elvével, ld. 7. tétel.

Neonterjedés: a szín illuzórikus ``elvándorlása' a környező területekre (ld. Sekuler-Blake 209. oldallal szemben, 14. színes tábla).

b) Méret

A távolság változásával megváltozik a retinára eső kép mérete is. A megítélés függ attól, hogy ismerjük-e a tárgy valódi méretét. Ha nem, akkor a környezetben lévő ismerős tárgyak alapján ítélünk.

Illúziókat ld. 9. Tételnél.

c) Perspektíva

A felszínek és tárgyak megjelenése a távolsággal együtt változik.

- lineáris perspektíva: az összetartó vonalak mélységérzetet keltenek, a különböző méretű tárgyak egyformának tűnhetnek, az egyformák pedig különbözőnek.

- textúragradiens (Gibson): a felület szerkezeti sűrűsége a távolsággal látszólag növekszik. A folyamatosság megszakadása sarkokat vagy hajlatokat jelez.

- levegőperspektíva: a távolság színváltozásokat, elmosódásokat okoz. Oka a fény szóródása a levegő részecskéin.

- árnyékolás: a látórendszer az árnyékot a háromdimenziós tárgyakhoz kapcsolja.

- relatív magassági helyzet: a magasabban elhelyezkedő tárgyat távolabbinak észleljük. A látóhatár mintha a szemmagasság fölött lenne.

- életlenség: a háttér életlennek tűnik a fixélt tárgyhoz képest

- a kettős kép változásai: egy távoli pont nézésekor a köztünk lévő tárgyakat duplán látjuk. Minél közelebbi a pont, annál erősebb a duplázás.

2. Mozgásparallaxis

A statikus jegyek torzításait a mozgás korrigálja.

Mozgásparallaxis: a megfigyelő mozgásakor a közelebb eső tárgyak látszólagos mozgása gyorsabb, mint a távolabbiaké. Ebből következtetünk a tárgyak relatív távolságára.

Ehhez az is elég, ha csak a fejünket mozgatjuk. Akkor is működik a dolog, ha a megfigyelő áll, és a tárgyak mozognak.

A becslés pontossága megegyezik a diszparitáson alapuló becsléssel (mindkettő elég jó).

Rogers és Graham kísérlete: a megfigyelő egy véletlenszerű pontokból álló képet néz. A pontok egy része eltérően mozog, mint a többi pont, így mélységészlelés jön létre.

Miért van szükség diszparitásra, ha a mozgásparallaxis is megbízható? Azért, mert a vadászó állatok nem mindig mozoghatnak vadászat közben. (Sekuler-Blake)

A távolság-információk integrációja

Bruno és Cutting kísérlete: méret, takarás, mozgás és perspektíva összes kombinációját megvizsgálták. Az észlelés során a különböző információk összeadódnak. Szerintük minden jelzőmozzanatnak van egy megfelelő agyi ``minimodulja'.

Ha a jelzőmozzanantok konfliktusba kerülnek, egyik sem lesz domináns, a mélységészlelés leromlik. Kétértelmű ábráknál (pl Necker-kocka, ld. Sekuler-Blake 29. old) a kép időben változik.

Varga-Dúll szerint viszont nem egyszerűen összeadódnak a hatások, létezik domináns jelzőmozzanat (pl. takarás). Az észlelés lehet labilis, pl. jól ismert tárgyak esetén az agy figyelmen kívül hagyja a vizuális információt (homorú arc esetében).

Nagyságkonstancia

Skálázási folyamat, ahol az egyik mértékegységet (a retinális kép méretét) méretarányosan átfordítjuk egy másikra (az észlelt méretre). Automatikus folyamat.

Holway és Boring: sok mélységinformáció mellet majdnem tökéletes tárgy méretének a becslése, viszont pl. az egyik szem becsukásával a becslés jobban függ a retinális kép méretétől.

Schiffman: ismerős tárgy esetében az emlékezet segít.

Emmert: utókép nagyságának megítéltetése: távolra nézve nagyobbnak, közelre nézve kisebbnek látszik (miközben retinális mérete természetesen azonos). Nagyság-távolság invariancia: az észlelt nagyság a retinális méret és az észlelt távolság szorzata.

A nagyságkonstancia idegi háttere nem ismert.

Mozgásészlelés

Mikor látunk mozgást? Ha egy tárgy képe mozog a retinánkon (térbeli változás).

Látszatmozgás akkor jön létre, ha a tárgy képe nem mozog a retinán, mégis mozgónak észleljük (időbeli változás).

1. Stroboszkopikus mozgás (másnéven phi-jelenség; Wertheimer, 1912): két külön fénypont felvillantása néhány ezredmásodperc különbséggel. A film is a stroboszkopikus mozgáson alapul.

2. Villogás (flicker): 60 Hz a leginkább villogó. A periférián érzékenyebbek vagyunk a villogásra. A gyerekek érzékenyebbek. Kritikus fúziós frekvencia: a legmagasabb frekvencia, aminél még villogásként érzékeljük a fényjelenséget.

3. Indukált (kiváltott) mozgás (Duncker): egy kisebbet körülvevő nagyobb tárgy mozog, a kisebb (mozdulatlan) tárgy látszik mozogni. Pl.: a szomszédos vonat elindul, úgy észleljük, mintha mi mennénk az ellenkező irányba (saját mozgás illúziója).

Valódi mozgás

Mozgásérzékelési küszöbünk nagyon alacsony (adaptív érték). Főleg a retina külső részei, a csapok érzékenyek a mozgásra (mozgást már akkor is érzékelünk, ha a tárgy a csap átmérőjének egyötödével mozdul el). Ezzel a megfigyelő anticipálja azt, amit majd odafordulva látni fog, és ez hatékony segítség a további explorációhoz (Neisser).

Sokkal jobban érzékeljük a relatív mozgást (elmozdulás mintázott háttér előtt), mint az abszolút mozgást. Gibson szerint a háttértakarás-felfedés alapján közvetlenül észleljük a mozgást (úgy, mint a távolságot).

A mozgás egyes paramétereit (pl. irányt) kódoló specializált sejtek találhatók a látókéregben. Ezért szelektív sérülés lehetséges (pl. egy nőbeteg nem észlelte a vízszint emelkedését, a másik mozgását, nem értette a beszédet, ha nézte a szájmozgást).

Szelektív adaptáció : az adott irányú mozgásra specializált sejtek érzékenységének csökkenése a mozgás szemlélése közben (fáradás). Az érzékenység csökkenését a mozgási utóhatás bizonyítja (pl. vízesés nézése után úgy tűnik, a szikla felfelé mozog).

Biológiai mozgások

Az észlelőrendszer meg tudja állapítani, hogy élőlénytől származik-e a mozgás.

Johansson kísérlete: ember ízületeihez sötétben világító pontokat erősített. Ha nem mozog, random ponthalmaznak látjuk. Ha mozog, felismerjük, hogy ember és hogy mit csinál. Ha visszajelzést kapunk a saját mozgásunkról, felismerjük magunkat. Az azonosításokhoz 200 ms elegendő (automatizmus).

A 4. hónaptól a csecsemő az emberi mozgást preferálja (Fox & McDaniel).

A férfi-női mozgás megkülönböztetésének alapja, hogy máshol van a mozgáscentrum (Cutting).

Vizuális vezetés lokomóció során

Követjük a szemünkkel a tárgyat; honnan tudjuk, hogy odaértünk a tárgyhoz (vagy az hozzánk)? Onnan, hogy a retinális kép hirtelen nagyra nő. Már kisbabák is megrettennek a hirtelen naggyá vált tárgytól. Az optikai áramlás iránya is segít (Sekuler-Blake, 287.old).

Szemmozgások

1. Céltárgy megtalálására: szakkádikus (ugráló) szemmozgás. Célja: a foveába hozni a tárgyat. Időtartama: 0,5 sec, sebessége: 20 cm/sec. Iránya, sebessége nem változtatható útközben. Olvasáskor kb. 5x/sec.

A mozgatórendszere nem fáradékony.

A mozgás alatt nincs információ-felvétel, csak előtte és utána. Ennek magyarázatai:

a) a mozgás túl gyors (felső küszöb feletti).

b) a megállókban felvett információ maszkolja az útközbenit.

c) a gyorsaság miatt nincs pontos információ a szem irányáról, ezért a látórendszer inkább kihagyja.

Mikroszakkád: állandó, apró ugrálás a stabilizált retinakép elkerülése érdekében.

Perceptuális stabilitás: a szemmozgásokat kivonjuk a tárgy mozgásaiból. A szemmozgató izom küldi az impulzust vagy már a mozgásparancs kiadásakor megy az impulzus? Kísérlet: vizsgálták a passzív szemmozgatást (nincs parancs, van mozgás) és a szemizmok bénítását (van parancs, nincs mozgás). Az eredmények szerint a mozgásparancs számít.

2. Követő (folyamatos) szemmozgás

Célja: szemmel tartani a tárgyat úgy, hogy az információ-felvétel maximális legyen.

Prediktív szakkád: oda ugrik a tekintetünk, ahol elvárjuk a tárgyat. Ehhez tapasztalat kell (a kicsik rosszul teljesítenek - pl. ingát nézve továbbviszik a tekintetüket).

Dinamikus vizuális élesség: a lencsegörbület hozzáigazítása a mozgó tárgyhoz.

3. Fixáló nézés

Fejünk, testünk mozgásai ellenére is tudunk fixálni, mert a vesztibuláris rendszer jelzi a mozgást, és a vizuális rendszer ellenlépéseket tesz (vesztibuláris szemmozgások). Az összhang sérülhet (``lötyög' a látvány) pl. nagy dózisú antibiotikumoktól vagy idegen szemüveg viselésétől. Azonban idővel adaptálódunk.

Információfeldolgozás szövegolvasáskor (Marton M.)

Olvasás közben a szemmozgás szakkádikus (fixálást ugrás követ, majd megint fixálás stb.). Az olvasáskutatás egyik alapkérdése, hogy a szakkád megindulása előtt megtörténik-e a fixált információ feldolgozása.

Hogaboam: fixáció alatt lezajlik a szó bekódolása és mentális szótárban való elérése, de tovább folytatódik a szó jelentésének beillesztése a mondatba (szintaktikai osztályozás).

Agyi potenciál-vizsgálatok: a szövegbe kevésbé illő szavaknál észrevettek egy késői negatív összetevőt, ami a szemantikai feldolgozást jelentheti .

Marton kísérletei: folyamatos illetve szavankénti olvasást vizsgált. A k.sz.-eknek (csak 9-en voltak!) történeteket kellet olvasniuk, amelynek volt unalmas (elővételezhető) és érdekes (meglepő) része.

A folyamatos olvasásnál volt eltérés (késői negatív potenciál az érdekes részeknél). Ez a különbség a 300 ms-nál hosszabb fixációknál mutatkozott (az összes fixáció 25%-a volt ilyen), tehát az ennél rövidebb fixációk alatt nem valósul meg a szemantikai feldolgozás (csak lexikai azonosítás).

Szavankénti olvasásnál nem mutatkozott különbség az érdekes és az unalmas részek között. Ennek oka azonban lehet az is, hogy az adott mondattípus (érdekes/unalmas) szavainak potenciáljait egyetlen átlagban összesítették, így elmosódhattak az egyedi potenciálkülönbségek.

Következtetés: a hosszabban fixált szavak az adott mondatrész kulcsszavai.

Nincsenek megjegyzések:

Való világ 4 élőben az interneten

Való világ 4 élőben az interneten