WIDZENIE

Zjawiska umysłowe, wszelkie świadome i nieświadome zjawiska psy­chiczne, doz­na­nia wzrokowe czy słu­chowe, doz­na­nia bólu, łaskot­ki, swędze­nie, myśli, z pewnoś­cią całość naszego życia psy­chicznego, są efek­tem pro­cesów zachodzą­cych w naszym mózgu (Sear­le, 1995)

Ogólna budowa szlaku wzrokowego

Móz­gowe pro­cesy leżące u podłoża doświad­czenia widzenia są real­i­zowane przez sieci neu­ronów, tworzą­cych tzw. szlak wzrokowy. Jest to skom­p­likowana funkcjon­al­nie i anatomicznie struk­tu­ra bio­log­icz­na, która w najwięk­szym uproszcze­niu skła­da się z trzech mod­ułów. Pier­wszy mod­uł, to oczy, a ściślej ich układy opty­cznesiatków­ki. Na dru­gi mod­uł składa­ją się wszys­tkie struk­tu­ry pod­ko­rowe, leżące między oczy­ma a korą mózgu, zwłaszcza w pła­cie potylicznym. I trze­ci mod­uł, najbardziej skom­p­likowany, najm­niej poz­nany a zarazem, jak się wyda­je, najważniejszy dla widzenia to połąc­zone ze sobą korowe obszary w różnych płat­ach mózgu (ryc. 4).

Ryci­na 4. Schemat struk­tur tworzą­cych neu­ronalne ścież­ki wzrokowe. Opra­cow­anie graficzne P.A.

Podzi­ał szlaku wzrokowego na trzy częś­ci wyni­ka z uję­tych zgrub­nie funkcji real­i­zowanych przez struk­tu­ry zna­j­du­jące się w ramach każdej z nich. Pier­wszy mod­uł – oczy – jest odpowiedzial­ny za rejes­trację światła i wstęp­ną orga­ni­za­cję danych sen­so­rycznych. W drugim mod­ule, dane te są porząd­kowane i kat­e­go­ry­zowane. Oby­d­wie te częś­ci tworzą tzw. wczes­ny etap szlaku wzrokowego. W trzec­im mod­ule, najbardziej skom­p­likowanym funkcjon­al­nie i struk­tu­ral­nie, dane sen­so­ryczne są anal­i­zowane, a następ­nie inte­growane i syn­te­ty­zowane. Współpracu­jące ze sobą struk­tu­ry mózgu tworzące ten blok określa się jako wyższe lub późne etapy przetwarza­nia danych sen­so­rycznych. Final­nym efek­tem pra­cy wszys­t­kich tych mod­ułów jest subiek­ty­wne doświad­cze­nie widzenia.

Procesy oddolne i odgórne

Kierunek przepły­wu impul­sów ner­wowych na szlaku wzrokowym został zasyg­nal­i­zowany na ryc. 4 za pomocą strza­łek. Pomarańc­zowe strza­ł­ki wskazu­jące kierunek od oczu przez struk­tu­ry pod­ko­rowe do kory mózgu oznacza­ją tzw. odd­olne pro­cesy przetwarza­nia danych sen­so­rycznych lub inaczej – z dołu do góry (bot­tom-up). Zgod­nie z tym kierunk­iem przepły­wu danych sen­so­rycznych, do płatów kory mózgu przekazy­wane są dane o rozkładzie światła docier­a­jącego do oczu obser­wa­to­ra w takim zakre­sie, w jakim fotore­cep­to­ry je rejestru­ją, a połąc­zone z nimi komór­ki ner­wowe – przekażą wyżej. Oznacza to, że jeśli jakaś część sce­ny wiz­ual­nej jest, np. jaśniejsza niż inna, to inten­sy­wniej oświ­et­lone recep­to­ry zareagu­ją z więk­szą siłą, pro­por­cjon­al­nie do jej jas­noś­ci i taką też infor­ma­cję przekażą do góry, w kierunku cen­trali, czyli różnych częś­ci kory mózgu.

Na pozór mogło­by się wydawać, że jeśli mówimy o per­cepcji wiz­ual­nej to odd­ol­ny kierunek przetwarza­nia danych sen­so­rycznych jest jedynym możli­wym sposobem poz­nawa­nia świa­ta za pomocą wzroku. Oczy, niczym aparat fotograficzny lub kam­era wideo, rejestru­ją światło a mózg inter­pre­tu­je jego rozkład, tworząc treść subiek­ty­wnego doświad­czenia widzenia. W rezulta­cie obser­wa­tor ma poczu­cie, że wie, co zna­j­du­je się przed jego oczy­ma. Nic jed­nak bardziej myl­nego. Codzi­enne doświad­cze­nie pod­suwa tysiące przykładów, które przeczą zasadzie mechan­icznej rejes­tracji wideo, za pośred­nictwem oczu-kamer lub oczu-aparatów fotograficznych. Nie znaczy to byna­jm­niej, że nie ma żad­nych podobieństw między oczy­ma i mechan­iczny­mi środ­ka­mi rejes­tracji obrazu. Ale jed­na różni­ca jest zasad­nicza, aparaty nie mają nic do pomyśle­nia o świecie, który rejestru­ją. Co najwyżej mogą zasyg­nal­i­zować, że w kadrze zna­j­du­je się, np. ludz­ka twarz. Nie mają jed­nak zielonego poję­cia do kogo ona należy, a także co łączy nas z jej właś­ci­cielem lub właścicielką.

Cho­ci­aż zakres obuocznego pola widzenia człowieka w płaszczyźnie hory­zon­tal­nej wynosi ok. 180° a w płaszczyźnie wer­tykalnej ok. 130°, to prze­cież nie jest tak, że z taką samą wyrazis­toś­cią spostrzegamy wszys­tkie obiek­ty zna­j­du­jące się w tym obszarze. Pon­ad­to, obec­noś­ci niek­tórych rzeczy może­my w ogóle nie dostrzec, jeśli będą niety­powe lub nieis­totne z punk­tu widzenia aktu­al­nie wykony­wanego zada­nia. Może­my, np. przeoczyć gory­la przechadza­jącego się po boisku między koszykarza­mi, którzy poda­ją do siebie piłkę wtedy, gdy skon­cen­tru­je­my się na zlicza­niu tych podań (Simons i Chabis, 1999). Te włas­noś­ci sys­te­mu wzrokowego intu­icyjnie wyko­rzys­tu­ją mis­tr­zowie kine­matografii, z Alfre­dem Hitch­cock­iem na czele.

Może­my również błęd­nie domyślać się obec­noś­ci jak­iś przed­miotów w sce­nie wiz­ual­nej, tylko dlat­ego, że częs­to widy­wal­iśmy je w podob­nych sytu­ac­jach. Na przykład, może­my być pewni, że widzieliśmy włącznik światła na ścian­ie obok drzwi, choć fak­ty­cznie go tam nie było. Krótko mówiąc, mózg akty­wnie przetwarza dane sen­so­ryczne i oce­nia ich przy­dat­ność ze wzglę­du na aktu­al­nie wykony­wane zadanie. Efek­tem tego pro­ce­su może być równie dobrze zig­norowanie całkiem sporej grupy danych sen­so­rycznych lub prze­ci­wnie, wzbudze­nie mięśni steru­ją­cych rucha­mi gałek ocznych w celu prze­niesienia wzroku w inną część sce­ny, by sięgnąć po nowe dane. Wszys­tkie te pro­cesy określa się ogól­ną nazwą pro­cesów odgórnych lub inaczej – z góry na dół (top-down). Na ryc. 4 ten kierunek został zaz­nac­zony strza­łka­mi skierowany­mi w dół w kolorze fioletowym.

Pro­cesy odgórne zarządza­ją przetwarzaniem danych sen­so­rycznych, w tym sen­sie, że fil­tru­ją je ze wzglę­du na rodzaj aktu­al­nie wykony­wanego zada­nia, intencję, potrze­by, nastaw­ie­nie, przeko­na­nia, wiedzę lub oczeki­wa­nia obser­wa­to­ra. Ich wyni­ki mają wpływ na ruch gałek ocznych, ukierunk­owu­jąc osie widzenia na te ele­men­ty obrazu, które wyma­ga­ją głęb­szej anal­izy. Wszech­stronne bada­nia ekspery­men­talne doty­czące roli nastaw­ienia rozu­mi­anego, jako uogól­niony stan gotowoś­ci do określonej formy reagowa­nia, również w zakre­sie per­cepcji wiz­ual­nej, były prowad­zone już w lat­ach 60. XX wieku przez uczniów Dymi­tra Uznadzego, w ramach tzw. gruz­ińskiej szkoły psy­cho­log­icznej (Bżaława, 1970; Prangiszwili, 1969; Uznadze, 1966).

Pod­sumowu­jąc, subiek­ty­wne doświad­cze­nie widzenia jest wynikiem przetwarza­nia danych sen­so­rycznych za pomocą pro­cesów, które w porząd­ku z dołu do góry orga­nizu­ją je i „przepy­cha­ją” w kierunku wyższych pięter mózgu oraz pro­cesów odgórnych, które selekcjonu­ją i mody­fiku­ją te dane w zależnoś­ci od aktu­al­nych potrzeb, przekon­ań lub wiedzy obser­wa­to­ra, a także odgórnie wpły­wa­ją na kadrowanie następ­nych frag­men­tów sce­ny wizualnej.

Systemy analizy zawartości i kadrowania sceny wizualnej

Na ryc. 4 zaz­nac­zono wiele różnych struk­tur móz­gowych, które biorą udzi­ał w przetwarza­niu danych sen­so­rycznych na wczes­nych i późnych eta­pach szlaku wzrokowego. Struk­tu­ry te są połąc­zone ze sobą w nieprzy­pad­kowy sposób, podob­nie jak nieprzy­pad­kowo połąc­zone są ze sobą tranzys­to­ry na płytce drukowanej radiood­biorni­ka. Poszczególne struk­tu­ry mózgu (zwane jądra­mi, obszara­mi, płacika­mi, bruz­da­mi, zakrę­ta­mi itd.) są pow­iązane ze sobą za pomocą aksonów komórek ner­wowych, czyli prze­wodów, po których z ciała jed­nej komór­ki bieg­ną impul­sy ner­wowe do innej. W tym bio­log­icznym układzie są takie struk­tu­ry, które tylko przesyła­ją impul­sy ner­wowe do innych, ale są i takie, które zarówno wysyła­ją, jak i bezpośred­nio lub pośred­nio otrzy­mu­ją od innych struk­tur infor­ma­c­je zwrotne. Co więcej, wewnątrz poszczegól­nych struk­tur mózgu również ist­nieją skom­p­likowane połączenia między tworzą­cy­mi je neu­ron­a­mi. Sieć wszys­t­kich tych połączeń jest naprawdę skom­p­likowana. Jed­nak ze wzglę­du na funkc­je, jakie pełnią różne sieci współpracu­ją­cych ze sobą skupisk neu­ronów, biorą­cych udzi­ał w przetwarza­niu danych wzrokowych, moż­na wyróżnić dwa główne sys­te­my. Są to: sys­tem kadrowa­nia i sys­tem anal­izy zawartoś­ci sce­ny wizualnej.

Każde doświad­cze­nie widzenia obe­j­mu­je tylko frag­ment więk­szej całoś­ci. Widz­imy, jak­by w ramkach (kadrach). Nie może­my jed­nocześnie widzieć wszys­tkiego, co dzieje się z każdej strony głowy. Oglą­danie czegokol­wiek jest więc sek­wencją kadrów, czyli widoków rzeczy, ogranic­zonych polem widzenia. Chcąc zobaczyć niewidoczne frag­men­ty sce­ny trze­ba zmienić miejsce, z którego jest ona aktu­al­nie oglą­dana lub pozosta­jąc w tym samym miejs­cu, zmienić położe­nie oczu lub głowy. Tę funkcję real­izu­je neu­ronal­ny sys­tem kadrowa­nia sce­ny wiz­ual­nej, który kieru­je ruchem gałek ocznych (a także ruchem głowy i całego ciała), fik­su­jąc osie widzenia na najbardziej intere­su­ją­cych częś­ci­ach sce­ny wizualnej.

Jak nietrud­no się domyślić różni­ca między oglą­daniem dowol­nej sce­ny wiz­ual­nej a oglą­daniem obrazu pole­ga na tym, że nieza­leżnie od nat­u­ral­nych ograniczeń zakre­su pola widzenia, obraz ma również swo­je granice. W obrazach muzeal­nych wyz­nacza­ją je ramy, odci­na­jące zamalowaną powierzch­nię dzieła od ściany. Rama­mi obrazu równie dobrze mogą być krawędzie ekranu kinowego, mon­i­to­ra telewiz­yjnego, kom­put­era, obrys zdję­cia w gaze­cie, a także kur­ty­na teatral­na, czy nawet bardziej umowne, a prze­cież również ist­niejące granice, w ramach których real­i­zowane jest przed­staw­ie­nie w przestrzeni miejskiej lub sali wid­owiskowej. Oglą­danie obrazu wyma­ga ignorowa­nia tego, co zna­j­du­je się poza jego grani­ca­mi, zwłaszcza, gdy nat­u­ral­ny zakres pola widzenia obe­j­mu­je również tę przestrzeń. Bar­wa czy fak­tu­ra ściany, na której wisi obraz nie należą do niego. Oglą­danie obrazu doma­ga się zatem przede wszys­tkim respek­towa­nia wyz­nac­zonych przezeń ograniczeń przestrzen­nych. Oglą­dać obrazwidzieć ten obraz w przestrzeni, np. muzeum, to jakoś­ciowo zupełnie różne dwa akty widzenia.

Drugą ważną cechą widzenia jest to, że kadr wyz­nac­zony przez zakres pola widzenia lub ramy obrazu zawsze ma jakąś treść. Składa­ją się nań rzeczy tworzące scenę, ich bar­wy, tło, kom­pozy­c­ja przestrzen­na, ruch. Zrozu­mie­nie sce­ny wiz­ual­nej wyma­ga, aby jej cechy zostały przeanal­i­zowane i skon­fron­towane z posi­adaną wiedzą i doświad­cze­niem wiz­ual­nym. Jest to real­i­zowane przez neu­ronal­ny sys­tem anal­izy zawartoś­ci obrazu. Pod­sta­wową funkcją tego sys­te­mu jest doprowadze­nie do subiek­ty­wnego doświad­czenia widzenia cho­ci­aż niekoniecznie musi to być równoz­naczne z rozu­mie­niem tego, co jest właśnie widziane.

Wiele osób, które po raz pier­wszy miało okazję zobaczyć pon­ad czterometrowej dłu­goś­ci płót­no Mar­ka Rothko (ryc. 5) zada­je sobie pytanie: „O co tu chodzi?”, lub w wer­sji bardziej radykalnej: „Dlaczego to w ogóle jest trak­towane jako dzieło sztu­ki?”. Brak wiedzy, częs­to nie tylko wiz­ual­nej, może być poważnym ogranicze­niem poziomu i głębokoś­ci rozu­mienia obrazu. Nieza­leżnie jed­nak od tego czy trafnie rozu­mi­ane jest to, co widać na obra­zie, bez wąt­pi­enia neu­ronal­ny sys­tem anal­izy zawartoś­ci sce­ny wiz­ual­nej zawsze dąży do nada­nia sen­su widzianemu.

Ryci­na 5. Mark Rothko, Czer­wone na bor­dowym. Fresk, Sekc­ja 7 (1959). Tate Mod­ern, Lon­dyn, Wiel­ka Bry­ta­nia [182,9 x 457,2 cm]
Dzieląc sys­te­my wzrokowe: na sys­tem kadrowa­nia i sys­tem anal­izy zawartoś­ci warto również dodać, że oby­d­wa te sys­te­my dzi­ała­ją w odd­ol­nym i odgórnym try­bie przetwarza­nia danych sen­so­rycznych. Z jed­nej strony, w niemal każdej sce­nie są bowiem takie ele­men­ty, które bardziej przy­ciągną uwagę i w tym sen­sie pobudza­jąc sys­tem kadrowa­nia sce­ny wiz­ual­nej, akty­wiz­u­ją sys­tem anal­izy jej zawartoś­ci w try­bie przetwarza­nia odd­alonego. Z drugiej strony, ta sama sce­na może podle­gać specy­ficznej anal­izie i być kadrowana w zależnoś­ci o aktu­al­nie wykony­wanego zada­nia przez obser­wa­to­ra, co jest real­i­zowane w try­bie odgórnego przetwarza­nia danych sensorycznych.

SYSTEM ANALIZY ZAWARTOŚCI OBRAZU

Cechy sceny wizualnej

Min­i­mal­nym warunk­iem subiek­ty­wnego doświad­czenia widzenia jest zare­je­strowanie (spostrzeże­nie) ksz­tał­tu fig­ury płask­iej (dwuwymi­arowej) lub trójwymi­arowego obiek­tu w przestrzeni zna­j­du­jącej się w polu widzenia obser­wa­to­ra. Nie rozstrzygam tutaj, czy najpierw widz­imy rzeczy w dwóch czy w trzech wymi­arach, ponieważ spór w tej spraw­ie wciąż nie jest rozstrzyg­nię­ty (np. Marr, 1982; Piz­lo, 2008). Nieza­leżnie jed­nak od tego, ów ksz­tałt, równie dobrze może być prosty, np. punkt lub kon­tur fig­ury geom­e­trycznej, jak i złożony, np. prze­jeżdża­ją­cy samochód.

W nat­u­ral­nych warunk­ach niezwyk­le rzad­ko mamy do czynienia z sytu­acją, w której nie widz­imy żad­nego ksz­tał­tu w polu widzenia, czyli czegoś, co granicząc z czymś innym, ujaw­nia swo­ją odręb­ność. Prze­by­wanie w gęstej, nieprzeniknionej ciem­noś­ci lub we mgle może prowadz­ić do wniosku, że nic nie widz­imy. Owo „nic” oznacza to po pros­tu nieobec­ność jakiegokol­wiek ksz­tał­tu. Ksz­tałt jest pod­sta­wową cechą defini­cyjną każdej fig­ury lub obiek­tu i ich częś­ci, a także cechą tła i przestrzeni, w jakiej się one zna­j­du­ją, czyli cechą defini­cyjną każdej sce­ny wiz­ual­nej (Bag­ińs­ki i Fran­cuz, 2007; Fran­cuz i Bag­ińs­ki, 2007). Ksz­tał­ty widzianych rzeczy są najważniejszym kry­teri­um ich kat­e­go­ryza­cji (Fran­cuz, 1990) oraz stanow­ią pod­stawę wiedzy o wyglą­dach świa­ta (Barsa­lou, 1999). Mogą wyz­naczać granice rzeczy nazwanych, ale również nienazwanych.

O ile doświad­cze­nie nieobec­noś­ci jakichkol­wiek ksz­tałtów w polu widzenia w nat­u­ral­nych warunk­ach jest raczej dość rzad­kie, o tyle sztu­ka współczes­na dostar­cza wielu mod­e­lowych przykładów obrazów, które staw­ia­ją odbior­cę wobec takiego doświadczenia.

W 1951 roku Robert Rauschen­berg wys­taw­ił ser­ię prowoka­cyjnych obrazów zaty­tułowanych Białe płót­na, na których nie było po pros­tu nic namalowane (ryc. 6). Nawet granice obrazów były wyz­nac­zone tylko przez cie­nie rzu­cane na ścianę przez blejtramy.

Ryci­na 6. Robert Rauschen­berg, Białe płót­na (1951). San Fran­cis­co Muse­um of Mod­ern Art, San Fran­cis­co, USA [182,9 x 274,3 cm]
Białe płót­na Rauschen­ber­ga ujaw­ni­a­ją dwie sub­telne granice, pier­wszą – między widze­niem sce­ny, której ele­mentem jest obraz a oglą­daniem obrazu i drugą – między odd­ol­ny­mi i odgórny­mi proce­sa­mi przetwarza­nia danych sen­so­rycznych. Z jed­nej strony, obraz na ryc. 6 nie zaw­iera żad­nej treś­ci, choć treś­cią sce­ny wiz­ual­nej, w której się on zna­j­du­je, są trzy poma­lowane na biało, pros­tokątne płót­na. Z drugiej strony właśnie dlat­ego, że te obrazy nie zaw­ier­a­ją żad­nych ksz­tałtów prowoku­ją umysł odbior­cy do wypełnienia ich dowol­ny­mi treś­ci­a­mi. Do podob­nych wniosków w dziedzinie muzy­ki doszedł przy­ja­ciel Rauschen­ber­ga, John Cage, który w 1952 roku skom­ponował i wykon­ał słyn­ny utwór „4,33” na orkiestrę sym­fon­iczną. Pod­czas wyko­na­nia tego utworu nie zabrzmi­ał ani jeden instru­ment. Ksz­tałt, podob­nie jak dźwię­ki utworu muzy­cznego są zatem kat­e­go­ri­a­mi, które odnoszą się zarówno do tego co rejestru­ją zmysły (oczy lub uszy), jak i do tego, co wyt­warza umysł obser­wa­to­ra lub słuchacza.

Drugą włas­noś­cią każdej sce­ny wiz­ual­nej jest bar­wa (col­or), czyli konkret­na jakość zmysłowa, która przysługu­je fig­urze lub obiek­towi wyz­nac­zone­mu przez jego ksz­tałt albo tłu. Bar­wę moż­na opisać za pomocą trzech wymi­arów: odcienia (hue), czyli inaczej tego, co na ogół rozu­miemy pod poję­ciem koloru czer­wonego lub niebieskiego, jas­noś­ci (light­ness, bright­ness, val­ue), zwanej także lumi­nancją (lumi­nance) lub walorem bar­wy (col­or val­ue), charak­teryzu­ją­cym jej jas­ność na kon­tin­u­um między czernią a bielą oraz nasyce­nia (sat­u­ra­tion, chro­ma), czyli tego, co odbier­amy jako inten­sy­wność bar­wy. Cza­sem doda­je się jeszcze połysk (gloss), który jest pochod­ną charak­teru powierzch­ni lub mate­ri­ału pokry­tego bar­wą. Spostrze­gane różnice między płaszczyz­na­mi obrazu w zakre­sie jas­noś­ci (lumi­nancji) oraz odcienia są ważny­mi wskazówka­mi doty­czą­cy­mi ksz­tałtów fig­ur lub obiek­tów w sce­nie wiz­ual­nej. Oprócz wymienionych włas­noś­ci zmysłowych, bar­wom przyp­isy­wane są także różne wartoś­ci sym­bol­iczne, które mogą mody­fikować znaczenia widzianych rzeczy (Gage, 2010; Popek, 2012; Zielińs­ki, 2008).

Trze­cią charak­terystyką sce­ny wiz­ual­nej jest jej przestrzen­na orga­ni­za­c­ja w dwóch lub w trzech wymi­arach. Jeżeli kon­sty­tu­ty­wną cechą sce­ny jest spostrzeże­nie w niej co najm­niej jed­nego ksz­tał­tu, który sugeru­je obec­ność jakiejś rzeczy i odd­ziela ją od tła, to nat­u­ral­nie ta rzecz musi zna­j­dować się w określonym miejs­cu w przestrzeni. Odwołanie się do poję­cia miejs­ca rzeczy w sce­nie wiz­ual­nej uświadamia, że jest ona przed­staw­ie­niem oglą­danym z jakiegoś punk­tu widzenia oraz, że jest ona ogranic­zona przez zakres pola widzenia obser­wa­to­ra lub ramy obrazu.

Określe­nia miejs­ca rzeczy takie jak, np. „z prawej” lub „z lewej strony”, „wyżej” lub „niżej”, a także „bliżej” lub „dalej” zarówno od obser­wa­to­ra, jak i od siebie nawza­jem, zawsze są zre­laty­wiz­owane do punk­tu, z jakiego dany układ rzeczy jest widziany oraz do ram kadru. W takim samym stop­niu doty­czy to całych scen wiz­ual­nych, jak i obrazów. Waga pozy­cji obser­wa­to­ra w sto­sunku do widzianej przez niego sce­ny jest tak duża, że moż­na nawet mówić o jego ego­cen­trycznej pozy­cji w świecie oglą­danych rzeczy (Goodale i Mil­ner, 2008). Owo uprzy­wile­jowanie bierze się z fak­tu, że w sce­nie wiz­ual­nej obser­wa­tor nie tylko widzi rzeczy, ale widzi również relac­je między nimi. Spostrze­gane w płaszczyźnie prostopadłej do osi widzenia relac­je między rzecza­mi w sce­nie wiz­ual­nej i w obra­zie są intu­icyjnie usta­lane w odniesie­niu do stron ciała obser­wa­to­ra i nat­u­ral­nych ram, wyz­nac­zonych przez zakres jego pola widzenia, a także przez ramy obrazu. Z kolei dostrzeże­nie relacji między rzecza­mi wzdłuż linii równoległych do osi widzenia, czyli w głąb, nie jest już tak oczy­wiste i wyma­ga stosowa­nia spec­jal­nych pro­ce­dur przetwarza­nia danych siatkówkowych i wiedzy o wskaźnikach głębi, w celu ich uchwycenia.

Czwartą i zarazem ostat­nią cechą sce­ny wiz­ual­nej jest jej dynami­ka. Jest ona pochod­ną szy­bkoś­ci, zmi­en­noś­ci, przyspieszenia i tra­jek­torii ruchu, zarówno przed­miotów wewnątrz sce­ny wiz­ual­nej, jak i obser­wa­to­ra. Ruch rzeczy zna­j­du­ją­cych się w sce­nie wiz­ual­nej desta­bi­lizu­je relac­je przestrzenne między nimi. Dodatkowo obser­wa­tor może zmieni­ać swo­je położe­nie wzglę­dem danej sce­ny, zmieni­a­jąc tym samym punkt jej widzenia. I nie chodzi tu tylko o przemieszczanie się obser­wa­to­ra w przestrzeni (np. oglą­danie wys­taw skle­powych pod­czas spaceru), ale również o ruch jego oczu, który powodu­je przenosze­nie osi widzenia na różne frag­men­ty sce­ny. Krótko mówiąc, ruch przed­miotów w sce­nie wiz­ual­nej i ruch obser­wa­to­ra pod­czas jej oglą­da­nia w najwyższym stop­niu kom­p­liku­ją anal­izę subiek­ty­wnego doświad­czenia widzenia. Zgod­nie z wcześniejszą zapowiedz­ią, zagad­nie­nie ruchu w obra­zie, czyli wewnątrz kadru nie jest przed­miotem tej książ­ki, nato­mi­ast ruch obser­wa­to­ra, a w szczegól­noś­ci ruch jego gałek ocznych pod­czas oglą­da­nia obrazu, oczy­wiś­cie – tak.

Wymienione cztery cechy sce­ny wiz­ual­nej: ksz­tałt, bar­wa, orga­ni­za­c­ja przestrzen­na i dynami­ka, w grun­cie rzeczy dają się sprowadz­ić do dwóch kat­e­gorii, cho­ci­aż nie są to kat­e­gorie rozłączne. Pier­wszą, stanow­ią te włas­noś­ci sce­ny, które pozwala­ją obser­wa­torowi rozpoz­nać zna­j­du­jące się w niej przed­mio­ty i orzec coś o ich for­ma­ch i barwach. Jest to kat­e­go­ria rzeczy. Per­cep­cyj­na anal­iza egzem­plarzy tej kat­e­gorii na ogół nie zależy ani od tego, gdzie się one zna­j­du­ją w sto­sunku do obser­wa­to­ra, ani też od tego czy zna­j­du­ją się one w ruchu czy też są ustabilizowane.

Z kolei orga­ni­za­c­ja przestrzen­na i ruch obiek­tów w sce­nie wiz­ual­nej niemal zawsze odnoszą się do czegoś, o czym może­my powiedzieć, że ma jak­iś ksz­tałt i bar­wę. Dostrzeże­nie rzeczy, jako zna­j­du­jącej się, np. z prawej strony sce­ny wiz­ual­nej wyni­ka z jej położe­nia wzglę­dem ciała obser­wa­to­ra. Cechy te mają jed­nak nie tylko wyraźny związek z reprezen­tacją jego ciała, ale także z moto­ryką. Ogól­nie rzecz biorąc orga­ni­za­c­ja przestrzen­na i ruch obiek­tów w sce­nie wiz­ual­nej tworzą kat­e­gorię relacji.

Wymienione kat­e­gorie cech sce­ny wiz­ual­nej nie są rozłączne, ponieważ ist­nieją takie doświad­czenia wiz­ualne, które leżą na ich styku. Bard­zo szy­bko porusza­ją­cy się obiekt lub obser­wa­tor, poprzez całkowite zatar­cie się linii kon­tur­owych, a nawet barw rzeczy zna­j­du­ją­cych się w sce­nie wiz­ual­nej, mogą wywołać doświad­cze­nie widzenia ruchu, który nie jest ruchem rzeczy o określonym ksz­tał­cie. Ze wzglę­du na dużą szy­bkość, z jaką obser­wa­tor może się poruszać, jak również ze wzglę­du możli­woś­ci w zakre­sie kre­owa­nia obrazów za pośred­nictwem mediów elek­tron­icznych, licz­ba takich doświad­czeń stale rośnie. Jak dotąd ewoluc­ja nie wyk­sz­tał­ciła sprawnych mech­a­nizmów radzenia sobie z taki­mi sytu­ac­ja­mi. Najlep­szym tego prze­jawem są niewy­jaśnione mech­a­nizmy wielu iluzji opty­cznych w zakre­sie per­cepcji ruchu, wyt­wor­zone za pomocą cyfrowych tech­nik wiz­ual­iza­cji (zob. np. strona Michaela Bacha, Opti­cal Illu­sions & Visu­al Phe­nom­e­na), a także złudzenia, jakim ule­ga­ją, np. piloci samolotów odrzu­towych (Bednarek, 2011).

Widzenie, jako akt kreacji

Znakomite wprowadze­nie do prob­lematy­ki funkcjonowa­nia neu­ronal­nego sys­te­mu anal­izy zawartoś­ci sce­ny wiz­ual­nej zaw­iera artykuł Mar­garet Liv­ing­stone i Davi­da Hubela (lau­re­a­ta nagrody Nobla z dziedziny fizjologii i medy­cyny w roku 1981), opub­likowany w 1988 roku w Sci­ence. Cho­ci­aż od jego wyda­nia minęło już ćwierćwiecze, a wyni­ki badań w dziedzinie neu­ronau­ki poz­naw­czej zwery­fikowały więk­szość for­mułowanych w nim hipotez, doty­czą­cych przetwarza­nia danych wzrokowych, to nadal stanowi on aktu­alne i wiary­godne źródło infor­ma­cji na tem­at struk­tu­ry i funkcji poszczegól­nych ele­men­tów skład­owych szlaku wzrokowego.

Pod­sta­wowym ustal­e­niem doty­czą­cym funkcji szlaku wzrokowego w for­mowa­niu się subiek­ty­wnego doświad­czenia widzenia jest stwierdze­nie, że poczy­na­jąc od komórek ner­wowych zna­j­du­ją­cych się w siatkówkach obu oczu obser­wa­to­ra, a kończąc na różnych struk­tu­rach jego mózgu, wymienione w poprzed­nim para­grafie cechy sce­ny wiz­ual­nej takie, jak: ksz­tałt, bar­wa, ori­en­tac­ja przestrzen­na dwu- i trójwymi­arowa oraz ruch, są anal­i­zowane przez cztery, częś­ciowo nieza­leżnie od siebie ścież­ki (podsys­te­my) neu­ronalne. Stwierdze­nie to ma fun­da­men­talne znacze­nie dla zrozu­mienia, w jaki sposób dochodzi do pow­sta­nia doświad­czenia widzenia sce­ny i zna­j­du­ją­cych się w niej rzeczy. Otóż wyni­ka z niego, że zare­je­strowane przez fotore­cep­to­ry dane doty­czące rozkładu światła wpada­jącego w danym momen­cie do oka, na prze­waża­jącej częś­ci szlaku wzrokowego są przed­miotem częś­ciowo nieza­leżnych od siebie anal­iz, prowad­zonych przez cztery wyspec­jal­i­zowane podsys­te­my ner­wowe. Celem ich akty­wnoś­ci jest zin­ter­pre­towanie tych danych ze wzglę­du na cechy przed­miotów i/lub ich frag­men­tów, które aktu­al­nie zna­j­du­ją się w polu widzenia obser­wa­to­ra w świ­etle posi­adanych doświad­czeń wizualnych.

Doświad­cze­nie widzenia kom­plet­nej sce­ny wiz­ual­nej nie jest efek­tem prostego odzwier­ciedle­nia obrazu rzu­towanego na siatkówkę oka (jak, np. w cam­era obscu­ra), ale zachodzi w dwóch zasad­niczych fazach: (1) dekom­pozy­cji, pole­ga­jącej na anal­i­ty­cznym i względ­nie nieza­leżnym od siebie bada­niu wymienionych cech sce­ny wiz­ual­nej, po uprzed­nim wyab­stra­howa­niu ich z siatkówkowego obrazu oraz (2) kom­pozy­cji, czyli inte­growa­niu (syn­te­ty­zowa­niu) wyników anal­iz przeprowad­zonych w fazie pier­wszej, z uwzględ­nie­niem danych zapisanych już uprzed­nio w pamię­ci wizualnej.

Obec­ność obu wymienionych faz w każdym akcie widzenia prowadzi do wniosku, że wynik inte­gracji sen­so­rycznej zawsze (w mniejszym lub więk­szym stop­niu) odb­ie­ga od zare­je­strowanych danych źródłowych. Oznacza to, że treś­ci doświad­czenia wiz­ual­nego są stale raczej wyt­warzane przez sys­tem wzrokowy, a nie – jak mogło­by się wydawać – odt­warzane z obrazów siatkówkowych. W tym sen­sie widze­nie jest aktem kreacji, pod­czas którego dochodzi do skon­struowa­nia obrazu rzeczy­wis­toś­ci zare­je­strowanej przez sys­tem fotore­cep­torów, zna­j­du­ją­cych się w siatkówkach oczu obserwatora.

Wczesny system analizy zawartości sceny wizualnej

Fotore­cep­to­ry umieszc­zone w siatków­ce wewnątrz oka rejestru­ją rozkład wpada­jącego doń światła. Jest to pier­wszy etap pro­ce­dury anal­izy zawartoś­ci sce­ny wiz­ual­nej. Najważniejsze struk­tu­ry neu­ronalne, które biorą udzi­ał w rejes­tracji i orga­ni­za­cji danych sen­so­rycznych na wczes­nych eta­pach szlaku wzrokowego zostały przed­staw­ione na ryc. 7.

Ryci­na 7. Struk­tu­ry neu­ronalne zaan­gażowane w anal­izę zawartoś­ci sce­ny wiz­ual­nej na wczes­nych eta­pach szlaku wzrokowego (rzut z boku i z dołu). Opra­cow­anie graficzne P.A.

Wczes­ny sys­tem anal­izy zawartoś­ci sce­ny wiz­ual­nej zasad­nic­zo skła­da się z dwóch odręb­nych struk­tur: oka (eye), a w szczegól­noś­ci układu opty­cznego, czyli soczew­ki, która zna­j­du­je się w przed­niej jego częś­ci i siatków­ki (reti­na), zlokali­zowanej na tyl­nej ścian­ie, wewnątrz oka oraz ciała kolan­ko­watego bocznego (lat­er­al genic­u­late nucle­us; LGN), leżącego mniej więcej w połowie dro­gi między oczy­ma a korą mózgu, w miejs­cu zwanym wzgórzem (thal­a­mus).

W siatkówkach oczu zna­j­du­ją się między inny­mi tzw. komór­ki zwo­jowe (gan­glion cells). Ich aksony, czyli wypust­ki, po których jak po dru­cie tele­fon­icznym bieg­ną syg­nały ner­wowe w głąb mózgu, tworzą nerw wzrokowy (optic nerve). Na odcinku między oczy­ma a LGN, zna­j­du­je się skrzyżowa­nie wzrokowe (optic chi­asm), miejsce, w którym wiąz­ka aksonów odprowadza­ją­cych syg­nały ner­wowe z każdego oka rozdziela się na dwie częś­ci. Połowa aksonów z lewego oka łączy się z połową aksonów z prawego oka (podob­nie dru­ga połowa aksonów komórek zwo­jowych wychodzą­ca z jed­nego i z drugiego oka) i dalej bieg­ną razem do prawej i do lewej półkuli mózgu. Odcinek między skrzyżowaniem wzrokowym a LGN nazy­wa się trak­tem wzrokowym (optic tract).

Z LGN impul­sy ner­wowe są przekazy­wane do tzw. pier­wot­nej kory wzrokowej (pri­ma­ry visu­al cor­tex lub stri­ate cor­tex) w pła­cie potylicznym mózgu za pośred­nictwem aksonów dużej grupy komórek, których ciała zna­j­du­ją się w LGN. Ten odcinek nazy­wa się promienis­toś­cią wzrokową (optic radi­a­tion) i z grub­sza domy­ka on pier­wszy etap przesyła­nia i przetwarza­nia danych sen­so­rycznych na szlaku wzrokowym.

Oko – metafora aparatu fotograficznego

Pod wielo­ma wzglę­da­mi budowa oka i aparatu fotograficznego są do siebie podob­ne. Zan­im wskażę na zasad­nicze różnice między nimi, warto przyjrzeć się tej analogii (ryc. 8).

Ryci­na 8. Schematy­cz­na budowa aparatu fotograficznego i oka. Opra­cow­anie graficzne P.A. na pod­staw­ie Groves i Schlesinger (1979)

Szlak wzrokowy rozpoczy­na się w oku. Podob­nie, jak aparat fotograficzny, oko skła­da się ze szczel­nej i szty­wnej obu­dowy. W oku nazy­wa się ją twar­dówką (scle­ra). Jej funkcją jest ochrona gał­ki ocznej przed uszkodzeni­a­mi mechan­iczny­mi oraz sta­bi­liza­c­ja jej kształtu.

W przed­niej częś­ci oka zna­j­du­je się układ opty­czny, czyli bio­log­iczny odpowied­nik obiek­ty­wu w apara­cie fotograficznym. Najbardziej na zewnątrz wysunię­ta jest przezroczys­ta rogówka (cornea), która podob­nie, jak twardówka zabez­piecza oko przed uszkodze­niem mechan­icznym. Pełni ona również funkcję swego rodza­ju fil­tra ochron­nego i soczew­ki o stałej ogniskowej. Tuż za rogówką zna­j­du­je się otwór obiek­ty­wu, zwany źrenicą (pupil), którego śred­ni­ca jest reg­u­lowana za pomocą przysłony, czyli tęczów­ki (iris).

Naw­iasem mówiąc, w odróżnie­niu od przysłony w apara­cie fotograficznym, tęczówka jest bar­w­na: najczęś­ciej brą­zowa (w różnych odcieni­ach), ale może być również szara, zielona lub niebies­ka (ryc. 8.1).

Ryci­na 8.1. Bar­wy tęczówek oczu w zależnoś­ci od iloś­ci pig­men­tu. Opra­cow­anie na pod­staw­ie Franssen, Cop­pens, van den Berg (2008)

Za tęczówką leży zmi­en­noog­niskowa soczewka (lens), jeden z najbardziej zdu­miewa­ją­cych narządów w naszym ciele. Ralf Dahm (2007) nazy­wa ją „krysz­tałem bio­log­icznym”. Soczewka oka ma dwie włas­noś­ci, które odróż­ni­a­ją ją od układu opty­cznego w apara­cie fotograficznym. Po pier­wsze, ma znakomitą przezroczys­tość, dzię­ki czemu prze­puszcza do wnętrza oka niemal 100% światła, oczy­wiś­cie pod warunk­iem, że jest w pełni spraw­na. Soczewka oka jest również zmi­en­noog­niskowa, co pozwala obser­wa­torowi na wyraźne oglą­danie rzeczy zna­j­du­ją­cych się w różnej odległoś­ci od niego. Mech­a­nizm zmi­any ogniskowej soczew­ki oka w niczym nie przy­pom­i­na zmi­any ogniskowej w obiek­ty­wie fotograficznym.

Utrzymy­wanie ostroś­ci widzenia obiek­tów zna­j­du­ją­cych się w różnej odległoś­ci od układu opty­cznego oka jest zag­waran­towane przez możli­wość zmi­any ksz­tał­tu soczew­ki oka. Im obiekt jest bliżej oczu obser­wa­to­ra tym grub­sza sta­je się soczewka, a im dalej, tym jest cieńsza (ryc. 9).

Ryci­na 9. Ako­modac­ja soczew­ki oka do różnych odległoś­ci od obiek­tu, na którym kon­cen­tru­je się wzrok. Opra­cow­anie graficzne P.A.

Soczewka jest przy­czepi­ona do wewnętrznej częś­ci gał­ki ocznej za pomocą mięśni rzęskowych (cil­iary mus­cles), które kur­cząc się roz­cią­ga­ją soczewkę, przez co sta­je się ona cieńsza, a rozluź­ni­a­jąc – spraw­ia­ją, że soczewka pęcznieje w środ­kowej częś­ci. Efekt sku­pi­a­nia promieni świ­etl­nych na tyl­nej ścian­ie gał­ki ocznej, czyli ogniskowa­nia, jest związany ze zmi­aną kąta załamy­wa­nia się promieni świ­etl­nych na soczew­ce o różnej gruboś­ci. Grub­sza soczewka zała­mu­je promie­nie świ­etlne pod więk­szym kątem niż cieńsza. Zjawisko to nazy­wa się ako­modacją (acco­modi­a­tion) oka.

Na prze­ci­wległej ścian­ie układu opty­cznego oka leży światłoczuła matryca, czyli siatkówka (reti­na). Wyś­ciela ona ok. 70% wewnętrznej powierzch­ni gał­ki ocznej. Światło odbite od przed­miotów zna­j­du­ją­cych się w sce­nie wiz­ual­nej lub emi­towane przez nie oświ­et­la dno oka i tworzy jej siatkówkowe odw­zorowanie, Charak­teryzu­je się ono tym, że jest: sfer­yczne, pomniej­szo­neodwró­cone „do góry noga­mi” w sto­sunku do ory­gi­nału (oczy­wiś­cie zakłada­jąc, że wiemy, jak wyglą­da ory­gi­nał). Tak czy inaczej, dla mózgu takie zniek­sz­tałce­nia nie stanow­ią więk­szego problemu.

Jeżeli obser­wa­tor ma w pełni sprawny układ opty­czny to cały obraz sce­ny wiz­ual­nej jest rzu­towany na powierzch­nię siatków­ki z bard­zo dużą dokład­noś­cią. Jest ostry i wyraźny. Nieste­ty, byna­jm­niej nie oznacza to, że siatkówka odzwier­cied­la go w każdym miejs­cu z taką samą jakoś­cią, z jaką jest na nią rzu­towany. Ze wzglę­du na sposób, w jaki anal­i­zowany jest rozkład światła pada­jącego na siatkówkę, moż­na porów­nać ją do moc­no pod­niszc­zonego ekranu kinowego, który w wielu miejs­cach jest pofał­dowany, zanieczyszc­zony, a miejs­ca­mi nawet podz­i­u­raw­iony. Krótko mówiąc, o ile ze wzglę­du na budowę, oko i aparat fotograficzny mają wiele wspól­nych cech, o tyle funkcjonowanie tych urządzeń jest niemal całkowicie odmi­enne (Duchows­ki, 2007). Sen­so­ry w matrycy aparatu fotograficznego zare­jestru­ją każdy para­metr światła z taką samą jakoś­cią, fotore­cep­to­ry w siatków­ce oka – nie.

W siatków­ce wys­tępu­ją dwa rodza­je fotore­cep­torów, czyli komórek światłoczułych. Są to: czop­ki (cones) i prę­ci­ki (rods). Nazwy tych recep­torów pochodzą od ich ksz­tałtów: czop­ki przy­pom­i­na­ją nieco stoż­ki, a prę­ci­ki – walce (ryc. 10). Prę­ci­ki są nieporówny­wal­nie bardziej wrażli­we na światło wpada­jące do oka niż czop­ki, dlat­ego czop­ki pracu­ją w ciągu dnia a w nocy „zasyp­i­a­ją” zaadap­towane do ciem­noś­ci. Z kolei prę­ci­ki, prze­ci­wnie – „śpią” w dzień zaadap­towane do światła, a w nocy są akty­wne (Młod­kows­ki, 1998).

Ryci­na 10. Prę­cik i czopek. Opra­cow­anie graficzne P.A. na pod­staw­ie Matthews (2000) i Nolte (2011)

Czop­ki z różną siłą reagu­ją na różne dłu­goś­ci fal elek­tro­mag­ne­ty­cznych w zakre­sie światła widzial­nego, czyli mniej więcej od 400 do 700 nanometrów. Między dłu­goś­cią fali elek­tro­mag­ne­ty­cznej a widze­niem barw ist­nieje ścisła zależność (ryc. 11). Czop­ki reagu­ją także na inten­sy­wność fali świ­etl­nej. Z kolei prę­ci­ki nie różnicu­ją barw, ale są szczegól­nie wyczu­lone na jas­ność (inten­sy­wność) światła. Obraz odzwier­cied­lany przez prę­ci­ki jest achro­maty­czny. Oznacza to tyle, że kiedy się ściem­nia i prę­ci­ki prze­j­mu­ją kon­trolę nad widze­niem przes­ta­je­my różni­cow­ać bar­wy, różnicu­jąc nadal odcie­nie szaroś­ci. Oczy­wiś­cie zasa­da ta odnosi się wyłącznie do barw pokry­wa­ją­cych powierzch­nie, od których odbi­ja się światło, a nie tych, które je emi­tu­ją. W nocy widz­imy kolorowe neony, ponieważ emi­towane przez nie światło pobudza czop­ki. Może­my jed­nak nie dostrzec różni­cy między zie­lenią i czer­wienią lakierów dwóch sto­ją­cych obok siebie samo­chodów w ciem­nej uli­cy, ponieważ w słabych warunk­ach oświ­etle­niowych odbi­ja­ją one mniej więcej tyle samo światła i prę­ci­ki zareagu­ją na nie podobnie.

Ryci­na 11. Dłu­goś­ci fal elek­tro­mag­ne­ty­cznych w zakre­sie światła widzial­nego w wer­sji chro­maty­cznej (bar­wnej) i achro­maty­cznej, w kon­tekś­cie innych dłu­goś­ci fal elek­tro­mag­ne­ty­cznych; m – metr, nm – nanometr, mm – milimetr, km – kilo­metr. Własne opra­cow­anie graficzne.

Widze­nie w warunk­ach bard­zo dobrego oświ­etle­nia nazy­wa się widze­niem fotopowym (pho­topic) i biorą w nim udzi­ał przede wszys­tkim czop­ki, nato­mi­ast widze­nie w warunk­ach słabego oświ­etle­nia to widze­nie sko­topowe (sco­topic) i jest ono wynikiem akty­wnoś­ci pręcików.

Pod­czas zmierzchu, wczes­nym rankiem lub księży­cową nocą pracu­ją oby­d­wa rodza­je fotore­cep­torów. Im jest ciem­niej, tym słab­sza sta­je się reakc­ja czop­ków, a prę­ci­ki wybudza­ją się z dzi­en­nego letar­gu i reagu­ją coraz inten­sy­wniej. Z kolei, im jest jaśniej wów­czas czop­ki zaczy­na­ją inten­sy­wniej reagować na światło, a prę­ci­ki – coraz mniej. Mamy wów­czas do czynienia z tzw. widze­niem mezopowym (mesopic) (ryc. 12). To szczegól­nie niebez­pieczny czas dla kierow­ców, ponieważ żaden z sys­temów siatkówkowych nie dzi­ała wów­czas na 100%. Jas­ność, która jest warunk­iem akty­wiz­a­cji określonego sys­te­mu widzenia wyraża się za pomocą jed­nos­tek zwanych kan­de­la­mi na metr kwadra­towy. Nie wchodząc w szczegóły defini­cyjne, jed­na kan­dela odpowia­da mniej więcej światłu o zmierzchu, już po zachodzie słońca.

Oglą­danie obrazów jest możli­we przede wszys­tkim za pomocą czop­ków, które są odpowiedzialne za widze­nie w dobrych warunk­ach oświ­etle­niowych i dlat­ego im będziemy przyglą­dali się szczegól­nie uważnie.

Ryci­na 12. Trzy sys­te­my widzenia: sko­topowy, mezo­topowy i fotopowy z zaz­nac­zoną akty­wnoś­cią prę­cików i czop­ków w odniesie­niu do różnych wielkoś­ci oświ­etle­nia sce­ny wiz­ual­nej; jas­ność jest wyrażona w licz­bie kan­deli na m2 [cd/m2]. Własne opra­cow­anie graficzne na pod­staw­ie Schu­bert (2006)

Rozmieszczenie czopków w siatkówce

W siatków­ce oka dorosłego człowieka moż­na doliczyć się ok. 4,6 mil­iona czop­ków (Cur­cio, Sloan, Kali­na i Hen­drick­son, 1990). Najwięk­sze ich skupisko zna­j­du­je się w miejs­cu prze­cię­cia siatków­ki przez oś widzenia (visu­al axis). Jej dru­gi koniec przeci­na z kolei miejsce, na którym kon­cen­tru­je­my wzrok. Oś widzenia jest nachy­lona pod kątem ok. 5° w sto­sunku do osi opty­cznej oka (optic axis), prze­b­ie­ga­jącej przez środ­ki wszys­t­kich ele­men­tów układu opty­cznego oka, czyli rogów­ki, źreni­cy i soczew­ki (ryc. 13).

Ryci­na 13. Oś opty­cz­na oka i oś widzenia zilus­trowane na hory­zon­tal­nym przekro­ju prawego oka (widok z góry). Opra­cow­anie graficzne P.A.

Punkt prze­cię­cia osi widzenia z siatkówką to niewiel­ki obszar w ksz­tał­cie elip­sy o cię­ci­wach ok. 1,5 mm w pio­nie i 2 mm w poziomie oraz o powierzch­ni ok. 2,4 mm2 (Niżankows­ka, 2000). Miejsce to nazy­wa się plamką żółtą (mac­u­la) i jest tam upakowanych pon­ad pół mil­iona czop­ków, czyli pon­ad 200 tys./mm2. Dla porów­na­nia, na 1 mm2 powierzch­ni ekranu LCD o rozdziel­czoś­ci 1920 x 1200 zna­j­du­ją się zaled­wie 3–4 pik­se­le. To 50 tys. razy mniej niż w cen­tral­nej częś­ci oka!

Wewnątrz plam­ki żółtej zna­j­du­je się jeszcze mniejszy obszar o powierzch­ni ok. 1 mm2, zwany dołkiem cen­tral­nym (fovea). W jego środ­ku tzw. dołeczku (fove­o­la) licz­ba czop­ków może osiągnąć nawet 324 tys./mm2. U dorosłego człowieka jest ich w tym miejs­cu śred­nio ok. 199 tys./mm2 (Cur­cio i in., 1990), a im dalej od doł­ka cen­tral­nego tym jest ich mniej (ryc. 14).

Ryci­na 14. Śred­nia gęs­tość wys­tępowa­nia czop­ków i prę­cików na powierzch­ni siatków­ki. Na zdję­ci­ach zagęszcze­nie czop­ków (więk­sze) i prę­cików (mniejsze) w zależnoś­ci od odległoś­ci od doł­ka cen­tral­nego. Własne opra­cow­anie graficzne na pod­staw­ie Cur­cio i in. (1990)

Gdy­by moż­na było wyko­rzys­tać czop­ki z okol­i­cy środ­ka doł­ka cen­tral­nego do zbu­dowa­nia małoo­brazkowej matrycy o wymi­arach 36 x 24 mm z przez­nacze­niem dla cyfrowego aparatu fotograficznego, to jej rozdziel­czość wynosiła­by nie 12, czy nawet 30 megapik­seli, ale ok. 280 Mpix! Dokład­ność obrazu reje­strowanego przez komór­ki zna­j­du­jące się w okol­i­cy doł­ka cen­tral­nego jest niewyobrażal­nie duża. Na ryc. 15 moż­na zobaczyć pow­ięk­szoną 900 razy powierzch­nię siatków­ki w okol­i­cy środ­ka doł­ka cen­tral­nego, z widoczny­mi czop­ka­mi w ksz­tał­cie plamek (Ahnelt, Kolb i Pflug, 1987). Mniej więcej w taki sposób wyglą­da powierzch­nia całej siatków­ki-ekranu, na który rzu­towany jest obraz zna­j­du­ją­cy się naprze­ci­wko oka. W różnych miejs­cach może być tylko nieco inne zagęszcze­nie fotore­cep­torów. To czego mózg dowiadu­je się na tem­at świa­ta za pośred­nictwem oczu jest bezpośred­nio związane z akty­wnoś­cią tych niewiel­kich punk­tów ekranowych.

Ryci­na 15. Pow­ięk­szony 900 razy frag­ment siatków­ki oka w okol­i­cy środ­ka doł­ka cen­tral­nego. Własne opra­cow­anie graficzne na pod­staw­ie Ahnelt, Kolb i Pflug (1987)

Powierzch­nia doł­ka cen­tral­nego stanowi zaled­wie 0,1% powierzch­ni całej siatków­ki, zaś powierzch­nia plam­ki żółtej – 0,3% (Młod­kows­ki, 1998). Nie ma tam w ogóle prę­cików, a zna­j­du­jące się w tym obszarze czop­ki stanow­ią 1/8 wszys­t­kich czop­ków zna­j­du­ją­cych się w siatków­ce. Pozostałe 4–5 mil­ionów czop­ków rozkła­da się na 99,7% powierzch­ni siatków­ki wokół plam­ki żółtej. Oznacza to, że na 1 mm² siatków­ki poza plamką żółtą przy­pa­da ich śred­nio ok. 7 tys. (Hofer, Car­roll i Williams, 2009). To nadal całkiem sporo, ale na prze­waża­jącej częś­ci siatków­ki jest ich jed­nak praw­ie trzy­dzieś­ci razy mniej niż w dołku centralnym.

Jak nietrud­no się domyślić, bezpośred­nią kon­sek­wencją opisanego rozkładu fotore­cep­torów na siatków­ce jest to, że w zależnoś­ci od miejs­ca jej oświ­etle­nia, rzu­towany obraz jest przetwarzany z inną rozdziel­czoś­cią przestrzen­ną. Inny­mi słowy, z miejsc o więk­szym zagęszcze­niu fotore­cep­torów mózg czer­pie znacznie więcej danych, które pozwala­ją mu wyraźniej zrekon­struować obraz sce­ny wiz­ual­nej, niż na pod­staw­ie danych pochodzą­cych z tych częś­ci siatków­ki, które są uboższe w fotoreceptory.

Kilka zdań na temat pręcików

Jak zostało to już zasyg­nal­i­zowane, oprócz czop­ków, w siatków­ce ludzkiego oka zna­j­du­ją się jeszcze inne fotore­cep­to­ry, czyli prę­ci­ki. Ich licz­ba waha się od 78 do 107 mil­ionów w zależnoś­ci od człowieka (śred­nio ok. 92 mil­iony). Prę­cików jest zatem pon­ad 20 razy więcej niż czop­ków (Cur­cio i in., 1990). Oznacza to, że siatkówka jest znacznie gorzej wyposażona „hard­ware­owo” do oglą­da­nia świa­ta w barwach przy pełnym oświ­etle­niu niż mono­chro­maty­cznie i w ciem­noś­ci. Najpraw­dopodob­niej jest to pozostałość po naszych drapieżnych przod­kach, którym niespec­jal­nie zależało na oglą­da­niu świa­ta w kolorach i zde­cy­dowanie prefer­owali polowanie nocą niż w ciągu dnia. No cóż, widze­nie bar­wne odziedz­iczyliśmy po naszych małpich przod­kach, którzy woleli spoży­wać posił­ki w ciągu dnia, uważnie przyglą­da­jąc się bar­wie skór­ki od banana lub man­go. Miało to decy­du­jące znacze­nie, co najm­niej w kwestii niestrawności.

W dołku cen­tral­nym nie ma prę­cików a pier­wsze pojaw­ia­ją się dopiero na obrzeżach plam­ki żółtej. Im dalej od plam­ki żółtej tym jest ich więcej, a najwięk­sza licz­ba prę­cików zna­j­du­je się w odległoś­ci ok. 20° od doł­ka cen­tral­nego i jest porówny­wal­na do licz­by czop­ków w plam­ce żółtej, czyli ok. 150 tys./mm2 (ryc. 14). Prze­suwa­jąc się jeszcze dalej w kierunku peryferii siatków­ki licz­ba prę­cików stop­niowo zmniejsza się i na jej krawędzi­ach jest ich już o połowę mniej, czyli ok. 75 tys./mm2.

Taki rozkład prę­cików powodu­je, że w słabych warunk­ach oświ­etle­niowych, może­my dostrzec coś w miarę wyraźnie nie patrząc wprost tylko „kątem oka”, a dokład­niej, prze­suwa­jąc środek układu opty­cznego oka o ok. 20° kątowych od miejs­ca, które chce­my dokład­nie zobaczyć. Dopiero wtedy obraz rzu­towany na siatkówkę zostanie zin­ter­pre­towany z najwięk­szą możli­wą rozdzielczością.

Dziura w siatkówce

Na koniec jeszcze kil­ka zdań, doty­czą­cych drob­ne­go szczegółu kon­struk­cyjnego siatków­ki. Mniej więcej w odległoś­ci 15° od doł­ka cen­tral­nego, w przynosowej częś­ci siatków­ki każdego oka zna­j­du­je się dosłown­ie „dziu­ra” o śred­ni­cy 1,5 mm i powierzch­ni ok. 1,2 mm2. To miejsce nazy­wa się plam­ką ślepą (blind spot) lub tar­czą ner­wu wzrokowego (optic disc) i nie ma w tym miejs­cu ani jed­nego fotore­cep­to­ra. Tamtędy prze­chodzi nerw wzrokowy, po którym bieg­ną syg­nały o stanie pobudzenia fotore­cep­torów do wnętrza mózgu, a także naczy­nia krwionośne, niezbędne do dotle­nienia komórek wewnątrz oka. W tym miejs­cu obraz rzu­towany na dno oka trafia w pustkę. Bard­zo łat­wo moż­na się o tym przekon­ać. Wystar­czy zamknąć prawe oko i lewym patrzeć na jeden z krzyżyków, zna­j­du­ją­cy się po prawej stron­ie na ryc. 16, a następ­nie powoli zbliżać się i odd­alać od niego. W którymś położe­niu głowy stwierdz­imy, że leżące po lewej stron­ie kółko sta­je się niewidoczne, a prz­er­wa w linii zni­ka. Dzieje się tak ponieważ obraz punk­tu lub prz­er­wy w linii jest rzu­towany na plamkę ślepą.

Ryci­na 16. Test na plamkę ślepą w siatków­ce lewego oka. Własne opra­cow­anie graficzne na pod­staw­ie Hur­vich (1981)

Na szczęś­cie mamy dwo­je oczu i to znacznie zmniejsza prob­le­my związane z niewidze­niem frag­men­tu obrazu w obrę­bie plam­ki ślepej. Ponieważ oczy są odsunięte od siebie, dlat­ego na ich siatków­ki w punkcie tar­czy ner­wu wzrokowego rzu­towane są nieco inne frag­men­ty sce­ny wiz­ual­nej. W rezulta­cie, ten frag­ment, którego nie widzi jed­no oko, widzi drugie i vice ver­sa. Ostate­cznie mózg i tak anal­izu­je dane dostar­c­zone mu równocześnie z obu oczu.

Wyspecjalizowane komórki zwojowe

Odd­ol­na anal­iza zawartoś­ci sce­ny wiz­ual­nej na wczes­nych eta­pach szlaku wzrokowego jest możli­wa dzię­ki obec­noś­ci w siatkówkach oczu obser­wa­to­ra nie tylko fotore­cep­torów, ale również różnych typów komórek ner­wowych, z których szczegól­nie ważną rolę pełnią wspom­ni­ane już komór­ki zwo­jowe (gan­glion cells). Spec­jal­izu­ją się one w przetwarza­niu danych, doty­czą­cych: (1) dłu­goś­ci fali światła widzial­nego, co stanowi pod­stawę widzenia barw, (2) kon­trastów jas­noś­ci światła, dzię­ki czemu widz­imy, m.in. krawędzie rzeczy lub ich częś­ci, czyli gen­er­al­nie rzecz biorąc – ksz­tał­ty, (3) zmi­en­noś­ci oświ­etle­nia w cza­sie, która stanowi pod­stawę widzenia ruchu i (4) rozdziel­czoś­ci przestrzen­nej, która leży u podłoża ostroś­ci widzenia.

Wśród wielu rodza­jów komórek zwo­jowych moż­na ziden­ty­fikować takie, które są szczegól­nie wrażli­we, np. na częs­totli­wość fali światła widzial­nego odpowiada­jącego bar­wie zielonej. Oznacza to mniej więcej tyle, że jeżeli te komór­ki zwo­jowe wysyła­ją – niczym alfa­betem Morse’a – impul­sy ner­wowe w kierunku kory mózgu, wów­czas obser­wa­tor doświad­cza widzenia czegoś zielonego. A jeśli zak­ty­wiz­u­ją się komór­ki odpowiedzialne za detekcję ruchu, to mózg „dowiadu­je się”, że coś się zmienia przed oczy­ma obser­wa­to­ra, choć na pod­staw­ie tych infor­ma­cji jeszcze nie „wie” czy to coś się rusza w sce­nie wiz­ual­nej, czy porusza się obser­wa­tor, czy też jed­no i drugie. Ale i tego szy­bko „się dowie” anal­izu­jąc dane płynące z innych zmysłów. Dość powiedzieć, że widze­nie takiej czy innej włas­noś­ci obrazu bezpośred­nio wyni­ka z kondy­cji neu­ronal­nych przetworników i przekaźników danych sen­so­rycznych. Ich uszkodze­nie może spowodować, że jakiejś cechy obrazu po pros­tu nie dostrzegamy, jak­by jej nie było.

Kiedy przyjrzymy się budowie anatomicznej komórek zwo­jowych okazu­je się, że zasad­nic­zo dzielą się one na trzy grupy. Pier­wszą, stanow­ią komór­ki karłowate (midget gan­glion cells), o drob­nych ciałach i sto­sunkowo niewielkiej licz­bie odgałęzień, czyli drzew dendry­ty­cznych oraz aksonu. Dru­ga gru­pa to komór­ki para­solowe (para­sol gan­glion cells), o dużych ciałach i znacznie więk­szej iloś­ci odgałęzień (ryc. 17). Trze­cią grupę tworzą komór­ki pyłkowe (bis­trat­i­fied gan­glion cells), o maleń­kich ciałach i niepro­por­cjon­al­nie dużych roz­gałęzieni­ach w sto­sunku do wielkoś­ci ich ciała, choć i tak znacznie mniejszych niż roz­gałęzienia komórek para­solowych, a nawet karłowatych (Dacey, 2000).

Ryci­na 17. Ciała i roz­gałęzienia komórek zwo­jowych karłowatych i para­solowych w zależnoś­ci od odległoś­ci od doł­ka cen­tral­nego. Własne opra­cow­anie graficzne na pod­staw­ie Wan­dell (1995)

Cho­ci­aż komór­ki karłowate są mniejsze niż para­solowe, to ich wielkość, a zwłaszcza ilość i rozłożys­tość drzew dendry­ty­cznych, które umożli­wia­ją im odbieranie impul­sów ner­wowych od innych komórek, zależy od odległoś­ci, w jakiej zna­j­du­ją się one od doł­ka cen­tral­nego. Im bliżej zna­j­du­ją się doł­ka cen­tral­nego, tym jedne i drugie są mniejsze.

Oprócz dendry­tów, każ­da komór­ka ner­wowa ma również akson, czyli takie odgałęzie­nie, które odprowadza impul­sy ner­wowe z ciała danej komór­ki do innej. To właśnie aksony wszys­t­kich trzech rodza­jów komórek zwo­jowych tworzą zasad­niczy zrąb ner­wu wzrokowego (opitc nerve). Skła­da się on z ok. 1 mil­iona (od 770 tysię­cy do 1,7 mil­iona) aksonów komórek zwo­jowych (Jonas, Schmidt, Müller-Bergh, Schlötzer-Schre­hardt i in., 1992) i przy­pom­i­na nieco przewód elek­tryczny, złożony z miedzianych drucików.

Ilość aksonów trzech wymienionych typów komórek zwo­jowych w ner­wie wzrokowym nie jest taka sama. Najwięcej, bo ok. 80% stanow­ią aksony komórek karłowatych, a tylko po ok. 10% stanow­ią aksony komórek para­solowych i pyłkowych. Włók­na komórek małych (tzn. karłowatych i pyłkowych) stanow­ią zatem ok. 90% wszys­t­kich aksonów tworzą­cych nerw wzrokowy. Oznacza to, że z jak­iś powodów dane przesyłane przez mniejsze komór­ki zwo­jowe są ważniejsze dla mózgu niż dane docier­a­jące doń za pośred­nictwem aksonów więk­szych (para­solowych) komórek zwojowych.

Ciała komórek zwo­jowych zna­j­du­ją się w siatków­ce oka. Ich dendry­ty odbier­a­ją dane z fotore­cep­torów, za pośred­nictwem jeszcze innych komórek, ale nimi zajmiemy się później. W każdym razie, ze wzglę­du na mniejszą ilość dendry­tów, komór­ki karłowate łączą się ze znacznie mniejszą iloś­cią fotore­cep­torów i innych komórek w siatków­ce, niż komór­ki para­solowe, które mają duże drze­wa dendry­ty­czne. Ważne jest nato­mi­ast to, że małe komór­ki zwo­jowe (karłowate i pyłkowe) łączą się przede wszys­tkim z fotore­cep­tora­mi zna­j­du­ją­cy­mi się w cen­tral­nej częś­ci siatków­ki. Są one więc znacznie wrażli­wsze na rozdziel­czość przestrzen­ną oświ­etle­nia siatków­ki niż komór­ki para­solowe. Dzię­ki komórkom karłowatym może­my zatem z wielką dokład­noś­cią odróż­ni­ać od siebie ksz­tał­ty jed­nych rzeczy od innych. Pewien prob­lem stanowi tylko to, że najwięk­sze ich skupisko pokry­wa sto­sunkowo niewiel­ki obszar siatków­ki, a w rezulta­cie – niewiel­ki zakres pola widzenia.

Inną włas­noś­cią małych komórek zwo­jowych jest ich wrażli­wość na dłu­goś­ci fal świ­etl­nych. Pon­ad 90% z nich spec­jal­izu­je się w tym zakre­sie, dając początek pro­ce­som widzeniaróżni­cow­a­nia barw. Niemal wszys­tkie komór­ki karłowate znakomi­cie różnicu­ją dłu­goś­ci fali elek­tro­mag­ne­ty­cznej, odpowiada­jącej bar­wie zielonej i czer­wonej, nato­mi­ast znacznie gorzej radzą sobie z opozy­cją barw żółtej i niebieskiej. Ale to zadanie wykonu­ją komór­ki pyłkowe. To one odgry­wa­ją pod­sta­wową rolę w przetwarza­niu danych doty­czą­cych różni­cow­a­nia bar­wy niebieskiej i żółtej (Dacey, 2000).

W prze­ci­wieńst­wie do małych komórek zwo­jowych, komór­ki zwo­jowe typu para­solowego nie różnicu­ją dłu­goś­ci fali świ­etl­nej, ale za to są znacznie wrażli­wsze na wykry­wanie krawędzi między płaszczyz­na­mi o podob­nej jas­noś­ci, niż komór­ki karłowate. Są one w stanie zare­je­strować 1–2‑procentową różnicę w jas­noś­ci płaszczyzn leżą­cych obok siebie, a 10–15-procentowe różnice w jas­noś­ci kodu­ją bez prob­lemów (Shap­ley, Kaplan i Soodak, 1981).

Komór­ki karłowate wyma­ga­ją znacznie więk­szej różni­cy w zakre­sie jas­noś­ci leżą­cych obok siebie płaszczyzn, żeby ją zare­je­strować. Pon­ad­to, komór­ki para­solowe pokry­wa­ją dużo więk­szy obszar siatków­ki oka niż komór­ki karłowate. Obie te cechy dużych komórek zwo­jowych znakomi­cie uzu­peł­ni­a­ją ograniczenia małych komórek w zakre­sie detekcji kon­turów rzeczy zna­j­du­ją­cych się w polu widzenia obser­wa­to­ra poza dołkiem cen­tral­nym oraz w odniesie­niu do relacji przestrzen­nych między nimi.

Jest jeszcze jed­na waż­na różni­ca między komórka­mi mały­mi i duży­mi. Otóż duże komór­ki mają znacznie grub­sze aksony niż komór­ki małe i dlat­ego przesyła­ją impul­sy ner­wowe dwukrot­nie szy­b­ciej, tj. z pręd­koś­cią ok. 4 m/sek., niż komór­ki karłowate. Ta włas­ność komórek para­solowych ma kluc­zowe znacze­nie dla detekcji zmi­an w oświ­etle­niu siatków­ki, co pozwala obser­wa­torowi dostrze­gać ruch. Wzrokowa detekc­ja ruchu przed­mio­tu (a także ruchu obser­wa­to­ra) jest równoz­nacz­na z prze­suwaniem się tego samego lub podob­ne­go układu światła i cienia po siatków­ce oka w cza­sie. Tem­po i kierunek prze­sunięć obrazu na siatków­ce jest wskaźnikiem szy­bkoś­ci i kierunku ruchu.

Kończąc tę funkcjon­al­ną charak­terystykę wiel­kich i drob­nych komórek ner­wowych warto również zauważyć, że podob­nie jak cechy niemal każdej sce­ny wiz­ual­nej również i one dają się połączyć w dwie kat­e­gorie. Otóż komór­ki karłowate i pyłkowe, są szczegól­nie wrażli­we na bar­wę i rozdziel­czość przestrzen­ną światła, która stanowi pod­stawę widzenia ksz­tałtów rzeczy w sce­nie wiz­ual­nej i różni­cow­a­nia ich od siebie. Moż­na powiedzieć, że to dzię­ki ich akty­wnoś­ci mamy szan­sę odd­zielać od siebie i od tła przed­mio­ty, które tworzą scenę wiz­ual­ną. To najbardziej pod­sta­wowa funkc­ja widzenia i właśnie dlat­ego aksony komórek karłowatych i pyłkowych są tak licznie reprezen­towane w ner­wie wzrokowym.

Z kolei komór­ki para­solowe, dzię­ki dużej szy­bkoś­ci przesyła­nia syg­nałów oraz znacznie więk­szej wrażli­woś­ci na różni­cow­anie odcieni jas­noś­ci w sce­nie wiz­ual­nej, niż komór­ki małe, umożli­wia­ją widze­nie ruchu i orga­ni­za­cji przestrzen­nej oglą­danej sce­ny, a także bard­zo skutecznie wspo­ma­ga­ją pro­ces iden­ty­fikacji kon­turów rzeczy.

Tak oto z budowy anatomicznej i fizjologii komórek zwo­jowych wynika­ją określone ich funkc­je, a z nich zaczy­na­ją wyła­ni­ać się zrę­by subiek­ty­wnego doświad­czenia widzenia obrazu. Obrazy widz­imy bowiem tak jak widz­imy, ponieważ taki mamy bio­log­iczny hard­ware, a nie dlat­ego, że one takie są.

Od siatkówki do ciała kolankowatego bocznego

Pier­wszą struk­turą w mózgu, do której docier­a­ją infor­ma­c­je z siatkówek oczu jest zna­j­du­jące się we wzgórzu, ciało kolankowate boczne (LGN). Już w lat­ach 20. XX wieku Mieczysław Minkows­ki, szwa­j­cars­ki neu­rolog pol­skiego pochodzenia odkrył, że aksony małych i wiel­kich komórek zwo­jowych łączą się z LGN w zaskaku­ją­co uporząd­kowany sposób (Valko, Mumen­thaler i Bas­set­ti, 2006).

Budowa LGN przy­pom­i­na ziarno fasoli, po prze­cię­ciu którego ujaw­nia się sześć wyraźnie odd­zielonych od siebie warstw komórek ner­wowych o dwóch różnych wielkoś­ci­ach (ryc. 18).

Ciem­niejsze warst­wy komórek oznac­zone cyfra­mi 1 i 2, odbier­a­ją impul­sy ner­wowe za pośred­nictwem aksonów para­solowych komórek zwo­jowych. Ponieważ ciała komórek tworzą­cych te warst­wy w LGN również mają sto­sunkowo duże rozmi­ary, dlat­ego warst­wy te są zwane – wielkokomór­kowymi (mag­no­cel­lu­lar lay­ers), typu M (mag­no) lub typu Y.

Ryci­na 18. Przekrój ciała kolankowa­t­ego bocznego (LGN) z zaz­nac­zony­mi warst­wa­mi: 1 i 2 – wielkokomórkowy­mi (czer­wone strza­ł­ki wskazu­jące na ciemne pas­ki), 3–6 – drob­nokomórkowy­mi (białe strza­ł­ki wskazu­jące na ciemne pas­ki) i 7 – pyłkokomórkową (żół­ta strza­ł­ka wskazu­ją­ca na jas­ny pasek między warst­wą 2 i 3). Własne opra­cow­anie graficzne na pod­staw­ie notatek do wykładów Lery Boroditsky

Warst­wy oznac­zone cyfra­mi 3–6 odbier­a­ją syg­nały z aksonów małych komórek zwo­jowych, a ponieważ same również składa­ją się z komórek o niewiel­kich ciałach, dlat­ego te warst­wy zwane są – drob­nokomórkowy­mi (par­vo­cel­lu­lar lay­ers), typu P (par­vo) lub typu X. Budowa anatomicz­na i cechy funkcjon­alne małych i dużych komórek zwo­jowych zlokali­zowanych w siatkówkach oczu oraz komórek tworzą­cych poszczególne warst­wy ciała kolankowa­t­ego bocznego, są niemal iden­ty­czne. Dlat­ego też wśród badaczy zaj­mu­ją­cych się prob­lematyką widzenia jest zgo­da, co do tego, że para­solowe komór­ki zwo­jowe, a w dwóch warst­wach LGN – komór­ki typu M są częś­cią tzw. wielkokomórkowego szlaku wzrokowego (mag­no­cel­lu­lar path­way), nato­mi­ast karłowate komór­ki zwo­jowe, a w czterech warst­wach LGN – komór­ki typu P wyz­nacza­ją, tzw. drob­nokomórkowy szlak wzrokowy (par­vo­cel­lu­lar path­way).

Na ryc. 18 zaz­nac­zono także warst­wę siód­mą, która zna­j­du­je się między warst­wa­mi wielko- i drob­nokomórkowy­mi, czyli drugą i trze­cią. W tej warst­wie zna­j­du­ją się komór­ki pyłkowe (konio­cel­lu­lar cells) lub inaczej – typu K, które odbier­a­ją pro­jekc­je ze zwo­jowych komórek pyłkowych. W związku z ist­nie­niem tej warst­wy w LGN, do dwóch poprzed­nich, należy dodać trze­ci szlak wzrokowy, tzw. pyłkokomórkowy (konio­cel­lu­lar path­way). Ponieważ komór­ki na szlaku pyłkokomórkowym stanow­ią zaled­wie ok. 10% wszys­t­kich komórek zwo­jowych oraz z uwa­gi na to, że pełnią one ana­log­iczne funkc­je do funkcji pełnionych przez komór­ki karłowate, dlat­ego szlak pyłkokomórkowy trak­tu­je się jako część szlaku drobnokomórkowego.

Pod­sumowu­jąc włas­noś­ci drob­no- i wielkokomórkowego szlaku wzrokowego warto rzu­cić okiem na poniższe zestawienie.

Charak­terysty­ka Szlak wielkokomórkowy Szlak drobnokomórkowy
Wielkość ciała komórek zwojowych duże małe
Wielkość pola recep­cyjnego komórek zwojowych duże małe
Szy­bkość trans­misji impul­sów nerwowych szy­b­ka wol­na
Ilość aksonów w ner­wie wzrokowym i trak­cie optycznym mała duża
Różni­cow­anie barw nie tak
Wrażli­wość na kontrast mała duża
Rozdziel­czość przestrzenna mała duża
Rozdziel­czość cza­sowa i wrażli­wość na ruch duża mała
Wrażli­wość na różni­cow­anie jas­noś­ci płaszczyzn leżą­cych obok siebie duża mała

Podział warstw w LGN ze względu na skrzyżowanie wzrokowe

Warst­wy LGN dzielą się nie tylko na pyłkowe, drob­ne i wielkie, ale również na prawe i lewe. Podob­nie jak więk­szość struk­tur móz­gowych, LGN jest ciałem parzystym, tzn. wys­tępu­je zarówno po prawej, jak i po lewej stron­ie mózgu. U naczel­nych, w tym także u człowieka, między siatkówka­mi oczu a LGN zna­j­du­je się wspom­ni­ane już skrzyżowanie wzrokowe (ryc. 19). Jest to miejsce podzi­ału wiązek aksonów komórek zwo­jowych na dwie częś­ci. To bard­zo spry­t­ny wynalazek ewolucji, ponieważ dzię­ki niemu utra­ta jed­nego oka nie pocią­ga za sobą całkowitego wyłączenia które­jś częś­ci mózgu z przetwarza­nia danych wzrokowych. Po skrzyżowa­niu się wiązek ner­wu wzrokowego, do LGN, leżącego po tej samej stron­ie co oko, trafi­a­ją dane z zewnętrznej (skro­niowej) częś­ci siatków­ki tego oka oraz dane z przynosowej częś­ci siatków­ki drugiego oka.

W wyniku podzi­ału aksonów ner­wu wzrokowego na dwie częś­ci, warst­wy LGN oznac­zone na ryc. 18 numera­mi 1, 4 i 6 odbier­a­ją syg­nały z oka leżącego po prze­ci­wnej stron­ie głowy, a warst­wy 2, 3 i 5 – z oka zna­j­du­jącego się po tej samej stron­ie głowy co LGN. Ta sama zasa­da doty­czy obu struk­tur LGN, zna­j­du­ją­cych po prawej i po lewej stron­ie głowy.

Ryci­na 19. Schemat połączeń siatkówek prawego i lewego oka z pra­wo- i lewopółku­lowym LGN za pośred­nictwem aksonów komórek zwo­jowych tworzą­cych nerw wzrokowy (do skrzyżowa­nia wzrokowego) i pas­mo wzrokowe między skrzyżowaniem a LGN. Opra­cow­anie graficzne P.A.

Warto zapamię­tać, że LGN pełni funkcję orga­nizu­jącą dane sen­so­ryczne doty­czące różnych cech sce­ny wiz­ual­nej. Po niemal chao­ty­cznej plą­taninie dendry­tów i aksonów rozlicznych komórek, z których zbu­dowana jest siatkówka oka, od tego miejs­ca już znacznie łatwiej moż­na się zori­en­tować, po których prze­wodach płyną dane źródłowe doty­czące barw, kon­turów rzeczy, ich ruchu i orga­ni­za­cji przestrzen­nej. Pon­ad­to ich uporząd­kowanie pozwala przewidzieć, nie tylko z której strony ciała one napły­wa­ją, ale także z której częś­ci oka. Widze­nie jest poważnym przed­sięwz­ię­ciem logisty­cznym dla mózgu i dlat­ego dobra orga­ni­za­c­ja danych jest pod­stawą sukce­su, czyli zbu­dowa­nia trafnej reprezen­tacji sce­ny wizualnej.

Promienistość wzrokowa

Ostat­ni etap wczes­nego szlaku przetwarza­nia danych wzrokowych kończy się na tzw. promienis­toś­ci wzrokowej (optic radi­a­tion). Za jej pośred­nictwem, dane o rozkładzie światła w sce­nie wiz­ual­nej są dostar­c­zone do kory wzrokowej (visu­al cor­tex) w pła­cie potylicznym (occip­i­tal lobe), a ściślej mówiąc do tzw. bruzdy ostro­gowej (cal­carine sul­cus), zna­j­du­jącej się po wewnętrznej stron­ie tych płatów. Promienis­tość w isto­cie jest pas­mem aksonów komórek, których ciała tworzą poszczególne warst­wy w LGN. Swo­ją ory­gi­nal­ną nazwę bierze ze specy­ficznego układu włókien, które sze­rokim łukiem rozkłada­ją się wśród cias­no upakowanych struk­tur leżą­cych pod korą mózgu (ryc. 20).

Ryci­na 20. Promienis­tość wzrokowa – połącze­nie między poszczegól­ny­mi warst­wa­mi LGN i pier­wot­na korą wzrokową w pła­cie potylicznym. Z lewej strony obraz anatomiczny mózgu wyko­nany post mortem, z prawej obraz wyko­nany tech­niką trak­tografii. Własne opra­cow­anie graficzne na pod­staw­ie Wan­dell i Winaw­er (2011)

Frenologiczny punkt widzenia na funkcje kory mózgu w procesie widzenia

Jeszcze pod koniec XIX domin­u­jącą kon­cepcją neu­ropsy­cho­log­iczną była frenolo­gia (phrenol­o­gy). Zgod­nie z założe­ni­a­mi jej twór­cy, niemieck­iego fizy­ka Fran­za Jose­fa Gal­la, ist­nieje ścisły związek między budową anatomiczną i lokaliza­cją różnych struk­tur kory mózgu a real­i­zowany­mi przez nie funkc­ja­mi psy­chiczny­mi, czyli umysłem. Jakkol­wiek obec­nie frenolo­gia jest trak­towana jako pseudonau­ka, to w isto­cie była ona niezwyk­le trafną intu­icją, która leży u pod­staw współczes­nej neu­ronau­ki (Fodor, 1983).

Ze wzglę­du na brak odpowied­nich narzędzi diag­nos­ty­cznych, a także metodologii badań neu­ropsy­cho­log­icznych, frenol­o­gowie dość swo­bod­nie kojarzyli funkc­je psy­chiczne z różny­mi częś­ci­a­mi kory mózgu. W odniesie­niu do widzenia nie mieli jed­nak wąt­pli­woś­ci, że jest ono real­i­zowane przez korę czołową, nad- i okołooc­zodołową. Całą tę część kory określono jako per­cep­cyjną i różnym jej frag­men­tom przyp­isano funkc­je widzenia: ksz­tał­tu (form, pole 23), wielkoś­ci (size, pole 24) i bar­wy (col­or­ing, pole 26), a także odczuwa­nia ciężaru (weight, pole 25). W okoli­cach skro­niowych oczodołów lokali­zowali funkc­je związane z per­cepcją liczb (num­ber, pole 28) i zdol­noś­ci­a­mi obliczeniowy­mi (order, cal­cu­la­tion, pole 29), a w korze zaoc­zodołowej – funkc­je językowe (lan­guage, pole 33). W struk­tu­rach czołowych znalazła również swo­ją lokaliza­cję wyobraź­nia (imi­ta­tion, pole 21) (ryc. 21).

Frenol­o­gowie nawet się nie domyślali, że widze­nie jest pro­ce­sem, który angażu­je najbardziej odd­alone od oczu struk­tu­ry kory mózgu, czyli płat potyliczny. Tym częś­ciom mózgu byli raczej skłon­ni przyp­isać takie funkc­je, jak płod­ność, miłość rodzi­ciel­ską i miłość do dzieci w ogóle (philo­prog­en­i­tive­ness, pole 2), przy­jaźń i przy­wiązanie (adhe­sive­ness, pole 4), umiłowanie domu i ojczyzny (inhab­i­ta­tive­ness, pole 3a), a także zdol­ność do kon­cen­tracji uwa­gi, zwłaszcza w zada­ni­ach intelek­tu­al­nych (con­cen­tra­tive­ness, pole 3).

Intere­su­jące są także funkc­je przyp­isy­wane przez frenologów płatom skro­niowym, które – jak dzisi­aj już wiemy – także odgry­wa­ją istot­ną rolę w widze­niu. Raczej lokali­zowali w nich pod­stawę prze­bo­jowoś­ci (com­bat­ive­ness, pole 5), siły (destruc­tive­ness, pole 6) i powś­ciągli­woś­ci (secre­tive­ness, pole 7).

Wyni­ki badań w obszarze neu­ronau­ki ujawniły całkowicie odmi­en­ną od freno­log­icznej lokaliza­cję struk­tur odpowiedzial­nych za różne funkc­je psy­chiczne, a w szczegól­noś­ci za widzenie.

Ryci­na 21. Strona z Webster’s Aca­d­e­m­ic Dic­tio­nary z 1895 roku z ilus­tracją i opisem korowych lokaliza­cji funkcji psychicznych.

Kora wzrokowa w świetle neuronauki

Przetwarzaniem danych sen­so­rycznych na wyższych pię­tra­ch szlaku wzrokowego, zaj­mu­je się ok. 4–6 mil­iardów komórek ner­wowych w pła­cie potylicznym, ciemieniowym, skro­niowym, a nawet czołowym. W sum­ie, dane zare­je­strowane przez fotore­cep­to­ry zna­j­du­jące się w siatkówkach oczu angażu­ją ok. 20% całej powierzch­ni kory mózgu człowieka (Wan­dell, Dumoulin i Brew­er, 2009). Ze wzglę­du na szczegól­nie ważną rolę, jaką w pro­ce­sie widzenia odgry­wa­ją płaty potyliczne, obszar ten nazy­wa się także korą wzrokową (visu­al cor­tex) (ryc. 22).

Ryci­na 22. Kora wzrokowa i inne struk­tu­ry korowe zaan­gażowane w widze­nie. Opra­cow­anie graficzne P.A. na pod­staw­ie Logo­thetis (1999) i Zeki (2003)

Ze wzglę­du na budowę anatomiczną, korę wzrokową moż­na podzielić na dwie częś­ci: korę prążkową (stri­ate cor­tex) i korę poza­prążkową (extrasr­tri­ate cor­tex). Kora prążkowa zna­j­du­je się w miejs­cu, zwanym bruzdą ostro­gową (cal­carine sul­cus), na samym końcu pła­ta potylicznego, w jego częś­ci przyśrod­kowej (ryc. 23 A). Zgod­nie z klasy­fikacją obszarów mózgu zapro­ponowaną w 1907 roku przez niemieck­iego neu­rolo­ga, Korbini­ana Brod­man­na, jest to pole 17. Oprócz bruzdy ostro­gowej obe­j­mu­je ono także frag­ment zewnętrznej częś­ci pła­ta potylicznego (ryc. 23B). Pole 17 jest również określane, jako pierwszorzę­dowa kora wzrokowa (primery visu­al cor­tex) lub obszar V1 (od pier­wszej litery ang­iel­skiego słowa vision i pod­kreśle­nia, że jest to pier­wszy korowy etap szlaku wzrokowego).

W obu półku­lach mózgu, w obszarze V1 zna­j­du­je się ok. 300 mil­ionów neu­ronów, czyli 40 razy więcej niż licz­ba neu­ronów w LGN (Wan­dell, 1995). Do V1 płyną impul­sy ner­wowe wzdłuż promienis­toś­ci wzrokowej, czyli po aksonach komórek, których ciała zna­j­du­ją się w LGN.

Ryci­na 23. Bruz­da ostro­gowa z zaz­nac­zonym polem 17, czyli korą prążkową (V1) od strony: A – wewnętrznej, lewego pła­ta potylicznego i B – zewnętrznej, prawego pła­ta potylicznego. Własne opra­cow­anie graficzne na pod­staw­ie Hor­ton i Hoyt (1991)

Pozostałe częś­ci kory wzrokowej nazy­wa się korą poza­prążkową. Zasad­nic­zo obe­j­mu­je ona brod­man­nowskie pola 1819, lub zgod­nie z inną notacją, obszary: V2, V3, V3A, V4V5 (ryc. 22). W anal­izie danych wzrokowych biorą również udzi­ał struk­tu­ry korowe, zna­j­du­jące się we wszys­t­kich płat­ach mózgu: w pła­cie ciemieniowym, np. V7 lub bruz­da śród­ciemieniowa (intra­pari­etal sul­cus; IPS), w pła­cie skro­niowym, np. dol­na kora skro­niowa (infe­ri­or tem­po­ral cor­tex; ITC) lub gór­na bruz­da skro­niowa (supe­ri­or tem­po­ral sul­cus; STS) oraz w pła­cie czołowym, np. korowy ośrodek skoja­rzo­nego spo­jrzenia w bok (frontal eye field; FEF).

Żeby zrozu­mieć, co mózg robi ze światłem pobudza­ją­cym fotore­cep­to­ry w siatkówkach oczu trze­ba przeanal­i­zować budowę i funkc­je wszys­t­kich tych jego częś­ci korowych, które są zaan­gażowane w widzenie.

Skąd się biorą prążki na powierzchni kory V1?

Kora prążkowa bierze swo­ją nazwę od wyglą­du powierzch­ni, przy­pom­i­na­jącej nieco umaszcze­nie zebry (ryc. 24). Ciem­niejsze prąż­ki widoczne na jej powierzch­ni pow­stały w wyniku wybar­wienia komórek za pomocą tech­ni­ki oksy­dazy cytochro­mowej (cytochrome oxi­dase; COX). Odbier­a­ją one syg­nały płynące z oka leżącego po prze­ci­wnej stron­ie głowy niż dany frag­ment kory V1 (LeV­ay, Hubel i Wiesel, 1975; Sin­ci­ch i Hor­ton, 2002). Jak pamię­tamy, po skrzyżowa­niu wzrokowym, poszczególne warst­wy komórek w prawym i w lewym LGN odbier­a­ją syg­nały płynące zarówno z oka leżącego po tej samej, jak i po prze­ci­wnej stron­ie głowy. Podob­nie jest w korze V1. Do obu jej częś­ci, czyli z prawej i z lewej strony mózgu płyną impul­sy ner­wowe  z oczu leżą­cych po obu stronach głowy.

Ryci­na 24. Zdję­cie powierzch­ni kory prążkowej lewego pła­ta potylicznego; widok z góry po rozłoże­niu bruzdy ostro­gowej na płaszczyźnie i wybar­wie­niu jej za pomocą tech­ni­ki oksy­dazy cytochro­mowej; ciem­niejsze prąż­ki wskazu­ją na położe­nie tych komórek, które odbier­a­ją syg­nały z oka leżącego po prze­ci­wnej, czyli po prawej stron­ie głowy. Własne opra­cow­anie graficzne na pod­staw­ie Sin­ci­ch i Hor­ton (2002)

Żeby zrozu­mieć skąd się biorą prąż­ki na powierzch­ni pier­ws­zorzę­dowej kory wzrokowej trze­ba zajrzeć do jej wnętrza przeci­na­jąc ją w poprzek (ryc. 25). Na pier­wszy rzut oka, na przekro­ju kory wzrokowej widać tylko trzy pas­ki, dwa nieco jaśniejsze i jeden ciem­niejszy zna­j­du­ją­cy się między nim. Ten ciem­niejszy zwany jest prążkiem Gen­nar­iego (stria of Gen­nari), od nazwiska jego odkry­w­cy, włoskiego stu­den­ta medy­cyny, Francesco Gen­nar­iego. Bez mikroskopu nie widać innych szczegółów budowy wewnętrznej pier­ws­zorzę­dowej kory wzrokowej.

Ryci­na 25. Poprzeczny przekrój kory prążkowej przez bruzdę ostro­gową. A – zdję­cie z wyraź-nie widoczną jas­ną wstążką kory prążkowej z ciem­niejszym prążkiem Gen­nar­iego i B – schematy­czne odw­zorowanie zdję­cia A z zaz­nac­zonym zakre­sem kory V1. Własne opra­cow­anie graficzne na pod­staw­ie Andrews, Halpern i Purves (1997)

Jeśli jed­nak obe­jrzymy ją pod mikroskopem – a zwłaszcza po uprzed­nim wybar­wie­niu zna­j­du­ją­cych się tam komórek – wów­czas zobaczymy coś, co przy­pom­i­na uporząd­kowaną struk­turę warstw w LGN. Komór­ki w korze V1 są ułożone w 6 poziomych warstw, oznaczanych rzym­ski­mi cyfra­mi, od I do VI. Najsz­er­sza jest warst­wa IV, która dzieli się jeszcze na cztery cieńsze warst­wy: IVA, IVB, IVCα i IVCβ (ryc. 26).

Widoczny na ryc. 25 ciem­ny prążek Gen­nar­iego to właśnie frag­ment IV warst­wy, a ściślej obszar, w którym zna­j­du­ją się połączenia między warst­wa­mi IVB a IVCα. Warst­wa IV pełni funkcję bramy wejś­ciowej do kory wzrokowej mózgu. To przez nią, a zwłaszcza przez warst­wy IVCα i IVCβ, docier­a­ją do pier­wot­nej kory wzrokowej impul­sy ner­wowe z LGN, a wcześniej z siatkówek obu oczu, za pośred­nictwem promienis­toś­ci wzrokowej. Dopiero z warst­wy IV dane sen­so­ryczne są rozsyłane dalej do komórek zna­j­du­ją­cych się w innych warst­wach kory V1.

Ryci­na 26. Przekrój poprzeczny kory prążkowej maka­ka z wybar­wiony­mi warst­wa­mi komórek metodą: A – Niss­la i B – Gol­giego. Bar­wny pas na poziomie warst­wy IVB i IVCα wskazu­je na położe­nie prąż­ka Gen­nar­iego. Własne opra­cow­anie graficzne na pod­staw­ie Lund (1973)

Islamska architektura kory V1

Następ­ną cieka­wostką związaną z budową pier­wot­nej kory wzrokowej jest to, że komór­ki, które tworzą poszczególne jej warst­wy łączą się ze sobą w wyraźne kolum­ny. Dobrze je widać na zdję­ciu wyko­nanym metodą Gol­giego na ryc. 26. Drze­wa dendry­ty­czne komórek zna­j­du­ją­cych się w I warst­wie są niczym głow­ice kol­umn, których bazę stanow­ią komór­ki zna­j­du­jące się w warst­wie VI, a trzon – komór­ki leżące w warst­wach od II do V.

Patrząc na prążkowaną powierzch­nię pier­wot­nej kory wzrokowej na ryc. 24 widz­imy zatem tylko głow­ice poszczegól­nych kol­umn. Jeżeli jed­nak zostaną wybar­wione kolum­ny komórek, które odbier­a­ją impul­sy ner­wowe tylko z jed­nego oka, wów­czas wszys­tkie głow­ice tych kol­umn także przyjmą tę bar­wę, a na powierzch­ni kory wzrokowej zobaczymy ciem­niejsze prąż­ki (ryc. 27). Wskazu­ją one na miejs­ca, gdzie w korze wzrokowej zna­j­du­ją się rzędy komórek odbier­a­ją­cych i przetwarza­ją­cych syg­nały z prawego lub lewego oka. Tworzą one coś w rodza­ju kolum­nad takich, jakie może­my podzi­wiać w Wielkim Meczecie w Kor­do­bie. Tuż obok jed­nej kolum­nady bieg­nie następ­ny rząd neu­ronal­nych kol­umn, odbier­a­ją­cych syg­nały z drugiego oka itd.

Ryci­na 27. Kolum­nady neu­ronów w korze prążkowej, odbier­a­jące syg­nały z prawego i z lewego oka. Opra­cow­anie graficzne P.A.

Zorientowane komórki

Odkrycie następ­nej włas­noś­ci pier­wot­nej kory wzrokowej zakończyło się przyz­naniem Nagrody Nobla w 1981 roku dwóm neu­rofizjol­o­gom Davi­d­owi Hube­lowi i Torstenowi Wieselowi. Ekspery­men­tu­jąc z korą wzrokową kota stwierdzili oni, że sto­jące obok siebie kolum­ny komórek, które reagu­ją na dane płynące z jed­nego oka są wyspec­jal­i­zowane w zakre­sie ori­en­tacji przestrzen­nej frag­men­tów kon­turów rzeczy reje­strowanych przez to oko. Oznacza to, że wewnątrz kory V1 kolum­ny komórek są uporząd­kowane w dwóch płaszczyznach.

Jed­ną płaszczyznę wyz­nacza­ją komór­ki reagu­jące nieza­leżnie od siebie na dane płynące z prawego i lewego oka. Z kolei dru­ga płaszczyz­na leży w poprzek tamtej i obe­j­mu­je komór­ki, które reagu­ją na różne kąty, pod jaki­mi spostrze­gany jest frag­ment kon­tu­ru widzianej rzeczy, nieza­leżnie od tego, za pomocą którego oka został on zare­je­strowany. Opisu­jąc tę zdu­miewa­jącą struk­turę pier­ws­zorzę­dowej kory wzrokowej Hubel i Wiesel (1972) zapro­ponowali funkcjon­al­ny mod­el uporząd­kowa­nia kol­umn komórek w V1, znany jako mod­el kostek lodu (ice-cube mod­el) (ryc. 28).

Ryci­na 28. Funkcjon­al­ny mod­el kostek lodu ilus­tru­ją­cy wrażli­wość kol­umn neu­ronów tworzą­cych pier­wot­ną korę wzrokową na dane pochodzące z prawego i z lewego oka oraz na dane doty­czące kąta nachyle­nia kon­tu­ru zare­je­strowanego w danym frag­men­cie siatków­ki oka. Opra­cow­anie graficzne P.A. na pod­staw­ie Hubel (1988)

Oczy­wiś­cie nie należy tego mod­elu trak­tować dosłown­ie, choć­by z tego powodu, że – jak przekon­al­iśmy się oglą­da­jąc powierzch­nię kory V1 – rzędy kol­umn neu­ronów reagu­ją­cych na syg­nały płynące z jed­nego lub drugiego oka byna­jm­niej nie są ułożone wzdłuż linii prostych. Tym niem­niej mod­el ten znakomi­cie ilus­tru­je ogól­ną zasadę funkcjon­al­nego uporząd­kowa­nia wewnętrznej struk­tu­ry pier­wot­nej kory wzrokowej.

Otóż wyglą­da na to, że już na wstęp­nym etapie szlaku wzrokowego, obraz rzu­towany na siatkówkę oka jest dzielony przestrzen­nie na tysiące małych kawałków. Każdy z tych kawałków zaw­iera infor­ma­cję o swoim położe­niu na siatków­ce oraz o ori­en­tacji krawędzi leżą­cych na styku płaszczyzn różnią­cych się ze wzglę­du na inten­sy­wność oświ­etle­nia. W pier­wot­nej korze wzrokowej anal­i­zowana jest zawartość wszys­t­kich tych kawałków i w zależnoś­ci od miejs­ca na siatków­ce oraz od ori­en­tacji zare­je­strowanych krawędzi, akty­wiz­owana jest określona gru­pa kol­umn komórek. W ten sposób najpraw­dopodob­niej kodowana jest infor­ma­c­ja o ksz­tał­tach rzeczy. Na dal­szych eta­pach szlaku wzrokowego jest ona wyko­rzysty­wana do rekon­strukcji obiek­tów tworzą­cych całą scenę wizualną.

Na pier­wszy rzut oka może się wydawać czymś całkowicie irracjon­al­nym, żeby otrzy­mu­jąc na siatków­ce oka kom­plet­ny obraz sce­ny wiz­ual­nej, sys­tem wzrokowy najpierw rozkładał go na czyn­ni­ki pier­wsze, a następ­nie z tych ele­men­tów składał go ponown­ie. Otóż po głęb­szym zas­tanowie­niu musimy jed­nak dojść do wniosku, że trud­no było­by wymyśleć bardziej eko­nom­iczny sys­tem przetwarza­nia danych wzrokowych. Wystar­czy tylko wziąć pod uwagę niewyobrażal­ną ilość danych dostar­czanych do mózgu przez pobudzane czop­ki i prę­ci­ki w każdej sekundzie, gdy nasze oczy są otwarte. Inny­mi słowy złożoność i zmi­en­ność scen wiz­ual­nych w cza­sie wyma­ga­ją od sys­te­mu wzrokowego pode­jś­cia sys­te­mowego, opartego na kilku czytel­nych zasadach. Sprowadza­ją się one do anal­izy danych wzrokowych ze wzglę­du na najważniejsze włas­noś­ci zarówno sce­ny wiz­ual­nej, jak i urządzenia które je rejestru­je, czyli siatkówki.

Jeżeli bowiem nie­zlic­zone ksz­tał­ty wszys­t­kich widzianych rzeczy moż­na wyz­naczyć za pomocą różnic w jas­noś­ci dwuwymi­arowych płaszczyzn, na styku których zarysowu­je się kon­tur ksz­tał­tu, to nieporówny­wal­nie łatwiej jest kodować te ksz­tał­ty za pomocą sto­sunkowo niewielkiej iloś­ci komórek wrażli­wych na ori­en­tację kon­turów w zakre­sie od 0 do 180o, niż za pomocą niemożli­wej do osza­cow­a­nia iloś­ci komórek i ich połączeń, które pamię­tały­by każdy ksz­tałt ze wszys­tki­mi jego wyglą­da­mi. Cho­ci­aż i ten wari­ant jest „poważnie brany pod uwagę” przez mózg, również ze względów ekonomicznych.

Okazu­je się bowiem, że nawet poje­dyncze komór­ki mogą kodować ksz­tał­ty złożonych rzeczy, ale tylko tych, które są bard­zo dobrze znane i sil­nie utr­walone w struk­tu­rach mózgu. Oczy­wiś­cie nie w korze V1, tylko na dal­szych eta­pach korowego szlaku wzrokowego. Są to tzw. komór­ki babcine (grand­moth­er cells), które reagu­ją wybiór­c­zo na konkretne rzeczy lub ludzi (Gross, 2002; Kreiman, Koch i Fried, 2000; Quiroga, Kraskov, Koch i Fried (2009); Quiroga, Mukamel, Isham, Malach i in (2008). Warto w tym miejs­cu przy­pom­nieć, że możli­wość kodowa­nia złożonych ksz­tałtów przez poje­dyncze komór­ki odkrył i opisał już w lat­ach 60. XX wybit­ny pol­s­ki neu­rofizjolog, Jerzy Konors­ki (1967). Komór­ki te nazy­wał neu­ron­a­mi gnos­ty­czny­mi (gnos­tic neu­rons). Zgod­nie z jego kon­cepcją stanow­iły one najwyższe piętro przetwarza­nia danych o ksz­tał­tach widzianych rzeczy, reje­strowanych przez pole gnostycz­ne (gnos­tic fields), złożone z wielu komórek na wcześniejszych eta­pach szlaku wzrokowego.

Wraca­jąc do równie znakomi­tych odkryć Hubela i Wiesela warto dodać, że ziden­ty­fikowali oni nie jeden, ale dwa rodza­je komórek tworzą­cych kolum­ny w korze V1. Oprócz kol­umn komórek uwrażli­wionych na kąt nachyle­nia kon­turów, tzw. komórek prostych (sim­ple cells), stwierdzili również obec­ność komórek, które reagu­ją na kierunek ruchu. Są to tzw. komór­ki złożone (com­plex cells). W ramach niniejszej mono­grafii, ruch rzeczy w sce­nie wiz­ual­nej nie będzie przed­miotem anal­izy, dlat­ego nie rozwi­jam tutaj tego wątku.

Retinotopowa mapa w korze prążkowej

Przed­staw­iony w poprzed­nim rozdziale opis niezwykłych włas­noś­ci pier­wot­nej kory wzrokowej byna­jm­niej nie jest jeszcze kom­plet­ny. Zna­jąc już nieco wewnętrzną budowę kory V1, wróćmy ponown­ie na jej powierzch­nię. I tu czeka na nas kole­j­na niespodzianka.

Otóż, rzędy kol­umn komórek, które odbier­a­ją syg­nały z siatkówek prawego i lewego oka odzwier­cied­la­ją uporząd­kowanie zna­j­du­ją­cych się w nich fotore­cep­torów. Nie jest to odw­zorowanie 1:1, ale znany jest algo­rytm pozwala­ją­cy przewidzieć, które kolum­ny neu­ronów w pier­ws­zorzę­dowej korze wzrokowej zareagu­ją w odpowiedzi na sty­mu­lację określonej częś­ci siatków­ki. Algo­rytm złożonej trans­for­ma­cji log­a­ryt­micznej (com­plex log­a­rithm trans­for­ma­tion) został opra­cow­any przez Eri­ca L. Schwartza (1980) na pod­staw­ie anatomicznej lokaliza­cji połączeń między komórka­mi zwo­jowy­mi, które zbier­a­ją infor­ma­c­je z różnych częś­ci siatków­ki a różny­mi częś­ci­a­mi kory V1 w prawym i lewym pła­cie potylicznym (ryc. 29).

Ryci­na 29. Mod­el retino­topowej orga­ni­za­cji kol­umn neu­ronów w pier­wot­nej korze wzrokowej: A – odróżnione od siebie bar­wne częś­ci powierzch­ni siatków­ki oka i B – powierzch­nie kory V1 zabar­wione odpowiada­ją­cym im bar­wnym powierzch­niom siatków­ki. Opra­cow­anie graficzne P.A. na pod­staw­ie Hubel (1988)

Z ryc. 29 wyni­ka, że ok. 30% kol­umn neu­ronów w pier­ws­zorzę­dowej korze wzrokowej odbiera dane pochodzące z obszaru plam­ki żółtej, która obe­j­mu­je pole widzenia w zakre­sie do 5° (bar­wa żół­ta). Następ­na, trze­cia część kol­umn neu­ronów w V1 zaj­mu­je się obszarem siatków­ki między 5° a 20° pola widzenia (bar­wa czer­wona) i wresz­cie pozostałym obszarem siatków­ki tj. między 20° a 90° pola widzenia, zaj­mu­je się pozostała część neu­ronów kory w polu 17 (bar­wa zielona, jas­no- i ciemnoniebieska).

Ponieważ – jak pamię­tamy – najwięcej danych płynie wzdłuż aksonów komórek karłowatych i pyłkowych, czyli tzw. szlakiem drob­nokomórkowym, dlat­ego w korze V1 najwięcej kol­umn komórek odbiera właśnie te dane. Jeśli przy­pom­n­imy sobie jeszcze, że drob­ne komór­ki zwo­jowe obsługu­ją przede wszys­tkim te oko­lice siatków­ki oka, które zna­j­du­ją się w okol­i­cy doł­ka cen­tral­nego, wów­czas stanie się zrozu­mi­ałe, że licz­ba kol­umn komórek zaj­mu­ją­cych się tym rodza­jem danych jest niewspółmiernie więk­sza niż licz­ba kol­umn odbier­a­ją­cych dane z pozostałych częś­ci siatkówki.

Jed­no z pier­wszych badań, w którym zare­je­strowano reakc­je komórek w korze V1 na bodziec wzrokowy zostało przeprowad­zone przez Rogera Tootel­la i współpra­cown­ików na makakach (Tootell, Sil­ver­man, Switkes i de Val­ois, 1982). Zademon­strowali oni efekt odzwier­ciedle­nia w korze V1, wzoru fig­ury oglą­danej przez małpę (ryc. 30). Warto dodać, że najwyraźniejsze odw­zorowanie uzyskano w warst­wie IVC. Jest to zrozu­mi­ałe, ponieważ to właśnie na tym poziomie syg­nały z LGN docier­a­ją do V1.

Ryc. 30. A – bodziec wzrokowy, B – wybar­wiona metodą 2DG (2‑deoxyglucose analy­sis) pier­ws­zorzę­dowa kora wzrokowa na poziomie warst­wy IVC. Na pod­staw­ie Tootell, Switkes, Sil­ver­man i Hamil­ton (1988)

Dru­gi przykład jeszcze wyraźniej ilus­tru­je, jak wiele już wiemy na tem­at retino­topowej orga­ni­za­cji kory V1 nie tylko u makaków, ale również u człowieka i jej akty­wnoś­ci pod­czas widzenia. W bada­ni­ach, na które chci­ałbym zwró­cić uwagę, reakcję kory wzrokowej człowieka reje­strowano za pomocą skan­era fMRI 7T (Poli­meni, Fis­chl, Greve i Wald, 2010). Tym razem oso­ba badana oglą­dała na ekranie kom­put­era literę „M”, w dwóch wer­s­jach: pozy­ty­wowej i negaty­wowej (ryc. 31B). Jej ksz­tałt został odpowied­nio przetwor­zony za pomocą wspom­ni­anego już algo­ryt­mu Schwartza, który określa zależnoś­ci przestrzenne między obrazem rzu­towanym na połowę siatków­ki oka (visu­al hemi­field), a jej odzwier­ciedle­niem na powierzch­ni kory wzro­kowej (cor­ti­cal sur­face; ryc. 31 A).

Ryci­na 31. A – obraz rzu­towany na powierzch­nię siatków­ki oraz oczeki­wany na powierzch­ni kory V1 i B – bodźce stosowane w bada­ni­ach przez Jonathana R. Poli­meni i współpra­cown­ików (2010). Własne opra­cow­anie graficzne na pod­staw­ie Poli­meni, Fis­chl, Greve i Wald (2010)

Eksponu­jąc zniek­sz­tał­cony bodziec wzrokowy zamierzano sprawdz­ić, w jakim stop­niu kolum­ny neu­ronów, które są wrażli­we na różne kąty kon­turów pow­sta­ją­cych na styku kon­trastu­ją­cych ze sobą powierzch­ni, trafnie odzwier­ciedlą ksz­tałt litery „M”. Pod­czas fik­sowa­nia wzroku przez badanych na środ­kowym, czer­wonym punkcie, mier­zono akty­wność neu­ronów w korze V1 i stwierd­zono, że na poziomie warst­wy IVC całkiem przyz­woicie odzwier­cied­la się obraz litery „M” (ryc. 32 C; niebies­ki kształt).

Ryci­na 32. A – obraz rzu­towany na powierzch­nię siatków­ki oraz oczeki­wany na powierzch­ni kory V1 i B – bodźce stosowane w bada­ni­ach przez Jonathana R. Poli­meni i współpra­cown­ików (2010). Własne opra­cow­anie graficzne na pod­staw­ie Poli­meni, Fis­chl, Greve i Wald (2010)

Nie trze­ba chy­ba niko­go przekony­wać, jak ogromne możli­woś­ci otwier­a­ją te odkrycia w zakre­sie przy­wraca­nia możli­woś­ci widzenia osobom, które utraciły wzrok, w wyniku choro­by lub mechan­icznego uszkodzenia siatkówek oczu. Zami­ast danych wysyłanych przez fotore­cep­to­ry zna­j­du­jące się w siatkówkach oczu do kory V1, moż­na wysłać do niej syg­nał bezpośred­nio z kamery wideo. Po jego przetworze­niu za pomocą algo­ryt­mu Schwartza oraz sty­mu­lowa­niu nim komórek w pier­ws­zorzę­dowej korze wzrokowej za pomocą elek­trod moż­na doprowadz­ić do pow­sta­nia doświad­czenia widzenia. Wiele wskazu­je na to, że to już nieodległa przyszłość.

I jeszcze kilka zdań o plamkach i barwach

Omaw­ia­jąc budowę i funkc­je pier­ws­zorzę­dowej kory wzrokowej nie moż­na pom­inąć jeszcze jed­nego ele­men­tu. Otóż pomiędzy kolum­na­mi komórek, które odd­ziel­nie z jed­nego i z drugiego oka odbier­a­ją infor­ma­c­je o ori­en­tacji przestrzen­nej frag­men­tów kon­turów, zna­j­du­ją się niewielkie, cylindryczne skupiska neu­ronów, które pełnią ważną funkcję, m.in. w per­cepcji barw (Liv­ing­stone i Hubel, 1984). Wys­tępu­ją one w zasadzie we wszys­t­kich warst­wach kory wzrokowej, za wyjątkiem warst­wy IV (ryc. 33).

Ryci­na 33. Zmody­fikowana wer­s­ja mod­elu pier­wot­nej kory wzrokowej zapro­ponowana przez Davi­da Hubela i Torste­na N. Wiesela (1977) uwzględ­ni­a­ją­ca kolum­ny komórek plamkowych w korze V1. Opra­cow­anie graficzne P.A. na pod­staw­ie Liv­ing­stone i Hubel (1984)

W pol­skim tłu­macze­niu ang­iel­sko­języ­cznej nazwy „blobs”, określa się je jako „kro­pel­ki”, „plam­ki”, a nawet „kleksy” (Matthews, 2000), nato­mi­ast rzadziej uży­wa się ory­gi­nal­nej nazwy tej struk­tu­ry, odkry­tej przez Jonathana C. Hor­tona i Davi­da Hubela (1981), tj. patch­es, czyli łaty. Nazwy te pochodzą stąd, że po prze­cię­ciu wzdłuż kory V1 i wybar­wie­niu jej za pomocą metody oksy­dazy cytochro­mowej, na jej powierzch­ni moż­na dostrzec dość niereg­u­larnie rozmieszc­zone plam­ki zna­j­du­jące się między kolum­na­mi komórek, które reagu­ją na ori­en­tację krawędzi widzianych rzeczy (ryc. 34).

Ryci­na 34. Fotografia powierzch­ni kory V1 z zaz­nac­zony­mi prążka­mi i plamka­mi, wskazu­ją­cy­mi na miejs­ca kol­umn neu­ronów wrażli­wych na bar­wy. Własne opra­cow­anie graficzne na pod­staw­ie Blas­del (1992a)

Wejścia i wyjścia z kory V1

Domyka­jąc wycieczkę w głąb pier­wot­nej kory wzrokowej warto uporząd­kować wiedzę doty­czącą jej połączeń z inny­mi struk­tu­ra­mi mózgu. Przede wszys­tkim wiado­mo, że do kory V1 najwięcej danych dociera z LGN sze­rokim trak­tem, zwanym promienis­toś­cią wzrokową. Aksony komórek tworzą­cych promienis­tość wzrokową łączą się z komórka­mi kory V1 na poziomie warst­wy IV. Aksony te tworzą trzy ścież­ki wzrokowe: wielko- drob­no- i pyłkokomórkową.

Ścież­ka wielkokomórkowa łączy się z korą V1 na poziomie warst­wy IVCα i przenosi dane doty­czące jas­noś­ci frag­men­tów sce­ny wiz­ual­nej. Nie są one kodowane z tak wysoką rozdziel­czoś­cią, jak dane płynące po ścieżce drob­nokomórkowej, ale za to obe­j­mu­ją znacznie więk­sze obszary widzianej sce­ny. Dane te stanow­ią pod­stawę glob­al­nej orga­ni­za­cji przestrzen­nej obiek­tów zna­j­du­ją­cych się w wykadrowanej sce­nie. Pon­ad­to, po ścieżce wielokomórkowej płyną syg­nały, które stanow­ią pod­stawę widzenia ruchu. Zarówno per­cepc­ja glob­al­nej orga­ni­za­cji przestrzen­nej wewnątrz sce­ny wiz­ual­nej, jak i per­cepc­ja jej zmi­en­noś­ci, związanej z ruchem zna­j­du­ją­cych się w niej obiek­tów i ruchem obser­wa­to­ra, są kluczem do naszej ori­en­tacji w przestrzeni. Dane bieg­nące z warst­wy IVCα po ścieżce wielokomórkowej trafi­a­ją do sąsiadu­jącej z nią warst­wy IVB. Stąd są one wysyłane w dwóch kierunk­ach: do kory V2 oraz do kory V5, zwanej również obszarem przy­środ­ko­wym skro­niowym (medi­al tem­po­ral area; MT), który spec­jal­izu­je się w przetwarza­niu danych doty­czą­cych ruchu w sce­nie wiz­ual­nej (ryc. 35).

Boga­ta w aksony ścież­ka drob­nokomórkowa łączy się z V1 na poziomie warst­wy IVCβ. Przenosi ona dwa rodza­je infor­ma­cji: o dłu­goś­ci i inten­sy­wnoś­ci fali świ­etl­nej pobudza­jącej różne grupy czop­ków w siatków­ce, czyli o bar­wie i o lumi­nancji. Dane te charak­teryzu­ją się z jed­nej strony wysoką rozdziel­czoś­cią przestrzen­ną, a z drugiej, są ogranic­zone do sto­sunkowo niewielkiego frag­men­tu pola widzenia. Infor­ma­c­ja o dłu­goś­ci fali świ­etl­nej, zwłaszcza w zakre­sie opozy­cji bar­wy czer­wonej i zielonej, jest kierowana z warst­wy IVCβ do skupisk neu­ronów tworzą­cych plam­ki, a stamtąd do kory V2. Z kolei infor­ma­c­ja o inten­sy­wnoś­ci oświ­etle­nia, która stanowi fun­da­ment widzenia kon­turów płynie z warst­wy IVCβ, wzdłuż kol­umn wrażli­wych na określone kąty frag­men­tów kon­turów (zwłaszcza w warst­wach II i III), i stąd także jest wyprowadzana do kory V2.

Ryci­na 35. Wejś­cia do kory V1 szlaków wielko‑, drob­no- i pyłkokomórkowych z LGN oraz wyjś­cia z kory V1 do kory V2, V3, V4 i V5 (MT), a także zwrot­nie do LGN i SC. Własne opra­cow­anie graficzne na pod­staw­ie mate­ri­ałów zamieszc­zonych na stron­ie Lab­o­ra­to­ry for Visu­al Neuroscience

Nieco inaczej jest ze szlakiem pyłkokomórkowym, który w korze V1 łączy się bezpośred­nio ze skupiska­mi neu­ronów tworzą­cych wal­cow­ate plam­ki, bez pośred­nict­wa kol­umn w warst­wie IV. Po ścieżce pyłkokomórkowej przenos­zone są dane w zakre­sie opozy­cji bar­wy niebieskiej i żółtej. Z plamek płyną one dalej w kierunku kory V2.

Kora V2

Zde­cy­dowana więk­szość danych docier­a­ją­cych do kory V1 z siatków­ki przez LGN jest przekazy­wana dalej do kory V2 lub, według klasy­fikacji Brod­man­na – pola 18. Podob­nie, jak V1 skła­da się ona z leżą­cych obok siebie struk­tur komórkowych o różnej budowie anatomicznej. Po ich wybar­wie­niu moż­na je łat­wo od siebie odróżnić, ponieważ tworzą charak­terysty­czne prąż­ki (ryc. 36). W korze V2 moż­na wyróżnić zasad­nic­zo trzy rodza­je prążków: cienkie (thin stripes), grube (thick stripes), które wybar­wia­ją się na ciem­no i tzw. regiony międzyprążkowe (pale stripes), które pod­czas wybar­wia­nia pozosta­ją jasne (Matthews, 2000). Prąż­ki układa­ją się w tym samym ryt­mie wzdłuż całej kory V2, czyli: cien­ki – międzyprążkowy – gru­by – międzyprążkowy – cien­ki – międzyprążkowy, itd.

Ryci­na 36. Przekrój boczny przez prążkową struk­turę kory V2 małpy po jej wybar­wie­niu za pomocą oksy­dazy cytochro­mowej. Własne opra­cow­anie graficzne na pod­staw­ie Hor­ton i Hock­ing (1996)

Pon­ad połowa komórek w korze V2 reagu­je niemal iden­ty­cznie, jak komór­ki w V1 (Will­more, Prenger i Gal­lant, 2010). Najpraw­dopodob­niej oznacza to, że przetwarza­ją one dane doty­czące prostych cech sce­ny wiz­ual­nej, m.in. takich jak frag­men­ty krawędzi, ich ori­en­tac­je, kierunek ruchu i bar­wy (Sit i Miikku­lainen, 2009). Komór­ki te nie są już jed­nak zor­ga­ni­zowane topograficznie, tak jak w korze V1. Dru­ga połowa komórek V2 zaj­mu­je się bardziej złożony­mi cecha­mi sce­ny wiz­ual­nej. Między inny­mi są one akty­wne w odpowiedzi na kon­tu­ry ilu­zo­ryczne lub kon­tu­ry defin­iowane przez fak­turę powierzch­ni (von der Hey­dt, Peter­hans i Baum­gart­ner, 1984; von der Hey­dt i Peter­hans, 1989), a także na skom­p­likowane ksz­tał­ty i ich ori­en­tację (Hegdé i van Essen, 2000; Ito i Komat­su, 2004; Anzai, Peng i van Essen, 2007).

Każdy z trzech rodza­jów prążków odbiera inne dane z V1, zgod­nie z wielokrot­nie już syg­nal­i­zowanym podzi­ałem ścieżek wzrokowych na trzy rodza­je ze wzglę­du na ich funkc­je. I tak, dane z obszarów plamkowych w V1 są przekazy­wane do komórek tworzą­cych cienkie prąż­ki w V2. W prążkach tych zanika­ją już anatomiczne różnice między komórka­mi tworzą­cy­mi drob­no- i pyłkokomórkową ścieżkę, nato­mi­ast dochodzi do inte­gracji wszys­t­kich danych, które stanow­ią pod­stawę widzenia barw. Inny­mi słowy, neu­rony tworzące cien­ki prążek w korze V2 są wyspec­jal­i­zowane w zakre­sie orga­ni­za­cji danych o różnych dłu­goś­ci­ach fali elek­tro­mag­ne­ty­cznej tworzącej całe spek­trum światła widzianego. Dane te są dalej przekazy­wane zarówno bezpośred­nio, jak i za pośred­nictwem kory V3 do kory V4, zwanej korowym ośrod­kiem widzenia barw (DeY­oe i van Essen, 1985; Shipp i Zeki, 1985; van Essen, 2004). Der­rik E. Ash­er i Alyssa A. Brew­er (2009), na pod­staw­ie wyników badań fMRI sugeru­ją, że w zakre­sie przetwarza­nia barw w polu V4 są istotne różnice międzypółku­lowe. Otóż okazu­je się, że w pra­wostron­nym korowym ośrod­ku widzenia barw neu­rony są znacznie bardziej wrażli­we na bodźce chro­maty­czne niż achro­maty­czne, nato­mi­ast w polu V4 zna­j­du­ją­cym się z lewej strony nie stwierd­zono różnic w akty­wnoś­ci neu­ronów na bodźce chro­maty­czne i achromatyczne.

Wysoko­rozdziel­cze widze­nie ksz­tałtów na pod­staw­ie kon­trastów w zakre­sie lumi­nacji ma swo­je źródło – jak pamię­tamy – w danych przekazy­wanych za pośred­nictwem ścież­ki drob­nokomórkowej, które z kolum­nad w V1 trafi­a­ją do regionów międzyprążkowych w V2. To jed­na z najważniejszych struk­tur w korze wzrokowej, której akty­wność stanowi pod­stawę orga­ni­za­cji danych umożli­wia­ją­cych rozpoz­nawanie ksz­tałtów rzeczy w sce­nie wiz­ual­nej. Dane z obszarów międzyprążkowych w V2 również trafi­a­ją do V4.

Inte­gracją danych doty­czą­cych ksz­tałtów widzianych rzeczy zaj­mu­ją się te struk­tu­ry mózgu, które odbier­a­ją pro­jekc­je z V4, czyli zakręt dol­ny skro­niowy (infe­ri­or tem­po­ral gyrus; IT) oraz zakręt wrze­cionowaty (fusiform gyrus), ze szczegól­nym miejscem zwanym obszarem rozpoz­nawa­nia twa­rzy (fusiform face area; FFA) (ryc. 37).

Ryci­na 37. Struk­tu­ry korowe zaan­gażowane w widze­nie. A – lewe półku­la i B – widok mózgu od dołu. Opra­cow­anie graficzne P.A. na pod­staw­ie Yokochi, Rohen i Wein­reb (2006)

Trzec­im rodza­jem prążków w korze V2 są prąż­ki ciemne i grube. Tu z V1 docier­a­ją dwie kat­e­gorie danych: doty­czące przestrzen­nej orga­ni­za­cji sce­ny wiz­ual­nej i ruchu. Dane o glob­al­nej orga­ni­za­cji przestrzen­nej umożli­wia­ją zarówno stwierdze­nie obec­noś­ci takich czy innych obiek­tów w sce­nie wiz­ual­nej (stanow­ią więc również pod­stawę widzenia ich ksz­tałtów), jak również ich rozmieszczenia wzglę­dem siebie. Ze wzglę­du na sto­sunkowo niską rozdziel­czość, dane te pełnią funkcję ogól­nie ori­en­tu­jącą w przestrzeni i – w zależnoś­ci od sytu­acji – stanow­ią impuls do skierowa­nia uwa­gi i dokład­niejszą anal­izę na wybranych frag­men­tach sce­ny przez sys­te­my odpowiedzialne za widze­nie wysoko­rozdziel­cze. Syg­nały kodu­jące infor­ma­c­je doty­czące glob­al­nej ori­en­tacji przestrzen­nej są kierowane do kory V3.

Z kolei dru­ga kat­e­go­ria danych płyną­cych z V1 do grubych, ciem­nych prążków w V2 stanowi pod­stawę doświad­czenia widzenia ruchu. Stąd są one wyprowadzane do wspom­ni­anego już obszaru MT, czyli kory V5 i dalej V3A, będą­cych ko­rowym ośrod­kiem per­cepcji ruchu (Roe i Ts’o, 1995; Shipp i Zeki, 1989) (ryc. 37).

Ścieżka brzuszna i grzbietowa

Oprócz inte­growa­nia danych docier­a­ją­cych z V1, kora V2 stanowi także niezwyk­le ważny węzeł na szlaku wzrokowym, w którym biorą początek dwie nowe, częś­ciowo nieza­leżne od siebie ścież­ki wzrokowe: brzusz­na (ven­tral path) i grz­bi­etowa (dor­sal path) (Mil­ner i Goodale, 2008). Swo­je nazwy biorą one od umiejs­cowienia w korze mózgu. Gdy­byśmy przed­staw­ili sobie mózg, jako zwierzę, np. rybę, to struk­tu­ry leżące na jej górnej powierzch­ni, czyli płaty ciemieniowe kojarzyły by się z grz­bi­etem, a struk­tu­ry zna­j­du­jące się w dol­nej częś­ci (np. płaty skro­niowe) – z brzuchem (ryc. 38). I tak właśnie jest z nazwa­mi tych szlaków. Podob­nie, jak pod­ko­rowe ścież­ki wielko‑, drob­no- i pyłkokomórkowe, leżące na wcześniejszych eta­pach szlaku wzrokowego, również obie ścież­ki korowe (brzusz­na i grz­bi­etowa) różnią się od siebie pod wzglę­dem anatomicznym i funkcjonalnym.

Ryci­na 38. Dwa szla­ki wzrokowe: brzuszny, typu „co” i grz­bi­etowy, typu „gdzie”. Opra­cow­anie graficzne P.A. na pod­staw­ie Mil­ner i Goodale (2008)

His­to­ria odkrycia tych dwóch szlaków wzrokowych się­ga lat 80. ubiegłego stule­cia. W 1982 roku Leslie G. Unger­lei­der i Mor­timer Mishkin opub­likowali wyni­ki badań nad akty­wnoś­cią kory móz­gowej rezusów, pod­czas wykony­wa­nia przez nie zadań wyma­ga­ją­cych, albo różni­cow­a­nia przed­miotów, albo ich lokaliza­cji za pomocą wzroku. Oczy­wiś­cie w tych cza­sach nie stosowano jeszcze skan­erów mag­ne­ty­cznych do lokaliza­cji akty­wnoś­ci różnych częś­ci mózgu pod­czas wykony­wa­nia przez badanych jakiegoś zada­nia. Hipotezy doty­czące funkcji takiej czy innej częś­ci mózgu testowano w ten sposób, że oper­a­cyjnie usuwano z mózgu małpy obszar, o którym sąd­zono, że ma jakieś znacze­nie dla poprawnego wyko­na­nia określonego zada­nia, a następ­nie – oczy­wiś­cie po okre­sie rekon­wales­cencji – mał­pa wykony­wała to zadanie. Jeśli wykony­wała je gorzej lub wcale w porów­na­niu do tych małp, których móz­gi nie zostały uszkod­zone, wów­czas uznawano, że usunię­ta część jest odpowiedzial­na za poprawne wyko­nanie tego zada­nia. W ten właśnie sposób Unger­lei­der i Mishkin ustalili, że jeżeli uszkodze­niu uległa skro­niowa część mózgu obe­j­mu­ją­ca oko­lice V4 i IT, wów­czas małpy miały poważne prob­le­my z praw­idłowym rozpoz­nawaniem znanych sobie przed­miotów, ale całkiem nieźle radz­iły sobie z zada­ni­a­mi wyma­ga­ją­cy­mi od nich lokaliza­cji przed­miotów w przestrzeni. Z kolei małpy z uszkodze­niem płatów ciemieniowych, zwłaszcza w okoli­cach kory V5/MT, nie potrafiły wyko­rzysty­wać wskazówek przestrzen­nych, nato­mi­ast bez trudu rozpoz­nawały znane przed­mio­ty (Mishkin, Unger­lei­der i Macko, 1983; Unger­lei­der, 1985).

Wyni­ki swoich badań Unger­lei­der i Mishkin (1982) zawar­li w kon­cepcji, zgod­nie z którą dane docier­a­jące do kory V2 z cen­tral­nych częś­ci siatkówek oczu za pośred­nictwem ścieżek drob­no- i pyłkokomórkowej są przekazy­wane w kierunku pła­ta skro­niowego i stanow­ią pod­stawę iden­ty­fikacji i rozpoz­nawa­nia przed­miotów w sce­nie wiz­ual­nej. Z kolei dane płynące po szlaku wielkokomórkowym (czyli z peryfer­yjnych częś­ci siatkówek oczu) są przekazy­wane w kierunku pła­ta ciemieniowego i stanow­ią pod­stawę lokaliza­cji przed­miotów w tej scenie.

Pier­wsza dro­ga została umown­ie nazwana drogą typu „co”, ponieważ akty­wiz­a­c­ja struk­tur mózgu, które zna­j­du­ją się wzdłuż tego szlaku pozwala na rozpoz­nanie przed­mio­tu, a w szczegól­noś­ci jego ksz­tał­tu i bar­wy, czyli prowadzi do odpowiedzi na pytanie: „co to jest?”. Z kolei dru­ga dro­ga została nazwana drogą typu „gdzie”, ponieważ tworzące ją struk­tu­ry mózgu są akty­wne wów­czas, gdy zadanie poz­naw­cze wyma­ga ori­en­tacji przestrzen­nej w odniesie­niu do przed­miotów zna­j­du­ją­cych się w sce­nie wiz­ual­nej, czyli prowadzi do odpowiedzi na pytanie: „gdzie się to coś znajduje?”.

Dziesięć lat później, Melvyn A. Goodale i A. David Mil­ner (1992) zapro­ponowali alter­naty­wną kon­cepcję funkcji obu szlaków wzrokowych. Zasad­nic­zo nie zak­wes­t­ionowali oni poglą­du, zgod­nie z którym szlak brzuszny „zaj­mu­je się” taki­mi włas­noś­ci­a­mi sce­ny wiz­ual­nej, jak ksz­tałt i bar­wa przed­miotów zna­j­du­ją­cych się w sce­nie. Według nich struk­tu­ry mózgu akty­wne na szlaku brzusznym rzeczy­wiś­cie stanow­ią pod­stawę rozpoz­nawa­nia przed­miotów spostrze­ganych w sce­nie wiz­ual­nej na pod­staw­ie zare­je­strowanych danych sen­so­rycznych doty­czą­cych rozkładu jas­noś­ci i barw, w tym również tak złożonych obiek­tów, jak np. twarz ludzka.

Najważniejsza mody­fikac­ja kon­cepcji Unger­lei­der i Mishk­i­na doty­czyła nato­mi­ast funkcji szlaku grz­bi­etowego. Zdaniem Goodale’a i Mil­nera, akty­wiz­a­c­ja struk­tur mózgu tworzą­cych ten szlak pozwala obser­wa­torowi nie tyle ori­en­tować się w przestrzeni i rozkładzie widzianych przed­miotów w sce­nie, ale przede wszys­tkim pozwala mu kon­trolować własne dzi­ała­nia pode­j­mowane w tej przestrzeni.

Do takiego wniosku dos­zli oni obser­wu­jąc zachowanie pac­jen­t­ki, znanej pod inic­jała­mi D.F., która cier­pi­ała na tzw. agnozję wzrokową, czyli niez­dol­ność do rozpoz­nawa­nia widzianych przed­miotów. Źródłem jej prob­lemów były rozległe uszkodzenia struk­tur mózgu w obrę­bie szlaku brzusznego. Najbardziej zdu­miewa­jące było to, że cho­ci­aż D.F. miała znaczne trud­noś­ci w rozpoz­nawa­niu przed­miotów, to potrafiła się nim całkiem nieźle posługi­wać, wykonu­jąc pre­cyzyjne zada­nia moto­ryczne i ruchowe. Za real­iza­cję tych zadań jest bowiem odpowiedzial­ny szlak grz­bi­etowy, który u tej pac­jen­t­ki nie był uszkod­zony. Szczegółowy opis przy­pad­ku pac­jen­t­ki D.F. oraz wykład swo­jej kon­cepcji szlaków wzrokowych Mil­ner i Goodale przed­staw­ili w książce wydanej w 1995 roku (pol­skie tłu­macze­nie zostało opub­likowane w 2008 roku na pod­staw­ie II wyda­nia ang­iel­sko­języ­cznego z roku 2006).

Pod­sumowu­jąc, w uję­ciu Unger­lei­der i Mishk­i­na, szlak grz­bi­etowy pozwala obser­wa­torowi poz­naw­c­zo uch­wycić lokaliza­cję i relac­je przestrzenne między przed­mio­ta­mi w sce­nie wiz­ual­nej. Ów obser­wa­tor przy­pom­i­na widza oglą­da­jącego film 3D w kinie, w którym przestrzeń przed­staw­ia mu się w całej złożonoś­ci, a on na bieżą­co ujmu­je związ­ki między widziany­mi obiek­ta­mi. Z kolei, zgod­nie z sug­estią Goodale’a i Mil­nera, wzrokowa ori­en­tac­ja w przestrzeni możli­wa dzię­ki akty­wnoś­ci struk­tur móz­gowych leżą­cych na szlaku grz­bi­etowym jest tylko punk­tem wyjś­cia do kon­troli włas­nego dzi­ała­nia pode­j­mowanego w tej przestrzeni. Tak rozu­mi­ana funkc­ja szlaku grz­bi­etowego, z biernego obser­wa­to­ra sce­ny wiz­ual­nej, wobec której zaj­mu­je on pozy­cję zewnętrzną (np. kino­mana), czyni zeń akto­ra, zna­j­du­jącego się wewnątrz oglą­danej sce­ny (np. alpin­istę). Co więcej, w oglą­danej przestrzeni ów aktor zaj­mu­je pozy­cję cen­tral­ną (ego­cen­tryczną), a wszys­tkie relac­je między oglą­dany­mi rzecza­mi są relaty­wiz­owane do zaj­mowanego przezeń miejs­ca w tej przestrzeni oraz do zadań moto­rycznych, jakie ma on do wykonania.

Integracja danych z obu szlaków wzrokowych

Było­by dzi­wne, gdy­by dwa omówione szla­ki wzrokowe dzi­ałały w całkowitej izo­lacji od siebie. Doświad­czenia z pac­jen­tką D.F. pokaza­ły, że uszkodzenia szlaku brzusznego, skutku­jące niez­dol­noś­cią do rozpoz­nawa­nia przed­miotów za pomocą wzroku, nie zaburza­ją zdol­noś­ci do manip­u­lacji tymi przed­mio­ta­mi. Tym niem­niej coraz więcej danych wskazu­je również na to, że oby­d­wa szla­ki są ze sobą sko­mu­nikowane, a wyni­ki ich akty­wnoś­ci inte­growane, tworząc subiek­ty­wne doświad­cze­nie wieloaspek­towego kon­tak­tu z obiektem.

Mark R. Pen­nick i Rajesh K. Kana (2011) poprosili oso­by badane, żeby wykony­wały dwa rodza­je zadań. Jed­no pole­gało na rozpoz­nawa­niu i nazy­wa­niu prezen­towanych przed­miotów, a drugie na określa­niu ich położe­nia. Pod­czas wykony­wa­nia zadań reje­strowano akty­wność ich mózgów za pomocą funkcjon­al­nego rezo­nan­su mag­ne­ty­cznego (fMRI). Zgod­nie z oczeki­waniem okaza­ło się, że pod­czas wykony­wa­nia zadań rozpoz­nawa­nia szczegól­nie akty­wne były struk­tu­ry leżące wzdłuż szlaku brzusznego, a pod­czas wykony­wa­nia zadań na lokaliza­cję – wzdłuż szlaku grz­bi­etowego. Badaczy intere­sowało jed­nak to, czy są takie struk­tu­ry mózgu, które są akty­wne nieza­leżnie od tego, które zadanie było wykony­wane. Okaza­ło się, że jest kil­ka takich struk­tur, które najpraw­dopodob­niej inte­gru­ją dane pochodzące z obu szlaków wzrokowych. Są one zlokali­zowane zwłaszcza w pła­cie czołowym, takie jak lewy zakręt czołowy środ­kowy (left mid­dle frontal gyrus, LMFG) i lewy zakręt przedśrod­kowy (left pre­cen­tral gyrus, LPRCN), a także w pła­cie ciemieniowym: prawy płacik ciemieniowy górny (right supe­ri­or pari­etal lob­ule, RSPL) i leżą­ca tuż pod nim bruz­da śród­ciemieniowa (intra­pari­etal sul­cus; IPS (ryc. 37).

Wszys­tkie te struk­tu­ry tworzą rodzaj sieci asoc­ja­cyjnej, zbier­a­jącej dane z różnych źródeł a następ­nie kom­pilu­jącej je do takiej postaci, którą odczuwamy, już nie tylko jako doświad­cze­nie widzenia, ale także jako doświad­cze­nie ist­nienia rzeczy w świecie, w którym żyje­my. Wyni­ki badań Pen­nick i Kana potwierdza­ją wcześniejsze doniesienia doty­czące funkcji wymienionych struk­tur mózgu (Buchel, Coull i Fris­ton, 1999; Clayes, Dupont, Cor­nette, Sunaert i in., 2004; Jung i Haier, 2007; Schenk i Mil­ner, 2006).

SYSTEM KADROWANIA SCENY WIZUALNEJ

Kadr, czyli zakres pola widzenia

Wiemy już z grub­sza, w jaki sposób jest zbu­dowany siatkówkowy ekran, na którym światło wpada­jące do oka odzwier­cied­la scenę wiz­ual­ną. Wiemy również trochę na tem­at układu opty­cznego oka. Warto zatem uzmysłow­ić sobie, jaki jest ksz­tałt i wielkość pola widzenia, czyli – przy­wołu­jąc znowu metaforę aparatu fotograficznego – jaki jest rozmi­ar poje­dynczego kadru, ogranic­zonego rama­mi naświ­et­lanego pola.

W fotografii mówi się o kącie widzenia obiek­ty­wu (field of view; FOV), co oznacza kąt między najbardziej odd­alony­mi od siebie punk­ta­mi świ­etl­ny­mi w płaszczyźnie hory­zon­tal­nej lub wer­tykalnej na matrycy światłoczułej, zare­je­strowany­mi za pomocą obiek­ty­wu o określonej ogniskowej. I tak, np. kąt widzenia obiek­ty­wu o ogniskowej 50 mm rejestru­je obraz na matrycy lub klatce fil­mowej o wymi­arach 24 x 36 mm w zakre­sie 40° w płaszczyźnie hory­zon­tal­nej i 27° w płaszczyźnie wertykalnej.

Kon­cepc­ja pola widzenia (field of vision) za pomocą oczu jest ana­log­icz­na do poję­cia kąta widzenia obiek­ty­wu. Pole widzenia oznacza obszar reje­strowany przez nieru­chome oko w unieru­chomionej głowie. W płaszczyźnie hory­zon­tal­nej wynosi on 150–160° (60–70° w częś­ci przynosowej i ok. 90° w częś­ci skro­niowej), a w płaszczyźnie wer­tykalnej ok. 130° (50–60° powyżej osi widzenia i 70–80° poniżej osi widzenia) (ryc. 39).

Ryci­na 39. Zakres pola widzenia w płaszczyźnie wer­tykalnej i hory­zon­tal­nej. Opra­cow­anie graficzne P.A.

Zakres pola widzenia oka jest znacznie mniej reg­u­larny niż pros­tokąt­ny ksz­tałt matrycy fotograficznej. Różnicę w zakre­sie ksz­tał­tu i wielkoś­ci obu pól widzenia (oka i aparatu fotograficznego) ilus­tru­je ryc. 40. Przed­staw­ia ona schematy­cznie ksz­tałt siatków­ki prawego oka, która jest rzu­towana na powierzch­nię kuli, z zaz­nac­zonym zakre­sem pola widzenia oso­by pod­danej bada­niu perym­e­tryczne­mu. Celem takiego bada­ni­a­jest wyz­nacze­nie obry­su pola widzenia nieru­chomego oka we wszys­t­kich możli­wych kierunkach.

Na cen­tral­ną część siatków­ki oka nan­iosłem zarys małoo­brazkowego kadru o wymi­arach 24 mm x 36 mm, naświ­et­lanego w apara­cie fotograficznym z obiek­ty­wem o ogniskowej 50 mm (zaz­nac­zony na pomarańc­zowo). Pokry­wa on niewielką część całego pola widzenia. Jak pamię­tamy w odległoś­ci ok. 20° pola widzenia od doł­ka cen­tral­nego w każdym kierunku licz­ba czop­ków na siatków­ce radykalnie się zmniejsza. Oznacza to, że 50-mil­i­metrowy obiek­tyw znakomi­cie pokry­wa tę część pola widzenia, która charak­teryzu­je się najwięk­szą rozdziel­czoś­cią i najwyższą wrażli­woś­cią na różni­cow­anie dłu­goś­ci fali elek­tro­mag­ne­ty­cznej w zakre­sie światła widzial­nego. Z tego wzglę­du obiek­tyw o takiej ogniskowej nazy­wany jest standardowym.

Ryci­na 40. Zakres pola widzenia prawego oka (wynik bada­nia perym­e­trycznego) z nanie­sionym małoo­brazkowym kadrem wyz­nac­zonym przez kąt widzenia obiek­ty­wu o ogniskowej f = 50 mm. Opra­cow­anie graficzne P.A. na pod­staw­ie NASA Vision Group

Ponieważ na ogół oglą­damy rzeczy za pomocą dwo­j­ga oczu (stere­oskopowo), zatem nie od rzeczy będzie dołącze­nie ilus­tracji zakre­su obuocznego pola widzenia (ryc. 41). W płaszczyźnie wer­tykalnej niewiele się zmienia, ale znacznie posz­erza się pole widzenia w płaszczyźnie hory­zon­tal­nej do, co najm­niej, 180°. Na ten wykres także nan­iosłem małoo­brazkowy kadr odpowiada­ją­cy zakre­sowi widzenia obiek­ty­wu 50-milimetrowego (zaz­nac­zony na czer­wono), jak również sze­rokokąt­nego obiek­ty­wu o ogniskowej 13 mm, który pozwala na fotografowanie dużych obiek­tów z małych odległoś­ci (zaz­nac­zony na zielono). Dopiero sze­rokokąt­ny obiek­tyw o tak niewielkiej ogniskowej pokry­wa więk­szą część pola widzenia człowieka, który oglą­da scenę za pomocą dwo­j­ga oczu.

Ryci­na 41. Zakres stere­oskopowego pola widzenia (biały) z nanie­siony­mi kadra­mi wyz­nac­zonym przez kąt widzenia obiek­ty­wu o ogniskowej f = 50 mm (czer­wony) i f = 13 mm (zielony). Pola szare oznacza­ją obszary widzenia tylko za pomocą jed­nego oka. Opra­cow­anie graficzne P.A. na pod­staw­ie NASA Vision Group

Pod­sumowu­jąc, zakres pola widzenia oczu jest całkiem spory, ale fak­ty­cznie – jak już niebawem się przekon­amy – nie przekła­da się to widze­nie sce­ny równie wyraz­iś­cie w każdym punkcie tego pola. Prze­ci­wnie, tylko niewiel­ki obszar zna­j­du­ją­cy się w okol­i­cy doł­ka cen­tral­nego siatków­ki dostar­cza do kory mózgu pre­cyzyjnych danych o oglą­danych rzeczach. Pozostała (tzw. peryfer­ycz­na) część pola widzenia pozwala zaled­wie ori­en­tować się, co do obec­noś­ci niezbyt ostro widzianych rzeczy w sce­nie wiz­ual­nej, ale za to jest szczegól­nie wrażli­wa na ich ruch.

Zakres pola widzenia a wielkość obiektu w kadrze sceny wizualnej

Zakres pola widzenia mówi nam coś na tem­at ksz­tał­tu i wyrażonej w jed­nos­tkach kątowych wielkoś­ci wykadrowanej sce­ny wiz­ual­nej, na której przez ułamek sekundy fik­su­je­my wzrok. Korzys­ta­jąc z opisu pola widzenia za pomocą jed­nos­tek kątowych warto zatrzy­mać się i pobaw­ić w prostą aryt­metykę. Poz­woli ona uświadomić sobie, w jaki sposób mózg sza­cu­je odległoś­ci lub wielkoś­ci widzianych rzeczy w sce­nie. O wszys­t­kich tych infor­ma­c­jach decy­du­ją trzy para­me­try: (1) rzeczy­wista wielkość (size; S) oglą­danego obiek­tu (rozu­mi­ana jako jego wysokość lub sze­rokość), wyrażona w milime­tra­ch, cen­tymetra­ch lub metra­ch, (2) kąt (angle; A) pola widzenia, wyrażony w stop­ni­ach i (3) odległość (dis­tance; D) obiek­tu od soczew­ki oka, wyrażona w milime­tra­ch, cen­tymetra­ch lub metra­ch (ryc. 42). Ponieważ wielkość siatków­ki w oku jest stała, a soczewka automaty­cznie dopa­sowu­je ogniskową do tego obiek­tu, który zna­j­du­je się na prze­cię­ciu osi widzenia, dlat­ego oba te wskaźni­ki mogą być pominięte w usta­la­niu poszczegól­nych para­metrów rzeczy zna­j­du­ją­cych się w kadrze sce­ny wizualnej.

Ryci­na 42. Para­me­try, za pomocą których moż­na opisać zakres pola widzenia. Opra­cow­anie graficzne P.A.

Zna­jąc rzeczy­wistą wielkość obiek­tu w jed­nos­tkach metrycznych oraz jego odległość od oczu obser­wa­to­ra, bez trudu moż­na wyz­naczyć jego wielkość kątową wg następu­jącego wzoru:

Jeżeli znamy wielkość kątową obiek­tu i jego odległość od oczu obser­wa­to­ra, może­my z kolei obliczyć jego wielkość rzeczywistą:

Może­my również wyliczyć, w jakiej odległoś­ci od oczu obser­wa­to­ra zna­j­du­je się obiekt, zna­jąc jego wielkość rzeczy­wistą i kątową:

Zas­to­su­jmy te wzo­ry w odniesie­niu do sytu­acji oglą­da­nia, np. obrazu w muzeum. Przy­puśćmy, że z odległoś­ci 200 cm ktoś oglą­da obraz o wymi­arach 61 cm (wysokość) x 43 cm (sze­rokość). Na pod­staw­ie wzorów może­my obliczyć, że jego wysokość i sze­rokość kątowa wynoszą, odpowiednio:

oraz

Na pod­staw­ie bada­nia perym­e­trycznego wiado­mo, że śred­ni zakres pola widzenia człowieka w płaszczyźnie wer­tykalnej wynosi ok. 130°, a to oznacza, że cały obraz o wysokoś­ci kątowej nieco pon­ad 17° zna­j­du­je się w polu widzenia obser­wa­to­ra. Nieste­ty, byna­jm­niej nie znaczy to, że w całoś­ci jest on równie ostro widziany.

Jak zostało to już wcześniej zasyg­nal­i­zowane, ze wzglę­du na budowę siatków­ki oko człowieka maksy­mal­nie wyraźnie rejestru­je tylko do ok. 5° powierzch­ni sce­ny wiz­ual­nej, to okazu­je się, że z odległoś­ci 200 cm pen­etru­je ono powierzch­nię obrazu w ksz­tał­cie zbliżonym do koła o śred­ni­cy ok. 17,5 cm (dla 5° kąta pola widzenia):

Jeżeli pod­staw­imy oblic­zoną śred­nicę do wzoru na powierzch­nię koła, czyli:

gdzie π jest stałą i wynosi ok. 3,14, a r to promień tego koła, czyli połowa jego śred­ni­cy, to okaże się, że z odległoś­ci 2 metrów ostro widz­imy powierzch­nię ok. 240 cm2

Na pier­wszy rzut oka wyda­je się to całkiem sporo, ale kiedy porów­namy tę powierzch­nię z powierzch­nia całego obrazu, która wynosi pon­ad 2600 cm2

gdzie h to wysokość a w to sze­rokość pros­tokąt­nego obrazu, to okaże się, że pole widzenia o wielkoś­ci ok. 240 cm2 pokry­wa tylko niespeł­na 10% powierzch­ni całego obrazu. Wyni­ka to z następu­jącego stosunku:

czyli

Wypa­da dodać, że mózg „korzys­ta” z przy­toc­zonych wzorów do różnych celów, np. do oce­ny odległoś­ci w głąb między dwo­jgiem ludzi. Jeśli „wie”, że mają oni podob­ny wzrost (np. 180 cm), ale wielkość kątowa jed­nego wynosi, np. 21°, a drugiego 12°, to łat­wo może dojść do wniosku, że pier­wszy zna­j­du­je się w odległoś­ci niespeł­na 5 m od oczu obserwatora:

a dru­gi w odległoś­ci pon­ad 8,5 m od niego:

Do zagad­nień związanych z wynikiem bada­nia perym­e­trycznego i wzorów, za pomocą których moż­na obliczyć zakres pola widzenia lub odległość obiek­tu od obser­wa­to­ra jeszcze wrócimy przy okazji omaw­ia­nia prob­lematy­ki widze­niem kształtów.

Widzenie holistyczne czy sekwencyjne?

Do tej pory pisałem o widze­niu obrazu w taki sposób, jak­by był on nam dany w całoś­ci, w jed­nym rzu­cie oka. Takie jest nasze subiek­ty­wne doświad­cze­nie. Na ogół potrze­bu­je­my chwili by zori­en­tować się, jakie obiek­ty zna­j­du­ją się w sce­nie wiz­ual­nej i co ona przed­staw­ia. Mamy wraże­nie, że obrazy „chwytamy” momen­tal­nie. Ale właśnie to subiek­ty­wne doświad­cze­nie widzenia przysła­nia nam prawdę na tem­at sek­wen­cyjnoś­ci i niekom­plet­noś­ci danych, które stanow­ią jego pod­stawę. Oglą­danie jest bowiem pro­ce­sem real­i­zowanym w cza­sie i między inny­mi dlat­ego, że jest to czas bard­zo krót­ki, mamy wraże­nie, że obraz wyła­nia się przed naszy­mi oczy­ma w jed­nej chwili.

Naw­iasem mówiąc, momen­tal­ność całoś­ciowego uję­cia obrazu wiąże się także z jed­nym z najbardziej tajem­niczych zjawisk umysłowych, czyli wyobraźnią (imagery). Służy ona, m.in. do przy­pom­i­na­nia sobie w całoś­ci uprzed­nio widzianych scen pod wpły­wem chwilowego pobudzenia fotore­cep­torów. Jest to mech­a­nizm oper­owa­nia zasoba­mi pamię­ci wzrokowej. Cza­sem rzeczy­wiś­cie wystar­czy jeden rzut oka, żeby pobudz­ić wyobraźnię do zrekon­struowa­nia całej sce­ny wiz­ual­nej i doświad­czenia jej jako widze­nie (Fran­cuz, 2007a; 2007b; 2010a; 2010b). Wyobraź­nia odgry­wa także nieba­gatel­ną rolę w proce­sach kat­e­go­ryza­cji per­cep­cyjnej, leżącej u podłoża for­mowa­nia się pojęć (Barsa­lou, 1999; Fran­cuz, 2011).

Na doświad­cze­nie widzenia składa­ją się zatem dwa współdzi­ała­jące ze sobą mech­a­nizmy. Jeden z nich już z grub­sza poz­nal­iśmy. Jest to omówiony w poprzed­nim rozdziale mech­a­nizm anal­izy zawartoś­ci sce­ny wiz­ual­nej. Jego zadaniem jest reje­strowanie rozkładu światła odbitego od rzeczy zna­j­du­ją­cych się w tej sce­nie lub emi­towanego przez nie i przekazanie tych danych do kory mózgu. Jest to odd­ol­ny mech­a­nizm widzenia (bot­tom-up). Dru­gi mech­a­nizm opiera się na danych doty­czą­cych wyglądów świa­ta, które zostały wcześniej zare­je­strowane w różnych struk­tu­rach mózgu. To pamięć wizual­na (visu­al mem­o­ry), która pod­suwa możli­we inter­pre­tac­je dla aktu­al­nie docier­a­ją­cych do mózgu danych drogą odd­ol­ną. Musimy jed­nak pamię­tać o tym, że znacznie mniej wiemy na tem­at tych odgórnych mech­a­nizmów widze­nia (top-down), niż na tem­at mech­a­nizmów oddolnych.

Myślę, że dopiero jesteśmy na samym początku dro­gi, która poz­woli odpowiedzieć na pytanie, w jaki sposób prze­chowywane są dane w pamię­ci wiz­ual­nej i w jaki sposób są one wyko­rzysty­wane do budowa­nia doświad­czenia widzenia. W każdym razie, na obec­nym poziomie wiedzy o per­cepcji wzrokowej może­my powiedzieć tylko tyle, że to co subiek­ty­wnie odczuwamy jako widze­nie kom­plet­nych obrazów (scen lub obiek­tów) jest raczej wyt­worem umysłu obser­wa­to­ra, niż rejes­tracją rzeczy­wis­toś­ci dostęp­nej za pomocą oczu. Zwracałem już kil­ka razy na to uwagę i jeszcze będę to nier­az pod­kreślał. Widziana sce­na jest efek­tem złoże­nia ze sobą dwóch rodza­jów danych. Jedne pochodzą z rejes­tracji rozkładu oświ­etle­nia jej frag­men­tów ogranic­zonych zakre­sem pola widzenia i drugie, zapisane w pamię­ci wspom­nień wiz­ual­nych, które wypeł­ni­a­ją braku­jące częś­ci układan­ki za pomocą mech­a­niz­mu wyobraże­niowego. Pro­gramy wzrokowe dzi­ała­ją tak szy­bko, że nie dostrzegamy kole­jnych faz pow­stawa­nia obrazu-układan­ki, tylko mamy wraże­nie, że widz­imy go od razu w całoś­ci. Podob­nie jest z oglą­daniem fil­mu w kinie. Na ekranie widz­imy płyn­ny ruch a prze­cież tak naprawdę w ciągu każdej sekundy oglą­damy tylko 24 nieru­chome zdję­cia. Czyn­nikiem decy­du­ją­cym o efek­cie jest bard­zo krót­ki czas ich ekspozycji.

Dlaczego poruszamy oczami?

Obser­wowal­nym prze­jawem sek­wen­cyjnoś­ci pro­ce­su widzenia jest ruch gałek ocznych. Żeby dobrze zrozu­mieć, jaką rolę odgry­wa on pod­czas oglą­da­nia sce­ny wiz­ual­nej, musimy najpierw odpowiedzieć na dwa fun­da­men­talne pyta­nia: dlaczego oczy się w ogóle porusza­ją i jak się poruszają.

Zakres wysoko­rozdziel­czego pola widzenia za pomocą recep­torów sku­pi­onych w cen­tral­nej częś­ci siatków­ki oka jest niewiel­ki. Przy­pom­nę, że obe­j­mu­je on nie więcej niż 5° kąta pola widzenia, co odpowia­da ok. 3% powierzch­ni ekranu 21 calowego mon­i­to­ra oglą­danego z odległoś­ci 60 cm. W sto­sunku do całej powierzch­ni ekranu to doprawdy niewiele. Żeby zobaczyć, co się zna­j­du­je w innych, 3‑procentowych frag­men­tach powierzch­ni musimy po pros­tu skierować na nie wzrok, zmieni­a­jąc położe­nie oczu.

Gdy­by oczy były na szty­wno zamon­towane w cza­szce, wów­czas bylibyśmy zmuszeni nieustan­nie poruszać głową, a to pochła­ni­ało­by niepro­por­cjon­al­nie więcej energii, niż poruszanie oczy­ma. Było­by to zatem nieadap­ta­cyjne, a ewoluc­ja raczej nie wzmac­nia takich zachowań. Pod­sumowu­jąc, porusza­my oczy­ma, m.in. dlat­ego, że zakres pola widzenia jest ogranic­zony a zmieni­a­jąc ich położe­nie jesteśmy w stanie obe­jrzeć poszczególne frag­men­ty sce­ny by z nich złożyć cały obraz. Sens poprzed­niego zda­nia ma bard­zo daleko idące kon­sek­wenc­je, doty­czące rozu­mienia, w jaki sposób gro­madz­imy dane doty­czące oglą­danej sceny.

Skanowanie różnych frag­men­tów sce­ny wiz­ual­nej nie jest jedynym powo­dem ruchu oczu. Innym może być, np. śledze­nie porusza­jącego się obiek­tu bez zmi­any położe­nia głowy lub utrzymy­wanie wzroku na sta­bil­nym obiek­cie, wtedy, gdy obser­wa­tor się porusza. Krótko mówiąc, ist­nieje wiele rodza­jów ruchów oczu, a wszys­tkie one pełnią ściśle określone funkc­je w pro­ce­sie opty­mal­nego kadrowa­nia sce­ny wiz­ual­nej. Zan­im jed­nak opiszę różne rodza­je ruchów oczu warto dokład­niej przyjrzeć się ich neuro-mechanice.

Neuro-mechanika ruchliwego oka

Oko jest osad­zone w oczodole wyś­cielonym kilku­milimetrową warst­wą tkan­ki tłuszc­zowej. Ponieważ więk­sza część zewnętrznej powło­ki gał­ki ocznej, czyli twardówka jest gład­ka, dlat­ego oko bez najm­niejszych oporów może poruszać się w oczodole, niczym kul­ka w dobrze nas­marowanym łożysku. Gał­ka ocz­na jest oczy­wiś­cie mniejsza niż otwór oczodołu i mogła­by łat­wo zeń wypaść, gdy­by nie mięśnie trzy­ma­jące ją od wewnętrznej strony cza­sz­ki. Ich rola nie sprowadza się jed­nak byna­jm­niej tylko do prze­ci­wdzi­ała­nia wypada­niu oka z oczodołu, ale pełnią one znacznie ważniejsze funkc­je. Podob­nie, jak mięśnie przy­czepi­one do koś­ci ręki czy nogi umożli­wia­ją ich ruch, również mięśnie przy­czepi­one do gał­ki ocznej stanow­ią mechan­iczną pod­stawę zmi­any jej położenia.

W ruchach każdego oka uczest­niczą po trzy pary antag­o­nisty­cznych mięśni, przy­czepi­onych do tyl­nej, zewnętrznej powierzch­ni każdego z nich. Mięśnie proste boczne, skro­niowy (lat­er­al rec­tus) i przyśrod­kowy (medi­al rec­tus) pozwala­ją na ruch oka w pra­wo lub w lewo, mięśnie proste, górny (supe­ri­or rec­tus) i dol­ny (infe­ri­or rec­tus) porusza­ją okiem do góry lub w dół, a mięśnie skośne, także górny (supe­ri­or obliqe) i dol­ny (infe­ri­or obliqe), pozwala­ją na ruch rota­cyjny gał­ki ocznej, dzię­ki czemu możli­we jest skierowanie oczu w miejs­ca leżące między płaszczyzną hory­zon­tal­ną i wer­tykalną, np. w prawy górny lub lewy dol­ny róg obrazu (ryc. 43). Naw­iasem mówiąc oczy mogą także cofać się w głąb cza­sz­ki. Wykonu­ją wów­czas tzw. ruch retrak­cyjny, będą­cy wynikiem skur­czenia się wszys­t­kich mięśni jed­nocześnie, np. w sytu­acji przewidy­wanego uderzenia w twarz. Mięśnie porusza­jące gałką oczną charak­teryzu­ją się tym, że kur­czą się najszy­b­ciej spośród wszys­t­kich mięśni porusza­ją­cych ciałem człowieka (Matthews, 2000).

Ryci­na 43. Trzy pary antag­o­nisty­cznych mięśni, porusza­ją­cych gałką oczną (lewą): (a) prosty górny i (b) dol­ny, umożli­wia­jące ruch oka w płaszczyźnie wer­tykalnej, © prosty boczny skro­niowy i (d) przyśrod­kowy (od strony nosa), umożli­wia­jące ruch oka w płaszczyźnie hory­zon­tal­nej oraz (e) skośny górny i (f) skośny dol­ny, umożli­wia­jące ruch rota­cyjny oka i widze­nie w płaszczyz­nach ukośnych. Opra­cow­anie graficzne P.A.

Ze wzglę­du na budowę anatomiczną oka i cza­sz­ki, sposób osadzenia gał­ki ocznej w oczodole oraz charak­terystykę wymienionych par mięśni zewnątrz­gałkowych, zakres ruchów oka jest ogranic­zony do ok. 90° (maksy­mal­nie do 100°) w płaszczyźnie hory­zon­tal­nej oraz ok. 80° (maksy­mal­nie do 125°) w płaszczyźnie wertykalnej.

Warto przy tej okazji zwró­cić uwagę na to, że cho­ci­aż zakres ruchów gałek ocznych w oczodołach jest całkiem spory, to w prak­tyce na ogół nie przekracza on 30° w każdej płaszczyźnie. Wyni­ka to z ruch­li­woś­ci głowy. Patrząc, np. w górę rzad­ko nap­inamy mięsień prosty dol­ny do granic wytrzy­małoś­ci, tylko raczej przechylimy głowę nieco w tył i w ten sposób bez wysiłku skupimy wzrok na intere­su­ją­cym obiek­cie, jed­nocześnie utrzy­mu­jąc oczy w bardziej nat­u­ral­nym położe­niu w oczodole. Jeśli chcielibyśmy nato­mi­ast spo­jrzeć, np. w lewo bez poruszenia głową, wów­czas oś widzenia prawego oka przetnie nos i obraz pochodzą­cy z tego oka będzie ogranic­zony. Dlat­ego korzyst­niej jest dopomóc sobie lekkim skrętem głowy w właśnie w lewo.

I na koniec kil­ka zdań doty­czą­cych połączeń między mięś­ni­a­mi zewnątrz­gałkowy­mi a najbliższy­mi struk­tu­ra­mi mózgu, z których pochodzą syg­nały wpły­wa­jące na ich pracę. Pary mięśni przy­czepi­onych do gałek ocznych reagu­ją gwał­townym skur­czem lub rozluźnie­niem pod wpły­wem impul­sów ner­wowych płyną­cych wzdłuż ner­wów cza­szkowych (cra­nial nerves) z komórek ner­wowych (tzw. motoneu­ronów), zlokali­zowanych w rdze­niu krę­gowym. Mięśnie proste (oprócz bocznego skro­niowego) oraz skośny dol­ny są akty­wiz­owane przez impul­sy płynące wzdłuż aksonów komórek zlokali­zowanych w jądrze dodatkowym ner­wu oko­ru­chowego (Edinger–Westphal nucle­us), za pośred­nictwem III ner­wu czasz­ko­we­go, zwanego oko­ru­chowym (ocu­lo­mo­tor nerve) (ryc. 44). Mięsień skośny górny jest kon­trolowany przez jądro ner­wu bloczkowego (nucle­us nervi trochlearis) za pośred­nictwem IV (blocz­ko­wego) ner­wu cza­szkowego nato­mi­ast mięsień prosty boczny jest połąc­zony z jądrem ner­wu odwodzącego (abducens nucle­us) za pośred­nictwem VI (odwodzą­cego) ner­wu czasz­kowego. Na razie niech wystar­czy ustal­e­nie skąd pochodzą syg­nały akty­wiz­u­jące mięśnie zewnątrz­gałkowe, ale niebawem dowiemy się skąd płyną syg­nały pobudza­jące z kolei wszys­tkie trzy wymienione jądra ner­wowe. To właśnie ich akty­wiz­a­c­ja przekła­da się na określony ruch gał­ki ocznej.

Ryci­na 44. Połączenia między jądra­mi motoneu­ronów zlokali­zowanych w rdze­niu krę­gowym a mięś­ni­a­mi zewnątrz­gałkowy­mi prosty­mi (oprócz bocznego skro­niowego) oraz mięśniem skośnym dol­nym. Opra­cow­anie graficzne P.A. na pod­staw­ie Kan­del, Schwartz i Jes­sell (2000)

Ogól­na klasy­fikac­ja ruchów oczu

Mamy już ogólne poję­cie ruchu oka. Czas przyjrzeć się nieco dokład­niej różnym rodza­jom ruchów gałek ocznych, zarówno w kon­tekś­cie ich funkcjon­al­noś­ci, jak i zarządza­ją­cych nimi neu­ro­bi­o­log­icznych mech­a­nizmów. Typolo­gia ruchów oczu jest dość boga­ta, cho­ci­aż niek­tóre są ważniejsze, a inne nieco mniej ważne z punk­tu widzenia prob­lematy­ki, pode­j­mowanej w niniejszej książce. Omówię je, poczy­na­jąc od tych, których znacze­nie dla widzenia obrazu jest nieco mniejsze, a kończąc na tych, które stanow­ią trzon mech­a­niz­mu kadrowa­nia sce­ny wiz­ual­nej. W grun­cie rzeczy nadrzęd­nym celem wszys­t­kich typów ruchów gałek ocznych jest podtrzymy­wanie najwyższej jakoś­ci widzenia w różnych warunk­ach oglą­da­nia sce­ny wizualnej.

Pier­wsza gru­pa ruchów oczu jest związana z pozornym bezruchem gał­ki ocznej, czyli tym momentem, w którym oko na chwilę fik­su­je się na jakimś frag­men­cie obrazu. To zaskaku­jące, ale nawet wtedy oczy wykonu­ją co najm­niej trzy drob­ne i całkiem odmi­enne ze wzglę­du na tra­jek­torię mikro­ru­chy, czyli ruchy fik­sacyjne: mikrosakady, mikrodryftmikro­drże­nia. Najkrócej mówiąc, prze­ci­wdzi­ała­ją one adap­tacji fotore­cep­torów do tego samego oświ­etle­nia pod­czas fik­sacji oka.

Drugą grupę ruchów oczu stanow­ią odruchy, czyli ruchy mimowolne, których celem jest podtrzymy­wanie przez dłuższą chwilę spo­jrzenia na wybranym obiek­cie w sce­nie wiz­ual­nej w specy­ficznych warunk­ach oglą­da­nia. I tak, np. celem od­ruchu przed­sionkowo-ocznego jest utrzymy­wanie spo­jrzenia na danym obiek­cie wtedy, gdy porusza się głowa. Z taką sytu­acją mamy do czynienia codzi­en­nie tak częs­to, że w toku ewolucji wyt­worzył się w pełni zau­tomaty­zowany mech­a­nizm oko­ru­chowy. Pozwala on nam na utrzymy­wanie wzroku na intere­su­ją­cym nas obiek­cie pod­czas zmi­any położe­nia wzglę­dem niego.

Innym, w pełni zau­tomaty­zowanym ruchem gałek ocznych jest odruch optokine­ty­czny. Jego celem jest utrzymy­wanie spo­jrzenia na obiek­cie wtedy, gdy, albo ten obiekt się porusza bard­zo szy­bko wobec nieru­chomego obser­wa­to­ra, albo obser­wa­tor się przemieszcza bard­zo szy­bko wzglę­dem nieru­chomego obiek­tu. Wresz­cie trze­ci odruch oko­ru­chowy umożli­wia obser­wa­torowi utrzymy­wanie spo­jrzenia na obiek­cie, który się doń zbliża lub od niego odd­ala, albo do którego się zbliża, lub od którego się odd­ala obser­wa­tor. Są to tzw. odruchy wer­gen­cyjne, przy czym te, które towarzyszą zmniejsza­jące­mu się dys­tan­sowi między obiek­tem a obser­wa­torem nazy­wa­ją się kon­wer­gen­cyjne, a te, które towarzyszą zwięk­sza­niu się tego dys­tan­su, nazy­wa­ją się dyw­er­gen­cyjne.

Trze­cia gru­pa ruchów oczu jest szczegól­nie waż­na dla zrozu­mienia, czym jest widze­nie. Są to ruchy kadru­jące. Pier­wszy, z nich nazy­wa się sakadą lub inaczej ruchem skokowym i jego celem jest pre­cyzyjne pozy­cjonowanie osi widzenia obu gałek ocznych na najważniejszym, z jakiegoś powodu, frag­men­cie sce­ny wiz­ual­nej. Sakady – jak się niebawem przekon­amy – mogą być wykony­wane pod wpły­wem impul­sów mają­cych swo­je źródło w sce­nie wiz­ual­nej, czyli odd­ol­nie, jak również mogą być sterowane odgórnie, w więk­szym lub mniejszym stop­niu zgod­nie z wolą obser­wa­to­ra. Drugim ruchem w tej grupie jest tzw. ruch podąża­nia. Żeby zrozu­mieć jego istotę wystar­czy zwró­cić uwagę na to, w jaki sposób mężczyźni (no, może nie wszyscy) przyglą­da­ją się mija­jącej ich atrak­cyjnej dziew­czynie. Ich wzrok jest niemal przyk­le­jony do które­jś jej częś­ci ciała. Oczy porusza­ją się dokład­nie z tą sama szy­bkoś­cią, z jaką się ona porusza. To właśnie jest ruch podążania.

Wspól­ną cechą sakad i ruchów podąża­nia jest to, że w odróżnie­niu od wszys­t­kich pozostałych, w znacznie więk­szym stop­niu są sterowane dowol­nie. Ich celem jest takie wykadrowanie sce­ny wiz­ual­nej, aby pozyskać z niej jak najwięcej danych, które poz­wolą na skon­struowanie trafnej reprezen­tacji poz­naw­czej tej sceny.

Fiksacyjne ruchy oczu

Każ­da saka­da kończy się krótkotr­wałą fik­sacją, czyli zatrzy­maniem ruchu gałek ocznych na tym frag­men­cie sce­ny wiz­ual­nej, która aktu­al­nie zna­j­du­je się na linii wzroku. Zafik­sowane oko wyglą­da na zupełnie nieru­chome, ale fak­ty­cznie wykonu­je ono w tym cza­sie trzy rodza­je mimowol­nych ruchów fik­sacyjnych, zwanych mikro­drże­niem (ocu­lar microtremor), mikro­dryf­tem (ocu­lar drift) i mikrosakadą (microsac­cade).

Fik­sacyjne ruchy oczu są szy­bkie i krótkie, mają skom­p­likowaną i wydawać by się mogło, zupełnie chao­ty­czną tra­jek­torię. Pełnią one jed­nak bard­zo ważne funkc­je pod­czas widzenia. Przede wszys­tkim zapo­b­ie­ga­ją adap­tacji pobud­zonej już grupy fotore­cep­torów do dzi­ała­jącego na nie światła. Niez­nacznie zmieni­a­jąc położe­nie usta­bi­li­zowanego oka pod­czas fik­sacji powodu­ją, że w rejes­trację tego samego obrazu rzu­towanego na siatkówkę stale angażowane są nowe, niepobud­zone jeszcze fotore­cep­to­ry. Ruchy te pozwala­ją także na zebranie jeszcze więk­szej iloś­ci danych z wykadrowanego frag­men­tu sce­ny wiz­ual­nej, na którym oczy się fik­su­ją (Leigh i Zee, 2006; Mar­tinez-Conde, Mack­nik i Hubel, 2004). Wszys­tkie te trzy rodza­je ruchów zostały po raz pier­wszy zare­je­strowane, a ich szczegółowy opis opub­likowany przez Roy’a M. Pritchar­da w 1961 roku (ryc. 45).

Mikro­drże­nia, nazy­wane również tremorem lub oczo­pląsem fizjolo­gicznym (phys­i­o­log­i­cal nys­tag­mus), są stałą i całkowicie mimowol­ną akty­wnoś­cią gałek ocznych pod­czas fik­sacji. Mają one najm­niejszą ze wszys­t­kich mikroruchów ampli­tudę o dłu­goś­ci nie przekracza­jącej śred­ni­cy poje­dynczego czop­ka zna­j­du­jącego się w dołku cen­tral­nym (Mar­tinez-Conde, Mack­nik, Tron­coso i Hubel, 2009) oraz nieporówny­wal­nie więk­szą niż one częs­totli­wość, bowiem w grani­cach 70–100 Hz (Bloger., Bojan­ic., Shea­han, Coak­ley. i in., 1999). Tra­jek­to­ria mikro­drżeń jest inna w każdym oku.

Ryci­na 45. Zapis graficzny trzech rodza­jów ruchów gał­ki ocznej, zare­je­strowany na tle mozai­ki fotore­cep­torów zna­j­du­ją­cych się w dołku cen­tral­nym siatków­ki oka o powierzch­ni 0,05 mm. Najdłuższe proste odcin­ki ilus­tru­ją tra­jek­torię mikrosakad, mikrodryft został zare­je­strowany w formie odcinków krzy­wych, nato­mi­ast zapisy mikro­drżeń pokry­wa­ją się z mikrodryftem i przy­pom­i­na­ją zygza­kowaty ścieg maszyny do szy­cia. Własne opra­cow­anie graficzne na pod­staw­ie Pritchard (1961)

Drugim rodza­jem ruchów fik­sacyjnych jest mikrodryft. Jest to sto­sunkowo wol­ny ruch gał­ki ocznej, w dość przy­pad­kowym kierunku, który powodu­je, że obraz rzu­towany na siatkówkę oka stale oświ­et­la nieco inną grupę fotore­cep­torów. Ampli­tu­da dryf­tu waha się od 1’ do 8’ (min­ut kątowych, czyli sześćdziesią­tych częś­ci stop­nia kątowego), a pręd­kość wynosi poniżej 30’/s (Rolfs, 2009). W odróżnie­niu od mikro­drżeń, dryft powodu­je glob­al­ną zmi­anę relacji między obrazem rzu­towanym na siatkówkę, a zna­j­du­ją­cy­mi się w niej fotore­cep­tora­mi. Ten ruch zapo­b­ie­ga adap­tacji fotore­cep­torów do tej samej inten­sy­wnoś­ci światła, a tym samym, zanika­niu obrazu. Pobud­zony już fotore­cep­tor na moment wyłącza się bowiem z absorbowa­nia nowej por­cji światła i przes­ta­je być na nie wrażli­wy. Wspom­ni­any Roy M. Pritchard (1961) wykazał, że usta­bi­li­zowanie obrazu na tej samej grupie fotore­cep­torów powodu­je, że z każdą chwilą obraz jest widziany coraz gorzej, aż do jego częś­ciowego lub całkowitego zaniku. Podob­nie, jak w odniesie­niu do mikro­drżeń, pod­czas fik­sacji oczu na tym samym frag­men­cie sce­ny wiz­ual­nej, tra­jek­to­ria dryf­tu w prawym i w lewym oku jest zupełnie inna (ryc. 46).

Ryci­na 46. Zapis tra­jek­torii dryf­tu (linia czarna) i mikrosakad (linia czer­wona) odd­ziel­nie dla prawej i lewej gał­ki ocznej pod­czas 1‑sekundowej fik­sacji oczu na powierzch­ni o wielkoś­ci ok. 1o kąta pola widzenia. Pozy­c­ja kole­jnych punk­tów sta­bi­liza­cji oka jest wyrażona w min­u­tach kątowych. Własne opra­cow­anie graficzne na pod­staw­ie Rolfs (2009)

Wresz­cie trze­ci rodzaj ruchów fik­sacyjnych oczu stanow­ią mikrosakady. W ostat­nich lat­ach budzą one coraz więk­sze zain­tere­sowanie (np. Eng­bert, 2006; Eng­bert, Kliegl, 2004; Mar­tinez-Conde i in., 2004; 2009; Rolfs, 2009). Ich ampli­tu­da jest bard­zo zróżni­cow­ana i waha się od 3’ (min­ut kątowych) do 2° kąta pola widzenia, zaś pręd­kość na ogół jest nieporówny­wal­nie więk­sza niż pręd­kość mikro­drżeń czy mikrodryf­tu (Mar­tinez-Conde i in., 2009). Efekt prze­sunię­cia siatków­ki w sto­sunku do rzu­towanego nań obrazu wywołany przez mikrosakadę jest ana­log­iczny do mikrodryf­tu. Mikrosaka­da jest jed­nak szyb­sza i najczęś­ciej prze­suwa oś widzenia na więk­szą odległość niż mikrodryft. Mikrosakady, w odróżnie­niu od tremoru i mikrodryf­tu, są wykony­wane syn­chron­icznie przez obo­je oczu (zob. linia czer­wona na ryc. 46).

Mar­tin Rolfs (2009) wskazu­je na wiele różnych funkcji, jakie pełnią mikrosakady. Przede wszys­tkim radykalnie zmieni­a­ją one relację rzu­towanego obrazu do powierzch­ni siatków­ki zapo­b­ie­ga­jąc jego zanika­niu, a pon­ad­to, sprzy­ja­ją utrzy­ma­niu wysok­iej ostroś­ci widzenia, służą do skanowa­nia niewielkiej powierzch­ni fik­sacji (m.in. w celu trafniejszej detekcji krawędzi rzeczy w sce­nie wiz­ual­nej) oraz pełnią ważną funkcję w pro­ce­sie pro­gramowa­nia kole­jnych sakad, poprzez prze­sunię­cia tzw. uwa­gi wzrokowej w nowe obszary sce­ny wizualnej.

Odruchy okoruchowe

Przegląd ruchów oczu uwikłanych w ruch obser­wa­to­ra lub obiek­tów w sce­nie wiz­ual­nej zacznę od omówienia trzech rodza­jów odruchów, czyli takich reakcji oczu, które niemal całkowicie wymyka­ją się spod kon­troli obser­wa­to­ra. Są to: odruch przed­sionkowo-oczny (vestibu­lo-ocu­lar reflex, VOR), odruch optokine­ty­czny (opto­ki­net­ic reflex) oraz odruchy wer­gen­cyjne (ver­gence), konwergen­cyjny (con­ver­gence) i dyw­er­gen­cyjny (diver­gence).

Już na pier­wszy rzut oka widać, że głowa i oczy mogą poruszać się nieza­leżnie od siebie. Ma to oczy­wiste plusy, ponieważ dzię­ki temu układ wzrokowy jest znacznie lep­iej przys­tosowany do różnych sytu­acji życiowych, które wyma­ga­ją dobrej ori­en­tacji w przestrzeni. Ta sytu­ac­ja rodzi jed­nak również pewien prob­lem, z którym ewoluc­ja znakomi­cie sobie poradz­iła. Chodzi o to, że niejed­nokrot­nie chce­my nieco dłużej fik­sować wzrok na jakimś szczególe sce­ny wiz­ual­nej, a jed­nocześnie jesteśmy w ruchu. Wystar­czy wyobraz­ić sobie jak skom­p­likowaną pracę muszą wykony­wać mięśnie oczu, żeby utrzy­mać wzrok na wybranym miejs­cu sce­ny wiz­ual­nej przez jeźdź­ca pod­czas zawodów hip­picznych. Głowa nie tylko porusza się we wszys­t­kich kierunk­ach, równoważąc zakłóce­nia równowa­gi związane z ruchem konia, ale pon­ad­to wciąż zmienia swo­je położe­nie wzglę­dem oglą­danej sce­ny. Nieco mniej ekstremal­ną, choć ana­log­iczną, sytu­acją jest oglą­danie wys­taw skle­powych pod­czas spaceru lub oglą­danie w ruchu obrazów wiszą­cych na ścianach w muzeum.

Mech­a­nizmem wzrokowym, który prze­ci­wdzi­ała utra­cie ostroś­ci widzenia związanym z ruchem głowy jest odruch przed­sionkowo-oczny, zwany również – przed­sionkowym. Odruch ten moż­na łat­wo zaob­ser­wować, gdy porusza­jąc głową w pra­wo i w lewo, stale spoglą­damy na jak­iś przed­miot (ryc. 47). Odruch przed­sionkowy może­my zaob­ser­wować wykonu­jąc proste zadanie. Patrząc w lus­tro postara­jmy się stale utrzymy­wać wzrok na źreni­cach swoich oczu i jed­nocześnie porusza­jmy głową we wszys­t­kich kierunk­ach. Każdy ruch głową w jed­ną stronę spowodu­je odru­chową reakcję oczu w prze­ci­wnym kierunku. Pręd­kość ruchów głowy i oka jest taka sama.

Ryci­na 47. Ilus­trac­ja odruchu przed­sionkowo-ocznego. Zadanie pole­ga na spoglą­da­niu na nieru­chomy przed­miot i porusza­niu głową w różnych kierunk­ach. Opra­cow­anie graficzne P.A.

U podłoża odruchu VOR leży mech­a­nizm fizjo­log­iczny, który w celu usprawnienia dzi­ała­nia sys­te­mu wzrokowego wyko­rzys­tu­je dane pochodzące z sys­te­mu kineste­ty­cznego, który przede wszys­tkim jest odpowiedzial­ny za utrzymy­wanie równowa­gi ciała (ryc. 48).

Ryci­na 48. Schemat neu­ronal­nego sub-sys­te­mu odpowiedzial­nego za odruch przed­sionkowo-oczny. Opra­cow­anie graficzne P.A. na pod­staw­ie Matthews (2000) i Nolte (2011)

Detekc­ja położe­nia i ruchu głowy zachodzi w narządzie przed­sionkowym, zlokali­zowanym w uchu wewnętrznym. Dane z narzą­du przed­sionkowego są przekazy­wane do jąder przed­sionkowo-bocznych, niewiel­kich skupisk neu­ronów zna­j­du­ją­cych się po obu stronach pnia mózgu (a dokład­niej w częś­ci grz­bi­etowo-bocznej rdzenia przedłużonego). Stąd syg­nały są przekazy­wane do dwóch par jąder, które bezpośred­nio zaw­iadu­ją rucha­mi oczu, czyli wspom­ni­anych już jąder ner­wu oko­ru­chowegoodwodzącego (Matthews, 2000; Nolte, 2011).

Pod­sumowu­jąc, nawet naj­drob­niejsze odchyle­nie głowy od pio­nu jest reje­strowane w narządzie przed­sionkowym a infor­ma­c­ja o tym, skrzęt­nie wyko­rzysty­wana przez sys­tem odpowiedzial­ny za ruchy gałek ocznych. Dzię­ki odru­chowi przed­sionkowo-oczne­mu może­my stale rzu­tować wybrany frag­ment obrazu na cen­tral­ną część siatków­ki bez utraty ostroś­ci widzenia.

Odruch optokine­ty­czny, pojaw­ia się w sytu­acji, gdy głowa jest względ­nie sta­bil­na, nato­mi­ast oczy bezwied­nie fik­su­ją się na sto­sunkowo dużym obiek­cie, którego obraz szy­bko zmienia swo­je położe­nie na siatków­ce. Na przykład, jadąc pociągiem od cza­su do cza­su zatrzy­mu­je­my spo­jrze­nie na jakimś ele­men­cie tej dynam­icznej sce­ny i kiedy zni­ka z pola widzenia, oczy znowu „przyk­le­ja­ją się” do innego obiek­tu. Odruch optokine­ty­czny może współwys­tępować z odruchem przed­sionkowo-ocznym, czyli wtedy gdy dodatkowo porusza się głowa (Mus­tari i Ono, 2009). Ma on krót­ki czas latencji (poniżej 100 ms), sto­sunkowo dużą pręd­kość (nawet powyżej 180°/sek.) i naprawdę trud­no jest go kon­trolować (Büt­tner i Krem­my­da, 2007). Zasad­nic­zo ma on niewielkie znacze­nie pod­czas oglą­da­nia sta­bil­nych obrazów.

Pod­sta­wową funkcją obu odruchów (przed­sionkowego i optokine­ty­cznego) jest kom­pen­sowanie utraty ostroś­ci widzenia obiek­tu zna­j­du­jącego się w sce­nie wiz­ual­nej, spowodowanej ruchem obser­wa­to­ra lub obiek­tu zna­j­du­ją­cych się w płaszczyźnie prostopadłej do osi widzenia. Z kolei tzw. odruch wer­gen­cyjny wys­tępu­je pod­czas oglą­da­nia sce­ny wiz­ual­nej, w której obiek­ty (lub obser­wa­tor) zmieni­a­ją położe­nie wzglę­dem siebie w linii równoległej do osi widzenia, czyli zbliża­ją się lub odd­ala­ją od siebie.

Odruchy wer­gen­cyjne wys­tępu­ją w dwóch for­ma­ch, jako odruch kon­wer­gen­cyjny, czyli zbieżny lub dyw­er­gen­cyjny, czyli roz­bieżny. Ich pręd­kość jest podob­na i wynosi ok. 25°/s. Celem odruchów wer­gen­cyjnych jest utrzymy­wanie osi widzenia na obiek­cie, w zależnoś­ci od jego dys­tan­su od obser­wa­to­ra. Gdy odległość między nimi zmniejsza się, wów­czas źrenice gałek ocznych zbliża­ją się do siebie (kon­wer­genc­ja), a gdy odległość się zwięk­sza, odd­ala­ją się od siebie (dyw­er­genc­ja) (ryc. 49).

Ryci­na 49. Odruchy wer­gen­cyjne: A – dyw­er­gen­cyjny (obiek­ty odd­ala­jące się lub odległe) i B – kon­wer­gen­cyjny (obiek­ty zbliża­jące się lub bliskie). Opra­cow­anie graficzne P.A.

Odruch ten przy­pom­i­na trochę robi­e­nie zeza, zbieżnego lub roz­bieżnego. Kiedy obiekt zna­j­du­je się w odległoś­ci więk­szej niż 5–6 m od obser­wa­to­ra, wów­czas osie widzenia obu oczu ustaw­ia­ją się niemal równoległe do siebie. Jest to grani­ca, powyżej której odruchy wer­gen­cyjne oczu odgry­wa­ją coraz mniejszą rolę w stere­oskopowym, czyli dwuocznym widze­niu głębi. Podob­nie, jak poprzed­ni, odruch ten ma sto­sunkowo niewielkie znacze­nie dla rozpoz­nawa­nia głębi w sytu­acji oglą­da­nia płask­iej powierzch­ni obrazu.

Podstawowy mechanizm kadrowania sceny wizualnej

Ruchy sakad­owe (sac­cadic) oczu zasad­nic­zo służą do prze­niesienia spo­jrzenia z jed­nego punk­tu względ­nie sta­bil­nej sce­ny wiz­ual­nej na inny. Moż­na je łat­wo obser­wować, spoglą­da­jąc w oczy komuś, kto się czemuś przyglą­da. Zobaczymy wów­czas, że źrenice gałek ocznych obser­wa­to­ra co pewien czas, równocześnie zmieni­a­ją swo­je położe­nie, ustaw­ia­jąc osie widzenia na kole­jnych frag­men­tach oglą­danego obrazu.

Po każdym skoku, czyli sakadzie oczy nieru­chomieją na krót­szą lub dłuższą chwilę. Ten moment nazy­wa się fik­sacją wzroku i jest jed­nym z najważniejszych aktów w pro­ce­sie widzenia. Właśnie wtedy reje­strowane są dane o poziomie pobudzenia fotore­cep­torów w siatkówkach oczu, a już chwilę później przekazy­wane do mózgu, jako infor­ma­c­ja o aktu­al­nie widzianym frag­men­cie sce­ny wiz­ual­nej. To jest moment „naświ­et­la­nia kadru”.

Na ryc. 50B zaz­naczyłem ruchy sakad­owe (żółte lin­ie) i miejs­ca fik­sacji wzroku (żółte punk­ty) zare­je­strowane pod­czas oglą­da­nia portre­tu Krystyny Potock­iej, namalowanego przez Angelicę Kauff­mann z kolekcji wilanowskiej (ryc. 50A). Obraz był oglą­dany przez 24 oso­by badane na mon­i­torze kom­put­erowym, a ruch ich gałek ocznych zare­je­strowałem za pomocą oku­lo­gra­fu SMI High­Speed 1250 Hz. Wyni­ki tego ekspery­men­tu zostaną omówione w ostat­nim rozdziale książ­ki, który jest poświę­cony per­cepcji piękna.

Ryci­na 50 A. Angel­i­ca Kauff­mann, Portret Krystyny Potock­iej (1783/1784). Muzeum Pałacu Króla Jana III w Wilanowie, Warsza­wa, Pol­s­ka [155 x 113 cm] i B – obraz Angeli­ci Kauff­mann z nanie­sionym zapisem tra­jek­torii ruchu gałek ocznych 24 osób badanych. Opra­cow­anie na pod­staw­ie wyników badań własnych.
Pod­czas sakad fotore­cep­to­ry także są pobudzane, ale ze wzglę­du na szy­bkość ruchu gał­ki ocznej, obrazy rzu­towane wów­czas na siatkówkę są całkowicie nieostre, jak nieostry może być obraz za okna­mi pędzącego TGV, zarówno w pier­wszym planie – ze wzglę­du na ruch pociągu, jak i w dal­szych – ze wzglę­du na odległość (ryc. 50.1.).
Ryci­na 50.1. Zdję­cie z okna TGV na połud­niu Francji. Opra­cow­anie graficzne P.F.

Mózg „nie jest zain­tere­sowany” tymi dany­mi i dlat­ego krótkotr­wale wyłącza niek­tóre podze­społy, a dokład­niej mówiąc, te częś­ci kory wzrokowej, które są odpowiedzialne za odbiór danych o stanie pobudzenia fotore­cep­torów (Paus, Mar­rett, Wors­ley i Evans, 1995; Burr, Mor­rone i Ross, 1994). Zjawisko to nazy­wa się wygasza­ni­an­iem sakad­owym (sac­cadic sup­pres­sion) lub maskowaniem sakado­wym (sac­cadic mask­ing). Dzi­ałanie tego mech­a­niz­mu jest podob­ne do dzi­ała­nia migaw­ki w kamerze fil­mowej (ryc. 51).

Ryci­na 51. Zasa­da dzi­ała­nia migaw­ki w kamerze, jako analo­gia mech­a­niz­mu maskowa­nia sakad­owego. Własne opra­cow­anie graficzne na pod­staw­ie Łow­ic­ki (2005)

Nagry­wanie fil­mu pole­ga na naświ­et­la­niu sek­wencji kadrów na unieru­chomionej taśmie celu­loid­owej, pokry­tej światłoczułą błoną. Pod­czas prze­suwa­nia taśmy o jed­ną klatkę, obra­ca­ją­ca się migawka na moment całkowicie ją zasła­nia. W ten sposób błona fotograficz­na nie jest naświ­et­lana pod­czas ruchu taśmy tylko wtedy, gdy jest ona nieru­choma. Reje­strowanie sce­ny wiz­ual­nej za pomocą oczu prze­b­ie­ga podob­nie. Mózg anal­izu­je tylko te obrazy, które zostały zare­je­strowane przez fotore­cep­to­ry pod­czas fik­sacji wzroku, a nie pod­czas sakady. Dzię­ki temu sce­na wiz­ual­na, doświad­czana przez nas jako widze­nie jest kon­struowana przede wszys­tkim w opar­ciu o wyraźne i sta­bilne (tzn. nierozmyte i nieporus­zone) obrazy. Cza­sy sakad podob­nie, jak cza­sy prze­sunię­cia taśmy nie należą do cza­su trwa­nia zare­je­strowanej sce­ny wiz­ual­nej. Na szczęś­cie są one o rząd wielkoś­ci krót­sze niż fiksacje.

W ciągu każdej sekundy oczy wykonu­ją 3–5 sakad. W chwilach pod­wyżs­zonego pobudzenia może być ich jed­nak znacznie więcej. Ruchy sakad­owe są gwał­towne – zaczy­na­ją i kończą się równie nagle, i w zależnoś­ci od sytu­acji trwa­ją od 10 do 200 ms, np. pod­czas czy­ta­nia wynoszą śred­nio, ok. 30 ms (Duchows­ki, 2007; Leigh i Zee 2006). Różnią się od siebie dłu­goś­cią, czyli ampli­tudą, a także pręd­koś­cią. Ampli­tu­da sakady jest uza­leżniona od wielu czyn­ników, m.in. od wielkoś­ci sce­ny wiz­ual­nej lub położe­nia zna­j­du­ją­cych się w niej obiek­tów, ale na ogół nie przekracza 15° kąta pola widzenia (maksy­mal­nie może wynosić do 40°). Czas jej wyko­na­nia jest pro­por­cjon­al­ny do ampli­tudy, choć nie jest to zależność pros­tolin­iowa. Podob­nie, pręd­kość sakady wzras­ta pro­por­cjon­al­nie (choć także nie lin­iowo) w sto­sunku do ampli­tudy i u człowieka może wynosić nawet do 900°/sek. (Fis­ch­er i Ramsperg­er, 1984). To najszyb­szy ruch ludzkiego ciała. Zależnoś­ci między ampli­tudą, cza­sem i pręd­koś­cią każdej sakady są względ­nie stałe. Tę cechę ruchów sakad­owych nazy­wa się stereotypo­wością sakady (Bahill, Clark i Stark, 1975). 

Bal­isty­czność jest drugą, obok stereo­ty­powoś­ci, cechą sakad (Duchows­ki, 2007). Jest ona rozu­mi­ana jako bezwład­ność, a zarazem niezmi­en­ność kierunku ruchu gał­ki ocznej po rozpoczę­ciu sakady. Podob­nie, jak nie moż­na zmienić para­metrów lotu kamienia od momen­tu jego wyrzuce­nia, tak też saka­da, której pręd­kość, przyspiesze­nie i kierunek zostaną zapro­gramowane przed jej rozpoczę­ciem, zasad­nic­zo nie mogą być już zmienione w trak­cie wyko­na­nia (Car­pen­ter, 1977).

Ist­nieje wiele rodza­jów ruchów sakad­owych (pełną klasy­fikację zob. Leigh i Zee, 2006, s. 109–110), ale dwa z nich są szczegól­nie ważne z punk­tu widzenia prob­lematy­ki przed­staw­ianej w niniejszej książce. Są to odruchy sakad­owe (reflex­ive sac­cades) oraz sakady wolicjon­alne (vol­un­tary sac­cades). Odru­chowe, czy inaczej mimowolne sakady pojaw­ia­ją się w odpowiedzi na specy­ficzne ele­men­ty sce­ny wiz­ual­nej takie, jak np. nagłe pojaw­ie­nie się jakiegoś obiek­tu, gwał­towny ruch, wydat­ność (salien­cy) różnych jej częś­ci, kon­trast, błys­ki lub mig­ota­nia, a nawet dźwię­ki, w stronę których odru­chowo kieru­ją się oczy. Z kolei sakady wolicjon­alne (dowolne) są sterowane odgórnie, tzn. ich tra­jek­to­ria jest pod­porząd­kowana takim czyn­nikom, jak np. wiedza, nastaw­ie­nie, świadome poszuki­wanie czegoś w obra­zie lub oczeki­wanie obserwatora.

Neu­ronal­na pod­stawa ruchów sakadycznych

Najważniejsze struk­tu­ry neu­ronalne, które biorą udzi­ał w kon­troli ruchów gałek ocznych (zarówno sakady­cznych, jak i podąża­nia) zostały przed­staw­ione na ryc. 52. Ich wielość oraz skom­p­likowana sieć łączą­cych je dróg znakomi­cie uświadami­a­ją, jak złożony mech­a­nizm steru­je zwycza­jnym spo­jrze­niem w pra­wo lub w lewo. Nie ma tu miejs­ca na przy­padek, choć cza­sem ta maszyne­r­ia może nie nadążać za biegiem wydarzeń.

Ryci­na 52. Struk­tu­ry i dro­gi neu­ronalne zaan­gażowane w for­mowanie się decyzji doty­czącej ruchów gałek ocznych. Opra­cow­anie graficzne P.A. na pod­staw­ie Duchows­ki (2007), Wurtz (2008) oraz Yokochi, Rohen i Wein­reb (2006)

Zaczni­jmy od tych struk­tur sys­te­mu kon­troli ruchu gałek ocznych, które zna­j­du­ją się na wczes­nych eta­pach szlaku wzrokowego. Jed­ną z najważniejszych jest wzgórek górny blasz­ki czworaczej (supe­ri­or col­licu­lus; SC), zna­j­du­ją­cy się w pokry­wie śród­móz­gowia. Impul­sy ner­wowe docier­a­ją do zewnętrznych warstw tej struk­tu­ry z siatków­ki za pośred­nictwem wiąz­ki włókien ner­wu wzrokowego, zwanej szlakiem siatkówkowo-wzgór­ko­wym (retino-col­lic­u­lar path­way) (ryc. 52, ścież­ka niebieska).

Pod­sta­wowym zadaniem SC jest ustaw­ie­nie pozy­cji gałek ocznych w taki sposób, aby ich osie widzenia znalazły się dokład­nie naprze­ci­wko najbardziej intere­su­jącego frag­men­tu sce­ny wiz­ual­nej. Budowa i funkcjonowanie tej zdu­miewa­jącej struk­tu­ry przy­pom­i­na nieco celown­ik nowoczes­nego kara­binu strzel­ca wyborowego. Jest zbu­dowany warst­wowo, podob­nie, jak wiele struk­tur pod­ko­rowych (np. LGN) lub korowych (np. V1) mózgu (ryc. 53).

Ryci­na 53. Wzgórek górny blasz­ki czworaczej zna­j­du­ją­cy się na grz­bi­etowej częś­ci śród­móz­gowia: warst­wy wejś­cia i wyjś­cia. Opra­cow­anie graficzne P.A. na pod­staw­ie Wurtz (2008)

Przede wszys­tkim wierzch­nia warst­wa SC, do której docier­a­ją zakończenia synap­ty­czne aksonów komórek zwo­jowych z siatkówek oczu obser­wa­to­ra (dro­ga siatkówkowo-wzgórkowa), ma retino­topową orga­ni­za­cję, ana­log­iczną do pier­ws­zorzę­dowej kory wzrokowej, czyli V1 (Naka­hara, Mori­ta, Wurtz i Opti­can, 2006).

Między reakc­ja­mi fotore­cep­torów umieszc­zonych w określonych miejs­cach siatków­ki a reakc­ja­mi komórek tworzą­cych zewnętrzną warst­wę SC zachodzi topograficzny związek (zob. ryc. 54).

Ryci­na 54. Retino­topowa orga­ni­za­c­ja pier­wszej (szarej) warst­wy wzgór­ka górnego blasz­ki czworaczej. Z lewej strony połowa siatków­ki oka, a z prawej odpowiada­ją­ca jej retino­topowa orga­ni­za­c­ja komórek ner­wowych w SC. Koło i trójkąt sym­bol­izu­ją dwa bodźce, które wywołały reakcję fotore­cep­torów w określonym miejs­cu w siatków­ce oraz komórek w SC. Własne opra­cow­anie graficzne na pod­staw­ie Naka­hara, Mori­ta, Wurtz i Opti­can (2006)

Podob­nie, jak w V1 również w SC, najwięk­szą część mapy zaj­mu­je reprezen­tac­ja okolic doł­ka cen­tral­nego siatków­ki. Znakomi­cie ilus­tru­ją to zaz­nac­zone na ryc. 54 dwie fig­ury: koło i trójkąt. Kółko, którego pozy­cję trud­no jest pre­cyzyjnie ustal­ić na pod­staw­ie wykre­su siatków­ki, bez trudu i dokład­nie moż­na zlokali­zować na jej retino­topowej mapie w SC. Topograficznie zori­en­towana reprezen­tac­ja danych siatkówkowych w SC ma takie znacze­nie dla wyko­na­nia kole­jnej sakady, jak mapa w szta­bie dowodzenia oper­acją wojskową, dla pre­cyzyjnego określe­nia celu następ­nego ataku.

Drugą niezwyk­le intere­su­jącą cechą SC jest to, że komór­ki zna­j­du­jące się w jej głęb­szych warst­wach reagu­ją nie tylko na bodźce wzrokowe, ale również słu­chowe (Jay i Sparks, 1984) i czu­ciowe (Groh i Sparks, 1996). Tłu­maczy to, m.in. dlaczego nagły dźwięk lub zapach mogą skierować oczy na ich źródło. Wzgórkowy celown­ik wzrokowy nie jest więc narzą­dem odi­zolowanym od innych zmysłów, wyspec­jal­i­zowanym tylko w zakre­sie reakcji na bodźce wiz­ualne, ale urządze­niem bio­log­icznym wrażli­wym na znacznie szer­sze spek­trum sty­mu­lacji zmysłowej. To dzię­ki takim struk­tur­om móz­gowym mamy poczu­cie, że nasze zmysły nie dzi­ała­ją w izo­lacji od siebie, ale tworzą w pełni zin­te­growany sys­tem reagu­ją­cy w sko­or­dynowany sposób na różne prze­jawy rzeczy­wis­toś­ci (Cup­pi­ni, Ursi­no, Magos­so, Row­land i in., 2010).

Wresz­cie po trze­cie, SC koor­dynu­je pracę kilku różnych struk­tur móz­gowych, wysyła­jąc do nich i odbier­a­jąc od nich impul­sy ner­wowe, w celu ostate­cznego ustal­e­nia miejs­ca kole­jnej sakady. Po otrzy­ma­niu danych z siatków­ki o aktu­al­nym położe­niu oka wzglę­dem sce­ny wiz­ual­nej, SC przesyła je w kierunku dwóch struk­tur, zna­j­du­ją­cych się w korze mózgu (ryc. 52).

Pier­wsza dro­ga, a właś­ci­wie kil­ka odręb­nych ścieżek, bieg­nie w kierunku płatów ciemieniowych, a dokład­niej do bocznej kory śród­ciemieniowej (lat­er­al intra­pari­etal cor­tex; LIP), wyś­ciela­jącej powierzch­nię bruzdy śródciemie­niowej (intra­pari­etal sul­cus; IPS). Jed­na ze ścieżek prowadzi do tego miejs­ca przez LGN, pier­wot­ną korę wzrokową (V1) i dalej przez okolicę skro­niową przyśrod­kową (medi­al tem­po­ral; MT), czyli syg­nal­i­zowany już obszar odpowiedzial­ny za widze­nie ruchu V5 oraz obszar skro­niowy przyśrod­kowy górny (medi­al supe­ri­or tem­po­ral; MST), które zna­j­du­ją się w głębi bruzdy skro­niowej górnej (supe­ri­or tem­po­ral sul­cus) (ryc. 52, ścież­ka zielona).

Inna ścież­ka bieg­nie krót­szą drogą przez przyśrod­kowe jądra podusz­ki (pul­v­inar medi­al nuclei), a stamtąd już bezpośred­nio do bruzdy skro­niowej górnej i dalej do IPS (Wurtz, 2008) (ryc. 52, ścież­ka czerwona).

Dru­ga waż­na struk­tu­ra, do której SC wysyła dane doty­czące aktu­al­nej pozy­cji oka zna­j­du­je się w korze czołowej (frontal cor­tex), a dokład­niej, w tyl­nej częś­ci zakrę­tu czołowego środ­kowego (mid­dle frontal gyrus) i w przyle­ga­jącej do niego bruzdy przedśrod­kowej (pre­cen­tral sul­cus). Struk­tu­ra ta jest znana pod dosyć osobli­wą nazwą korowego ośrod­ka sko­ja­rzo­nego spo­jrzenia w bok (frontal eye field; FEF). W rzeczy­wis­toś­ci ośrodek ten jest odpowiedzial­ny za dowol­ny ruch sakad­owy oka zna­j­du­jącego się po prze­ci­wnej stron­ie głowy oraz za płyn­ny ruch gałek ocznych. Dro­ga z SC do FEF prowadzi przez jądra grz­bi­etowo-przyśrod­kowe (dor­so­me­di­al nucle­us), zlokali­zowane we wzgórzu (ryc. 52, ścież­ka żółta).

Oby­d­wa te ośrod­ki, czyli IPS i FEF, po uzyska­niu wszys­t­kich potrzeb­nych danych z jąder wzgórza, podusz­ki i struk­tur zlokali­zowanych na wzrokowym szlaku grz­bi­etowym (a zwłaszcza MT i MST), zaj­mu­ją się: anal­izą danych doty­czą­cych aktu­al­nego położe­nia oka w sto­sunku do kadru sce­ny wiz­ual­nej, uzgad­ni­an­iem wyników tych anal­iz między sobą, a następ­nie zwrot­nie, przekazaniem decyzji o zmi­an­ie położe­nia oka do SC (Got­tlieb i Bal­an, 2010; Kable i Glim­ch­er, 2009; Noudoost, Chang, Stein­metz i Moore, 2010; Wen, Yao, Liu i Ding, 2012) (ryc. 52, ścież­ki pomarańc­zowe). Dane doty­czące współrzęd­nych nowej pozy­cji oka są nanos­zone na retino­topową mapę siatków­ki w wierzch­niej warst­wie SC i przekazy­wane dalej w formie instrukcji do wykonania.

Z SC infor­ma­c­ja bieg­nie do niewielkiej grupy jąder, zlokali­zowanych w przy­pośrod­kowej częś­ci tworu siatkowa­t­ego mostu (para­me­di­an pon­tine retic­u­lar for­ma­tion; PPRF) dwoma ścieżka­mi. Jed­na prowadzi bezpośred­nio z SC do PPRF, a dru­ga pośred­nio, przez móżdżek (cere­bel­lum), który bierze udzi­ał we wszys­t­kich oper­ac­jach związanych z ruchem orga­niz­mu (Gross­berg, Sri­hasam i Bul­lock, 2012) (ryc. 52, ścież­ki pur­purowe). Poprzez połączenia PPRF z jądra­mi ner­wu oko­ru­chowego, bloczkowego i odwodzącego syg­nał jest w końcu wysyłany do trzech par mięśni zewnątrz­gałkowych, za pośred­nictwem III, IV i VI ner­wu cza­szkowego (ryc. 52, ścież­ka file­towa). Mięśnie kur­cząc się lub rozluź­ni­a­jąc powodu­ją ruch oka, czyli sakadę i tym samym ustanaw­ia­ją nową pozy­cję środ­ka kadru. Tak oto dob­ie­ga koń­ca oper­ac­ja wyko­na­nia poje­dynczego ruchu gałek ocznych, która w nor­mal­nych warunk­ach na ogół nie zaj­mu­je więcej niż 1/3 sekundy.

Ruch podąża­nia

Spośród ruchów oczu, których celem jest utrzymy­wanie w kadrze niezbyt szy­bko porusza­jącego się obiek­tu w płaszczyźnie prostopadłej do osi widzenia, najważniejszy jest ruch podąża­nia (smooth pur­suit). Uza­sad­nie­niem dla jego omówienia w książce poświę­conej płask­iemu, nieru­chome­mu obra­zowi jest to, że coraz częś­ciej oglą­damy takie właśnie obrazy na karose­ri­ach tramwa­jów lub auto­busów, a także na bil­bor­dach ciąg­nię­tych na lawe­tach za samochodem.

Śred­nia pręd­kość ruchu podąża­nia jest znacznie mniejsza niż pręd­kość sakad i za wyjątkiem jego pier­wszej fazy na ogół nie przekracza 30°/sek. Ruch podąża­nia rozpoczy­na się ok. 100–150 ms po detekcji ruchu obiek­tu (Büt­tner i Krem­my­da, 2007). Od tego momen­tu przez 40 ms oko rozpędza się w kierunku zgod­nym z kierunk­iem ruchu obiek­tu, usiłu­jąc go „dogo­nić”. W tym cza­sie pręd­kość oka może zwięk­szyć się nawet do 50°/sek. i w zależnoś­ci od pręd­koś­ci obiek­tu oraz odległoś­ci z jakiej jest oglą­dany, oś widzenia może prze­sunąć się przed obiekt lub pozostać nieco w tyle za nim. Tak czy inaczej, przez następ­ne 60 ms oko z grub­sza dopa­sowu­je swo­ją pręd­kość do pręd­koś­ci obiek­tu. Jest to pier­wsza, tzw. swo­bod­na faza ruchu podąża­nia (open-loop pur­suit). Jej celem jest po pros­tu zainicjowanie ruchu gałek ocznych i prze­sunię­cie osi widzenia w tym kierunku, w którym przemieszcza się obiekt oraz w miarę możli­woś­ci doprowadze­nie do tego, aby znalazł się na ich prze­cię­ciu. Prze­bieg tej fazy jest niemal iden­ty­czny u ludzi, jak i u małp (Carl i Gell­man, 1987; Krau­zlis i Lis­berg­er, 1994).

Dru­ga faza ruchu podąża­nia pole­ga na stałym utrzymy­wa­niu spo­jrzenia na porusza­ją­cym się obiek­cie. Prze­b­ie­ga ona na zasadzie pow­tarza­ją­cych się pętli sprzężeń zwrot­nych (closed-loop pur­suit). Kil­ka razy na sekundę sys­tem wzrokowy sprawdza wielkoś­ci różni­cy między pozy­cją porusza­jącego się obiek­tu a pozy­cją oka, a ściślej doł­ka cen­tral­nego. Początkowo korek­ta obu pozy­cji odby­wa się 3–4 razy na sekundę i jeżeli obiekt porusza się mniej więcej ze stałą pręd­koś­cią, zmniejsza się do 2–3 razy na sekundę (Leigh i Zee, 2006). W ten sposób, za pomocą krót­kich skoków, osie widzenia stale przeci­na­ją porusza­ją­cy się obiekt mniej więcej w tym samym miejs­cu. Ponieważ sko­ki oczu są niewielkie, a im dalej zna­j­du­je się przed­miot od obser­wa­to­ra tym są krót­sze, dlat­ego ruch podąża­nia spraw­ia wraże­nie, jak­by był wy­gła­dzony (smooth) lub płyn­ny, a nie skokowy.

Ciekawą włas­noś­cią ruchu podąża­nia jest jego iner­c­ja. Gdy śled­zony obiekt zniknie nagle z pola widzenia (np. obser­wowany samochód zostanie przysłonię­ty przez kępę przy­drożnych drzew), wów­czas przez ok. 4 sekundy oczy będą kon­tyn­uować ruch podąża­nia w kierunku ustalonym przed zniknię­ciem tego obiek­tu (pomi­mo jego nieobec­noś­ci w sce­nie), a ich pręd­kość powoli zacznie się zmniejszać, jed­nak nie mniej niż do 60% pręd­koś­ci początkowej. Jeżeli po czterech sekun­dach od zniknię­cia obiekt nie pojawi się ponown­ie w kadrze, wów­czas ruch podąża­nia wygasa (Barnes, 2008; Beck­er i Fuchs, 1985).

Mech­a­nizm iner­cji ruchu podąża­nia sza­cu­je najbardziej praw­dopodob­ny czas i miejsce wyłonienia się obiek­tu zza przeszkody po to, aby oczy mogły nadal utrzymy­wać na nim spo­jrze­nie. Oczy­wiś­cie warunk­iem wys­tąpi­enia tego efek­tu jest stała pręd­kość i znany kierunek ruchu obiek­tu, a także możli­wość obser­wowa­nia go przez pewien czas zan­im zniknie z pola widzenia.

Warto również dodać, że sys­tem wzrokowy człowieka znacznie lep­iej radzi sobie z utrzymy­waniem spo­jrzenia na ruchomych obiek­tach, które w płaszczyźnie prostopadłej do osi widzenia prze­suwa­ją się hory­zon­tal­nie niż wer­tykalnie, a jeśli już wer­tykalnie to lep­iej, gdy opada­ją niż się wznoszą (Grasse i Lis­berg­er, 1992). Ten porządek odzwier­cied­la częs­tość, z jaką mamy do czynienia z określonym rodza­jem ruchu obiek­tu w sce­nie wiz­ual­nej. Najczęś­ciej widz­imy obiek­ty porusza­jące się w płaszczyźnie hory­zon­tal­nej (w pra­wo lub w lewo), rzadziej w płaszczyźnie wer­tykalnej, z góry w dół (np. spada­jące przed­mio­ty), a jeszcze rzadziej – w płaszczyźnie wer­tykalnej, z dołu do góry.

Neurofizjologiczny model ruchów podążania

Neu­rofizjo­log­iczny mech­a­nizm ruchu podąża­nia łączy w sobie aż trzy pro­gramy oko­ru­chowe: odruch przed­sionkowy, ruch sakady­cznyspecy­ficzny pro­gram podąża­nia. Z odruchem przed­sionkowym łączą go struk­tu­ry pod­ko­rowe, zlokali­zowane zwłaszcza w pniu mózgu (Cullen, 2009). Najczęś­ciej bowiem, śledząc wol­no przemieszcza­ją­cy się obiekt nie tylko wodz­imy za nim wzrok­iem, ale również porusza­my głową. Ruch podąża­nia różni się jed­nak od odru­chowego utrzymy­wa­nia wzroku na obiek­cie pod­czas porusza­nia głową przede wszys­tkim tym, że w znacznie więk­szym stop­niu jest on dowolny.

Podob­nie, ruch podąża­nia i sakad­owy są kon­trolowane przez wiele tych samych struk­tur, leżą­cych na szlaku wzrokowym, począwszy od LGN, przez V1, MT i MST, a na FEF – kończąc (Gross­berg, Sri­hasam i Bul­lock, 2012; Ilg, 2009). W odróżnie­niu od ruchu sakady­cznego, ruch podąża­nia nie wyma­ga pośred­nict­wa struk­tur zna­j­du­ją­cych się w górnym wzgórku blasz­ki czworaczej pnia mózgu (SC).

Wresz­cie trze­ci mech­a­nizm, który odgry­wa najważniejszą rolę w pro­ce­sie dowol­nej inic­jacji i podtrzymy­wa­niu ruchu podąża­nia angażu­je specy­ficzne struk­tu­ry korowe związane ze znanym już z ruchów sakad­owych, czoło­wym ośrod­kiem sko­jar­zonego spo­jrzenia w bok (FEF), takie jak czo­ło­wy ośrodek ruchu podąża­nia (frontal pur­suit area; FPA) i dodatkowy ośrodek sko­jar­zonego spo­jrzenia w bok (sup­ple­men­tary eye field; SEF) (ryc. 52).

Spis treści