Menú

En este capítulo abordaremos en el tema de los movimientos oculares o visión dinámica. Hemos visto los mecanismos de la visión del movimiento y ahora veremos cómo se procesa toda la información que nos llega del mundo exterior, de un escenario que cambia continuamente.

movimientos oculares

Tipos de movimientos oculares

Sorprende el hecho de que cuando analizamos los movimientos de los ojos, la mayor parte del tiempo no estamos fijando o siguiendo un objeto de forma continua. En realidad, lo que hacen los ojos es ir “saltando” de un punto a otro de la escena, hasta que al final, fijamos la mirada en algo y mantenemos el enfoque siguiendo el movimiento que realice ese objeto o ajustándolo a nuestro movimiento, si es que no estamos parados.

De forma general, clasificamos los movimientos en tres categorías:

  • Sacadas.
  • Seguimiento lento.
  • Fijación.

A los cuales habría que añadir las vergencias como un movimiento diferente a los anteriores.

Las sacadas

Las sacadas son los movimientos oculares más rápidos, que redirigen los ojos hacia un nuevo punto del escenario que nos rodea.

Durante la sacada, el cerebro es ciego, no procesa información visual, únicamente lo hace cuando estamos fijando un objeto. Para conseguir esto, el sistema de percepción visual se vale de dos mecanismos, el primero se relaciona con la capacidad de resolución de la retina, sólo la mácula tiene un poder de resolución elevado que le permite enviar información de detalles al cerebro, así, hasta que no se fija un objeto, hasta que no se foveoliza, la información que envía la retina periférica, es de una calidad baja, 10 veces inferior a tan solo 20º de ésta.

Movimientos oculares en objetos en movimiento

Cuando se fija un objeto, tanto si estamos en movimiento como si estamos quietos pero con la cabeza en movimiento, para estabilizar el objeto y el entorno que nos rodea, disponemos de dos mecanismos muy potentes, el Reflejo Oculo-Vestibular (VOR) y el Reflejo Optoquinético (OKR).

Con estos sistemas, podemos estabilizar el entorno y los objetos y establecer un movimiento lento y controlado de seguimiento de ese objeto, aunque se esté moviendo o nos estemos moviendo o, ambas cosas a la vez (dentro de unos límites).

Frecuencia de los movimientos oculares

Se admite que hacemos una media de 1 a 4 sacadas segundo, siendo 4 el número máximo, por ejemplo cuando leemos. Una sacada tarda 30 ms y el rato que mantenemos la fijación, en torno a 300 ms, lo cual supone que si durante la sacada no vemos, equivale a decir que 1.5 hs al día somos ciegos.

Las sacadas son bilaterales y simétricas, solo cambia algo si se trata de un movimiento ocular de vergencia.

Las sacadas tienen unas características muy similares en todos los individuos. Su velocidad no es constante y varía según la amplitud de su recorrido, más rápida y duradera según incrementa la amplitud, con una fase de ascenso inicial y de saturación posterior. Se desencadenan tras la llegada de estímulos externos como un movimiento de algo dentro de la escena visual, la aparición de un nuevo objeto pero, en general, se generan sacadas de forma involuntaria y de forma constante cuando hacemos algo que requiere información visual, pero sin necesidad de buscar ningún objeto determinado. Por ejemplo, cuando vamos caminando, los ojos se van moviendo en sacadas, escaneando la escena que tenemos delante, procesando una información de calidad mínima pero suficiente para orientarnos y no tropezar, son sacadas algo más lentas que las anteriores, 130 mseg.

Funcionamiento de los movimientos oculares

En la mayoría de casos, las sacadas van alternando la posición, la dirección de la mirada, a un lado y a otro, bajo la acción de los grupos musculares, (si se activan el recto medio derecho y recto lateral izquierdo, mirando a la izquierda, la siguiente sacada se realizará, hacia la derecha, activando el lateral derecho y medio izquierdo. Son menos frecuentes los movimientos con direcciones verticales.

En la vida real se produce un escaneo del entorno con amplitudes de 30 grados, de los cuales, 20º corresponden a los ojos, las sacadas y 10º al movimiento de la cabeza.

Control de los movimientos oculares

El control de los movimientos oculares se realiza a tres niveles:

  1. Córtex cerebral, responsable de los movimientos voluntarios.
  2. Estructuras del cerebro medio, especialmente el colículo superior, responsable de las sacadas.
  3. Tallo cerebral, responsable del sistema motor que controla directamente los músculos oculares.

Los músculos oculares reciben inervaciones procedentes de los núcleos del tallo cerebral que a su vez, reciben inervaciones de los núcleos premotores, también situados en el tallo, ubicados sobre los primeros. A los núcleos premotores llegan inervaciones de la formación reticular pontina paramedia, responsable de las sacadas (burst units) y del mantenimiento de la posición de los ojos durante la fijación de los objetos (tonic units). En este nivel también se encuentran los núcleos reticulares del tegmento pontino, responsables de los movimientos finos de seguimiento.

Sobre los núcleos premotores también llegan inervaciones del núcleo vestibular, responsables de la estabilización de la visión durante los movimientos de la cabeza. En los núcleos premotores es donde se organizan los patrones inervacionales responsables de los distintos movimientos oculares.

Orientación visual

En un nivel superior se encuentra el colículo superior, responsable de la orientación visual, no solo de los ojos, también de la cabeza y el tronco. Es responsable de las sacadas y de los movimientos de la cabeza relacionados con las sacadas. En su región superficial llegan señales visuales y en sus capas más profundas llegan señales auditivas y somatosensoriales. El colículo recibe inervaciones del cortex, de las regiones frontales visuales (frontal eye fields, FEF), del área lateral intraparietal (LIP) y desde V1. Las regiones FEF y LIP de cada hemisferio estarían interconectadas a través del tálamo.

Parece que las sacadas se activan directamente desde las regiones frontales visuales o el colículo superior aunque el FEF representaría un estadio superior de control del sistema oculomotor. El FEF sería responsable también de la fijación y seguimiento fino de los objetos.

El papel que representa el área lateral intraparietal no está tan claro. Parece que ésta estaría más relacionado con funciones motoras, coordinación de movimientos de manos, cabeza, etc, desde estímulos visuales.

Movimientos oculares y movimientos de cabeza

Sobre las regiones frontales visuales llegarían estímulos procedentes del cortex prefrontal dorsolateral, una región asociada con la elaboración de planes de acción e inter-relación con el mundo que nos rodea.

Cuando se mueve la cabeza, se produce un movimiento compensatorio de los ojos, opuesto a la dirección de la cabeza, para estabilizar las imágenes. Este fenómeno se consigue mediante los sistemas VOR y OKR.

Sistema VOR

El sistema VOR, mediante los canales semicirculares del oído, detecta la velocidad de la cabeza y envía una señal compensadora a los núcleos que controlan los músculos extra-oculares, vía núcleos oculomotores.

El reflejo de compensación es prácticamente igual al de la cabeza, con una ganancia igual a 1, muy rápido, de aproximadamente 15 mseg. Si el estimulo de giro sigue, como cuando estamos delante de un tambor giratorio, cuando la amplitud del movimiento ocular supera los 50º, se produce una sacada donde los ojos vuelven a la posición de partida, iniciándose un nuevo movimiento de seguimiento, similar a un nistagmus.

Sistema OKR

Cuando la velocidad de giro de la cabeza no es tan elevada, se activa el OKR en vez del VOR.

Funciona según la velocidad en la que se deslizan la imagen sobre la retina, generando un movimiento ocular compensatorio en la dirección contraria, a través de la estimulación de los músculos extraoculares.

A diferencia del VOR, se ajusta el movimiento ocular mediante un mecanismo de feedback que intenta mantener la imagen alineada en la retina, en la mácula. El VOR no tiene reajuste y el OKR intenta estabilizar la escena para que se inicie el control fino de seguimiento de los objetos.

Generalizando, podemos decir que el OKR funciona para estabilizar la escena, a través de áreas amplias de ésta, mientras que los movimientos finos, requieren un target pequeño. Los movimientos finos pueden funcionar hasta velocidades que no superen los 15º seg, y si supera esta velocidad, se dispara una sacada que intenta corregir la posición y reiniciar el movimiento de seguimiento fino.

Cuando se superan los 100º seg, se inicia un movimiento sacádico constante. Cuando hay un seguimiento fino constante, se produce una ganancia de 0.9, lo que significa que si un objeto se mueve a 10º seg, los ojos lo sigue a 9º seg, con un error de desplazamiento en la retina de 1º seg. Esto explica la imposibilidad de fijar un objeto en el sitio exacto que le corresponde y explica situaciones conflictivas como el error de los árbitros al pitar un fuera de juego.

Las vergencias

Cuando se trata de ajustar la visión a diferentes distancias, es cuando se activan las vergencias.

Las vergencias son movimientos lentos y finos, con una latencia de 120 mseg aprox. Se activan tras una disparidad retiniana (macular) y pueden acompañarse de estímulo de acomodación, de reenfoque de la imagen.

Movimientos oculares en la vida cotidiana

Una de las cuestiones más importantes en la percepción visual hace referencia a los patrones de escaneo y fijación de una escena y sí estos patrones son similares en la mayoría de individuos.

Puntos de fijación ocular

Para estudiar el primer punto, patrones de escaneo y fijación, uno de los ejemplos más utilizados es el de la lectura y la inspección de cuadros.

Los primeros estudios demostraron que había una gran disparidad entre los puntos de fijación de ambos ojos y el recorrido de estos sobre la escena. Mediante los nuevos sistemas de eye tracker (registro de los movimientos oculares), se evidencio lo contrario, a pesar de ciertas disparidades entre los dos ojos, en la mayoría de casos se observa un gran paralelismo, haciendo buena la ley de Hering.

Respecto al patrón de inspección de la escena, también se encontró una cierta concordancia, se producía una fijación sobre los puntos más relevantes de la escena, caras, figuras, etc. Si la escena la analizamos con diferentes observadores, las diferencias son mayores en el patrón de inspección pero, nuevamente se observa una cierta similitud, fijación de caras, figuras y otros elementos destacables de la escena.

Otro aspecto interesante es que los ojos realizan varias sacadas por segundo, es decir que el observador permanece muy poco rato fijando un determinado punto de la escena, va saltando y vuelve sobre ese punto varias veces.

Movimientos oculares en una escena

Dos son las escuelas de pensamiento que intentan explicar el patrón de inspección de la escena.

  1. Bottoom-up (abajo-arriba): En la que los ojos se mueven según estímulos salientes de la escena que llegan a la retina, sin casi intervenir aspectos cognitivos.
  2. Top-down (arriba-abajo): Donde los movimientos no son tanto fruto de propiedades de la escena sino de fenómenos mentales, como el propósito de buscar un determinado objeto o llevar a cabo una determinada acción, claramente de índole cognitivo.

Actualmente la tendencia es pensar en un mecanismo mixto, donde se combinan los estímulos salientes (bottoom up) y aspectos cognitivos (top-down).

En esta línea de estudio, se buscó saber qué es lo que hace que un estímulo sea “saliente”. Lo primero es asumir que algo será saliente o importante, cuando reclame nuestra atención. Hay que diferenciar entre aquello que llama nuestra atención y es identificado en alguna parte de nuestra retina periférica, pero no dispara una sacada para fijarlo con la mácula y el estímulo que si provoca la foveolización con la sacada.

Qué estímulos provocan movimientos oculares y cuáles no

El primero es el más frecuente en la vida diaria y sigue un mecanismo diferente al segundo.

En el primer caso hablaríamos de un proceso preatentivo y en el segundo atentivo pleno. La diferencia entre ambos procesos queda clara cuando experimentamos con la detección de estímulos básicos en una escena con distractores. En la mayoría de casos, los individuos localizan rápidamente el elemento diferencial, en menos de 10 mseg, tiempo inferior al necesario para realizar un movimiento de foveolización, es un mecanismo automático de “pop-out” tal como lo describió Treisman en 1988.

Si el número de distractores aumenta pero el tiempo de reacción, de detección, permanece constante, se trata de un proceso de abajo arriba puro, periférico y, si el número de distractores supone un incremento del tiempo de reacción, gasto atencional, quiere decir que entran en juego mecanismos cognitivos y estamos ante un proceso de arriba abajo.

En la actualidad se asume que en la vida real funcionamos con mecanismo de pop out (en paralelo) y solo en determinadas circunstancias pasamos a foveolizar algo mediante un escrutinio secuencial postatentivo.

Cómo vemos el mundo

El mecanismo preatentivo funciona en paralelo, es decir, a la retina le llegan de forma simultánea diferentes estímulos de bajo nivel procedentes de la escena, e incluyen color, brillo, orientación, etc. Cada uno de estos estímulos produce un mapa de características y cada mapa se combina con los otros de forma aditiva, hasta formar un único mapa saliente con diversos puntos calientes que pueden llegar a captar la atención y generar un movimiento sacádico para ir a foveolizar uno de esos puntos (Itti y Koch, 2000). Uno de los problemas que planteaba esta teoría es que si hay unos puntos claramente “calientes” que llaman la atención, siempre iríamos a eso puntos y no apreciaríamos el resto de la escena. Para solventar este problema se especula con la existencia de un mecanismo de inhibición transitoria de los puntos calientes, de forma que los ojos pueden moverse libremente sobre la escena captando estímulos de bajo nivel, no salientes.

No parece que sea totalmente así pero, sí que es cierto que cuando analizamos una escena, solemos fijarnos en unos puntos determinados, de forma más o menos recursiva (puntos calientes), aunque el orden de movimientos oculares sea diferente cada vez o al comparar diferentes individuos (Tatler y Vincent, 2008, 2009).

La ubicación de objetos genera movimientos oculares

Otro aspecto importante en la detección de estímulos salientes es la ubicación de estos en la escena.

Sabemos que cuando se sitúan en regiones centrales, el nivel de detección es mayor que cuando están en la periferia, por eso toma más cuerpo la idea de que existe un sistema de cierta inhibición o de filtrado de los estímulos salientes más potentes, para dejar que los ojos realicen sacadas de inspección a lo largo de toda la escena. Estos movimientos también siguen ciertas “normas”, suelen ser de amplitud no muy grande y con mayor frecuencia sobre el eje horizontal (menos el vertical y menos el oblicuo).

Frente a la concepción bottoom-up de los estímulos salientes, se sitúa la hipótesis top-down, que se confirma con los estudios que demuestran que el movimiento de los ojos cambia al pasar de observar simplemente una cosa a cuando pedimos al observador que busque algo determinado en la escena. En este momento el tracker de los ojos muestra un patrón de movimientos completamente diferente, lo cual evidencia que esos movimientos pasan a estar determinados por un proceso mental de arriba hacia abajo (top-down).

Movimientos oculares, buscar u observar

La idea más generalizada es que en situaciones donde no hay una influencia fuerte de la mente (búsqueda de algo, etc), predominan los mecanismo bottoom-up, mientras que cuando se inicia un proceso mental, predominan los mecanismos top-down.

Uno de los puntos que todavía plantea dudas es el hecho de cómo reconocemos un determinado objeto, cúando captamos alguno de los aspectos salientes en la retina periférica o cúando se produce la sacada que lo foveoliza.

Movimientos oculares en el día a día

Parece que en situaciones donde no hay una guía mental clara, la visión seguiría un mecanismo de mapas master formados por los mapas de bajo nivel fruto de los estímulos salientes que parten de la retina periférica. Se genera un mapa de calidad media, suficiente para que tengamos una visión que nos oriente en la escena, minimizando los movimientos oculares para foveolizar (Vincent, 2007).

La foveolización aparece en las tareas concretas guiadas por una idea o proceso mental, generalmente de búsqueda de algo y, condicionado por experiencias cognitivas previas (Torralva y Oliva 2003 y 2006). Si buscamos una jarra de agua en una foto de una cocina, inspeccionaremos primero la encimera antes que el suelo, es más probable que esté en esa zona de la cocina en la foto.

Quiero ver algo

El papel que ejerce el pensamiento, la mente, a la hora de guiar los movimientos oculares, parece ser cada vez más relevante. Hay experiencias realizadas con el eye tracker en una escena donde se han filtrado los estímulos salientes, como velado de caras, etc y se observa que no hay una reducción en la fijación de puntos calientes, como los ojos, nariz y boca, aunque no se aprecien correctamente. Estos resultados estarían en línea con el hecho de que la mayoría de estos puntos salientes, como los ojos en una cara, tienen una cierta base cognitiva.

Respecto a las caras, en el humano y solo en este, se detectan según patrones de pop-out, <10 mseg, incluso en escenas con un amplio grupo de distractores (Hershler, 2005).

Tiempo de fijación ocular en las escenas

Otro punto de interés es el movimiento ocular respecto al tiempo que miramos o inspeccionamos una escena.

No está claro que en las fases iniciales del reconocimiento “manden” los mecanismos bottoom-up, basados en estímulos salientes y que a medida que pasa el tiempo vayan perdiendo efecto. Lo que sí parece más aceptado es el tiempo en que mantenemos la fijación en algún punto de la escena. En las fases iniciales estaría en torno a 250 mseg y posteriormente se irá alargando, hasta llegar a los 350 o 400 mseg. Es como si primero realizáramos una inspección general rápida y luego fuéramos analizando con más detenimiento alguno de los puntos escrutados.

Cómo vemos el mundo que nos rodea

Si preguntamos a cualquier individuo cómo vemos, seguramente responderá que vemos de forma continua y completa, es decir como cuando vemos una película. La realidad es muy diferente.

El proceso de visión es subjetivo, incompleto y discontinuo. La imagen que procesamos, en la mayor parte del tiempo, no procede de una fijación macular sino de la retina periférica o, en el mejor de los casos, paramacular, es decir, una imagen de bajo nivel, tan solo cuando foveolizamos es cuando realmente percibimos los detalles del mundo exterior y eso ocupa un tiempo mínimo en el cómputo global del periodo de visión a lo largo del día. Por otra parte, en un tercio del tiempo, durante los movimientos sacádicos, nuestra visión es ciega y, finalmente, la imagen del mundo exterior que nos formamos en nuestra psique, está muy influenciada por aspectos cognitivos y emocionales, lo cual supone un concepto de visión subjetiva, no objetiva, donde lo qué “ve” o cómo lo ve un individuo, será diferente a cómo lo ve otro individuo.

Visión discontinua

Que la visión es discontinua lo vemos en el hecho de que uno mismo no es consciente o no puede percibir los movimientos sacádicos de los ojos. Si nos colocados frente al espejo no somos capaces de ver este tipo de movimientos oculares, sin embargo es algo evidente cuando lo comprobamos en el registro que hace un eye-tracker. La continuidad de la visión es una mera ilusión.

Visión incompleta

La visión incompleta es algo que hasta la década de los noventa no se admitió, hasta entonces se creía que la visión suponía un análisis de la escena según el método “punto por punto”, análisis detallado de cada espacio y que su adición permitía reconstruir la escena como si de un cuadro se tratara, es lo que se conoce como “picture in the mind”.

Los estudios de varios autores, entre ellos O´Regan (2000), demostraron que cuando observamos una escena, un cuadro o foto, si durante la fase ciega de una sacada, cambiamos algo de esa escena, aunque sea bastante significativo, en la mayoría de casos no lo apreciaremos, seguiremos percibiendo la escena como en su inicio.

Una posible deducción de este hecho es que no vemos mediante una representación interna del mundo que nos rodea. Para O´Regan, lo que ocurre es que nos formamos una idea del entorno que nos rodea, de bajo nivel, justo para orientarnos y, sólo en determinadas circunstancias, detectamos los detalles de una parte de ese entorno, cuando nos interesamos por algo en concreto y lo foveolizamos.

La visión y el grado de atención

El grado de atención que ponemos en cada momento es un factor fundamental a la hora de explicar lo que vemos. Es muy diferente los detalles que recordaremos si andamos por un camino dando un paseo, que si andamos por un camino desconocido intentando recordar por donde vamos si sabemos que debemos repetirlo otro día como guías de senderismo.

Para Rensink, 2000, tal como se muestra en la figura original de su trabajo, más que una imagen tipo cuadro (en dos dimensiones), lo que hacemos es construir una representación virtual en 3D con niveles de detalle muy variables, sólo los más significativo para cada propósito (orientación, artístico, buscar setas, etc).

mecanismos del movimiento ocular

Movimientos oculares relacionados con el lenguaje

La representación virtual de Rensink estaría directamente ligada con la idea de representación integrada de Altman y Kamide, 2007, que señalan la relación entre la información visual y del lenguaje. Si un observador lo dejamos en una habitación y luego lo trasladamos a otra donde no hay nada, si en la primera había una ventana, cuando hablamos de la ventana o de una ventana en general, se constata que en la mayoría de casos realiza un movimiento de los ojos hacia la posición en donde se encontraba la ventana en la primera habitación, como si la buscáramos dentro de una construcción virtual en nuestra mente, donde conjugan espacio y visión.

Esta idea de integrar lenguaje y visión se sitúa más en la concepción dinámica de la percepción visual, alejándose de la concepción pictórica estática de antaño. La información hablada y la representación espacial generan un entorno virtual mucho más efectivo.

Imaginar espacios y los ojos

El espacio virtual puede ser de dos tipos:

Egocéntrico: Representamos aquello que veríamos delante nuestro, como cuando buscamos un objeto determinado en una habitación, nos fijamos en objetos más pequeños que nuestro cuerpo.

Alocéntrico: El espacio virtual es mayor, toda la habitación o el apartamento donde estamos, en general es una representación mayor que nosotros (Hayhoe, 2008)

Otro aspecto importante es cómo retenemos o cuánto retenemos, la información que estamos utilizando del entorno en un momento determinado.

Cuando hacemos algo que requiere información visual, hemos dicho que tendemos a construir una representación virtual del entorno y de lo que tenemos delante de nosotros, el objeto que manipulamos, ese escenario virtual no está formado con todos los detalles de la realidad, sólo entran aquellos aspectos que nos son útiles para realizar aquella tarea determinada.

Tiempo de retención visual

El problema que se plantea ahora es, no solo qué elementos entran en la representación mental sino, en cómo van apareciendo y desapareciendo, ya que hemos dicho que la representación virtual es dinámica, no pictórica estática. Tatler, 2001, constató que si a un individuo que está realizando un determinado tipo de tarea, como puede ser servir café, y en la mitad de la tarea se le dice que vaya a encender las luces (apretar el interruptor que está en una pared), y al finalizar esta acción se le pide que describa lo que recuerda, éste dará una gran cantidad de detalles de la pared pero muy pocos sobre la tarea inicial de ser café, que tan sólo hace unos segundos ocupaba su atención principal.

La conclusión a la que se llega es que utilizamos solo la información del entorno, la que es mínimamente necesaria para realizar las tareas que estamos realizando en un momento preciso y que esta información va cambiando rápidamente. Lo que utilizamos es de forma instantánea, sólo mientras nos es útil, así cuando cambiamos a otra cosa, ese dato se elimina de la memoria operativa, es como si no interesara guardarlo, ya no es útil en la representación virtual y mantenerlo puede interferir con los nuevos puntos entrantes y conducir a error, además del gasto energético que supone mantener más datos de los necesarios.

Movimientos visuales en tareas planificadas

Cuando avanzamos en la idea anterior de la representación virtual, como algo dinámico, alcanza su momento álgido cuando se trata de tareas con una actividad motora importante, como jugar al tenis.

En toda acción motora cabe diferenciar dos niveles:

  1. Especificación de la tarea.
  2. Ejecución de la tarea.

Tareas planificadas

La especificación de la tarea supone todo aquello que está relacionado con la planificación de una tarea, la lista de acciones necesarias para conseguir el objetivo propuesto.

Cabe diferenciar entre tareas rutinarias y las que no lo son.

En las tareas rutinarias no se necesita una supervisión detallada, las solemos hacer de forma semiautomática, y se produce un proceso competitivo de esquemas que guían de forma rápida y con poco gasto energético nuestra actividad en el desarrollo de una tarea.

En las tareas no rutinarias acontecen los mecanismos de esquemas secuenciales, que requieren mayor tiempo y son los propios de las tareas no rutinarias. En este último caso, las tareas están marcadas por el sistema atencional de supervisión, que supone la toma de consciencia de los pasos a realizar en una tarea. Este sistema se localiza en la región dorsal prefrontal del cortex, mientras que la planificación de la tarea se realiza en el cortex premotor y los ganglios basales.

Contenido de autoría. Propiedad de Área Oftalmológica Avanzada
Resumen
Movimientos oculares
Nombre del artículo
Movimientos oculares
Descripción
Explicamos los movimientos oculares al detalle y cómo vemos a lo largo del día. Este es uno de los capítulos sobre la visión, el ojo y cómo vemos.
Autor
Nombre del editor
Área Oftalmológica Avanzada
Logotipo del editor
Call Now Button