在本章中,我们将解决问题 眼球运动 或动态视觉。 我们已经看到了运动视觉的机制,现在我们将看到来自外部世界的所有信息是如何从不断变化的场景中处理的。

眼球运动

眼球运动的类型

令人惊讶的是,当我们分析眼球运动时,大多数时候我们并没有持续地注视或跟随一个物体。 实际上,眼睛所做的就是在场景中从一个点“跳”到另一个点,直到最后,我们将目光固定在某物上,并通过跟随该物体的运动或将其调整为我们的运动来保持焦点,如果是我们没有停止。

一般来说,我们将运动分为三类:

应该添加的 趋同 作为与之前不同的运动。

扫视

扫视是最快的眼球运动,它将眼睛重定向到我们周围场景的新点。

在扫视期间,大脑是失明的,它不处理视觉信息,只有在我们固定一个物体时才会这样做。 为了实现这一点,视觉感知系统使用了两种机制,第一种与解决问题的能力有关。 视网膜,只有 污点 它具有高分辨率,可以将详细信息发送到大脑,因此,在一个物体被固定之前,直到它形成中央凹,周边视网膜发送的信息质量很低,比它的 10º 低 20 倍.

移动物体中的眼球运动

当我们注视一个物体时,无论我们是在移动还是静止不动但头部移动,为了稳定物体和我们周围的环境,我们有两个非常强大的机制,即眼前庭反射 (VOR) 和视动反射。 OKR)。

使用这些系统,我们可以稳定环境和物体,并建立一个缓慢且受控的跟踪该物体的运动,无论它是在移动还是我们在移动或两者兼而有之(在限制范围内)。

眼球运动频率

众所周知,我们平均每秒进行 1 到 4 次麻袋操作,例如当我们阅读时,4 次是最大次数。 一次扫视需要 30 毫秒,而我们保持注视的时间在 300 毫秒左右,这意味着如果我们在扫视期间没有看到,就相当于说我们每天失明 1.5 小时。

眼跳是双侧对称的,只有当它是聚散的眼球运动时才会改变一些东西。

眼跳在所有个体中都具有非常相似的特征。 它的速度不是恒定的,而是根据 amp它的行程长度,更快,更耐用,因为它增加了 amp纬度,具有初始上升阶段和随后的饱和。 它们是在外部刺激到达后触发的,例如视觉场景中某物的运动、新物体的出现,但一般来说,当我们做一些需要视觉信息但不需要搜索任何特定对象。 例如,当我们走路时,眼睛以扫视的方式移动,扫描我们面前的场景,处理质量最低但足以引导我们而不是绊倒的信息,它们是比以前慢一些的扫视,130 毫秒。

眼球运动功能

在大多数情况下,眼跳会在肌肉群的作用下从一侧到另一侧交替位置,注视方向(如果右侧内直肌和左侧外直肌被激活,向左看,将进行下一次扫视) ,向右,激活右侧和中间左侧。垂直方向的运动不太频繁。

在现实生活中,环境扫描发生在 amp海拔 30 度,其中 20 度对应于眼睛、眼跳和 10 度对应于头部的运动。

控制眼球运动

眼球运动的控制在三个层次上进行:

  1. 大脑皮层,负责 自愿运动.
  2. 中脑结构,尤其是上丘, 负责提款.
  3. 脑干,负责运动系统 直接控制眼部肌肉.

眼肌接受来自脑干细胞核的神经支配,而脑干细胞核又接受来自运动前核的神经支配,运动前核也位于脑干中,位于前者上方。 运动前核接受来自旁正中脑桥网状结构的神经支配,该结构负责扫视(突发单位)和在物体固定期间保持眼睛的位置(强直单位)。 在这个层面也是脑桥被盖的网状核,负责精细的跟踪运动。

前庭核的神经支配也到达运动前核,负责在头部运动期间稳定视力。 负责不同眼球运动的神经支配模式在运动前核中组织。

视觉方向

更高的水平是上丘,不仅负责眼睛的视觉定位,还负责头部和躯干的视觉定位。 它负责扫视和扫视相关的头部运动。 视觉信号到达其表层区域,而听觉和体感信号到达其深层。 丘接受来自皮层、视觉额叶区域(额叶视野,FEF)、外侧顶叶区域(LIP)和 V1 的神经支配。 每个半球的 F​​EF 和 LIP 区域将通过丘脑相互连接。

眼跳似乎是直接从视觉额叶区域或上丘激活的,尽管 FEF 代表了动眼神经系统控制的更高阶段。 FEF 还将负责物体的精细固定和跟踪。

外侧顶叶区域的作用还不是很清楚。 似乎这与视觉刺激的运动功能、手、头等运动的协调性有关。

眼球运动和头部运动

来自背外侧前额叶皮层的刺激将到达视觉额叶区域,该区域与行动计划的制定以及与我们周围世界的相互关系有关。

当头部移动时,眼睛会发生与头部方向相反的补偿运动以稳定图像。 这种现象是通过 VOR 和 OKR 系统实现的。

VOR 系统

VOR 系统通过耳朵的半规管检测头部的速度,并通过动眼神经核向控制眼外肌的神经核发送补偿信号。

补偿反射实际上与头部相同,增益等于 1,非常快,大约 15 毫秒。 如果旋转刺激继续存在,例如当我们在旋转的鼓前,当 amp眼球运动角度超过 50º,眼球回到起始位置时会出现扫视,开始新的跟踪运动,类似于 眼球震颤.

OKR系统

当头部的转动率不是那么高时,OKR 被激活而不是 VOR。

它根据图像在视网膜上滑动的速度工作,通过刺激眼球向相反方向产生补偿性眼球运动。 眼外肌.

与 VOR 不同,眼球运动是通过一种反馈机制来调整的,该机制试图使图像在视网膜上的黄斑中保持对齐。 VOR 没有重置,OKR 尝试稳定场景,以便启动对象的精细跟踪控制。

概括地说,我们可以说 OKR 通过区域来稳定场景 amp它的谎言,而精细的动作需要一个小目标。 精细运动可以以不超过 15º sec 的速度运行,如果超过此速度,则会触发一个扫视,尝试纠正位置并重新启动精细跟踪运动。

当超过 100º 秒时,会开始持续的扫视运动。 当有恒定的精细跟踪时,会产生 0.9 的增益,这意味着如果物体以 10 秒的速度移动,眼睛会以 9 秒的速度跟随它,视网膜上的位移误差为 1 秒。 这解释了不可能将物体固定在与其对应的确切位置,并解释了冲突的情况,例如裁判在吹哨越位时的错误。

趋同

当谈到调整不同距离的视力时,就会出现收敛。

辐辏是缓慢而精细的运动,延迟约为 120 毫秒。 它们在视网膜(黄斑)差异后被激活,并且可以伴随着调节刺激,重新聚焦图像。

日常生活中的眼球运动

视觉感知中最重要的问题之一是场景的扫描和注视模式,以及这些模式在大多数人中是否相似。

眼睛注视点

为了研究第一点,扫描和注视模式,最常用的例子之一是帧读取和检查。

最初的研究表明,双眼的注视点与它们在场景中的路径之间存在很大差异。 通过新的眼球追踪系统(眼球运动记录),尽管两只眼睛之间存在某些差异,但在大多数情况下观察到了很大的平行度,这使得赫林定律很好。

关于现场的检查模式,也发现了一定的一致性,对现场最相关的点、人脸、人物等都有一个注视。 如果用不同的观察者分析场景,检查模式的差异会更大,但同样会观察到一定的相似性,面部、人物和场景的其他显着元素的固定。

另一个有趣的方面是眼睛每秒会进行几次扫视,也就是说,观察者会在很短的时间内固定场景中的某个点,然后多次跳跃并返回该点。

场景中的眼球运动

有两种思想流派试图解释现场的检查模式。

  1. 自下而上(自下而上):眼睛根据来自场景的刺激到达视网膜而移动,几乎没有认知方面的干预。
  2. 自顶向下:动作不是场景属性的结果,而是心理现象的结果,例如寻找某个对象或执行某个动作的目的,显然是认知性质的。

目前的趋势是考虑一种混合机制,其中外向刺激(自下而上)和认知方面(自上而下)相结合。

在这方面的研究中,我们试图了解是什么让刺激“外发”。 首先是假设 当某件事需要我们注意时,它会变得突出或重要. 我们必须区分什么引起了我们的注意,并在我们的周边视网膜的某些部分被识别,但不会触发一个扫视来固定黄斑,以及确实导致扫视形成小凹的刺激。

哪些刺激会引起眼球运动,哪些不会?

第一个是日常生活中最常见的,并且遵循与第二个不同的机制。

在第一种情况下,我们将谈论前注意过程,而在第二种情况下,我们将谈论完全注意的过程。 当我们尝试在带有干扰物的场景中检测基本刺激时,这两个过程之间的差异变得很明显。 在大多数情况下,个人可以在不到 10 毫秒的时间内快速定位差异元件,比执行中心凹运动所需的时间更短,这是 Treisman 在 1988 年描述的自动“弹出”机制。

如果干扰物的数量增加,但检测的反应时间保持不变,这是一个纯粹的、外围自下而上的过程,如果干扰物的数量意味着反应时间、注意力支出的增加,则意味着认知机制来了发挥作用,我们正面临一个自上而下的过程。

目前假设在现实生活中,我们使用弹出机制(并行)运行,并且只有在某些情况下,我们才会通过后注意顺序审查继续关注某些东西。

我们如何看待世界

预注意机制并行工作,即来自场景的不同低级刺激同时到达视网膜,包括颜色、亮度、方向等。 这些刺激中的每一个都会产生一个特征图,并且每个图都以一种相加的方式与其他图相结合,直到形成一个带有几个热点的单一传出图,这些热点可以吸引注意力并产生一个扫视运动来使其中一个小凹形成。点(Itti 和 Koch,2000 年)。 这个理论提出的问题之一是,如果有明显的“热点”吸引注意力,我们总是会去那些点,而不是欣赏场景的其余部分。 为了解决这个问题,推测存在一种瞬时热点抑制机制,使眼睛可以在捕捉低水平、非显着刺激的场景上自由移动。

看起来情况并非完全如此,但确实,当我们分析一个场景时,我们倾向于关注某些点,或多或少递归(热点),即使每个眼球运动的顺序不同时间或比较不同个体时(Tatler and Vincent, 2008, 2009)。

物体的位置会产生眼球运动

检测显着刺激的另一个重要方面是它们在场景中的位置。

我们知道 当它们位于中心区域时,检测水平高于它们在外围区域时,这就是为什么存在某种抑制或过滤最强大的输出刺激的系统的想法具有更多的实质,让眼睛在整个场景中执行检查扫视。 这些动作也遵循一定的“规则”,它们通常是 amp纬度不是很大,在水平轴上更频繁(更少垂直,更少倾斜)。

与显着刺激的自下而上的概念相反,自上而下的假设被研究证实,当从简单地观察一件事物到当我们要求观察者寻找确定的事物时,眼睛的运动会发生变化当场。 此时,眼动仪显示出完全不同的运动模式,这表明这些运动是由自上而下的心理过程决定的。

眼球运动,搜索或观察

最普遍的想法是,在没有来自思想的强烈影响的情况下(寻找某物等),自下而上的机制占主导地位,而当心理过程开始时,自上而下的机制占主导地位。

仍然引起怀疑的一点是我们如何识别某个物体,当我们捕捉到周边视网膜的一些显着方面或当产生小凹的眼跳时。

日常生活中的眼球运动

似乎在没有明确的心理指导的情况下,视觉将遵循由从外围视网膜开始的传出刺激产生的低级地图形成的主地图机制。 生成了一个中等质量的地图,足以让我们有一个在场景中引导我们的视觉,最大限度地减少眼球运动以形成中央凹(Vincent,2007)。

Foveolization 出现在由想法或心理过程引导的具体任务中, 通常是在寻找某些东西并受先前的认知经验的制约(Torralva and Oliva 2003 and 2006)。 如果我们在厨房的照片中寻找一壶水,我们会先检查地板前的柜台,它更有可能在照片中厨房的那个区域。

我想看点东西

思想在引导眼球运动方面所起的作用似乎越来越重要。 在外向刺激已被过滤的场景中使用眼动仪进行了体验,例如面纱等,观察到对热点的固定没有减少,例如眼睛、鼻子和嘴,虽然欣赏正确。 这些结果符合这样一个事实,即大多数这些显着点,如脸上的眼睛,都有一些认知基础。

关于人脸,只有在这个人脸中,它们是根据弹出模式检测的,<10 毫秒,即使在具有 amp一组干扰物(Hershler,2005)。

场景中的注视时间

另一个有趣的点是相对于我们观看或检查场景的时间的眼球运动。

目前尚不清楚在识别的初始阶段,自下而上的机制,基于传出的刺激,“发送”,随着时间的推移,它们会失去作用。 似乎更被接受的是我们在场景中的某个点保持固定的时间。 在初始阶段,它大约是 250 毫秒,之后会延长,直到达到 350 或 400 毫秒。 就好像我们首先进行了一次快速的全面检查,然后我们更详细地分析了一些经过审查的点。

我们如何看待我们周围的世界

如果我们问任何一个人我们是怎么看的,他们肯定会回答说我们看到的是连续的、完整的,也就是说,就像我们看电影一样。 现实非常不同。

视觉过程是主观的、不完整的和不连续的。 在大多数情况下,我们处理的图像不是来自黄斑固定,而是来自周边视网膜,或者在最好的情况下,是黄斑旁的,即低水平的图像,只有当我们出现中心凹时实际上,我们感知外部世界的细节,这在全天视觉周期的全局计算中占据了最少的时间。 另一方面,在三分之一的时间里,在扫视运动中,我们的视觉是盲目的,最后,我们在心灵中形成的外部世界的形象受到认知和情感方面的高度影响,这意味着一个概念主观视觉,而不是客观的,一个人“看到”什么或他如何看待它,将不同于另一个人如何看待它。

不连续的视觉

视觉是不连续的,我们看到它是因为自己没有意识到或无法感知眼睛的扫视运动。 如果我们被放在镜子前,我们就看不到这种类型的眼球运动,但是当我们在眼动仪制作的寄存器中检查它时,这是很明显的。 视觉的连续性只是一种幻觉。

不完整的视力

不完整的视觉直到九十年代才被承认,在此之前,人们认为视觉涉及根据“逐点”方法对场景进行分析,对每个空间进行详细分析,并且它的添加允许重建场景仿佛是一幅画,这就是所谓的“脑海中的画面”。

包括 O'Regan (2000) 在内的几位作者的研究表明,当我们看一个场景、一幅画或一张照片时,如果在眼跳的盲阶段,我们会改变那个场景,即使它非常重要,在大多数情况下,我们不会欣赏它,我们将继续像开始一样感知场景。

从这一事实可以得出的一个推论是,我们没有看穿我们周围世界的内部表征。 对于 O'Regan 来说,发生的事情是我们在低层次上形成了对我们周围环境的想法,只是为了定位自己,并且只有在某些情况下,我们才会检测到该环境的一部分的细节,当我们对混凝土中的某些东西感兴趣并对其进行中心凹定位时。

视力和注意力水平

在解释我们所看到的东西时,我们每时每刻的关注程度是一个基本因素. 如果我们沿着一条小径散步,我们将记住的细节与我们沿着一条未知的小径行走试图记住我们要去的地方,如果我们知道我们必须改天作为远足向导重复一遍,我们将记住的细节是非常不同的。

对于 Rensink,2000,如他作品的原始图形所示,我们所做的是构建一个具有高度可变细节水平的虚拟 3D 表示,而不是一个盒子型图像(二维),只有最重要的每个目的(方向、艺术、寻找蘑菇等)。

眼球运动机制

与语言有关的眼球运动

Rensink 的虚拟表示将直接与 Altman 和 Kamide, 2007 的集成表示的想法相关联,他们指出了视觉信息和语言之间的关系。 如果我们把一个观察者留在一个房间里,然后把他移到另一个什么都没有的房间里,如果第一个房间有一个窗户,当我们谈论窗户或一般的窗户时,会发现在大多数情况下,他会做出一个视线移向第一个房间窗户所在的位置,就好像我们在我们脑海中的虚拟结构中寻找它,空间和视觉结合在一起。

这种将语言与视觉相结合的想法更多地位于视觉感知的动态概念中,远离了过去的静态图像概念。 语音信息和空间表示创建了一个更有效的虚拟环境。

想象空间和眼睛

虚拟空间可以有两种类型:

以自我为中心:我们代表我们将在我们面前看到的东西,就像当我们在房间里寻找某个物体时,我们看到的物体比我们的身体还小。

异中心:虚拟空间更大,我们所在的整个房间或公寓,通常是比我们更大的表示(Hayhoe,2008)

另一个重要方面是我们如何保留或保留多少我们在给定时间从环境中使用的信息。

当我们做一些需要视觉信息的事情时,我们说过我们倾向于构建环境的虚拟表示,以及我们面前的东西,我们操纵的对象,这个虚拟场景不是由所有细节组成的现实中,只有那些对我们执行特定任务有用的方面。

视觉保留时间

现在出现的问题是,不仅是什么元素进入了心理表征,还有它们是如何出现和消失的,因为我们已经说过虚拟表征是动态的,而不是静态的图像。 Tatler, 2001 发现,如果一个人正在执行某种类型的任务,例如提供咖啡,在任务的中间被告知打开灯(按下墙上的开关),然后在结束时这个动作他被要求描述他记得什么,他会提供很多关于墙壁的细节,但很少关于成为咖啡馆的最初任务,这只是几秒钟前占据了他的主要注意力。

得出的结论是,我们只使用来自环境的信息,这些信息是执行我们在精确时刻执行的任务所需的最低限度的信息,并且这些信息正在迅速变化。 我们使用的东西是瞬时的,只有当它对我们有用的时候,所以当我们换成别的东西时,那个数据就从工作内存中删除了,就好像保存它没有意思,它不再有用了虚拟表示和保留它可能会干扰新的传入点并导致错误,此外还需要维护不必要的更多数据的能源费用。

计划任务中的视觉运动

当我们继续之前的虚拟表示概念时,作为动态的东西,它在涉及具有重要运动活动的任务时达到顶峰,例如打网球。

在所有运动动作中,可以区分两个层次:

  1. 任务规范。
  2. 任务执行。

计划任务

任务规范涉及与任务计划相关的所有内容,即实现建议目标所需的行动列表。

区分日常任务和非日常任务非常重要。

日常工作 不需要详细的监督,我们通常会半自动地进行,并且会产生一个竞争性的方案过程,该过程可以快速且能量消耗少,指导我们在任务开发中的活动。

非常规任务 顺序方案的机制出现,这需要更多时间并且是非常规任务的典型。 在后一种情况下,任务由注意力监督系统标记,这涉及到意识到要在任务中执行的步骤。 该系统位于背侧前额叶皮层,而任务计划则在前运动皮层和基底神经节中进行。

总结
眼球运动
文章的名称
眼球运动
描述
我们详细解释眼球运动以及我们一整天的观察方式。 这是关于视觉、眼睛和我们如何看待的章节之一。
作者
出版商名称
Área Oftalmológica Avanzada
出版商徽标