Dans ce chapitre nous traiterons des perception visuelle et comment nous percevons les objets comme un tout.

Nous reviendrons sur certains des aspects les plus pertinents de la façon dont notre système perceptif unifie l'information, comment il différencie ce qu'est l'objet par rapport au reste de la scène, le "fond" et comment le contour de la "proto-image" est élaboré du point de vue computationnel, avec la théorie de David Marr et du point de vue des stimuli émergents de Treisman et Biederman.

Enfin, nous verrons l'importance du contexte et comment la scène reste constante malgré les changements de taille ou les conditions d'éclairage de l'environnement.

perception visuelle des objets

La perception visuelle des objets a un caractère psychophysique marqué, c'est-à-dire qu'à partir de caractéristiques individuelles, on passe à des groupes de caractéristiques, les objets eux-mêmes et les scènes.

Actuellement, la plupart des chercheurs admettent que processus visuel Elle est due à la combinaison des stimuli, des sensations qui les déterminent et de leur intégration dans différentes zones du cerveau.

Les premiers à comprendre ce processus multiple furent les membres de la Gestalt. Max Wertheimer a été l'initiateur de ce courant en étudiant le phénomène du mouvement apparent, où une séquence d'images, fixes et statiques, présentées avec une fréquence adéquate, étaient capables de générer la sensation de mouvement. L'école de Francfort avec sa Gestalt Psychology a remis en question le mouvement structuraliste qui dominait à cette époque et qui proposait que la perception soit créée à partir de sensations.

Les psychologues de la Gestalt ont étudié les illusions d'optique, concluant que le tout est différent de la somme des parties. Ils ont étudié la manière dont les petits éléments des objets sont regroupés, ils ont proposé ce qu'on appelle des lois d'organisation perceptive : loi de grossesse, loi de similitude, loi de bonne continuation, loi de proximité, loi de destin commun et loi de familiarité.

Bien que ces principes organisateurs soient appelés lois, pour la plupart des psychologues aujourd'hui, ils correspondraient à des heuristiques ou à des règles générales qui aident à résoudre un problème, contrairement à une loi ou à un algorithme, qui est un processus qui conduit toujours à la solution d'un problème.

La considération de l'heuristique aux principes de Gestalt, est due au fait que son application n'est pas toujours parfaite, en termes d'informations qu'elle fournit. Parfois, cela peut nous faire faire des erreurs lors de l'interprétation de ce que nous percevons, cependant, l'utilisation de l'heuristique est amplargement diffusée dans le cerveau, dans la façon dont on résout les problèmes, l'utilisation d'une heuristique est beaucoup plus rapide que l'application d'algorithmes, avec un coût énergétique beaucoup plus élevé.

Il semble qu'à la suite de l'évolution, nous nous soyons habitués à utiliser l'heuristique dans les décisions que nous prenons et lors de la résolution de tout problème.

Trois nouveaux principes d'organisation perceptive ont récemment été proposés (Stephen Palmer, 1992 et 1999) :

  • Le principe de la région commune.
  • principe de liaison entre les éléments.
  • Le principe de synchronie.

L'un des problèmes qui intéressaient les chercheurs en Gestalt dans la perception visuelle était le soi-disant phénomène de ségrégation, que nous voyons dans les cas figure-fond, comme dans l'exemple de la coupe et des visages de Rubin.

perception visuelle

Qu'est-ce qui nous fait voir ou prendre conscience de telle ou telle chose, qu'est-ce qui détermine que l'une ou l'autre prédomine.

Il semble qu'il existe une série d'indices qui motivent la prédominance de quelque chose comme figure et de quelque chose comme arrière-plan. Les zones symétriques ont tendance à être perçues comme des figures, de la même manière que des zones plus petites par rapport à des zones plus grandes, ces dernières constituant le fond et les éléments significatifs, sont également plus susceptibles d'être perçues comme des figures.

constitution d'objets

Approche computationnelle de Marr

Pour David Marr, le système visuel il agirait comme s'il s'agissait d'un ordinateur programmé pour voir des objets. La scène qui se présente devant nous pénétrerait les yeux et serait projetée sur le rétine.

La première étape de l'analyse sera déterminer les zones claires et sombres ainsi que les zones où des changements d'intensité se produisent. Avec cela, une première esquisse des formes qui font partie de la scène commence, c'est ce qu'on appelle "l'esquisse primaire", qui comprend des zones fermées telles que des cercles, des ellipses ou des carrés, qui définiraient les objets.

Cette première étape consiste à définir les objets de la scène, pas leurs détails, leurs ombres ou leurs changements d'éclairage.

Selon Marr, le système visuel remplit cette fonction en analysant mathématiquement les changements d'intensité de l'image et ce que l'auteur appelle les contraintes naturelles du monde.

La prochaine étape est souches primitives de groupe. De la même manière que les psychologues de la Gestalt proposent.

Or les croquis primitifs sont regroupés selon des critères qui supposent l'utilisation du processus descendant, bien que l'auteur ne le précise pas complètement. Une représentation en surface des objets de la scène serait obtenue (croquis 2-1/2 D), aboutissant à une reconstruction tridimensionnelle de la scène (croquis 3D).

Théorie de l'intégration des fonctionnalités

La théorie de l'intégration des caractéristiques, également connue sous le nom de TIC et proposée par Treisman et Gelade (1987,1993, 1998 et ​​XNUMX), stipule que la perception des objets se produit selon une séquence d'étapes qui commence dans une première phase de forme "pré-attentionnel", où le système analyse l'image et détermine l'existence des caractéristiques qui forment les unités de base de la perception, telles que la courbure, l'orientation, la couleur, le mouvement, etc.

Dans une deuxième phase,stade d'attention focalisée», les caractéristiques de base sont combinées pour donner lieu à la perception de l'objet.

Une fois l'objet identifié, il est comparé aux données d'objets similaires préalablement catégorisés et stockés en mémoire.

Le passage du premier au second stade est la clé de cette théorie. Le système visuel agit en déterminant les frontières émergentes entre les zones composées d'éléments différents et au moyen d'une procédure de recherche visuelle. Dans une scène, nous pouvons avoir deux ensembles d'éléments, l'un à côté de l'autre pour créer campos textural, comme sur la figure. Si les deux zones contiennent des caractéristiques différentes, une frontière "surgit" immédiatement entre les deux zones, "émergente", comme sur la figure, où les composants ont des orientations différentes.

reconnaissance d'objet

Dans l'image suivante, nous pouvons voir la même situation plus clairement.

Les limites sont produites parce que l'un des composants a des lignes qui se croisent et l'autre pas (a et b), alors que dans la figure c, cela ne se produit pas, le modèle contextuel est le même et aucune limite émergente n'est produite (Nathdurf , 1990).

comment nous voyons les objets

Le processus de recherche visuelle

El processus de recherche visuelle suivre deux directives.

Un détection quasi-automatique, comme dans le cas de la figure, où le « O » se détache sur le fond des autres lettres qui l'entourent « V » et qui est perçu immédiatement, à la fois dans la situation (a), avec peu de distracteurs, et dans (b ), avec plus de distracteurs. Dans l'autre figure quelque chose de différent se produit, un détection qui demande un plus grand effort attentionnel, percevoir le « R » est plus difficile et se complique lorsqu'on passe de peu à beaucoup de distracteurs, ce qui implique une plus grande dépense de temps et d'énergie.

perception des formes

Dans les exemples ci-dessus, dans le premier cas, la détection est automatique, et s'appelle mettre en évidence dans "sortir ».

Détection automatique d'objet Vs avec un plus grand effort visuel

Le point culminant sur le pop-up est caractérisé car la détection du stimulus, en l'occurrence la lettre O, était indépendante du nombre de distracteurs qui l'entourent, les lettres "V", alors que dans les cas qui n'émergeaient pas automatiquement, comme dans l'exemple de la lettre "R", le nombre de distracteurs a maintenant une influence sur le temps nécessaire à leur détection, plus il y a de distracteurs et plus ils ressemblent au stimulus à détecter, plus il faut de temps pour leur identification, comme on peut le voir sur le graphique, qui représente une étude typique de la recherche visuelle, où la ligne (a) représente le cas du O entre le V et la ligne (b) celui du R entre P et Q, où le nombre de distracteurs augmente le temps de détection.

détection d'objets et de formes

En étudiant les stimuli qui avaient la caractéristique d'être émergents, Treisman a constaté que les plus importants étaient :

  • Courbure.
  • Alignement
  • Mouvement.
  • Couleur.
  • Luminosité
  • Adresse.
  • L'éclairage 

Ces caractéristiques seraient détectées au début de la phase pré-attentionnelle.

Les travaux expérimentaux de Treisman ont montré que les traits émergents sont perçus indépendamment (lignes, couleur, textures, mouvement, orientation, etc.) et c'est dans un stade ultérieur qu'ils seraient intégrés pour façonner les éléments qui composent la scène.

Cette première phase, d'indépendance naissante, s'explique par le fait que chacune de ces caractéristiques est traitée à un endroit différent du cerveau, les mouvements sont enregistrés dans les aires pariétales tandis que les visages dans la région inférotemporale.

L'étape de combinaison des caractéristiques perçues dans la phase pré-attentionnelle se produirait grâce aux mécanismes de l'attention focalisée, qui agiraient comme la "colle" qui unit les caractéristiques à un endroit spécifique.

Reconnaissance par composants

Proposé par Irving Biederman en 1987 et conforme à celui fourni par Marr et Treisman. La principale différence réside dans le fait que les éléments détectés ont un caractère volumétrique, une forme tridimensionnelle, et constituent les parties d'un objet.

Biederman a appelé ces unités volumétriques "géons" et en est venu à définir 36 formes de base, toutes remplissant trois propriétés fondamentales :

  • invariance de la vue: dans lequel les géons peuvent être identifiés même s'ils changent d'angle visuel.
  • discriminabilité: chaque géon se distingue de l'autre même si le point de vue varie.
  • Résistance au bruit visuel: dans lequel un géon peut être identifié même si la moitié de sa structure est effacée ou masquée par un autre géon.

La figure suivante montre les géons de base (a), qui constituent des parties des figures en (b), soulignant le fait que seule la combinaison de 2 ou 3 géons forme des figures déjà reconnaissables.

identification visuelle de la forme

Perception visuelle et reconnaissance et identification d'objets visuels

Reconnaître ou voir un objet

reconnaître un objet c'est l'expérience de percevoir quelque chose tel qu'il était connu auparavant.

identifier un objet cela signifie donner un nom à un objet, le classer correctement dans un schéma de catégorisation, savoir dans quel contexte il se trouve habituellement, c'est-à-dire se souvenir de quelque chose à propos de l'objet autre que simplement l'avoir vu auparavant.

Plus nous voyons un objet, plus la trace qu'il laisse dans notre mémoire est grande et plus cet objet nous devient familier, c'est-à-dire plus il est facile de l'identifier, nous passons au concept de devoir le reconnaître seul.

Les deux processus se produisent via un mécanisme de mémoire et de récupération. Lorsque nous voyons quelque chose, une image perceptive est générée et doit être comparée à d'autres représentations en mémoire, ainsi qu'aux liens que ces autres représentations ont avec d'autres informations stockées en mémoire.

Perception visuelle pilotée par les données et pilotée par les concepts

La la perception visuelle envoie des données de la rétine, comme la couleur, la luminosité, etc., qui seront regroupées, suivant les préceptes de la Gestalt, jusqu'à constituer un ensemble qui fait sens pour l'observateur, qui identifie ces informations comme quelque chose de concret.

D'autre part, nous pouvons processus à travers des concepts, à travers un mécanisme descendant, basé sur des expériences antérieures, des émotions, des connaissances antérieures, etc. qui guident activement la recherche de certains modèles dans les stimuli qui arrivent. Si pasamos ante un patio donde juegan niños y vemos salir volando un objeto no muy grande, lo primero que hará nuestro sistema visual es comprobar si se trata de una pelota, algo muy diferente si estuviéramos en un parque, entonces comprobaríamos si se trata de un oiseau. Il s'agit de vérifier si ce que nous voyons est ce que nous nous attendons à voir.

Perception visuelle de grands et petits objets

De manière générale, il semble que la globalité prime sur les aspects locaux, dans certaines limites.

La présence de stimuli, par exemple des lettres, composées de stimuli plus petits, révèle ce fait. La forme de la grande lettre est d'abord perçue, puis les stimuli, les lettres, qui la composent (Navon 1977). Un stimulus global est détecté plus rapidement qu'un stimulus local, à condition que le schéma d'ordonnancement ne soit pas rompu, c'est-à-dire que si les éléments qui composent la grande figure étaient éloignés les uns des autres, les petits éléments qui la constituent seraient perçus plus rapidement, de sorte que la perception des grandes figures, stimulus global, doit être plus rapide, les petits stimuli doivent être regroupés suffisamment proches les uns des autres. 

La taille absolue de la figure est également décisive, si elle est très grande tamppeu est perçu d'abord par rapport aux petits stimuli. L'interprétation de ce phénomène doit être placée dans les mécanismes d'attention.

Contexte et identification

Parfois des stimuli identiques sont perçus comme différents, selon le contexte dans lequel ils apparaissent, comme sur la figure où la lettre B et 13 sont identiques mais on les interprète comme une lettre ou un chiffre selon le contexte dans lequel on les trouve.

De la même manière, lorsqu'un objet inapproprié apparaît dans une certaine scène, s'il n'a pas de caractères de pertinence très significatifs, il passera très probablement inaperçu, contrairement aux objets appropriés dans cette scène, dont on se souviendra avec certitude. une plus grande facilité.

perception visuelle des objets

Constance perceptive dans la perception visuelle

Nous avons tous expérimenté comment les choses, les objets de la scène visuelle, restent constantes ou nous continuons à les identifier telles qu'elles sont, même si la situation de la lumière, de la distance ou de l'orientation change. Non pas parce que quelque chose s'approche de nous et grossit, nous pensons que c'est un autre objet différent du premier, il y a une constance de perception dans la conscience même si nos conditions de vision changent.

Il existe trois conditions de constance perceptive :

  • La taille et la forme.
  • Blancheur ou couleur de la surface.
  • Emplacement de l'objet dans l'espace par rapport à l'observateur.

La constance a deux phases fondamentales :

La première est celle de enregistrement, le processus par lequel les changements dans les stimuli proximaux sont codés pour le traitement (inconscient).

La seconde, de appréhension, de nature consciente, dans laquelle nous prenons conscience des propriétés de l'objet, du stimulus focal qui tend à rester constant, et des propriétés de la situation, qui indique des aspects plus changeants de l'environnement, comme la position du matière.

constance de la taille

Il faut rappeler que la taille des objets sur la rétine varie selon la distance à laquelle ils se trouvent, mais la perception de la taille ne dépend pas seulement de l'objet que l'on observe, sa perception dépend de l'environnement dans lequel il se trouve, sur les objets qui l'entourent et les distances absolues et relatives.

La constance de la taille est aidée par les repères picturaux, notamment ceux de distance et de profondeur, et par la dynamique des yeux, les informations envoyées par le muscles extraoculaires dans les mouvements de convergence ou divergence et en logement.

Dans la figure, nous voyons comment en (a), les trois hommes diminuent de taille en s'ajustant à la perspective, ce qui indique une distance de l'observateur, donc la taille doit être plus petite, comme cela se produit dans la rétine, cependant en (b) , si la taille ne correspond pas, même si les trois hommes sont de la même taille, il semble que le dernier, le plus éloigné, soit plus grand.

perception visuelle et taille

Pour les constructivistes comme les Gibsoniens, on a directement la constance, la scène, les stimuli qui la constituent ont toutes les informations nécessaires pour rendre possible la constance perceptive.

A côté des clés, il faut placer les facteurs cognitifs. Nous rencontrons des objets dont nous connaissons la nature, la taille et les caractéristiques générales, de sorte qu'ils nous sont familiers, ce qui facilite leur identification dans la scène et facilite le maintien de leur constance perceptive (Predemon 1993).

Perception visuelle et constance de la forme

La constance de forme peut être définie comme la constance relative de la forme perçue d'un objet indépendamment des variations de son orientation.

Para que se dé constancia de forma, el sistema visual debe compensar los cambios de forma similar a como hacía en la constancia de tamaño, de hecho existe una gran relación entre la constancia de la forma y el tamaño, ambas se relacionan con la percepción de la distance. Cependant, pour la forme, la distance désigne la distance relative des différentes parties de l'objet par rapport à l'observateur, son orientation dans l'espace ou son inclinaison. L'aide des repères de distance et de profondeur et du contexte qui pourrait indiquer le degré d'inclinaison est essentielle.

Perception visuelle, luminosité et blancheur

La quantité de lumière qui atteint la rétine à partir d'un objet dépend de la source qui l'éclaire, éclairement externe et, de la lumière réfléchie par cet objet, réflectance.

Une surface blanche réfléchira près de 90% de la lumière qui tombe sur elle, en revanche, une surface noire absorbera la majeure partie de la lumière qui l'atteindra, ne reflétant qu'une faible proportion.

éclat

On parle de brillance comme de l'intensité apparente de la source lumineuse. lumière qui éclaire une partie de la campou visuellepar exemple, une partie d'une pièce qui est éclairée par le soleil, par rapport à une autre partie de la pièce qui est plus éclairée. 

La luminosité

Un autre concept important est celui de luminosité, qui fait référence à la réflectance apparente d'une surface, dans laquelle les objets noirs réfléchissent peu de lumière et les objets blancs réfléchissent beaucoup de lumière.

La luminosité détermine la couleur de l'objet, dans un échelle du blanc au noir, c'est ce qu'on appelle la blancheur. Ne confondez pas les notions de blancheur et de brillance. Une feuille de papier blanche aura une luminosité différente selon qu'elle est vue en lumière faible ou vive, mais elle aura toujours la même teinte de blanc, conservant ainsi sa blancheur constante.

constance de la luminosité

Il y a deux explications qui ont été données pour la constance de la luminosité. La première soutient que la constance découle de la relation entre les stimuli. De la même manière que la constance de taille et de forme d'un objet était maintenue en référence au contexte et aux autres objets de la scène, il en va de même avec la luminosité, c'est un rapport entre la luminosité de la scène, de l'objet et de ce qui vous entoure. Si la quantité de la source lumineuse varie, comme le soleil, la réflectance sera différente, mais les changements seront proportionnels dans tous les composants de la scène, c'est-à-dire que les rapports de réflectance qui atteignent la rétine sont les mêmes que dans le situation initiale.

inhibition latérale

Le principe physiologique qui expliquerait ce phénomène serait l'inhibition latérale dans le camptu es réceptif. Un éclairage plus important implique une plus grande excitation de la zone stimulante mais, en même temps, une plus grande inhibition de la zone périphérique du campou réceptif. Avec moins d'éclairage, moins d'excitation se produit au centre de la campoy, moins inhibition campou périphérique de sorte que la réponse globale reste constante. 

Cette situation change lorsque l'on fait varier les conditions du fond, le contraste sera différent et donc la perception de la blancheur et de la luminosité variera.

Perception visuelle, couleur et teinte

Nous avons tous expérimenté comment une pomme rouge continue de paraître rouge même si nous varions l'intensité de la lumière qui tombe dessus ou même varions la teinte de cette lumière (bleu ou jaune), c'est la constance de la couleur.

Cette constance ne dépend pas de l'image de cet objet sur la rétine, isolément, elle dépend de sa relation avec les objets qui l'entourent et du contexte dans lequel il se trouve.

Cela ressemble beaucoup à ce que nous venons de voir en blancheur et en légèreté. La constance des couleurs serait liée aux processus d'adaptation.

Résumé
Perception visuelle
Nom de l'article
Perception visuelle
Description
Nous expliquons en détail la perception visuelle et comment nous percevons les objets qui nous entourent. C'est l'un des chapitres sur la vision, l'œil et la façon dont nous voyons.
Auteur
Nom de l'éditeur
Área Oftalmológica Avanzada
Logo de l'éditeur