|
Mémoire de stage de recherche
VISION ET AUDITION
Etude des processus cognitifs de
Nicolas Esposito
|
Il a été composé dans sa version papier à l'aide de
TEX et LATEX,
Je tiens à remercier cordialement Bruno BACHIMONT,
Charles LENAY,
Le monde visuel et le monde sonore peuvent chacun être étudiés en tant que signal avec les mêmes
outils mathématiques5 (séries de Fourier par exemple). Il
est donc intéressant de se demander si les processus cognitifs alors mis en jeu chez l'homme sont
eux aussi comparables. Nous allons aborder ce sujet en traitant de la reconnaissance et de la
différenciation dans chacun des deux mondes, puis nous chercherons comment ces processus peuvent être
comparés.
Perception, vision, audition, reconnaissance, différenciation, formes, couleurs, musique, sons,
illusions graphiques, daltonisme, cécité
Ce mémoire s'adresse à toutes les personnes intéressées par la perception et son étude en tant
qu'acte cognitif. On y traitera de ses différents aspects dans les domaines visuel et sonore
(reconnaissance de formes, vision des couleurs, justesse de la musique, etc.). Il sera aussi
intéressant d'évoquer des troubles de la vision tels que le daltonisme ou la cécité, toujours dans
le but d'enrichir notre perspective de la perception.
Notons aussi que ce mémoire n'a pas une problématique unique (qui pourrait être celle de la
troisième partie : Parallèle entre les mondes visuel et sonore), mais il dégage plutôt
une volonté de dresser un panorama de la vision et de l'audition au travers des processus de
reconnaissance et de différenciation.
C'est de ces interventions qu'a été dégagé le sujet de ce mémoire : V
ISION et AUDITION - Étude des processus cognitifs de
reconnaissance et de différenciation dans les domaines visuel et sonore
De même, l'ouïe possède une grande importance dans la perception du monde, prenons simplement
comme exemples les rôles primordiaux que ce sens a dans la communication et l'art. Effectivement,
il peut paraître moins évident et plus difficile à étudier que la vue, mais ces deux sens
sont finalement comparables.
Ce ne sont pas des sens de proximité6, ils sont
tous les deux largement véhiculés par les médias et ils sont complémentaires dans bien des
situations. La vue peut par exemple compléter l'ouïe dans un environnement bruyant où on est amené
à lire sur les lèvres pour mieux comprendre le message que l'on nous communique.
Il convient donc de les étudier en parallèle, en se concentrant sur les processus de
reconnaissance et de différenciation, et en mesurant ce qu'il peut y avoir de comparable dans les deux
mondes.
Dans le domaine visuel, nous différencierons aussi deux niveaux : les images en deux dimensions
(sans perspective, vues de face) et les images en trois dimensions (perçues en relief ou deux
dimensions sur un plan incliné). Ainsi, il sera par exemple intéressant d'étudier la
reconnaissance des formes à deux dimensions dans un environnement en trois dimensions ou des
illusions suggérant trois dimensions dans un environnement en deux dimensions.
Comme le montrent les travaux de Piaget et d'Inhelder [18], les activités perceptives se
développent progressivement avec l'âge. La perception est un cas particulier des activités
sensori-motrices et l'enfant acquiert son intelligence sensori-motrice par la succession
de différents stades, des réflexes jusqu'à la compréhension soudaine. Ainsi, l'enfant ne
peut être pris en compte dans notre étude. Par contre, nous pourrons nous intéresser à différentes
cultures présentes dans le monde des adultes afin de mettre en lumière leur incidence.
La reconnaissance des formes implique le fait que ces formes
doivent être contenues dans un monde que l'homme peut percevoir.
Ainsi accessibles, elles peuvent être traitées par le cerveau,
comparées à des formes connues et finalement identifiées.
Une scène visuelle peut être décomposée en trois parties
distinctes : les contours, les couleurs et les mouvements.
La structuration des formes [3] nécessite donc le
traitement de ces composantes pour obtenir respectivement les
formes, les surfaces et les déplacements.
La reconnaissance des formes s'obtient par le traitement des
contours.
En effet, les couleurs ne sont pas nécessaires, une vision en
nuances de gris (par exemple) permet toujours la reconnaissance des
formes.
Comme le montre l'illusion de la figure 1.1, ce sont les
contours qui donnent la forme, et pas forcément les couleurs.
Grâce à notre capacité à fermer les contours, on voit un carré alors
qu'il n'est pas représenté explicitement. Ici, la fermeture
du carré se fait par coopération des contours des trois
quarts de cercle et le traitement des contours est facilité par le
fait que l'écart entre les deux couleurs (le noir et le blanc) est
maximal.
La perception visuelle est donc un traitement actif de
l'information qui fait appel aux capacités de construction de notre
cerveau. L'information visuelle est tout d'abord traitée de façon
sensorielle,
l'oeil
transmet les stimuli au cerveau via le nerf optique.
Ensuite de façon perceptive, c'est à ce stade qu'on perçoit les
formes, les couleurs et les mouvements.
Et enfin de façon cognitive, on identifie alors les objets en
faisant intervenir nos représentations et nos connaissances.
Ce sont précisément ces deux derniers stades que l'on essaie de
reproduire sur des machines afin de concevoir une vision
artificielle.
Il existe de nombreuses méthodes qui visent à reproduire la vision
humaine.
Mais à l'heure actuelle, aucun système n'est en mesure de remplacer
les niveaux perceptifs et cognitifs (voir section précédente) dans
leur totalité.
On ne peut en effet concevoir de vision artificielle globale sans
intelligence artificielle de très haute qualité7.
Il est par contre possible d'obtenir une intelligence efficace pour
des domaines bien ciblés (environnement et connaissances limitées).
C'est le principe des systèmes experts et cela permet la
réalisation de visions artificielles très spécialisées qui sont
efficaces.
On pourra par exemple citer les systèmes de reconnaissance
d'empreintes digitales ou ceux qui peuvent garder votre voiture à
bonne distance de celles qui la précèdent.
Une méthode courante de vision artificielle consiste en une
succession de traitements : on commence par des traitements
numériques sur l'image et l'on en extrait finalement une
information sémantique.
Mais des recherches considèrent plutôt la vision comme comme un
système complexe [26] où toutes les étapes seraient plus
ou moins liées. Chaque traitement serait alors exécuté en fonction
du précédent et le résultat serait alors plus efficace.
On comprend dans cette méthode que la vision artificielle se doit
d'être active (tout comme la vision humaine8) et c'est ainsi qu'apparaissent des techniques de
prédiction et vérification [27].
La stratégie de perception est alors d'explorer la scène puis de
traiter les objets séparément de manière adéquate (tout comme
l'homme le fait9).
On voit bien que l'élaboration de système de vision artificielle
nous amène directement vers la psychologie de la vision humaine.
Et c'est donc tout naturellement que des recherches se sont
tournées vers ce qu'on appelle l'attention visuelle
[29].
On procède là à une analyse sérielle de zones restreintes de
l'image.
Le système localise ainsi plus rapidement les informations
pertinentes.
Une des voies prometteuses est celle de la vision stéréoscopique qui
permet de reconstruire une scène en trois dimensions.
On peut alors détacher les objets les uns des autres beaucoup plus
efficacement.
Mais le problème majeur réside dans la reproduction du processus
cérébral qui nous permet d'obtenir une image en relief à partir de
deux images en deux dimensions.
Il est parfois nécessaire de présenter un symbole en deux dimensions dans un environnement en
trois dimensions. On plaque alors le plus souvent le symbole sur une surface plane. Cela ne pose
pas de problème visuel lorsque la surface fait face à l'observateur comme c'est le cas des
affichages publicitaires sur les murs. Mais il est des situations où la surface ne peut faire face
à l'observateur, c'est le cas par exemple du dessin d'un panneau de circulation sur la chaussée.
Le dessin est alors volontairement allongé pour que les automobilistes le reconnaissent de loin.
Cette technique simple est suffisante pour reconnaître le panneau, mais elle ne restitue pas sa
géométrie exacte (voir figure 1.2). Sur la figure 1.3, les lignes horizontales
nous montrent bien que le bas du point exclamation est plus large que le haut. Il faut donc
appliquer au symbole une autre transformation pour en rétablir une vision correcte. Ainsi, le
point d'exclamation du panneau sera aussi large en haut qu'en bas. On pourra calculer l'amplitude
de cette transformation en fonction de l'angle de vue des observateurs potentiels10.
Il existe de nombreux types d'illusions graphiques
[36] :
Les illusions graphiques sont particulièrement intéressantes car
elles nous renseignent sur la façon que l'on a de regarder une
scène.
Mais on peut se demander si un système de vision artificielle
devrait lui aussi percevoir ces illusions comme nous le faisons.
La réponse est probablement oui puisqu'il est maintenant courant
d'entendre que l'intelligence artificielle sera une réalité
le jour où les machines feront les mêmes erreurs que les humains.
Les illusions graphiques pourraient donc se relever être un bon
test pour la vision artificielle.
Il existe des personnes dont le métier reconnu est l'illusionnisme. Mais d'autres pratiquent cet
art dans d'autres circonstances que des salles de spectacle, notamment pour la vente. Les
commerçants créent ce que l'on pourrait appeler des illusions des prix, dans le but de
nous faire acheter leur produits. Une première technique consiste à placer le prix tout juste sous
celui que l'on pourrait obtenir par arrondi, on aura par exemple 9 900 F à la place de 10 000 F.
Il y a dans cet exemple deux effets illusionnistes : le premier chiffre - un 9 - fait
immédiatement penser à 9 000 F et les deux 0 finaux font disparaître le second 9 grâce leur
supériorité numérique. Une seconde technique a pour effet de donner l'impression d'un prix peu
élevé en utilisant uniquement des chiffres de faible hauteur, par exemple : 11111 F,
volontairement regroupé pour masquer le nombre de chiffres. Elle suggère un produit accessible.
On est donc face à une situation où l'illusion (une certaine perception que l'on a de la réalité)
modifie délibérément l'action (le fait d'acheter ou de ne pas acheter).
Couché le papier, un stéréogramme se présente le plus souvent comme une texture se répétant à
l'infini [33]. C'est en accommodant sa vision derrière le plan du stéréogramme
que le relief apparaît (comme par exemple sur la figure 1.6).
Ainsi, chaque
oeil
perçoit les informations stéréoscopiques qui lui sont destinées et qui sont contenues dans les
légères perturbations de la texture du stéréogramme. On est ici confronté à une déformation
volontaire de la réalité, l'observateur se fait illusionniste à son tour et à sa propre intention.
La perception colorée [2] est conditionnée par les
longueurs d'ondes que réfléchissent les objets, ce qui implique le
fonctionnement du système photopique (système de vision du jour qui
dépend des cônes, à opposer au système scopique qui convient à
un faible éclairage et qui dépend des bâtonnets11.
Les trois types de cônes fournissent les composantes primaires
(rouge, vert et bleu) et la couleur est obtenue par synthèse
additive (les luminances s'ajoutent).
Si nos cônes manquent ou sont endommagés, on peut être victime de
troubles de la perception des couleurs (voir section
5.1, page pageref).
Et puisque certaines tribus affricaines n'auraient que très peu de
noms pour distinguer les couleurs, on peut se demander si leur
système visuel est indentique ou si il s'agit simplement d'un
aspect culturel.
La classification des couleurs nous apparaît donc comme un problème
très complexe.
Nous avons vu que les contours nous permettent de reconnaître les
formes (voir section 1.1.1, page pageref).
Mais comment ces contours sont-ils construits ?
Et bien justement par différence de couleur (à la lumière ou
d'intensité lumineuse dans l'obscurité).
C'est la frontière entre deux couleurs qui indique la présence d'un
contour (niveau perceptif).
De plus, certains contours sont mis en évidence par notre vision
stéréoscopique (niveau cognitif).
Le mouvement nait de la cohérence des positions successives d'un
objet [9].
Si un objet apparaît à des emplacements aléatoires dans l'espace,
l'observateur ne pourra pas identifier un mouvement précis.
Reconnaître un mouvement, c'est en fait reconnaître une forme
dans le temps, on parle alors de trajectoire.
Cela implique la mémorisation des emplacements précédents et la
reconnaissance de l'objet à chaque position.
Lorsqu'on dit qu'un objet tourne en rond, on a reconnu que sa
trajectoire formait un cercle.
Il convient alors de se demander si on reconnaît une trajectoire
comme on reconnaît une forme dans une scène.
Dans ce dernier cas on identifie des contours physiques, mais dans
le temps on identifie une forme abstraite par représentations
mentales successives.
Les représentations finales (cercle ou carré par exemple) peuvent
être semblables mais la perception ne se situe pas au même
niveau : on perçoit une forme au niveau perceptif mais la
perception d'une trajectoire nécessite le passage au niveau
cognitif.
Différencier, c'est déjà reconnaître au moins deux formes.
Ces formes peuvent être présentes simultanément, mais on peut aussi en mémoriser une ou même les
deux.
Une fois ces formes reconnues, on dispose des éléments nécéssaires et on peut identifier les
différences qu'il y a entre les deux formes, on les aura ainsi différenciées.
Percevoir le monde permet de se situer par rapport à son environnement.
La vision stéréoscopique nous permet par exemple de savoir où sont placés les
objets12.
C'est ce qu'on appelle la spatialisation.
Mais privé de la vue, un individu peut-il développer de nouvelles modalités perceptives qui
permettent tout de même une constitution de la spatialisation ?
C'est ce que montre le travail de Charle LENAY [14].
En équipant des aveugles de dispositifs de couplage sensori-moteurs de type cellule
photoélectrique connectée à un stimulateur tactile sur un doigt, on observe à l'issue d'une
certaine période d'adaptation la naissance d'une nouvelle modalité sensorielle qui permet
de ressentir la présence ou non d'objets.
La spatialisation naît alors de l'action : l'aveugle éloigne le doigt de son corps afin
d'obtenir plusieurs points de vue (une stéréo-perception est donc possible par le biais d'un
processus cognitif).
Il peut aussi explorer l'environnement par rotation ou par translation, et comme on reconnaît
une trajectoire dans un mouvement, l'aveugle peut, par mémorisation des états successifs,
reconnaître des formes ou des objets.
En restant passif, un individu équipé de ce système serait incapable de percevoir son
environnement.
C'est bien l'action qui lui permet d'utiliser un dispoditif technique simple pour se forger
un nouvel espace perceptif, l'action est donc constitutive de la perception.
En effet,
identifier et reconnaître ne sont pas des synonymes dans le domaine de la perception
[30].
Reconnaître implique que l'on ait déjà connaissance de l'objet, on connaît à nouveau
l'objet.
C'est une reconnaissance analytique.
Identifier implique que l'on ait déjà une catégorisation conceptuelle, on reconnaît un type
d'objet.
C'est une reconnaissance synthétique.
La représentation est au
coeur
de la théorie de la connaissance pour légitimer la possibilité qu'a le sujet d'accéder au monde.
L'objet n'est alors rien sans le sujet et la vérité est atteinte quand il y a adéquation entre
la représentation et le monde extérieur.
On peut considérer que l'émergence de la représentation s'est basée sur les mots
"information"
et
"voir"
de la conception prémoderne [19].
C'est avec Aristote que la notion de
"forme d'une chose"
a pris son sens.
Et pour Saint Thomas d'Aquin,
"voir"
signifiait justement
"saisir la forme d'une chose".
L'approche phénoménologique pourrait être définie comme le fait de considérer les choses comme
elles se donnent. Elle s'intéresse donc aux phénomènes.
La phénoménologie propose une interprétation de la connaissance privée de représentation, c'est
l'intentionnalité qui est ici le concept central.
C'est l'homme qui éclaire le monde et qui lui permet de présenter devant lui.
La perception est alors un processus fondamental, il permet notamment de comprendre l'imagination
ou la connaissance conceptuelle.
Il est reconnu que la phénoménologie est née dans la Phénoménologie de l'esprit de Hegel
[16],
mais les premières thèses essentielles ont été exposées dans les Recherches logiques
d'Husserl [11].
La phénoménologie de Merleau-Ponty [17] a pour tâche de mettre à nu le
"monde de la vie"
d'Husserl.
Pour cela, il reconstruit les catégories d'Husserl en privilégiant le sensible avant tout.
La phénoménologie consiste donc en un retour aux choses mêmes.
Dans le sens husserlien, c'est la capacité qu'a la conscience de pouvoir se saisir
elle-même et de pouvoir saisir ses objets [6].
La thèse représentationnaliste naturalise les représentations.
Elle intègre aussi une thèse formaliste (à opposer à syntaxique).
Le paradigme computo-représentationnaliste considère les processus cognitifs comme assimilables à
des calculs.
On aurait alors un cycle de ce type : sensation, perceptions, concepts et actions ; dans une
logique de traitement séquentiel de l'information.
L'apparition de l'ordinateur a conforté l'idée d'un monde où tout serait calculable [15].
On traduit les raisonnements mathématiques en algorithmes et on va parfois jusqu'à considérer
l'homme comme un simple système de traitement de l'information.
Le projet constructiviste est basé sur la boucle sensori-motrice.
Il est entre autre représenté par Merleau-Ponty, Piaget et Varela.
Ce dernier propose une alternative au concept de représentation : l'enaction
[21].
Cette approche peut s'expliquer par notre sens commun et notre capacité à sans cesse
faire émerger des questions pertinentes.
Elle tend vers une vision neurologique de l'esprit.
Nos références culturelles font en sorte que chacun perçoive13 le monde différemment. Mais certains individus
souffrent de pathologies qui bouleversent leurs perceptions visuelles et qui de ce fait, leur
imposent un monde d'autant plus différent. Il existe un grand nombre de troubles de la perception
visuelle [32] (myopie, presbytie, etc.), mais nous allons focaliser notre attention
sur deux troubles particulièrement intéressants : le daltonisme et la cécité. Comment se déroulent
alors les processus de reconnaissance et de différenciation ? Nous allons voir que l'incidence des
pathologies qui touchent la vision et qui conditionnent donc les perceptions conduit le plus
souvent à un comportement particulier et des repères socio-culturels différents.
Cette section sur le daltonisme est principalement basée sur une enquète qui a été menée à
l'occasion de ce mémoire (voir Annexe A, page pageref). Les résultats
portent sur une population très limitée et leur utilisation se fera en employant le mode
conditionnel s'ils n'ont pas été vérifié dans d'autres travaux.
La daltonisme est un trouble de la perception des couleurs (une dyschromatopsie ou
anomalie de la vision colorée) qui fut étudié pour la première fois par le physicien et chimiste
anglais John DALTON en 1794. Les daltoniens, qui sont aussi appelés dichromates,
ne peuvent généralement percevoir correctement que deux couleurs parmi les trois primaires, le
rouge, le vert et le bleu. Ceci est dû à une déficience des pigments des cônes (voir section
1.2, page pageref) récepteurs de la couleur verte ou de la couleur rouge
(les daltoniens au bleu sont extrêmement rares). Cette déficience est héréditaire, elle est due a
un gène récessif situé sur le chromosome X. Pour qu'une femme soit daltonienne, il faut par
conséquent que ses deux chromosomes X portent le gène. Ceci explique le faible taux de daltonisme
chez les femmes : 0,4 % contre 8 % chez les hommes.
Comme nous venons de le voir, un daltonien au vert aura des difficultés plus ou moins importantes
à voir la couleur verte. Ansi, il pourra juger de même couleur un vert et un gris. Même si le vert
fait partie de sa culture (on lui aura appris à l'école que l'herbe et les feuilles sont vertes),
il ne pourra pas faire la différence entre des couleurs vertes et d'autres couleurs. Il n'a donc
pas les capacités physiques lui permettant de distinguer certaines couleurs.
De même, le daltonien au vert pourra ne pas reconnaître une couleur verte comme étant verte. Si le
vert n'est pas mélangé avec d'autres couleurs, il aura de grandes difficultés à lui donner un nom
et il le qualifiera le plus souvent de gris. Si le vert est mélangé avec une autre couleur, il
donnera dans la majorité des cas le nom de l'autre couleur. Il n'a donc pas les capacités
physiques lui permettant de reconnaître certaines couleurs.
Tout d'abord, un daltonien peut être plus facilement sujet à des illusions visuelles au niveau des
couleurs. En effet, conscient de son handicap, un daltonien fait appel à sa culture pour
identifier des couleurs. Cela peut parfois l'amener à imaginer un rouge sur une image en
noir et blanc. Dans ce cas, le daltonien est victime de sa culture. Aussi, comme il ne verra pas
la même beauté d'un paysage, un daltonien ne verra pas l'art de la même façon. Il ne pourra pas
comprendre les jeux de couleur d'un tableau puisqu'il ne voit pas les mêmes couleurs que le
peintre. Ceci est particulièrement handicapant pour des tableaux construits principalement sur des
jeux de couleur comme c'est le cas dans le style impressionniste. Enfin, il semblerait que les
daltoniens n'aient pas une mémoire des couleurs aussi performante que les non-daltoniens.
Les daltoniens sont amenés à faire des différenciations de couleur que des personnes ne souffrant
pas de cette pathologie ne pourraient pas faire. Lors de tests qui consistent à reconnaître des
formes, lettres ou chiffres dans des mosaïques de points multi-colores (voir figure
5.1), un daltonien échouera sur les cartes qu'un autre sujet reconnaîtra. Mais il verra
des formes sur des cartes où la plupart des sujets ne reconnaît pas de forme. En fait, ces cartes
sont spécialement dessinées pour détecter le daltonisme. Les personnes qui en souffrent sont donc
capables de différencier des groupes de couleurs que d'autres ne pourraient pas différencier.
Cette différence de vision des couleurs est parfois utilisée comme avantage. On peut noter que des
militaires ont employé des daltoniens pour repérer des unités camoufflées. Il y a aussi des
dessinateurs qui surprennent et séduisent par leurs couleurs inhabituelles. Mais ces cas sont des
exceptions et le daltonisme reste dans la plupart des cas un handicap. Le photographe André A.
DERIAZ (né en 1948) a d'ailleurs été refusé au concours d'entrée de l'Ecole de
Photographie de Vevey du simple fait de son daltonisme. C'est ainsi que certaines professions sont
presque inaccessibles à cette partie de la population. C'est par exemple le cas des métiers de
l'électronique où il faut reconnaître les résistances par leurs couleurs.
Les aveugles (sujets n'ayant aucune perception visuelle) et les malvoyants (dont l'acuité visuelle
est inférieure à 1/20 ou dont le champ visuel est inférieur à 10° pour chaque
oeil)
sont considérés comme atteints de cécité [35]. Pour simplifier le discours, nous
parlerons simplement des aveugles.
En opposition au daltonisme, la cécité est un handicap fort. Il laisse 70 % des personnes qui en
sont touchées au chômage. Mais privé de sa vue, l'aveugle développe-t-il plus ses autres sens comme
on pourrait aisément l'imaginer ? Il s'avère effectivement que certains aveugles ont un goût
particulièrement
raffiné ou une ouïe excellente, mais la plus remarquable des différences par rapport aux personnes
ne souffrant pas de cécité est le plus souvent une grande capacité de mémorisation et de
concentration.
Ne pouvant voir l'environnement qui l'entoure, l'aveugle est contraint de s'en faire une
représentation mentale la plus précise possible. Ainsi, à l'aide de ses quatre autres sens, il se
forge une vision intérieure du monde.
Des aveugles affirment même voir à leur façon.
On pourrait s'avancer à dire qu'un aveugle voit comme un voyant dans un rêve, par le biais
d'une représentation mentale15. Un voyant peut se repérer en temps réel dans son environnement, il en a une vision
immédiate. Or, un aveugle ne peut percevoir que ce qu'il a à sa proximité. C'est dans ce cas qu'il
est nécessaire de mémoriser chaque lieu, chaque trajet ou chaque environnement sonsore. Ainsi,
dans des situations où la vision est inutile16, les
aveugles s'avèrent le plus souvent très performants.
Dans la représentation mentale du monde qu'a l'aveugle, les processus cognitifs comme la
reconnaissance de formes ne se font donc pas au même niveau.
Il faudra, tout comme pour reconnaître une trajectoire, mémoriser des sensations tactiles
successives pour pouvoir percevoir une forme.
Il en est de même pour la spatialisation, il faudra prendre de nombreux repères successifs pour
arriver à une représentation spatiale de son environnement.
Lorsque les autres sens viennent compenser une vision nulle ou presque,
il ne s'agit pas d'une compensation de la nature [22].
La suppléance des sens n'intervient nullement au niveau physique, mais
psychologique 17.
Ce phénomène naît de la volonté des non voyants de continuer à mener une vie aussi complète que
possible.
Un son est une sensation due à une vibration [10].
On peut caractériser un son par sa hauteur (grave, aigu), son amplitude (fort,
faible) et son timbre (pour les voix et les
instruments)18.
Il existe de nombreux types de sons, en voici quelques uns.
En dessous de 20 Hertz il s'agit d'infra-sons et
au dessus de 20 MHz il s'agit d'ultra-sons, ce sont dans les deux cas des vibrations
inaudibles.
On peut définir comme bruit un son gênant.
Cette définition est vaste et il existe aussi de nombreux types de bruits (bruit blanc, bruit
rose, etc.).
Les sons au volume élevé peuvent être particulièrement gênants et même provoquer des
dommages auditifs irréversibles [20].
Devant ces différents types de sons,
on peut se demander si on ne pourrait pas les traduire en terme de formes.
En effet, il n'est pas rare qu'un musicien sculpte un son ou une mélodie afin de lui donner la
forme la plus proche possible de ce qu'il veut exprimer [24].
La notion d'oreille intérieure désigne un contrôle volontaire des représentations
auditives chez les musiciens [7].
L'oreille intérieure s'exerce et se développe notamment dans les cours de solfège.
Ainsi, pour reconnaître une note de musique, on y fait appel (donc à une certaine forme de
culture musicale).
Reconnaître une mélodie, c'est mémoriser des intervalles successifs et reconnaître le mouvement ainsi
créé.
L'utilisation du mot mouvement n'est pas innocente, puisque nous pourrons comparer la reconnaissance
d'une mélodie à celle d'un mouvement d'objet dans le monde visuel.
Il est aussi intéressant de noter que des interprétations différentes d'une mélodie nous amènent toujours à la
reconnaître et que la plupart des interprètes tendent vers les mêmes variations temporelles qui seraient dues à des
contraintes fonctionnelles du système auditif [31].
Différencier deux mélodies implique tout d'abord leur reconnaissance et leur mémorisation.
Il faudra ensuite identifier les différences.
Celles-ci peuvent être de nombreux types, notamment au niveau des notes, du rythme, de la tonalité.
Tous les individus ne sont pas égaux devant cette tâche, les musiciens seront évidemment plus à même de
cerner ces différences.
Ils pourront par exemple, s'ils sont batteurs, discriminer les irrégularités de rythme beaucoup plus
facilement [28].
La culture des musiciens leur apporte aussi un système d'attentes harmonique qui leur permettra de déceler les
dissonances mélodiques assez aisément [25].
Comme nous l'évoquions en introduction, la vue et l'ouïe sont souvent complémentaires.
Accorder une couleur ou une forme à un son n'est pas rare.
Examinons un simple exemple pour mettre cela en évidence.
La figure 8.1 présente deux formes que l'on a choisi de nommer Malouma et Takété.
Sans connaître au préalable l'association entre les formes et leur nom,
vous n'aurez aucun mal à reconnaître Malouma ou Takété.
Expliquer cette capacité que nous avons avec des mots n'est pas aisé.
On pourrait par exemple dire que Malouma évoque quelque chose de fluide
et que Takété évoque plutôt quelque chose de contrarié.
Le simple fait que nous écrivions la musique suffit,
comme nous l'avons fait dans l'exemple précédent,
à mettre en évidence un nouveau parallèle entre les mondes visuel et sonore.
Les figures 9.1 et 9.2 sont les notations respectives d'une
mélodie et d'un accord, elles codent donc de la musique.
Néanmoins, on ne peut s'empêcher d'y voir des formes ;
par exemple, la ligne reliant les noires de la mélodie.
Depuis longtemps les artistes jouent sur ce genre de parallèle [4],
il n'est pas rare de voir des peintres inspirés par de la musique
ou des musiciens inspirés par de la peinture.
C'est ainsi que des partitions sont transformées en tableaux,
que des sculptures suggèrent des sons (par exemple en incorporant un instrument de musique)
ou même en produisent.
Comme si les artistes cherchaient à toucher en nous ce qui est commun aux sens
et qui procurerait donc d'autant plus de réactions.
La question principale est de se demander si on reconnaît une forme comme on pourrait reconnaître
un son.
Etant conscient que les mécanismes perceptifs sont totalement différents, on peut se demander si
on est en droit de comparer les processus cognitifs post perception alors mis en jeu.
Sont-il comparables ? Et si oui, en quoi ?
Les mécanismes perceptifs ne sont effectivement pas les mêmes, mais les processus cognitifs
peuvent être comparés dans bien des situations.
Par exemple, on peut comparer la reconnaissance d'une forme à la reconnaissance d'un son.
Dans les deux cas, le processus cognitif en jeu opère sur une perception instannée et il
se charge de faire le rapprochement entre cette perception et une représentation déjà connue
(pléonasme ?). Il s'agit là d'un premier niveau.
On peut en effet dégager un deuxième niveau dans lequel les processus cognitifs opèrent non
pas sur une perception instannée, mais sur une représentation mentale forgée par mémorisation
d'états successifs.
Dans ce cas, on pourrait par exemple comparer la reconnaissance d'une trajectoire à celle
d'une mélodie.
Le présent processus de reconnaissance peut être comparé au précedent, mais il ne se situe pas
au même niveau.
Il est précédé d'un processus de reconstruction mentale par mémorisation.
En stéréo-vision, notre perception visuelle est instannée (les deux images nous
parviennent simultanément).
Par contre, un non voyant devra toucher successivement différents objets de son environnement pour
s'en faire une représentation mentale.
Même si les sens mis en jeu sont différents, on se rend compte que les processus cognitifs qui
suivent sont comparables.
Il y a reconstruction d'une scène dans l'espace dans les deux situations, elle ne se fait
simplement pas au même niveau.
Dans le premier cas, elle devrait intervenir juste après la perception.
Dans le second cas, elle devrait intervenir après un processus de reconstruction mentale par
mémorisation qui serait comparable à celui qui est évoqué dans la section précédente.
La définition de la différenciation dans les deux mondes pourrait être identique : c'est
identifier des différences.
Mais il s'agit là d'un processus de niveau supérieur au processus précédemment évoqué puisqu'il
intervient obligatoirement à l'issue d'une phase de reconnaissance d'au moins deux entités (forme,
accord, etc.).
Et puisque la reconnaissance peut avoir lieu au premier ou au deuxième niveau, la différenciation
se fera au deuxième ou au troisième niveau.
Nous ne faisons aucune hypothèse sur une éventuelle spécialisation de ces processus (pour tendre
vers la thèse de Fodor) ou sur une généralisation des processus à l'ensemble des sens,
nous bâtissons simplement des types de processus sur des comparaisons dans les milieux visuel et
sonore.
Ces types de processus interviendraient à trois niveaux différents :
ARTICLES
ACTES DE JIOSC 97
SITES WEB
Etant personnellement daltonien et devant le peu de littérature sur cette pathologie, j'ai voulu
confronter mes impressions avec une population la plus large possible. J'ai pu, grâce à Internet,
contacter dix daltoniens par le biais d'un questionnaire (voir figures A.1 et
A.2) et chacun m'a répondu avec beaucoup de précision. De manière à comparer les
résultats avec ceux de personnes ne souffrant pas de daltonisme, j'ai envoyé un second
questionnaire20 (voir figure A.3) à vingt autres personnes.
Les résultats de cette enquête ne peuvent donc pas être considérés comme réellement utilisables,
mais ils fournissent déjà de bonnes indications qui pourront servir de point de départ à des
travaux beaucoup plus poussés.
1 Université de Technologique de Compiègne
2 PHIlosophie,
TEchnologie, COgnition
3 Stage de recherche
4 Journées Interdisciplinaires d'Orsay sur les Sciences
Cognitives
5 Pour cela, on généralise les outils mathématique des signaux à une
dimension (le son) aux signaux à deux dimensions (l'image).
6 Il n'y a pas de
contact physique entre ce que nous voyons ou entendons et nos yeux ou nos oreilles.
7 Malgré les
espérances passées de certains chercheurs, on est aujoud'hui encore
bien loin de ce type d'intelligence.
8 On ne mettra
pas en jeu les mêmes processus cognitifs selon la scène
observée.
9 On ne regarde pas deux objets
simultanément.
10 On peut
noter que des publicitaires utilisent cette technique pour faire apparaître des logos sur des
terrains tels que des pistes de Formule 1 où les spectateurs et les caméras de télévision n'ont
qu'un seul point de vue.
11 Les cônes et les
bâtonnets sont les photorécepteurs de
l'oeil.
Se reporter à la référence précédente ([2]) pour plus de
précisions sur le système visuel de l'homme.
12 La profondeur de champ de la vision permet aussi d'évaluer des
différences de distance entre les objets mais elle n'interviendrait qu'à une hauteur de 10 la spatialisation.
13 On entend ici percevoir au
sens large, perception et représentation.
14 Par exemple le bruit d'un ventilateur
possérieux ou le bruit d'une mouche.
15 Certains aveugles racontent même être parfois voyants dans
leurs rêves.
16 Travail par téléphone par exemple
17 l'oreille d'un musicien peut paraître plus sensible, mais c'est en fait le
fruit d'une culture, d'une éducation et/ou d'un travail particulier.
Il ne devrait pas y avoir de différence matérielle entre son oreille et celle d'un non
musicien.
18 On pourrait par exemple comparer ces éléments à la forme,
la taille et la couleur d'un objet.
19 La spatialisation mérite quant à elle une
étude plus approfondie puisqu'on pourrait être amené à considérer qu'il soit possible de se
spatialiser dans un environnement sans reconnaître aucun objet.
20 Ce second questionnaire ne contient donc pas de question en rapport avec
le daltonisme.
"Parce
que chacune des douze notes a une position, un titre, une fonction propre,
l'oeuvre
que nous entendons est plus qu'une simple masse sonore : elle développe devant nous
une
action."
(Milan KUNDERA, [13], p. 272)
pour l'obtention de l'unité de valeur
SC023 suite au séminaire JIOSC
974.
traduit en HTML avec TTH v1.57
et repaginé avec NiSLe v1.0.
François SEBBAH et
Véronique HAVELANGE pour leurs précieux enseignements.
Je remercie également Renaud SIRDEY, André GOASDOUÉ et
Nicolas SALZMANN
pour l'aide qu'ils m'ont apportée,
et toutes les personnes qui ont eu la
gentillesse de répondre à mon enquête.
(compression gzip) ;
ou au format PDF : memoire.pdf
Résumé
Mots-clés
Avant-propos
Contents
Table des figures
Introduction
JIOSC 97
Objet de l'étude
Les dimensions de la perception
A propos de la culture et des enfants
I Le domaine visuel
1 La reconnaissance dans le domaine visuel
1.1 Reconnaissance de formes
1.1.1 Reconnaissance des formes chez l'homme
1.1.2 Reconnaissance artificielle des formes
1.1.3 Vision d'objets en 2D dans un environnement 3D
1.1.4 Les illusions graphiques
Les illusion classiques
Les illusions des prix
Les stéréogrammes
1.2 Reconnaissance des couleurs
1.3 Reconnaissance des mouvements
2 La différenciation de formes dans le domaine visuel
3 La question de la spatialisation
4 De la reconnaissance à la représentation
4.1 La représentation
4.2 L'approche phénoménologique
4.3 Trois hypothèses des sciences cognitives
4.3.1 Thèse représentationnaliste
4.3.2 Paradigme computo-représentationnaliste
4.3.3 Projet constructiviste
5 Troubles de la perception visuelle
5.1 Le daltonisme
5.1.1 Définition
5.1.2 Reconnaissance et différenciation des couleurs
5.1.3 Les troubles occasionnés par le daltonisme
5.1.4 Le daltonisme comme différence utile
5.2 La cécité
II Le domaine sonore
6 La reconnaissance dans le domaine sonore
6.1 Reconnaissance de sons
6.2 Reconnaissance d'une note de musique
6.3 Reconnaissance d'une mélodie
7 La différenciation dans le domaine sonore
7.1 Différenciation de mélodie
III Parallèle entre les mondes visuel et sonore
8 Approche na ï ve
9 Approche artistique
10 Les processus cognitifs et leurs niveaux
10.1 A propos de la reconnaissance
10.1.1 Proposition de deux premiers niveaux
10.1.2 A propos de la stéréo-perception
10.2 A propos de la différenciation
Conclusion
Des types et des niveaux
Vers une perception artificielle modulaire
Bibliographie
Annexes
A Enquête sur le daltonisme
List of Figures
1.1 Exemple suggérant un carré
1.2 Point d'exclamation vu de face
1.3 Point d'exclamation vu sur une surface inclinée
1.4 Illusion de Müller-Lyer
1.5 Cascade de M.C. Escher (1961)
1.6 Le stéréogramme << JIOSC >>
5.1 Mosa ï ques de points multi-colores
8.1 Malouma et Takété
9.1 Accord
9.2 Mélodie
10.1 Combinaisons des différents types de processus
A.1 Questionnaire destiné aux personnes daltonniennes (page 1/2)
A.2 Questionnaire destiné aux personnes daltonniennes (page 2/2)
A.3 Questionnaire destiné aux personnes non daltonniennes
Introduction
JIOSC 97
Les Journées Interdisciplinaires d'Orsay sur les Sciences Cognitives proposaient en 1997 le sujet
suivant : La perception, du naturel à l'artificiel [34]. Ce sujet a été
traité les 1er et 2 décembre suivant trois principaux modes de fonctionnement : les
conférences plénières, les ateliers et les posters.
Objet de l'étude
Parmi les cinq sens intervenant dans la perception humaine, la vue est sans aucun doute le plus
étudié. On ne compte plus les ouvrages traitant de la vision, et la vue semble être à la fois le
sens le plus facile a étudier (troubles clairement reconnaissables, caractère très objectif) et
celui qui permet le mieux de percevoir le monde.
Les dimensions de la perception
Nous étudierons donc la reconnaissance et la différenciation dans les domaines visuel et sonore. Nous
le ferons selon deux méthodes : tout d'abord ponctuellement, avec par exemple la reconnaissance
d'une image ou d'un son, puis dans le temps, avec par exemple la reconnaissance d'un mouvement ou
d'un morceau de musique.
A propos de la culture et des enfants
Nous allons voir que la culture joue un rôle essentiel dans la perception. Mais pour reconnaître
et différencier, il faut posséder des modèles et être capable de manipuler des concepts. C'est
pour cette raison que nous ne traiterons pas des enfants ici, ces derniers étant en cours de
développement.
Part 1
Le domaine visuel
Chapter 1
La reconnaissance dans le domaine visuel
1.1 Reconnaissance de formes
1.1.1 Reconnaissance des formes chez l'homme
1.1.2 Reconnaissance artificielle des formes
1.1.3 Vision d'objets en 2D dans un environnement 3D
1.1.4 Les illusions graphiques
Les illusion classiques
Les illusions des prix
Les stéréogrammes
1.2 Reconnaissance des couleurs
1.3 Reconnaissance des mouvements
Chapter 2
La différenciation de formes dans le domaine visuel
Chapter 3
La question de la spatialisation
Chapter 4
De la reconnaissance à la représentation
4.1 La représentation
"Une
théorie du sens et de la signification est possible dès lors que le sens est
distingué de la représentation mentale, dès lors que le problème du sens possède une autonomie
théorique vis-à-vis de la
psychologie."
(Bruno BACHIMONT, [1], p. 249)
4.2 L'approche phénoménologique
4.3 Trois hypothèses des sciences cognitives
4.3.1 Thèse représentationnaliste
4.3.2 Paradigme computo-représentationnaliste
Fodor divise même l'esprit en dispositifs très spécialisés [8].
Ces modules traiteraient l'information du monde réel de façon automatique et c'est ainsi que les
représentations nous viendraient.
4.3.3 Projet constructiviste
Chapter 5
Troubles de la perception visuelle
5.1 Le daltonisme
5.1.1 Définition
5.1.2 Reconnaissance et différenciation des couleurs
5.1.3 Les troubles occasionnés par le daltonisme
5.1.4 Le daltonisme comme différence utile
5.2 La cécité
Part 2
Le domaine sonore
Chapter 6
La reconnaissance dans le domaine sonore
6.1 Reconnaissance de sons
6.2 Reconnaissance d'une note de musique
6.3 Reconnaissance d'une mélodie
Chapter 7
La différenciation dans le domaine sonore
7.1 Différenciation de mélodie
Part 3
Parallèle entre les mondes visuel et sonore
Chapter 8
Approche naïve
Chapter 9
Approche artistique
Chapter 10
Les processus cognitifs et leurs niveaux
10.1 A propos de la reconnaissance
10.1.1 Proposition de deux premiers niveaux
10.1.2 A propos de la stéréo-perception
10.2 A propos de la différenciation
Conclusion
Des types et des niveaux
Dans cette vision particulière de la perception humaine, et dans le cadre
de la reconnaissance et de la différenciation19,
nous avons vu qu'il pourrait y avoir trois types de processus cognitifs :
Niveaux ® 1 2 3
¯ Combinaisons
1 Reconnaissance de
l'entité
2 Reconstruction men- Reconnaissance de
tale par mémorisation l'entité
3 Reconnaissance de Différenciation
l'entité
4 Reconstruction men- Reconnaissance de Différenciation
tale par mémorisation l'entité Vers une perception artificielle modulaire
Actuellement les architectures des logiciels s'orientent de plus en plus vers des structures
modulaires où on peut ajouter, supprimer ou échanger des composants.
Un des buts de ces architectures est notamment de pouvoir réutiliser au maximum les composants
logiciels (pour par exemple accélérer les phases de développement, organiser les structures
complexes et/ou faciliter la maintenance).
On pourrait donc imaginer des systèmes de perception artificielle basés sur ce modèle de
composants.
Les composants pourraient être les trois types de processus précédemment exposées, ils
pourraient traiter des données en provenance du monde visuel comme du monde sonore ; et le système
pourrait être, pourquoi pas, étendu aux autres sens, si leurs processus se révélaient comparables.
Bibliography
Part 4
Annexes
Appendix A
Enquête sur le daltonisme
Footnotes:
File translated from TEX by TTH, version 1.57.