Rhétorique visuelle et énonciation1 

Maria Giulia Dondero 

https://doi.org/10.25965/visible.504

Sommaire
Texte intégral

0. Introduction

Le présent texte est à considérer comme un développement de deux autres articles (Dondero 2010a ; 2011) concernant les différences et les affinités entre la rhétorique des figures visuelles du Groupe µ et la rhétorique de l’énonciation relevant de la sémiotique du discours.

Dans cette étude, nous reviendrons dans un premier temps sur ces deux approches de la sémiotique visuelle que nous caractériserons par le biais de leurs conceptions respectives de la rhétorique — en prenant en considération la théorie de Jean-François Bordron également, qui peut être entendue comme un lieu de rencontre entre les deux autres. Dans un deuxième temps, nous nous consacrerons à développer la notion d’énonciation visuelle au sein de l’approche de la sémiotique du discours. L’objectif est d’ouvrir des pistes pour envisager l’étude des différents statuts de l’image (artistique, scientifique, éthico-politique, religieux, etc.) à partir d’une théorie de l’énonciation visuelle qui dépasse le niveau de l’énonciation énoncée.

1. Trois approches en rhétorique visuelle

La première approche concerne la rhétorique des figures du Groupe µ (1992). Cette rhétorique se présente comme un système d'opérations accomplies sur une grammaire visuelle tant iconique que plastique. Ces opérations sont censées produire des écarts visuels (degré perçu de la figure) par rapport à des normes perceptives et sémantiques (degré conçu de la figure). Ces normes relèvent des types iconiques afférents à des encyclopédies plus ou moins locales, d’un côté, et à des normes instituées par la théorie de la Gestalt (les lois de continuité, de différentiation, de construction des configurations), de l’autre.

La théorie du Groupe µ en rhétorique visuelle a été exemplifiée par des images artistiques et publicitaires : ces deux statuts, l’artistique et le publicitaire, n’ont jamais fait l’objet d’attention analytique dans le cadre de la modélisation théorique. D’une certaine manière, nous pourrions dire que ces recherches ont projeté le visuel sur l’artistique et le publicitaire, qui sont les domaines où la créativité est valorisée par rapport à une norme. C’est souvent cet écart par rapport à la norme qui fait qu’une image puisse effectivement être considérée comme artistique, l’art étant le domaine du dépassement continuel du connu et du normé. Les exemples relevant d’autres statuts ne figurent pas dans le Traité du signe visuel (Groupe µ, 1992) et il faudrait se demander si la raison ne réside pas dans le fait que les images relevant d’autres statuts ne fonctionnent pas comme des écarts par rapport à des normes… La rhétorique des figures n’a jamais pris l’image scientifique comme lieu d’exercice pour tester la puissance de la théorie par exemple. D’une certaine manière, l’analyse rhétorique de l’image insérée dans un discours scientifique demanderait une approche un peu différente de celle utilisée pour l’image artistique parce que l’image scientifique ne peut jamais fonctionner à l’instar d’une textualité clôturée et isolée. Dans le cas de la science, l’écart se manifeste toujours par rapport à un savoir d’autorité ou à des normes de référence qui se transforment d’une expérience à l’autre. Ceci dit, la théorie du Groupe µ, qui se base sur des écarts et des normes, n’est pas précieuse exclusivement pour les images artistiques, qui trouvent dans ce renouvellement des normes et des exceptions aux normes leur dynamique et leur sens, mais elle peut se révéler utile aussi pour analyser l’image relevant du discours scientifique. L’écart des normes signale dans ce dernier cas un obstacle qui devient une source de doute, d’arrêt, et peut-être de découverte. Chaque expérience scientifique fixe toujours un référentiel, voire un « théâtre de l’apparition » (Bordron 2009) où un phénomène doit pouvoir apparaître (ou pas) : si cette apparition n’a pas lieu ou n’a pas lieu dans la manière prévue, cet écart permet de revoir, et dans certains cas de la manière de corriger, la chaîne des transformées de l’expérience, ses sources et ses instruments. L’écart de positionnement, de forme ou d’apparition tout court marque un point d’arrêt, un nouveau centre de la discussion : ces écarts permettent d’acquérir une meilleure connaissance au moins des limites de l’opération expérimentale.

Les cas de la publicité, de la religion, de la presse et de l’actualité impliquent des rapports encore différents entre la norme perceptive stabilisée dans les pratiques culturelles de la vision et l’écart visuel, et ceux-ci restent à explorer. Notre objectif est de donner des suggestions pour caractériser finement les différentes vies des images à l’intérieur des institutions qui en valorisent des fonctionnements spécifiques : il s’agirait en fait de déplacer l’attention des images isolées entendues en tant que textualités et en tant qu’exemples du fonctionnement d’un visuel généralisé vers une étude des rhétoriques déterminant les différents statuts dont relèvent des multiples séries d’images.

La deuxième approche de la rhétorique visuelle se fonde sur la sémiotique du discours et nous la nommerons rhétorique de l’énonciation. L’article de Jacques Fontanille (1996), « Le trope visuel entre présence et absence », est très explicite sur la manière dont une théorie du discours, qui a dépassé les limites du signe via la théorie de l’énonciation, peut affronter la question de la rhétorique. Dans ce texte, l’auteur affirme que la rhétorique concernerait non pas un répertoire ou un système de règles et de normes de production des tropes mais des catégories et des opérations propres à la praxis énonciative elle-même et plus précisément les effets des figures sur le processus énonciatif en cours. Parmi ces effets des figures sur le processus énonciatif, Fontanille cite les déplacements de l’assomption énonciative, son affaiblissement/renforcement, les effets d’aspectualité et de tempo — et plus précisément l’amplification (qui concerne l’étendue) et l’accélération (qui concerne l’intensité) du tempo. Ces instruments analytiques permettraient de décrire non seulement une perception gestaltique mais les rythmes du déploiement visuel : si l’étendue de la rhétorique visuelle du Groupe µ concerne des aspects « non grammaticaux » dans l’agencement entre les sous-unités visuelles à l’intérieur d’une image, dans la sémiotique du discours et dans la sémiotique tensive, la taille de l’objet d’étude est plus importante car la rhétorique visuelle concerne le domaine de la praxis énonciative. Si la rhétorique des figures se fonde surtout sur l’opération de substitution d’une grandeur de l’expression par une autre, la rhétorique de la praxis énonciative concerne les couches discursives constituant la profondeur du discours et se disputant la manifestation. Les rapports entre les différentes couches discursives ne s’analysent pas en termes de remplacement mais d’intersection des voix énonciatives que le discours met en tension l’une l’autre créant de rapports de compétition et de conflit. En ce sens, le but de l’analyse de ces rapports n’est pas de repérer des figures, mais de caractériser les variations et les modulations des différents degrés d’assomption énonciative et des rythmes d’apparition, disparition et transformation des valeurs dans l’épaisseur discursive.

À ce propos, l’article de Denis Bertrand (2003), « L’extraction du sens : instances énonciatives et figures de l’indicible », affirme que le processus rhétorique en discours est analysable sur la base de trois séries de critères :

Ceux qui définissent tout d’abord les conditions de coexistence des catégories en concurrence (compatibilité ou incompatibilité, hiérarchie, extension ou intensité, etc.) […] ; les critères qui définissent ensuite les modes de présence relatifs de ces grandeurs simultanément signifiantes et se disputant la manifestation, selon la gradation des modes d’existence : sont alors en jeu les parcours du virtualisé́ à l’actualisé, de l’actualisé au réalisé́, du réalisé́ au potentialisé (lorsque les grandeurs sont mises en attente, impliquées et prêtes à̀ la manifestation) ; les critères qui définissent enfin l’assomption énonciative, par laquelle le sujet du discours prend position sur le mode de présence relatif des grandeurs concernées et les assume selon des degrés faibles d’intensité́ variables, forts ou faibles.

(Bertrand 2003, p. 4 de la version en ligne, nous soulignons)

L’association entre la perspective des modes d’existence et celle de l’assomption énonciative permet de différencier les modulations réciproques des multiples couches discursives.

Ceci dit entre parenthèses, en sémiotique visuelle, le problème de la gradation et de la modulation de l’assomption énonciative mène à une interrogation décisive concernant le langage visuel, qui pousse la recherche rhétorique vers ses frontières avec la tradition de la logique et de la linguistique : l’image peut-elle nier ce qu’elle représente, à savoir construire une distance entre ce qui est représenté sur son support et ce qui est assumé par le sujet de l’énonciation (Dondero 2012) ?

Note de bas de page 2 :

Sur la relation entre les degrés de monstration/exposition de l’informateur et la capacité/difficulté de capture de l’observateur, voir Fontanille (1989).

Bien sûr, il ne faut pas confondre la « positivité physique » de l’image avec l’affirmation prédicative — qui relève de la dimension du sens — : l’image est bien sûr positive au sens où elle présente toujours des signes sur un support, qui exemplifient toujours des propriétés, pour le dire selon Nelson Goodman (1968), mais cela ne revient pas à dire qu’elle est obligée d’affirmer ce qu’elle met en scène, ni qu’elle doit en prendre l’entière responsabilité. D’un point de vue méréologique et rhétorique, en fait, l’image peut moduler le représenté par soustraction, diminution, détournement, partition, addition, multiplication par rapport à une attente — comme l’a montré le Traité du signe visuel du Groupe µ ainsi que Bordron (2010). D’un point de vue énonciatif, l’image peut moduler le représenté par la non-assomption, prise de distance ou détournement, d’une valeur assertée dans l’image. On peut en fait repérer dans les configurations visuelles des différences de potentiel énergétique ainsi que sémantique et des dissymétries d’assomption énonciative des parcours virtualisés, actualisés, réalisés et potentialisés : l’image peut, par exemple, faire tomber dans la virtualisation des formes pourtant attendues dans le cadre d’une syntaxe figurative homogène ou bien ériger des obstacles à la réalisation d’une vision totalisante. En fait, tout en mettant en scène des objets, l’image n’est pas forcement obligée de les affirmer : elle peut moduler leurs différents degrés de présence jusqu’à les virtualiser et à les nier. Depuis De la représentation de Louis Marin, avec sa distinction entre représentation et présentation de la représentation, on peut affirmer que l’image se dédouble ou même se démultiplie et acquiert ainsi la possibilité de se déclarer elle-même comme véritable, erronée, fausse, infidèle ; elle peut assumer de manière contrastive ce qu’elle affirme sur le plan de l’assertion. Cela revient à dire que le fait que des objets soient représentés ne signifie pas automatiquement qu’ils sont pleinement assumés comme présents ou comme intentionnels de la part de l’énonciateur, ni comme pleinement révélés à l’observateur2.

Les modes d’existence rendent compte du fait que les figures représentées peuvent être manifestées à travers des degrés de présence différents. Dans une image, on peut en fait repérer des figures réalisées, à savoir pleinement reconnaissables et situées à la bonne place dans un environnement figuratif stable (et là, l’image est bien positive et affirmative). Voici, comme exemple, un portrait de famille du photographe Paul Strand (Fig. 1).

Fig. 1. Paul Strand, The Lusetti Family, Luzzara, Italy, The J. Paul Getty Museum, Los Angeles, 1953, Gelatin silver print, 11.7 x 15.1 cm ©Aperture Foundation

Fig. 1. Paul Strand, The Lusetti Family, Luzzara, Italy, The J. Paul Getty Museum, Los Angeles, 1953, Gelatin silver print, 11.7 x 15.1 cm ©Aperture Foundation

Mais on peut également repérer des figures virtualisées, à savoir des figures qui sont absentes mais dont le manque est manifesté : il s’agit de l’affirmation d’une négation, par exemple, lorsqu’il y a une interruption dans ce qui devrait être le déploiement stéréotypé de la syntaxe figurative. Voici un exemple, extrait de la production du photographe Denis Roche (Fig. 2). Le regard de la fille vers l’observateur est virtualisé en faveur de la mise en scène de l’acte créateur (Basso Fossali & Dondero, 2011).

Fig. 2. Denis Roche, 28 mai 1980 (Rome, « Pierluigi »), avec l’aimable autorisation de la Galerie Réverbère (Lyon).

Fig. 2. Denis Roche, 28 mai 1980 (Rome, « Pierluigi »), avec l’aimable autorisation de la Galerie Réverbère (Lyon).

Dans d’autres cas, il peut s’agir aussi de figures actualisées, à savoir de figures présentes dans l’image mais faiblement assumées, cachées à l’observateur, ou difficilement reconnaissables. C’est le cas du flou en photographie par exemple, mais aussi en peinture où les figures peuvent être représentées dans leur survenir, ou bien dans leur explosion, ainsi que dans leur processus de disparition, comme ici dans le cas du Pape Innocent X de Francis Bacon (Figure 3).

Fig. 3. Francis Bacon, Étude d'après le portait du Pape Innocent X de Vélasquez (1953) (Des Moines Art Center, Iowa). Purchased with funds from the Coffin Fine Arts Trust; Nathan Emory Coffin Collection of the Des Moines Art Center, 1980.

Fig. 3. Francis Bacon, Étude d'après le portait du Pape Innocent X de Vélasquez (1953) (Des Moines Art Center, Iowa). Purchased with funds from the Coffin Fine Arts Trust; Nathan Emory Coffin Collection of the Des Moines Art Center, 1980.

Enfin, il peut y avoir des figures potentialisées, à savoir en attente d’être développées par d’autres images ou par un hors-cadre – et dont, pourrait-on dire, on attend la suite. Voici un exemple (Figure 4) issue de la peinture religieuse et plus précisément de la peinture des visions extatiques : la Sainte Cécile de Raffaello. Ici on est face à l’affirmation d’une impossibilité de « continuer » dans l’avancement d’un récit, celui de la vision céleste de la Sainte Cécile. Ce tableau affirme la négation du déploiement de la vision transcendante : la vision appartient au domaine du non représentable et du non communicable, et ce qui est représenté dans le nuage n’est qu’un aperçu de ce dont on ne pourra jamais avoir une vision pleine.

Fig. 4. Raffaello Sanzio, L’extase de Sainte Cécile, 1515-1516 Pinacothèque nationale de Bologne, inv. 577. Avec l’aimable permission de MiBACT, Photo Pinacoteca Nazionale, Bologne

Fig. 4. Raffaello Sanzio, L’extase de Sainte Cécile, 1515-1516 Pinacothèque nationale de Bologne, inv. 577. Avec l’aimable permission de MiBACT, Photo Pinacoteca Nazionale, Bologne

Ces exemples ne sont peut-être que des tentatives hâtives de classer les instabilités rhétoriques de l’image, et nous sommes conscients que chaque exemple choisi peut instaurer une tension entre les quatre modes d’existence. Pour préciser les choses, il faudrait bien sûr insérer chaque image à l’intérieur d’un corpus ou d’un récit…

Dans un autre cadre, celui des images de statut scientifique, les modes d’existence permettent de rendre compte de la flexibilité de l’objet des recherches expérimentales en science : l’objet est avant tout une construction idéale et il sera progressivement identifié avec plusieurs « chaînes de transformations » — pour parler comme Bruno Latour (2001). L’objet scientifique est en fait avant tout imaginé (potentialisé) et les images ou les graphiques qui visent à représenter les résultats des investigations ou qui rendent visibles les comparaisons entre un modèle (virtuel) et des résultats obtenus (actuels) sont des approximations par rapport à celle qui sera choisie comme image identifiant l’objet et qui sera présentée à un public (réalisée).

Du point de vue des modes d’existence et par rapport à un objet de recherches, l’image choisie pour la vulgarisation peut être considérée comme une image réalisée, tandis que l’image finale d’une chaîne dans un processus d’expérience vaut comme une image actualisée par rapport à la chaîne qui l’a produite mais elle peut être considérée comme image potentialisée par rapport aux développements possibles de la recherche.

Nous sommes convaincue que les modes d’existence sont déterminants pour le développement d’une rhétorique de l’image dans le discours scientifique car ils peuvent expliquer les approximations, mais aussi les déviations de la recherche, et plus généralement l’archéologie d’un parcours de la pensée visant la constitution d’un objet : les pistes qui se sont présentées comme possibles et les décisions effectuées.

On s’aperçoit que, tout n’étant pas directement liée au modèle de la rhétorique de l’argumentation de Perelman, cette seconde acception de la rhétorique a en commun avec la rhétorique argumentative la taille pertinente de l’analyse : le discours dans son déploiement. La taille de l’objet analysé est en fait différente d’une image isolée et prend en compte des figures rhétoriques qui s’étendent dans des corpus où le repérage des écarts par rapport à des normes acquiert une grandeur intertextuelle ou concerne les inter-domaines tels que l’artistique et le scientifique.

La troisième approche de la rhétorique visuelle trouve son point de départ dans une sémiotique de la perception et la développe en une méréologie. Nous nous réfèrons, comme déjà annoncé, aux travaux de Jean-François Bordron sur l’iconicité. Ceux-ci conjuguent, à mon sens, l’approche énonciative propre à la sémiotique du discours avec les opérations rhétoriques instituées par le Groupe µ dans le Traité du signe visuel. La rhétorique pourrait s’entendre ainsi comme « une gestuelle opérant sur des totalités et sur des parties ». Le domaine de la rhétorique comprise comme une méréologie aurait comme projet « de reconnaître des actes (séparer, fusionner, lier, unifier, partager) portant sur des genres de relations (partie/tout, liaison/diversité, unité/multiplicité, dépendances entre instances) » (Bordron, 2010, p. 39).

L’auteur explique ainsi sa vision de la rhétorique :

La rhétorique suppose en son fond l’idée d’un objet doué d’une dynamique (il s’agit toujours d’action) et susceptible de compositions multiples. Que les parties constituant cet objet soient des arguments, des notions, des traits ou des couleurs n’est évidemment pas sans importance. Mais on peut postuler que, sous-jacente à ces sémiotiques particulières, se trouve la même exigence de composition, terme qui s’applique aussi bien au discours en langue qu’à une image. Il nous semble que, au moins quant à sa structure fondamentale, la composition relève d’une théorie du tout et des parties (une méréologie). 
(Bordron 2010, p. 39, nous soulignons)

Dans le cas du statut scientifique, cette approche permettrait d’étudier la manière dont l’objet de recherches est construit par les scientifiques à travers les images ou les séries d’images qui composent ce qui sera présenté comme l’objet scientifique : les séries d’images fonctionneraient comme des étapes manifestant les manières dont un objet de recherches est monté, démonté, commence à exister et devient communicable. Une approche méréologique pourrait contribuer à décrire le rapport entre l’objet scientifique dans sa totalité théorique et les différentes perspectives que les visualisations offrent de lui, voire les différentes versions, expérimentales, de sa composition.

2. L’énonciation énoncée : subjectivité et genres

Si dans des écrits précédents, nous nous sommes attachée à explorer la rhétorique visuelle du Groupe µ (Dondero 2010a), et à l’heuristique de la théorie de Bordron pour l’étude de l’image de statut scientifique (Dondero 2010b), nous voudrions à présent expliciter les raisons pour lesquelles la théorie de l’énonciation assure à notre sens une puissante compréhension du fonctionnement des images.

Nous craignons que l’heuristique de cette notion opérationnelle soit assez méconnue par le monde extérieur à la communauté des sémioticiens greimassiens. Pourtant, nous sommes convaincue depuis longtemps que la perspective de l’énonciation permettrait à la sémiotique de nourrir des liens déterminants avec les autres disciplines qui étudient l’image, telles que la philosophie de l’art, les sciences de l’information et de la communication, ainsi que la sociologie et l’anthropologie de l’art.

La notion d’énonciation, déclinée en énonciation énoncée, énonciation en acte et praxis énonciative, permettrait de faire émerger et d’étudier les fonctionnements variés de l’image, voire les différents statuts que l’image assume dans le cadre des institutions qui la valorisent comme image artistique, scientifique, politique, documentaire, etc. L’énonciation permet non seulement d’analyser l’articulation de sens de l’image (énonciation énoncée), mais aussi, à travers l’étude du sens des statuts qui la déterminent (praxis énonciative), les fonctionnements des domaines sociaux.

L’énonciation est un concept opérationnel qui nous paraît promis à un long avenir devant lui, surtout si on l’articule aux différents niveaux de pertinence sémiotique, comme le préconise Jacques Fontanille (2008).

Nous voudrions tout d’abord tenter de parcourir brièvement le développement de la théorie de l’énonciation dans le cadre du visuel, en partant de la transposition de la déclinaison de la pronominalité verbale en celle visuelle. Ensuite nous proposerons quelques pistes pour étudier les statuts de l’image en prenant également en considération les genres visuels.

Partons de la question classique, celle de la subjectivité, pour passer ensuite à la question des genres.

Comme il est couramment admis, plusieurs études en histoire de l’art et en théorie de l’image ont mis en relation la notion d’énonciation chez Émile Benveniste avec la question de la subjectivité dans l’image : il s’agit des travaux de Jean Paris (1965), de Louis Marin (1993) et de Daniel Arasse (1983 ; 1984 ; 1985 ; 1997 ; 1993 ; 1995).

Il est utile de rappeler brièvement que dans les discours verbaux, les marques énonciatives de la subjectivité et de l’intersubjectivité concernent notamment les pronoms personnels (je, tu, il, etc.) ainsi que les temps verbaux et la description et l’appropriation des lieux : selon Benveniste, par exemple, le pronom je est couplé à un ici et maintenant, ainsi que le il, la troisième personne, l'est à un ailleurs et à un alors.

Note de bas de page 3 :

Anne Beyaert-Geslin, dans plusieurs écrits, a pris en considération des images mettant en scène la subjectivité en l’articulant à travers le « on », la troisième personne entièrement impersonnelle, bien qu’il s’agisse d’images de face qui pourraient rappeler la relation personnelle « je-tu ». Pourtant, le « on » met en crise la notion même de portrait car le « on » appartient à tout le monde, il nous fait tous semblables, et il estompe toute singularité.

Note de bas de page 4 :

Voir à ce propos Benveniste (1966, p. 238). La distinction de Benveniste entre l’énonciation historique et l’énonciation discursive correspond à ce que Greimas et Courtès (1979) appellent débrayage énoncif et débrayage énonciatif. L’énon-ciation historique concerne les événements passés, clôturés, qui semblent se raconter eux-mêmes, sans aucune intervention du locuteur dans le récit. L’énonciation discursive, par contre, est caractérisée par tout énoncé supposant un locuteur et un auditeur dans un temps présent, et chez le premier l’intention d’influencer l’autre en quelque manière. Benveniste affirme qu’il s’agit surtout des discours oraux ou des écrits qui reproduisent des discours oraux ou qui en empruntent le tour et les fins : correspondances, mémoires, théâtres, ouvrages didactiques, bref tous les genres où quelqu’un s’adresse à quelqu’un, s’énonce comme locuteur et organise ce qu’il dit dans la catégorie de la personne.

Dans l’histoire de la sémiotique de l’image, c’est le système des regards qui a occupé la place qui revient aux pronoms dans le discours verbal. Le profil et le regard de face sont donc des transpositions visuelles de ce qu’on peut appeler respectivement énonciation historique (impersonnelle) et énonciation discursive (personnelle)3, si on reprend les termes de Benveniste4.

En ce qui concerne la question énonciative du temps, elle a été moins souvent abordée par rapport à la peinture et à la photographie car la sémiotique aussi a malheureusement subi l’influence de la dangereuse distinction entre arts de l’espace et arts du temps… Certains sémioticiens considèrent l’image fixe comme fixe justement, comme si elle ne déployait pas une conception du temps à travers la configuration de l’espace et des figures qui l’habitent. Ce choix implique l’écrasement des effets de sens produits par la composition visuelle sur la matérialité de l’objet-support.

Note de bas de page 5 :

Pour une étude des rythmes de la peinture matissienne, voir Beyaert-Geslin (2004).

Le temps est par contre signifié dans l’image par la disposition des figures sur les différents plans en profondeur et par l’orientation du regard que l’image nous impose. Chez Matisse, par exemple, tout est conjugué au temps présent, car toutes les figures sont disposées sur le même plan et la présence simultanée de tous les objets fonctionne comme une assimilation au temps présent5.

Dans la peinture figurative le premier plan signifie normalement le temps présent, mais dans le cas des tableaux de Rothko par exemple, comme chez Matisse, tout apparaît au premier plan — ce qui n’arrive pas dans le cas de Kandinsky où on distingue aisément la figure du fond. Dans le cas de Rothko, ce sont les différences de potentiel lumineux qui nous permettent de construire un avant et un après, une histoire des luttes de la lumière pour émerger, comme le démontre Fontanille dans son étude sur Rothko (1994).

Note de bas de page 6 :

Dans le cas d’images qu’on appelle abstraites, comme celles de Kandinsky étudiées par Floch (1985), ou celles de Rothko étudiées par Fontanille (1994), on peut parvenir à identifier des parcours qui orientent le regard de l’observateur via le parcours de la lumière : l’étude de l’énonciation énoncée concerne non seulement un lieu à occuper face à des visages, des corps et des objets disposés plus ou moins frontalement, mais surtout, et plus généralement, le parcours perceptif que l’image préfigure pour l’observateur.

Avec l’exemple des plans en profondeur on dépasse déjà le premier stade de la comparaison entre énonciation verbale et énonciation visuelle qui s’appuyait sur les pronoms et les orientations du visage et du regard. Ces orientations peuvent être considérées comme des unités aisément identifiables : le défi est bien sûr de repérer les simulacres de la subjectivité là où il n’y a pas de visages ni d’actions représentés6.

D’ailleurs, si la subjectivité est considérée par maintes disciplines comme une totalité, les théories de l’énonciation et de l’actantialité ont permis de la concevoir comme distribuée dans des corps et des objets différents, mais aussi dans des portions de l’espace et dans des intensités lumineuses changeantes au sein de l’image. Grâce à la théorie de l’énonciation, on peut montrer la manière dont la subjectivité éclate et circule à l’intérieur de l’image, souvent sous la forme d’une lutte pour s’affirmer, comme le dit Fontanille dans Les Espaces subjectifs (1989). Ici il affirme que la perspective de chaque image découle du produit de la lutte entre l’informateur et l’observateur pour acquérir le savoir, voire une vision complète des choses.

Nous sommes convaincue également que l’image peut être conjuguée non seulement au présent mais aussi au passé et au futur : on peut d’ailleurs concevoir une directionnalité, signifiée dans l’image à travers un trajet perceptif vers la profondeur du passé ou d’un ailleurs, à savoir vers ce qui est loin dans le temps et dans l’espace, ou une directionnalité vers l’observateur, vers ce qui est proche de nous dans l’espace et dans le temps, à savoir un ici-et-maintenant ou un temps futur.

Une photographie scientifique est souvent conjuguée au passé (lorsqu’elle est le résultat de preuves successives ou la sommation d’autres résultats) et au futur (lorsqu’elle relance la recherche collective), tandis qu’une image de vulgarisation est toujours une image conjuguée au présent (Dondero & Fontanille 2012). Au futur est conjuguée également la nature morte en peinture, qui fonctionne toujours comme un memento mori ; la photo d’actualité et notamment le reportage politique sont souvent conjugués au présent pour engager éthiquement l’observateur, nous interpeller et nous faire prendre position. Les images artistiques et publicitaires sont celles qui jouent le plus avec les différentes temporalités afin de dépayser nos compétences et nos habitudes perceptives.

En ce qui concerne l’espace, les images nous présentent un ailleurs — c’est souvent le cas des paysages qu’on aperçoit par une fenêtre ouverte — ou une vision directe et frontale, un ici.

Ces considérations nous amènent à distinguer les formes de subjectivité selon les genres, et notamment selon les genres picturaux, qui sont les plus codés et se présentent ainsi comme un point de départ sûr.

Dans le cas du portrait, les sujets dans le tableau établissent une relation je-tu, voire un dialogue direct : la personne qui nous regarde depuis le tableau fonctionne comme un miroir qui nous interroge directement dans les yeux et nous enlace dans une relation dialogique symétrique et conjuguée au présent. Mais les sujets peints dans un tableau peuvent nous traiter comme des « troisièmes personnes » quand ils sont disposés de profil, comme dans le cas des tableaux d’histoire, où les événements se déroulent sans nous interpeller. La scène d’histoire concerne en fait un rapport asymétrique entre quelque chose qui s’est déjà passé et un observateur qui contemple au temps présent (énonciation en acte). Le rapport n’est donc pas biunivoque comme dans le cas du portrait car l’événement regardé est déjà clôturé.

Pourtant, comme nous venons de le dire, la relation intersubjective ne se limite pas au système des regards humains thématisés et mis en scène de manière directe : la relation énonciative s’étend aussi aux positionnements des objets par rapport à leur hors-cadre et par rapport à la place de l’observateur. Pensons à la nature morte qui ne représente aucun personnage ni aucune action proprement dits, ni n'implique aucune figuration du système des regards : l’objet (verre, couteau, assiette, fleur, etc.), immanquablement posé dans une niche, semble toujours tomber de la table vers nous les spectateurs. L’observateur est visé par les objets représentés qui semblent tomber vers un hors-cadre en deçà des limites de la surface des images, en deçà de la frontière de la représentation. On pourrait dire qu’il s’agit d’images conjuguées au futur, mettant en scène le parcours vers un lieu de l’ici du spectacteur qui, du point de vue temporel, ne sera que le résultat de la transformation des objets périssables en poussière — les objets de la nature morte sont destinés à tomber, au sens le plus large du terme. Nous, les observateurs, représentons le futur de la nature morte en tant qu’humanité destinée à se transformer elle aussi en poussière ; en ce sens la nature morte nous traite comme un nous (l’humanité) et non pas comme un tu (l’individu), contrairement au portrait. Les objets nous interpellent car représentés en saillie mais en fait, il ne s’agit pas d’un dialogue « je-tu » proprement dit : il s’agit par contre d’un dialogue entre des objets inanimés et périssables et les êtres humains que nous sommes : il s’agit d’un dialogue impersonnel. Ce dialogue ne relève pas du dialogue je-tu proprement dit (première et deuxième personnes du singulier) mais de la relation nous-vous (première et deuxième personne du pluriel) : il s’agit d’un dialogue impersonnel car la nature morte s’adresse non pas à un individu précis mais à une humanité généralisée, à tout homme mortel et vulnérable, en lui adressant un avertissement : « vous allez mourir, comme nous, objets périssables, parmi d’autres objets périssables ». On pourrait ainsi affirmer que la nature morte est un genre hybride car il établit un dialogue, certes, mais un dialogue indirect entre des collectivités (d’objets et d’humains). Ces collectivités sont constituées d’objets s’assemblant sous la forme d’architectures d’équilibre précaire, destinées à la chute, et des figures humaines non singulières, sans identité spécifique : l’identité de l’homme qui observe la nature morte devient une identité diffusée à l’instar de la multiplicité d’objets mise en scène. La nature morte concerne finalement un dialogue entre des non-personnes : les objets multiples en équilibre instable sont en train de tomber vers l’observateur et prennent l’initiative d'inciter un homme générique à réfléchir sur l’instabilité des positions, la fragilité de toute chose, ainsi que la tromperie de toute apparence — la nature morte met d’ailleurs toujours en scène des surfaces réfléchissantes construisant des mirages et se révélant ainsi être le genre « trompeur » par excellence.

3. De l’énonciation énoncée à l’énonciation comme médiation entre Expression et Contenu

L’énonciation a pris, ces quinze dernières années, une place prépondérante dans le système théorique d’inspiration greimassienne : elle a assumé le rôle unificateur et fondateur qu’avait eu le parcours génératif du contenu. Cela a été possible grâce aux études sur l’image et les médias qui ont nécessairement porté l’attention des sémioticiens sur l’acte de textualisation, sur la syntaxe de production du plan de l’expression, voire sur sa genèse, et non seulement sur les effets de sens des textes — qui relèvent de la générativité.

Note de bas de page 7 :

Voir Fontanille (2008).

Le parcours génératif du contenu a établi que la textualisation n’est qu’un résultat secondaire d’une architecture de conversions entre niveaux construite indépendamment d’elle. La textualisation a donc été considérée comme un « ajout » final après la conversion progressive des niveaux profonds du parcours génératif  c’est ce rôle qui lui est donné dans le dictionnaire Greimas-Courtès en 1979. La textualisation en tant que mise en discours devrait être entendue plutôt comme le lieu à partir duquel les contenus et les valeurs prennent place, se modulent et se distribuent. Le parcours de l’expression proposé par Fontanille en 2004 ainsi que par Bordron (2011) visent, tous deux, à dépasser la faiblesse de cette approche sémiotique dominée par le parcours génératif du contenu, qui fait abstraction de toute influence de l’acte de textualisation7.

Pour Fontanille (2004), l’énonciation se définit comme le lieu de la constitution et du partage du plan de l’Expression et du plan du Contenu non seulement des énoncés mais également des pratiques observables dans notre vie quotidienne (énonciation en acte). L’acte énonciatif est en fait à la base du partage des deux plans de configuration sémiotique, de leur stabilisation iconique comme le dirait Bordron, et détient le rôle fondateur et régulateur de toute la production, l’orientation et l’interprétation du sens. Dans l’introduction de Soma et Séma, Fontanille revient sur l’évolution de la définition de la fonction sémiotique :

Dans la tradition saussurienne et hjelmslevienne, la relation entre les deux faces du signe ou les deux plans du langage est toujours une relation logique […]. Ce type de relation se passe d’opérateur : on constate, après coup, une fois le signe stabilisé ou le langage institué, que le signifiant et le signifié, l’expression et le contenu, sont en relation de présupposition réciproque ; il n’y a donc pas lieu de s’interroger sur l’opérateur de cette relation, et, donc, sur le rôle de l’énonciation, encore moins sur celui du corps. […] La position de Hjelmslev (et non de la tradition hjelmslevienne), est en fait plus hésitante, car il ne cesse de proclamer (1) que la distinction entre plan de l’Expression et plan du Contenu est purement pratique et n’a pas de valeur opératoire, et (2) qu’elle est fluctuante, et dépendante du point de vue et des critères de pertinence de l’analyste.

(Fontanille 2004, p. 13)

Dans Pratiques sémiotiques, Fontanille théorise un type d’énonciation spécifique à chaque niveau de pertinence sémiotique. Pour exemplifier l’intégration du texte à l’objet et successivement à la pratique il propose de prendre en considération les tablettes d’argile de l’ancien Moyen-Orient :

Le cas des objets est significatif du principe sur lequel repose l’ensemble du parcours envisagé : un principe d’intégration progressif par l’intermédiaire des structures énonciatives. En effet, le texte-énoncé présente deux plans d’énonciation différents : (i) : l’énonciation “énoncée”, inscrite dans le texte et sur la tablette, et (ii) l’énonciation présupposée, qui reste virtuelle et hypothétique ; c’est alors l’objet-support, avec sa tablette à inscrire […] qui va “incarner” et manifester par ses propriétés matérielles, le type d’interaction énonciative pertinent (ici : proposer/accepter, puis contester/vérifier/arbitrer). Bref, l’objet-support d’écriture intègre le texte en fournissant une structure de manifestation figurative aux divers aspects de son énonciation […]. Par ailleurs, en tant que corps matériel, cet objet est destiné à des pratiques et les usages de ces pratiques qui sont eux-mêmes des énonciations de l’objet ; à cet égard, l’objet lui-même ne peut porter que des traces de ces usages (inscriptions, usure, patine, etc.), c’est-à-dire des “empreintes énonciatives”, leur “énonciation-usage” restant pour l’essentiel, et globalement, virtuelle et présupposée : il faudra donc là aussi passer au niveau supérieur, celui de la structure sémiotique des pratiques, pour trouver des manifestations observables de ces énonciations.

(Fontanille 2008, pp. 23-24)

On peut donc repérer quatre types de modulation de l’énonciation différents suivant les modes d’existence :

  1. l’énonciation énoncée,

  2. l’énonciation virtuelle présupposée par le texte-énoncé qui est incarnée par le support-objet (et qui, à son tour, présélectionne le type d’interaction énonciative pertinent lors de la pratique future),

  3. les empreintes énonciatives déposées sur l’objet (énonciation-usage présupposé),

  4. les énonciation-usages manifestées dans la pratique, qui sont observables en acte.

Les types d’énonciation s’enchainent en une hiérarchie : ce qui était seulement présupposé à un niveau se manifeste à un niveau supérieur comme observable et cela grâce à un processus allant de la virtualité des possibles à l’actualisation des usages.

En ce qui concerne par contre la théorie de la constitution du plan de l’expression conçue par Bordron, il faut préciser que l’auteur ne parle pas d’énonciation à proprement parler dans son ouvrage L’iconicité et ses images. Le centre de l’attention est plutôt une intentionnalité de signification ayant comme cadre de déploiement un horizon ce qui nous semble bien correspondre à une certaine idée d’énonciation en tant que projet de sens. Dans son ouvrage, Bordron explique l’iconisation en prenant modèle non pas sur le langage-résultat, mais sur ce qu’il appelle un « processus émergent » : « Nous ne rejetons pas pour autant l’organisation de la fonction sémiotique selon les deux plans de Hjelmslev, mais nous pensons qu’il s’agit là d’un résultat et non du processus d’émergence du sens lors de l’iconisation du monde sensible » (Bordron 2011, p. 150, nous soulignons).

Il s’en suit que la fonction sémiotique doit être comprise non pas comme un état de dépendance entre deux formes, au sens hjelmslevien du terme, mais comme un acte. On revient à la question de la fonction rendue pertinente non pas lors de son figement mais lorsqu’elle est en cours de stabilisation.

Pour distinguer l’iconicité en tant que moment de constitution du sens de son institutionnalisation en signe (icône), Bordron trace les différences entre les sémiotiques saussuriennes et, plus généralement gestaltistes, et les sémiotiques du signe. Si ces dernières impliquent une théorie de la référence, les premières impliquent une théorie de la constitution :

Pour les structuralistes, il existe des substances ou des flux auxquels on peut donner forme. Pour eux, la signification consiste très généralement dans cette mise en forme des substances et flux, le plus souvent en les catégorisant. Le monde dans ce cas n’est pas une collection d’entités mais la donnée de forces qui viennent à prendre forme dans des actes de sémiotisation. Les théories du signe culminent donc dans une logique ; les théories structuralistes, dans une dynamique et une genèse. (Bordron 2011, p. 157, nous soulignons)

Contrairement donc aux sémiotiques du signe, de la référence, et des entités atomiques, l’iconicité appartient à une ontologie de forces à l’intérieur d’une plastique qui prend consistance.

Dans le chapitre « Sens et signification », Bordron (2011) schématise une architecture de la dynamique de l’expression, afin d’expliquer la transformation du sens (substance) vers la signification (forme). Le premier moment de cette dynamique de l’expression est celui de l’ouverture d’une virtualité : la matière concerne le fait qu’il y a quelque chose. L’indicialité concerne en fait une altérité que nous sommes appelés à explorer, elle fonctionne comme le moteur du processus suivant. Le deuxième moment est celui de la substanciation, le lieu de l’iconicité, et dépend de trois conditions : la première concerne une source d’énergie (la voix, la trace, la lumière, etc.) : quelle que soit la source pertinente, elle doit subir une sélection (seconde condition) de ses valeurs particulières — les bandes des fréquences, par exemple, peuvent fonctionner comme de formants en ce sens qu’ils sont ce à partir de quoi seront formées les articulations sonores ultérieures. La troisième condition est que les éléments servant de formants soient pris en charge par une organisation voire une articulation de la totalité en parties. C’est là que se joue la distance entre sens et signification, dans le passage entre le moment de l’organisation à l’intérieur du niveau de la substance et le moment de la « formation de la forme » au niveau du symbolique.

Venons-en à une question : on décrit, avec le processus d’iconisation, un acte s’auto-constituant voire émergeant à partir de la perception, qui est à la base de la genèse d’un plan d’expression qui constitue en même temps des contenus provisoires. Nous croyons que cet acte d’autoconstitution du plan de l’Expression a encore à faire avec le fonctionnement que nous reconnaissons à la base de l’énonciation et de la « rencontre » avec le plan du Contenu, mais peut-on encore concevoir que l’énonciation soit le lieu non seulement de la sélection de la langue de la part de l’acte de parole mais aussi de la dialectique entre langue et parole, entre compétence et performance, comme le voudraient Benveniste et Greimas ?

En sémiotique visuelle on s’est toujours confrontés avec la question de l’origine des tableaux-performances : faut-il penser à une compétence profonde qui puisse expliquer la combinatoire des traits plastiques sur la surface des discours, comme s’il s’agissait d’une grammaire ou faut-il renoncer à la lourde idée de langue comme le fait d’ailleurs Bordron ?

4. Le visuel face à la question de la langue saussurienne : les statuts

Après ce rappel du rôle constituant de l’énonciation dans la théorie sémiotique actuelle, venons-en à ce que nous considérons comme des problèmes encore ouverts bien que posés il y a longtemps. Justement le problème de la relation langue-parole dans le cas du visuel. Est-ce qu’une langue visuelle existe ? Est-ce qu’on a besoin de partir d’un répertoire de formes stabilisé, collectif, ainsi que d’une grammaire des relations pour pouvoir étudier les images ? Et, du côté de la production, est-ce qu’il existe une grammaire des possibles en peinture ? Une grammaire unique et universelle des combinaisons des couleurs, des lignes, des formes topologiques, comme l’ont, d’une certaine manière, soutenu les membres du Groupe µ en s’appuyant sur des règles perceptives ?

Au niveau de la morphologie, le problème concerne le fait que, si dans l’alphabet des langues naturelles chaque trait forme une unité facilement distinguable d’une autre (g par rapport à c par exemple), on ne peut pas dire la même chose d’un trait ou d’une ligne en peinture : il y a toujours des manifestations intermédiaires, et les unités sont à chaque fois, à chaque image, à construire et à reconstruire.

Qu'est-ce qui pourrait s'apparenter à des unités distinctes ainsi qu’à des règles syntaxiques en peinture, et notamment à des règles qui permettent ou interdisent la combinaison de certains traits comme dans le langage naturel ? Tout ce qu’on pourrait imaginer être interdit est surtout ce dont l’image artistique profite pour étonner et relancer la recherche de nouvelles formes. Ce qui est interdit, en art, est le « déjà fait » et le « déjà connu » : la règle n’est donc pas interne à une grammaire mais à des usages plus ou moins institutionnalisés par des artistes. Il y a évidemment des grammaires différentes qui agissent dans les autres domaines de l’image : le scientifique, le religieux, l’éthico-politique, etc. Nous ne pouvons donc pas envisager l’existence d’une langue visuelle universelle qui fonctionne pour tous les types d’image (comme le préconise le Groupe µ) mais nous ne pouvons pas non plus concevoir que chaque tableau constitue un système en soi, où la langue coïncide avec la parole  cela a été l’option des greimassiens dans les années 1980 : que la langue visuelle se produit en même temps que la parole ! Cela voudrait dire que chaque énoncé-tableau déploie ses propres explications à son intérieur et possède une grammaire propre à lui seulement, tout à fait autonome et unique. Cette conception impliquerait que cette langue est entièrement différente des langues des autres peintres, et supposerait un manque de communicabilité entre les projets des différents artistes et exclurait toute notion de filiation, de tradition et d’échange.

Nous cherchons une réponse médiane à ces questions : il existe plusieurs langues visuelles, selon les statuts dont relèvent les images, selon les époques et selon les cultures. Ce qu’on peut appeler langue en peinture correspond à des compétences locales, à des voies possibles et à des voies interdites ou déjà exploitées qui sont disponibles dans l’archive des formes : une stratégie permettant d’abandonner le lourd concept de langue est donc de l’articuler à travers la notion de statut. Les statuts de l’image n’ont jamais été pris en compte ni par le Groupe µ ni par l’école greimassienne. Preuve en est qu’un certain nombre de recherches en sémiotique visuelle ont confondu le visuel avec l’artistique, voire ont pris le statut artistique comme modèle de l’analyse du langage visuel sans tenir compte des articulations socio-historiques de ce statut. On peut bien affirmer pourtant qu’il existe des métamorphoses de formes, voire des traditions visuelles qui sont tout à fait repérables dans les domaines socialement institués tels que celui de l’art, et qui peuvent expliquer le « pourquoi » d’une image, voire sa nécessité à l’intérieur d’un paysage statutaire. Toute l’histoire de l’art est une histoire de métamorphoses de formes et d’une succession d’expérimentations ayant différentes manipulations de l’espace comme défi : de l’impressionnisme au cubisme et puis au futurisme, par exemple, se succèdent des stratégies différentes de solidification des contours et puis à nouveau de perte d’importance de ces contours, d’alourdissement de la palette chromatique suivi d’un virage vers des couleurs plus mobiles et de touches plus rapides…

Une première manière de distinguer différentes langues visuelles, voire des sous-langues, est par conséquent de distinguer les différents domaines sociaux où les images sont censées fonctionner : c’est à l’intérieur de chaque domaine qu’elles acquièrent leur statut voire qu’elles fonctionnent suivant une économie de valeurs partagées. Dans l’ouvrage écrit en collaboration avec Pierluigi Basso Fossali, Sémiotique de la photographie, nous avons essayé d’identifier des domaines d’appartenance des images photographiques : non seulement le domaine de l’art, mais également ceux de la science, de la religion, de la vie privée (et de famille), de l’éthique et de la politique. Les statuts déterminent le fonctionnement des images de différentes façons. Pour ne donner qu’un exemple rapide, pensons au fait que dans certains domaines l’image compte en tant qu’image originale, comme dans le cas de l’art — et qu’on invente au fil du temps des nouvelles manières de concevoir l’original, comme dans le cas des tirages photographiques, et des installations mixed media. Dans les domaines de la science et de la publicité l’original ne compte pas. Dans le domaine de la religion on est face à un fonctionnement intermédiaire : l’icône russe peut être reproduite en plusieurs exemplaires mais elle doit être considérée comme une vision originale des Pères de l’Église qui ne sont que des exécuteurs d’une image acheiropoïètes, l’original se trouve donc ailleurs que dans l’image, à sa source. Le domaine éthico-politique et notamment la photo de guerre fonctionne pareillement : l’authenticité n’a rien à faire avec la matérialité des multiples exemplaires, qui sont reproduits sans limites. Dans ce cas, on ne peut pas non plus inférer l’authenticité à partir de la plastique de l’image : elle ne peut qu’être constatée comme originale si on connaît l’histoire de vie du photographe et, même, ses blessures corporelles ainsi que tous signes qui puissent démontrer qu’il était là, en guerre, face au danger et qu’il a risqué sa vie pour prendre cette photo. Comme l’affirme Anne Beyaert-Geslin (2009), les zones floues à l’intérieur de la photo ne peuvent pas fonctionner comme une preuve de l’effort de la prise de vue : il faut connaître l’histoire de vie du photographe pour pouvoir statuer sur l’originalité-authenticité de chaque photo.

On pourrait considérer les statuts de l’image comme des cadres institutionnels diachroniquement dynamiques offrant des espaces de possibles qui sont les résultats d’une histoire des formes liées à des pratiques. Ces espaces de possibles sont des réservoirs de formes mais dans le domaine de l’art ces formes n’existent du point de vue de l’artiste que pour être dépassées (comme dans le cas de la mode, d’ailleurs) et les possibles dans le domaine de l’art fonctionneront donc de manière très différente des possibles dans le domaine éthico-politique ou religieux ; dans le cas du religieux le changement et la nouveauté sont vus davantage comme des dangers plutôt que comme le moteur de toute invention — le lien avec l’origine est toujours sacralisé.

Pour étudier les statuts il faudrait en premier lieu les distinguer dans la synchronie, comme nous venons de le faire très rapidement, et ensuite suivre pour chaque domaine, en diachronie, l’histoire des formes et des valeurs qui y sont liées. Il faudrait voir par exemple comment la question de la valorisation de l’original varie en art selon les périodes et les médias et comment cette valorisation de l’original peut devenir pertinente pour des images d’autres statuts. On a d’ailleurs constaté, grâce aux études de Beyaert-Geslin (2014), que la production et la circulation des objets d’art se rapproche actuellement de manière massive de celles du domaine scientifique, où l’objet authentique et unique n’a pas de pertinence. En fait, dans les pratiques de l’art contemporain plusieurs matériaux, plusieurs objets, travaillés par une collectivité d’artisans, signifient surtout en tant qu’étapes d’un projet plus global concernant une pratique de faire qui ne débouche pas forcément dans une présentation au public d’un objet unique à exposer dans un musée. Les pratiques artistiques se mélangent à d’autres pratiques de recherche et d’expérimentation et ce sont ces pratiques « sans objet final » qui deviennent matière de discussion dans le milieu de l’art…

Conclusions

D’un point de vue méthodologique, on pourrait affirmer qu’il y a deux stratégies pour étudier les images par rapport à leur « langue », voire à leurs statuts. Appelons « descendante » la première stratégie qui découle d’une tentative de spécifier le concept de langue en différentes sous-langues davantage opérationnelles, suivant un mouvement qui vise le rapprochement entre langue et parole à travers une opération de spécification de la langue. Mais il est également possible d’envisager un mouvement inverse, une deuxième stratégie, ascendant du local au global, où chaque image est étudiée à l’intérieur d’une œuvre auctoriale et celle-ci à l’intérieur d’un mouvement artistique entendu en tant que micro-langue caractérisée par des régularités et des règles observables qui évoluent dans le cadre d’un domaine donné. Par exemple on peut repérer, comme l’a fait Jean-Marie Floch (1985), une micro-langue en évolution chez Kandinsky à partir d’un seul tableau, Composition IV. Cette approche a permis d'émettre des hypothèses sur la signification des tableaux abstraits tels que Composition IV (1911) en le considérant dans le cadre plus vaste de tableaux plus figuratifs du début de la carrière du peintre russe où la composition des couleurs et des lignes était très proche de celle de la Composition IV. Floch analyse cette dernière en s’appuyant également sur des tableaux abstraits de la même période mais avec des titres condensant et expliquant leur contenu.

Vu l’impossibilité de repérer des règles grammaticales générales dans le langage visuel, il faut aller à la recherche de micro-systèmes locaux et historiquement attestés : il s’agit donc de micro-langues, de systèmes de références qui sont plus instables que ceux de la langue verbale, voire plus libres, mais pas totalement – bien qu’il puisse sembler qu’en art tout soit permis.

Il faut d’ailleurs prendre conscience du fait que, pour l’étude du langage visuel, on est parti, en sémiotique, du cas de la peinture, voire du domaine de l’art, tandis que pour constituer des théories linguistiques sur la compétence et la performance on est partis d’exemples du fonctionnement quotidien du langage, et non pas de son utilisation exceptionnelle… c’est peut-être aussi pour cette raison que le visuel nous paraît plus difficile à cerner, car nous avons toujours pris comme objet d’analyse des corpus exceptionnels, à valeur esthétique. Dans l’art, toutes les règles langagières sont censées être subverties. Cela a donc été difficile de repérer une normalité langagière : seuls le Groupe µ et Sonesson ont visé la description d’une langue visuelle « normale ».