logo du site Interfaces numériques

Entre télévision et Internet, des formes hybrides d'écriture audiovisuelle  ?

Marida Di Crosta 

https://doi.org/10.25965/interfaces-numeriques.2345

Parmi les formes audiovisuelles connectées émergeantes, le vidéoblog occupe une place à part et à part entière. Emblématique des mutations induites dans le paysage audiovisuel par les pratiques de YouTube, il témoigne également des allers-retours constants entre écritures télévisuelles et écritures spécifiques au Web. Du point de vue généalogique, le vidéoblog s’inscrit dans les expérimentations développées au cours des dernières décennies autour de la web-caméra. L’apanage des Youtubeurs, ce dispositif audiovisuel de narration et de mise en scène de soi fait l’objet de détournement dans le cadre de productions Web fictionnelles. Son écriture singulière et son cadre pragmatique de réception étant liés à l’environnement et aux cultures de YouTube, le vidéoblog de fiction permet d’interroger le rôle de l’interface et de l’interactivité dans le cadre de ces productions.

Among the emerging online audiovisual forms, the videoblog has its special place. Emblematic of the transformations in the audiovisual landscape induced by YouTube and its practices, it also reflects the constant interactions between television’s writing techniques and specific Web-content design. At the genealogical level, the video blog descends from the experiments developed over the last decades around the web-camera. The prerogative of Youtubers, this narrative audiovisual system has been used for producing fictional Web contents as well. Both its singular writing techniques and its pragmatic framework of reception being related to YouTube’s cultures and environment, the fictional video blog questions the role of interface and interactivity within the platform.

Sommaire

Texte intégral

1. Introduction

Au cours de la dernière décennie, la tension intermédiale entre télévision et Internet n’a cessé de s’accroitre. Aussi conflictuelle que prolifique, caractérisée à la fois par la rivalité et l’émulation, cette tension s’est amplifiée avec l’apparition dans le paysage médiatique des plateformes de diffusion vidéo et autres réseaux socio-numériques.

Du côté du média télévisuel, on assiste à des tentatives de plus en plus fréquentes d’extension du dispositif «  hors-télévision  ». Cela se produit à travers le transfert de contenus sur Internet et les réseaux et par la mise en place de nouvelles stratégies éditoriales et promotionnelles. L’utilisation de Twitter et Facebook en relation avec certaines émissions donne lieu à de nouvelles formes d’interaction à la fois avec les publics et avec le contenu télévisuel, permettant d’en prolonger la vie avant, pendant et après leur passage à l’antenne.

Pendant ce temps, du côté d’Internet, la compétition se durcit autour de la consommation de contenus audiovisuels – interactifs ou pas – conçus pour les écrans nomades et les plateformes vidéo. Parmi ces dernières, YouTube demeure jusqu’à présent la plus utilisée à l’échelle internationale pour le téléchargement, le visionnage et le partage de vidéos. Depuis sa création en 2005, elle participe chaque jour à la mise en ligne d’une quantité considérable de vidéos aux statuts et aux genres hétérogènes, produites dans le cadre de l’industrie ou en dehors. Le vidéoblog en particulier constitue la forme audiovisuelle la plus répandue sur YouTube dans la catégorie des contenus autoproduits (Burgess et Green, 2009).

Apparue au début des années 2000, cette version audiovisuelle du blog se distingue par son caractère conversationnel mettant en scène une tête parlante (talking head) se filmant avec une web-caméra, depuis sa chambre le plus souvent. Il serait d’ailleurs plus appropriée de qualifier ce genre de blog d’audio-logo-visuel (Chion, 1990, 2005), la place de la parole y étant prépondérante À l’instar de son homologue textuel, le blog vidéo se caractérise par une certaine forme d’interactivité, à la fois entre le contenu et les utilisateurs et entre ces derniers et l’auteur-producteur.

Emblématique des hybridations entre écritures audiovisuelles et pratiques numériques connectées, il s’est affirmé au fil des années en tant que forme spécifique de Web-narration. Non seulement il est à l’origine du phénomène de Youtubers, mais il a été également adopté dans le cadre de productions sérielles fictionnelles en ligne. Dès 2006, à l’époque de ses premiers balbutiements de YouTube, le vidéoblog avait fait l’objet d’un détournement fictionnel spectaculaire dans le cadre de l’expérience lonelygirl15 (EQAL, YouTube et MySpace, USA, 2006-2008). Le manque de clarté entourant de façon délibérée le statut et l’identité de la jeune femme devant la Web-caméra provoque pour la première fois le brouillage des frontières dans le blog vidéo entre fiction et non-fiction, production «  industrielle  » et auto-filmage. Entre 2012 et 2013, c’est par le biais de ce même dispositif que Hank Green, l’un des pionniers de cette pratique sur YouTube met en scène dans The Lizzie Bennet Diaries (Hank Green et Bernie Su, USA) la première adaptation Internet d’une œuvre littéraire du XIXe siècle, Orgueil et Préjugés de Jane Austen (1813).

C’est précisément cet usage fictionnel qu’il nous importe d’aborder. Au croisement de différents régimes représentationnels audiovisuels – cinématographique, télévisuel et connecté – le vidéoblog de fiction nous paraît cristalliser en effet un certain nombre de tensions intermédiales. Son développement témoigne des transformations opérées sur la production audiovisuelle par le numérique et Internet, ainsi que des emprunts réciproques et allers-retours constants entre formes télévisuelles et formes connectées. Mais ce genre-format renvoie également à la question de l’interactivité et à la relation entre le contenu et son producteur. Son écriture singulière et son cadre pragmatique de réception étant liés à l’environnement de YouTube, le vidéblog de fiction permet d’interroger le rôle de l’interface de la plateforme dans la mise en place et le développement de cette relation.

2. Le vidéoblog de fiction, le descendant des expériences pionnières de web-caméra

Le dispositif Web-narratif du vidéoblog constitue l’épine dorsale de l’expérience pionnière The Lizzie Bennet Diaries, la première transposition à l’écran connecté de l’un des romans les plus adaptés de l’histoire, Orgueil et Préjugés. Transposée en Californie deux siècles plus tard, réécrite pour Internet et les réseaux socio-numériques, l’histoire des sœurs Bennet a été fragmentée puis disséminée à travers plusieurs dispositifs médiatiques dont le blog vidéo du personnage de Lizzie (Elizabeth Bennet) constitue le volet principal.

Vive et spirituelle, en dernière année d’un master de communication, à 24 ans Lizzie vit toujours chez ses parents, accablée par un prêt étudiant à rembourser et une mère obsédée par la recherche de bons partis auxquels la marier, elle et ses sœurs (Jane, l’aînée presque parfaite et Lydia, la cadette écervelée). Lorsque Bing Lee, un riche étudiant de médicine, s’installe dans le voisinage en compagnie de sa sœur Caroline et de son ami Darcy, tout aussi fortuné, les choses se précipitent. Exaspérée, Lizzie décide de lancer un vidéoblog à l’aide de Charlotte Lu, son amie vidéaste.

L’expérience a démarré en avril 2012 et a duré un an (soit la durée diégétique de l’histoire racontée dans le roman), au rythme de deux épisodes hebdomadaires sur YouTube. Pendant que, face à la caméra, Lizzie, confie «  à Internet  » les événements de sa vie, d’autres personnages de l’histoire interagissent avec les internautes sur les réseaux socio- numériques (Facebook, Twitter, Tumblr…), en fournissant des éléments diégétiques complémentaires et d’autres points de vue que celui du personnage narrateur de Lizzie. Dans le cadre même de son blog, cette dernière s’applique une fois par mois à répondre aux questions posées par les internautes via les réseaux.

Ovationnée par les médias, récompensée par l’industrie, The Lizzie Bennet Diaries constitue l’un des rares exemples à succès de production indépendante de fiction audiovisuelle sérielle mise à disposition des publics uniquement en ligne (Online Only). Séduits autant par le dispositif narratif que par la richesse de l’histoire, les internautes sont au rendez-vous (plus de 40 millions de «  vues  », environs 250 000 abonnés). Il s’agit en effet d’une adaptation audiovisuelle numérique particulièrement réussie qui parvient à exploiter le potentiel narratif d’Internet et de YouTube, s’appuyant sur une compréhension approfondie de leurs usages. Dispositif à la fois de narration et de mise en scène, le vidéoblog se révèle en effet le moyen le plus adéquat pour traduire à l’écran connecté le procédé innovant du «  discours indirect libre  » élaboré par Jane Austen.

Par cette stratégie discursive sophistiquée, l’auteure d’Orgueil et Préjugés avait réussi à enchevêtrer la voix du personnage d’Elizabeth Bennet à celle du narrateur pour que le lecteur ne sache jamais exactement lequel des deux était en train de s’exprimer. Tout en racontant l’histoire à la troisième personne, Jane Austen «  commente  » de façon plus «  méta  » le discours des personnages, en privilégiant le point de vue particulier de son héroïne.

Lors de la transposition de l’œuvre à l’écran connecté, les scénaristes de Lizzie Bennet Diaries ont adopté directement la première personne et le point de vue d’Elizabeth (Lizzie), transformant au passage en mode narratif le mode dramatique de la fiction romanesque. Trois «  transformations intermodales  » qui relèvent respectivement de la vocalisation, de la transfocalisation et de la narrativisation (Genette, 1982) et qui participent de la réussite de cette adaptation intermédiale. Le «  Je Narrant  » constitue avec le regard caméra le dispositif énonciatif spécifique au vidéoblog.

Pour autant, le niveau méta-narratif est toujours présent, narration à la première personne, commentaire et même «  reconstitution historique  » s’entrelacent allégrement au fil des web-épisodes. L’approche narratologique permet en outre de pointer la dimension conversationnelle de ces stratégies oscillant entre présentation et représentation. Dans le roman comme sur YouTube, l’emploi de ce procédé méta-narratif mélangeant récit des faits et commentaires a pour effet de prendre le lecteur/spectateur directement à témoin de réactions, sentiments et réflexions de ce personnage particulier qu’est le narrateur.

Mais par-delà même de sa pertinence, sur le plan de l’intermédialité et de la méta-narration, en tant que transposition connectée du roman de Jane Austen, ce qui nous frappe dans le vidéoblog de The Lizzie Bennet Diaries est avant tout l’image. Aux yeux des internautes de longue date, la vue de cette «  tête parlante  » filmée à l’aide d’une caméra installée dans sa chambre de jeune fille n’est pas sans provoquer une sorte de déjà-vu, de reconnaissance idéique. Prise à rebours, cette image renvoie à bon nombre d’images homologues venues s’afficher à l’écran tout au long d’une vingtaine d’années d’expérimentations avec la web-caméra. Elle s’inscrit ainsi dans la généalogie des cultures et des pratiques d’Internet développées autour de la captation et de la diffusion d’images vidéo en ligne, ainsi que des détournements précoces de ses usages premiers. Dès lors, l’évocation de quelques étapes fondamentales de l’évolution de ces expérimentations devrait nous permettre de mieux cerner l’émergence de cette forme audiovisuelle connectée.

3. Aux origines du Broadcast Yourself

Note de bas de page 1 :

Cf. Stafford-Fraser, Q. : « Trojan Room Coffee Pot », https://www.cl.cam.ac.uk/coffee/qsf/coffee.html

La première expérience de captation et transmission à distance d’images réelles par le biais d’un ordinateur relié à une caméra date de novembre 1991. Lassés d’allers-retours inutiles, Quentin Stafford-Fraser et Paul Jardetzky, deux chercheurs de l’université de Cambridge, décident de braquer une caméra analogique reliée à un ordinateur sur la seule machine à café disponible dans leur laboratoire1. Deux ans plus tard (novembre 1993) les vidéos de surveillance du niveau du café pourront être mondialement diffusées via le réseau naissant d’Internet.

Première webcaméra de l’histoire, XCoffee restera allumée jusqu’en août 2001, devenant l’un des symboles du début du Web. Les conditions de sa naissance témoignent du caractère immédiat, utilitaire et autoréférentiel associé à la webcaméra dès son apparition. En raison du débit insuffisant de la connexion et des difficultés liées à la compression/ décompression des images, les premières expériences de captation- diffusion s’attachent en effet à des sujets prosaïques et statiques.

Note de bas de page 2 :

http://www.fishcam.com/

C’est sur l’aquarium installé chez Netscape qui se fixe en 1994 la deuxième web-cam active, inventant au passage le sous-genre de la fish-cam2. Dépourvus de toute intentionnalité artistique ou visée esthétique, ces dispositifs livrent au spectateur des vues d’objets réels telles quelles, en deçà de toute mise en forme (White, 2006). C’est donc dès l’avènement de cette technologie que s’établit l’association d’une dimension réaliste, voire banale, aux images captées par la webcaméra.

Après la machine à café et les poissons, c’est en avril 1996 que l’exploration des possibilités offertes par le dispositif de la Web-cam franchit une étape fondamentale, lorsqu’une étudiante américaine, Jennifer Ringley, décide d’installer une webcaméra sur l’ordinateur de sa chambre pour se filmer en continu. Très engageant au quotidien, le projet que sous-tend JenniCam (1996-2003) est dans ses intentions d’une simplicité wharolienne : montrer sa vie en temps réel, telle qu’elle se déroule, 24 heures sur 24, des années durant. Résumé par le slogan Life Online, ce geste donnera lieu à une expérience visuelle fascinante et déconcertante à la fois.

Note de bas de page 3 :

Cf « Voyeur Web site JenniCam to go dark », CNN.com, 10 décembre 2003, http://edition.cnn.com/2003/TECH/internet/12/10/jenni.cam.reut/

Offrant au spectateur une vision ininterrompue de la chambre à coucher d’une jeune femme, l’écran-webcaméra de JenniCam fonctionne comme une fenêtre ouverte non pas sur le monde extérieur (métaphore associée à la télévision) mais sur l’intérieur (de l’internaute- téléspectateur). Ringley se décrit comme une ancienne geek ayant souhaité «  créer une fenêtre à l’intérieur d’un zoo humain virtuel3  ». Le caractère intime de cette chronique et le déroulement en continu du flux d’images en font une expérience unique spécifique au Web, cette forme de lifecasting demeurant inimaginable à la télévision. Car Jennicam restera active sans solution de continuité pendant sept ans et huit mois.

Une expérience Web de longue haleine qui, sans être revendiquée comme artistique, finit par prolonger en temps réel sur Internet la radicalité du cinéma d’Andy Warhol (Sleep, 1963). Elle suscitera beaucoup d’excitation, de controverses et d’études sociologiques, et fera un nombre considérable d’émules, dans des contextes d’usage disparates, des projets d’art contemporain jusqu’aux camgirls. Elle contribuera surtout à l’émergence de la «  web-intimité  » (Thély, 2002), une dimension autre de l’intime et de la représentation de soi, voire de sa manière d’être.

Quelques années auparavant, les expériences singulières d’auto- filmage hors-ligne menées par Sadie Benning à Milwaukee (Wisconsin), avaient ouvert la voie. Enfermée dans sa chambre à longueur de journée (elle a quitté l’école pour échapper à l’homophobie des autres lycéens), Sadie entreprend de se filmer en noir et blanc avec une Fisher Price Pixelvision, la caméra jouet offerte par son père (James Benning, réalisateur de films expérimentaux et enseignant de cinéma).

Réalisée en 1989, Living Inside montre la jeune femme, alors âgée de 16 ans, confiant à la petite caméra portable ses pensées intimes et des «  prises  » morcelées de son corps d’adolescente en crise. Le caractère ambigu de ces images, à la fois privées et exhibées, et surtout la façon dont Sadie s’adresse à la caméra derrière la porte fermée de sa chambre, ont amené certains chercheurs à inscrire Living Inside dans la lignée des ancêtres du vidéoblog (Zimmerman, 1995 ; Jenkins, 2008).

Mais la puissance inédite de Jennicam tient à la dimension connectée et donc partagée de la caméra vidéo, à cette simultanéité entre captation, affichage et diffusion, à cette durée ininterrompue du flux d’images, à son accessibilité constante – on line la caméra est toujours ON. Pour la première fois dans l’histoire d’Internet, presque dix ans avant l’apparition de YouTube, une internaute lambda a tourné la webcam sur elle-même, diffusant en direct et en continu des images de soi, de sa vie intime au quotidien, auprès (potentiellement) de tout internaute dans le monde.

Cela marque le début d’une nouvelle ère, ce dispositif particulier de web-intimité se trouvant désormais au centre de nouvelles pratiques de lifecasting, spontanées ou institutionnalisées, que le média télévisuel saura reprendre à son compte dans Big Brother (Jost, 2005) et autres émissions de télé-réalité avec confessionnal.

Jennicam a montré que le Web allait devenir le lieu de nouvelles grandes formes fondamentalement hétérogènes (Delavaud, 2010) de l’audiovisuel, à côté du cinéma, de la télévision et de l’art vidéo. Affranchi des contraintes budgétaires et techniques de production et diffusion télévisuelle, tout internaute muni de web-cam peut désormais devenir éditeur-diffuseur de contenu audiovisuel autoproduit.

4. lonelygirl15 ou le virage fictionnel

Deux ans et quelques mois après la fermeture du site de Jennifer Ringley, le même dispositif de journal filmé en web-cam suscite à nouveau l’engouement et la polémique sur Internet avec l’apparition de lonelygirl15 (EQAL, 2006-2008). Derrière ce pseudonyme, Bree Avery, autre étudiante américaine, ouvre aux internautes une nouvelle fenêtre sur sa chambre et sa vie d’adolescente solitaire. Pour diffuser ses billets, lonelygirl15 profite désormais d’une plateforme d’hébergement dédiée de création récente.

Note de bas de page 4 :

Source : Businessweek, 23/08/2005.

Les technologies de vidéo en ligne ont entre-temps beaucoup évolué, à la fois sur le plan technique et des pratiques socio-culturelles. Entre 2004-2005, la pratique du blog vidéo connaît un premier développement sous l’impulsion d’un groupe Yahoo ! réuni autour de Videoblogging. info4. Marquée par l’émergence des premiers médias socio-numériques (MySpace, FlickR, LinkedIn…), et par l’idéologie du Web participatif, la vidéo en ligne est rentrée dans une nouvelle ère en 2005 avec l’apparition de YouTube.

Note de bas de page 5 :

Au cours de la semaine de diffusion, chaque vidéoblog obtient entre 50.000 et 100.000 vues sur YouTube. Intitulé « My Parents Suck », le billet vidéo posté le 4 juillet atteint 50.000 vues en deux heures et grimpera jusqu’à un demi-million à la fin de la semaine.

Lorsque Bree/lonelygirl15 y apparaît en 2006, elle rejoint la communauté restreinte mais croissante de vidéobloggeurs du genre confessionnal. Spirituelle et jolie, elle deviendra vite populaire auprès des premiers utilisateurs de la plateforme5. Son succès retentissant bouleversera le paysage du blog vidéo, en faisant de Bree l’une des premières stars de YouTube. Pourtant Bree n’existe pas dans la réalité. Interprété par une comédienne (Jessica Rose), scénarisé par une équipe de concepteurs, ce personnage fictionnel a réussi à duper l’espace de quelques mois tant les medias que le public. Dès lors, le statut du vidéoblog bascule du mode mise en scène de soi à production Web- narrative fictionnelle.

Il serait cependant inapproprié de réduire l’expérience de lonelygirl15 à un canular sur Internet car il s’agit en réalité de l’une des premières Web-série diffusées sur YouTube. Elle aura le mérite, entre autres, d’avoir démontré aux acteurs de l’audiovisuel traditionnel aussi bien qu’aux utilisateurs de la plateforme qu’il est désormais possible de gagner de l’argent sur YouTube avec un vidéoblog. Emblématique du Broadcast Yourself, ce dispositif Web permettra, au fil des années, l’émergence de YouTubeurs à succès (à l’instar, en France, de Cyprien Iov, ou Norman Thavaud).

Mais lonelygirl15 aura aussi joué un rôle essentiel dans l’élaboration de nouvelles formes de fiction audiovisuelle connectée. En opérant un basculement du dispositif d’un régime représentationnel à l’autre, elle invente une nouvelle voie pour l’entrée du spectateur dans la fiction. Ce jeu qui consiste à entretenir une certaine ambiguïté entre les deux régimes nous renvoie, du reste, aux expériences du média télévisuel des débuts, lorsqu’il était à son tour engagé dans la recherche de formes expressives propres. La figure du présentateur, celle du narrateur et de l’acteur protagoniste se trouvent parfois délibérément superposées dans certaines dramatiques policières des années 1950 (Delavaud, 2005). Les scénaristes et réalisateurs pionniers de la télévision ayant réussi à dépasser la contradiction à l’apparence insurmontable qui consiste à faire coexister dans le même cadre le régime fictionnel et l’instauration d’une relation très directe avec le spectateur.

La distinction entre réalité et fiction est en fait peu opérante dans la plupart de vidéoblogs où la frontière entre les deux se brouille considérablement. L’internaute spectateur n’étant plus contraint de choisir entre la lecture autobiographique du blog vidéo ou celle fonctionnalisante de la Web-série, il a tendance à regarder les vidéos «  comme si le vidéoblogueur mis en scène incarnait de quelque façon la persona Internet du créateur de la série Web (Chateauvert, 2014, italique de l’auteur).

Cependant une distinction existe, sur le plan de l’écriture, entre les vidéoblogs où l’auteure-interprète coïncide avec le personnage qu’elle incarne à l’écran (à l’instar d’Ina Mihalache, créatrice de Solange te parle) et ceux tels lonelygirl15 ou The Lizzie Bennet Diairies où la persona Internet est une comédienne engagée par la production. Dans ce cas de figure particulier, en effet, les modalités divergent, la dimension réflexive de l’autofiction et de l’autoproduction n’étant pas/plus en place.

Reste que ce jeu de croisement de régimes représentationnels est plutôt apprécié par les publics, appelés par ce biais à une nouvelle forme de connivence avec le contenu audiovisuel et les conditions mêmes de sa production-réception. Loin d’éloigner les internautes du vidéoblog de Bree, le dévoilement de la nature fictionnel de lonelygirl15 permet à la Web-série d’attirer un nombre encore plus important de fans. Elle se poursuivra sur deux saisons pendant deux ans.

5. Interactif, le vidéoblog fictionnel ?

L’implication du spectateur fait partie des questions fondamentales que soulève la diffusion sur YouTube d’une production fictionnelle indépendante. Au milieu de l’offre surabondante de vidéos et du flux constant de sollicitations et de prescriptions diverses que véhicule la plateforme, il s’agit d’une part d’attirer et de fidéliser autour de la chaîne de The Lizzie Bennet Diaries le nombre le plus important possible de spectateurs. D’autre part, il faut parvenir à faciliter l’appropriation et le partage de ce contenu audiovisuel en proposant à la communauté des modalités d’interactivité et de participation adéquates. Ces formes audiovisuelles connectées, cependant, posent de façon renouvelée la question de l’acception dans laquelle le terme d’interactivité est adopté. Qu’est-ce qui permettait de qualifier d’interactif un vidéoblog sur YouTube ?

Si le terme d’interactivité s’est généralisé au point d’être appliqué désormais à des objets ou situations non numériques, dans le paysage médiatique l’interactivité est considérée dans son acception originaire comme une qualité propre à l’informatique. Lorsqu’il entreprend de la définir au début des années 2000, Jean-Louis Weissberg évoque «  le dialogue avec un programme qui gouverne l’accès à des données  » (Weissberg, 2002). L’interactivité ne se situe pas de façon généralisée dans le rapport homme-machine, mais constitue une propriété du système technique localisée dans la structure intime du programme informatique.

Pour Jean-Louis Boissier, la notion d’interactivité gagne aussi à être prise dans son sens technique, telle que l’informatique l’a développée dans les années quatre-vingt. Cependant, à la différence de Weissberg, Boissier considère qu’elle est à entendre au sens un peu plus large de «  système de relation homme-machine  ». D’autant qu’une bonne compréhension des pratiques artistiques impliquant l’interactivité suppose obligatoirement la prise en compte des divers emplois culturels dans l’idée d’une interactivité contemporaine (Boissier, 2010).

Pour décrire les nouveaux rapports à l’image que produit l’informatique, Weissberg désigne l’irruption de la gestualité et de la corporalité comme le caractère le plus marquant de ces mutations (Barboza et al., 2006). L’image «  actée  » vient pallier le manque, dans l’image enregistrée, de cette qualité essentielle d’ « expérimentation dans l’actuel  ». Car par définition, l’enregistrement audiovisuel est une restitution du passé (de l’ordre du «  ça a été  » barthien). Alors que l’image numérique – au sens d’informatisée – a été inventée dans le but de devenir interactive, à savoir la représentation visuelle des effets immédiats des gestes effectués par l’interacteur (ce dernier maîtrisant ainsi le «  ça peut être  »).

Pour Weissberg, le régime numérique-interactif est ainsi fortement caractérisé par la remise du corps du spectateur au centre de l’univers de la représentation, et ce, «  à rebours des logiques de l’audiovisuel  ». Ce qui nous renvoie (avec Boissier) au caractère d’oxymoron de l’image vidéo- interactive, à ce paradoxe inscrit dans la racine «  vidéo  » qui questionne la marge effective de manœuvre donnée au spectateur lorsqu’il est censé transformer des images préenregistrées. Alors que du côté des jeux vidéo, appliquée aux images informatisées – au sens d’images de synthèse calculées en temps réel et gérées par un moteur logiciel – l’interactivité peut atteindre des niveaux bien plus élevés.

Qu’il s’agisse d’images enregistrées ou d’images calculées par la machine, force est de constater que la plupart des définitions données à l’interactivité appliquée à l’audiovisuel entre la fin des années quatre- vingt-dix et le début des années 2000 concernent des applications off-line (CD-ROM, installations) s’inscrivant dans le domaine de l’art ou des jeux vidéo. Elles remontent à la première vague d’Internet et précèdent l’essor des réseaux numériques dits sociaux, dans lesquels s’inscrit également une plateforme de partage de contenu vidéo telle que YouTube.

Depuis quelques années cependant, l’évolution des pratiques de production, diffusion et appropriation de contenus audiovisuels via les réseaux a fait émerger d’autres possibilités d’action et de relation, d’interaction et d’interactivité. Ces interactions inédites ont lieu non seulement entre l’image s’affichant à l’écran connecté et son regardeur, mais aussi entre ce dernier et les autres membres du public, entre les formes audiovisuelles connectées et leurs producteurs, ainsi qu’entre les différents écrans et dispositifs mêmes. La montée en puissance des publics caractérise en effet le système médiatique actuel, la permutation des rôles étant constitutive même du réseau dense d’Internet (chaque membre constituant à son tour un nœud «  émetteur-récepteur  » potentiel du réseau).

Côté écriture, cela a amené au développement de formes de scénarisation transmédiatiques de niveau méta-narratives englobant plusieurs dispositifs communicationnels et représentationnels, à commencer par les réseaux socio-numériques. Ces derniers permettent à l’utilisateur de participer de manière active à la production de contenus médiatiques, propres ou réalisés par autrui. Ils favorisent l’émergence de nouvelles possibilités de partage et de mise en circulation de contenus, ainsi que de formes d’expression et de créativité spécifiques (Proulx et Kwok Choon, 2011). Des formes accrues de participation peuvent alors résulter des pratiques parfois intensives de ces dispositifs, de la part tant des producteurs que des publics.

Le terme d’interactivité au sens de dialogue avec un programme informatique semble alors moins approprié pour décrire ces interactions multiples. Le contenu audiovisuel en tant que tel n’exige pas dans ce cas d’être manipulé par l’interacteur. Il ne se trouve pas non plus systématiquement affecté par ses actions. Comment rendre compte néanmoins des nouvelles formes de relation aux images ? Dans le cadre spécifique de YouTube, deux des modes d’interactivité définis par Eric Zimmerman, designer et chercheur reconnu dans le domaine du jeu et de la narration interactive, nous semblent à l’œuvre.

Du côté le plus bas de l’échelle, le mode d’ « interactivité fonctionnelle  » ou de participation utilitaire avec un «  texte  ». Cette forme d’interactivité désigne le niveau des interactions structurelles incontournables permettant de faire fonctionner le dispositif matériel du contenu. De l’autre côté de l’échelle se situerait le mode de la «  méta-interactivité  » ou de la participation culturelle avec un texte. Liée plus directement aux cultures de la convergence et des fans chères à Jenkins (Jenkins, 2006 ; Jenkins et al., 2013), cette modalité d’interaction se développe en dehors de l’expérience d’un contenu audiovisuel unique. Dans le contexte de ces pratiques, les publics détruisent, reconstruisent et remettent en circulation les contenus fragmentaires et linéaires proposés par la plateforme, s’appropriant et partageant les images au même titre que les autres éléments de la production narrative.

Ces deux modes d’interactivité, fonctionnel et méta, nous semblent constamment actifs dans l’environnement de YouTube. Régie par ses propres protocoles et cultures (Burgess et Green, 2009), la plateforme influe sur les modalités de conception et d’appropriation des vidéos qu’elle héberge. Par le biais de l’interface de YouTube, les utilisateurs - producteurs et spectateurs - partagent limites et avantages d’un cadre pragmatique de réception unique, spécifique à cet environnement et à la nature éminemment audiovisuelle des contenus.

Axé sur le feed-back (qualitatif aussi bien que quantitatif) d’utilisateurs organisés autour de communautés d’intérêt (éphémères ou durables), ce site d’hébergement est un espace de diffusion/réception en même temps qu’un outil relationnel. L’utilisateur y recouvre à la fois le rôle de producteur de contenu et celui de spectateur-évaluateur- contributeur, la permutation de ces rôles étant elle-même constitutive du mode d’existence et de fonctionnement de YouTube.

En guise de conclusion, nous citerons un billet du vidéoblog de The Lizzie Bennet Diairies emblématique de la qualité conversationnelle d’une écriture audiovisuelle toute tournée vers l’implication des spectateurs. Il s’agit de l’épisode n°  75 posté le 24 décembre 2012. C’est la veille de Noël et Lizzie tente de convaincre son amie Charlotte et sa sœur Jane de profiter de ce billet particulier pour composer une carte de vœux vidéo à l’intention de leurs viewers. Son enthousiasme n’étant pas suffisamment contagieux, une discussion s’engage autour des différentes façons dont chaque membre de la famille Bennet célèbre cette fête. Pour sa part, Jane aimerait savoir comment les spectateurs vont vivre cette période. C’est le déclic qui permet à Lizzie de boucler son billet.

Note de bas de page 6 :

Cf. : Holiday Tradition Response Videos. https://www.youtube.com/playlist?list=PLDjrsPTuZSrQLqUgy2j3Sn-rUhon3Ybj8

Le véritable but d’une carte de vœux étant de renouer le contact avec les personnes dont on aimerait avoir de nouvelles, elle propose au public de poster sur la plateforme une réponse vidéo à son Vlog racontant leurs traditions de Noël favorites. Réunies dans une playlist dédiées6, les vidéo- réponses des fans (43 vidéos vues plus de 7 800 fois) sont accessibles à partir de l’interface de YouTube. La permutation des rôles dans le cadre de cette forme connectée particulière est donc bien réelle. Les interactions avec le spectateur, son inclusion dans le dispositif, se font ici par le biais de la production narrative audiovisuelle.

À l’écriture spécifique des auteurs-scénaristes, certains spectateurs- utilisateurs de la plateforme répondent par leur propre écriture audiovisuelle, conscients, les uns comme les autres, du rôle que cela joue dans l’accomplissement d’une réception réussie. D’autant plus que Lizzie n’a pas manqué d’annoncer la couleur dès le jingle de l’épisode : «  This may get a little meta  ».