Quand les algorithmes prennent la parole
Prise en charge et automatisation de l’écriture de soi en contexte numérique

Benjamin Delalande 

https://doi.org/10.25965/interfaces-numeriques.3898

Le phénomène de quantification de soi et les pratiques d’automesures numériques sont à la source d’une gigantesque production de données collectées par des objets connectés. En s’appuyant sur des plateformes numériques dédiées au sport, l’objectif de cet article est de montrer comment le traitement algorithmique des données permet une prise en charge énonciative et opère des transformations automatisées de contenus pour créer ou modifier l’écriture et la représentation de soi. Il s’agit également de rendre compte d’une stratégie éditoriale qui mobilise la performance sportive des utilisateurs pour générer une augmentation de trafic par le biais du partage des contenus, et répondre aux logiques marchandes.

The phenomenon of the quantified self and digital self-measurement practices are at the source of a gigantic production of data collected by connected objects. Based on digital platforms dedicated to sport, the aim of this article is to show how the algorithmic processing of data allows enunciative support and operates automated transformations of content to create or modify writing and representation of the self. It is also about reporting on an editorial strategy that mobilizes users' sports performance to generate an increase in traffic through the sharing of content, and respond to market logic.

Sommaire
Texte intégral

1. Introduction

En l’espace de quelques années, les objets connectés ont remodelé le paysage d’Internet et se sont affirmés grâce à la miniaturisation des dispositifs mobiles de captation des informations et aux améliorations de la puissance de traitement. Par l’intégration de la technologie à des objets du quotidien (capteurs, systèmes d’exploitation, bluetooth, wifi, etc.), les objets connectés se présentent sous la forme d’appareils spécialisés et simples d’emploi : smartphones, liseuses, télévisions, bracelets, montres, lunettes, vêtements, balances, etc. De plus en plus discrets et dotés de nouvelles fonctionnalités, ils sont capables de capter et collecter en continu des données géo-localisées physiologiques et comportementales (poids, calories dépensées, distance parcourue, vitesse, nombre de pas, temps de sommeil, émotions, etc.) et de les communiquer à des dispositifs numériques interconnectés de traitement et d’analyse (réseaux sociaux numériques, applications sur smartphone, plateformes dédiées à la restitution et représentation visuelle des données, etc.).

Ces pratiques d’automesures numériques, également appelées mesure de soi, quantification de soi, self-tracking, ou encore quantified self font déjà partie du quotidien du grand public dans le domaine de la domotique, du sport, de la santé ou encore du bien-être. Elles profitent du succès des plateformes du web 2.0 et des réseaux sociaux numériques qui, par leur intermédiaire, banalisent la publication des informations personnelles et dont le succès tient à la manière dont ils recomposent la sociabilité des individus en offrant de nouvelles pratiques d’exposition et de représentation de soi par le partage de contenus et la mise en relation de l’individu avec la communauté. En effet, ces environnements numériques donnent aux utilisateurs la possibilité de produire des discours natifs en ligne au moyen d’opérations énonciatives dont ils peuvent maîtriser le contenu plurisémiotique par la saisie directe des données (photos, vidéos, commentaires, etc.) et leur publication.

Dans la perspective des recherches menées sur la représentation de soi et l’identité numérique, cette mise en relation de l’individu avec la communauté, par la publication des données saisies par l’utilisateur lui-même, s’accompagne d’autres ensembles de signes qui ne sont pas renseignés directement par l’utilisateur mais qui sont issus d’une quantification de l’information et de notifications des activités de l’utilisateur traitées par les algorithmes de la plateforme (mise à jour de profil, nombre d’amis, cadeau envoyé, score, classement, dernière connexion, etc.).

Que se passe-t-il alors quand des environnements numériques automatisent une production discursive des utilisateurs au moyen de traitements algorithmiques des données captées et transmises par les objets connectés ? L’objectif de cet article est d’amorcer une réflexion sur la prise en charge énonciative des algorithmes utilisés par les plateformes en lien avec des activités et des performances sportives, notamment Strava et The Beautiful Walk. Il s’agit également de rendre compte de la façon dont les données collectées permettent à la fois une mise en visibilité de la mesure de soi au moyen de graphiques ou schémas, et une co-construction de l’identité numérique des utilisateurs par leur mise en récit.

2. De la quantification de soi à l’exposition de soi

2.1. Le quantified self comme phénomène de l’automesure en milieu numérique

Note de bas de page 1 :

Arruabarrena et Quettier situent les pratiques ritualisés de la mesure dans le prolongement des travaux de Goffman sur les rites d’interactions du quotidien.

Note de bas de page 2 :

Les technologies de soi ou techniques de soi sont définies par Foucault comme « les procédures [...] qui sont proposées ou prescrites aux individus pour fixer leur identité, la maintenir ou la transformer en fonction d’un certain nombre de fins, et cela grâce à des rapports de maîtrise de soi sur soi ou[/et] de connaissance de soi par soi » (Foucault, 2001, p. 1032) cité par (Granjon et al., 2011).

Fondés par Kevin Kelly et Gary Wolf, le quantified self est un mouvement qui a émergé aux États-Unis en 2007 au sein duquel on observe un ensemble de pratiques de mesures de soi effectuées grâce aux technologies portables. Quantifier pour mieux connaître son corps et son comportement afin de les améliorer, les perfectionner pour maximiser son bien-être, optimiser son potentiel humain et reprendre le pouvoir sur soi-même ; les rituels1 de l’automesure numérique sont des pratiques qui donnent « la possibilité aux usagers d’intervenir sur leur flux d’activités » (Arruabarrena, Quettier, 2013). À ce titre, et dans le prolongement de ce que Foucault appelle le souci de soi, elles peuvent s’appréhender comme des technologies de soi2, réfléchies et volontaires, « comme une mise en chiffres de soi », et « s’exprimer par “l’écriture de soi” comme révélateur de ce que l’on est, en s’inspectant soi-même » (Granjon et al., 2011).

Note de bas de page 3 :

Quel que soit l’objet de la mesure, les quantifications peuvent être actives (quantified self) ou passives dans le cas d’un enregistrement en continu des données comme on peut l’observer chez les adeptes du life-logging.

Note de bas de page 4 :

Depuis le rapport émis par la société Cisco, figurant parmi les leaders en infrastructure réseau, on peut aujourd’hui parler de l’Internet of Everything (IoE) pour remplacer l’Internet des objets (IdO). Difficilement traduisible, l’« Internet du tout connecté » est un internet multidimensionnel qui combine l’IdO et le big data, et dans lequel tous les objets et infrastructures devraient se retrouver connectés à Internet.

Ce phénomène de quantification de soi et d’enregistrement des données personnelles trouve son origine, dès les années 1970, dans les travaux de Steve Mann qui cherchait à définir, dans le prolongement du paradigme de la cybernétique, une nouvelle intelligence homme-machine en munissant ses vêtements de capteurs capables d’enregistrer des images et des données pour objectiver son expérience quotidienne3. Aujourd’hui, le phénomène connaît une forte progression grâce au développement conjoint des services de stockage de données en ligne (cloud computing) et de l’Internet des objets4 par lequel se déploie, de façon massive, une diversité de capteurs équipant les objets connectés qui s’interfacent avec le corps. L’Internet des objets est en effet cette extension du réseau internet dans laquelle une multitude d’objets interconnectés peuvent communiquer de manière directe ou indirecte avec des terminaux dans le but de collecter des données en continu et de les redéployer vers des dispositifs de traitements numériques fournis par les réseaux sociaux et les plateformes dédiées qui les enregistrent et les analysent ensuite (Mosco, 2016).

Dépassant les pratiques traditionnelles de recherche de connaissance de soi, les activités sont ainsi quantifiées par des dispositifs connectés qui mettent la donnée brute au cœur du quantified self ; elle est successivement collectée, analysée et exploitée pour donner à l’utilisateur une objectivation chiffrée et quantifiée de ses réalités existentielles (Granjon et al., 2011) et lui permettre d’opérer des changements dans sa vie quotidienne. Elle est ensuite partagée, publiée et commentée par les utilisateurs des plateformes. La transformation des activités des utilisateurs en objet numérique participe alors à la « digitalisation de la vie elle-même » (Rouvroy, Berns, 2009) au point de considérer désormais la présentation de soi comme une identité numérique délimitée par le système informatique. En captant l’ordinaire, ces quantifications se présentent comme des formes appareillées de réflexivité, elles révèlent « une dimension “cachée” de l’existence personnelle » en dévoilant « ce qui se trame en deçà » (Granjon et al., 2011).

2.2. Des traces, des signes et du calcul au fondement de l’identité numérique

Car, ce qui se trame en deçà, c’est la captation et le traitement algorithmique des traces laissées par l’utilisateur pendant son parcours de navigation, par exemple le temps de consultation d’une page, le chemin pour parvenir à une information, etc. La trace, appréhendée comme « le résultat de ce qui est causé par le comportement d’une entité dans son environnement » (Bachimont, 2015), signale un « mode de présence » de l’utilisateur, elle « assigne une signature invisible à un comportement informationnel, qui n’est pas toujours perçu comme tel » (Merzeau, 2009). La dissémination des traces par l’utilisateur et leur enregistrement automatique font dire à Merzeau que « désormais on ne peut plus ne pas laisser de traces ». Cette collection de traces « que nous laissons derrière nous, consciemment ou inconsciemment, au fil de nos navigations sur le réseau et de nos échanges marchands ou relationnels dans le cadre de sites dédiés » (Ertzscheid, 2009) est prise en charge par un ensemble de calculs qui obéissent aux logiques marchandes des éditeurs numériques.

Note de bas de page 5 :

On peut préciser avec Coutant que « La construction du profil passe au moins autant par les commentaires, messages, tags, invitations déposées par les interactants, que par les activités individuelles. On en arrive même au paradoxe qu’il est relativement fréquent d’y exister sans même avoir créé de compte, les utilisateurs indiquant les participants à un événement ou taggant les personnes présentes sur une photo même si celles-ci n’ont pas créé de profil. » (Coutant, 2011) (nous soulignons).

Définie comme « l’ensemble des signes qui manifestent l’utilisateur dans les dispositifs de communication numérique » (Georges, 2013), par exemple le profil de l’utilisateur dans les réseaux sociaux numériques, l’avatar ou le pseudonyme, l’identité numérique est multidimensionnelle ; elle s’articule en trois couches : identités déclarative, agissante et calculée. L’identité déclarative se compose des signes que l’utilisateur déclare lui-même par les données qu’il saisit directement, par exemple le nom, la date de naissance, au cours d’une procédure d’inscription à un service. L’identité agissante, quant à elle, témoigne de l’activité sociale au sein du réseau de l’utilisateur par des procédures de calcul, par exemple « x et y sont désormais amis ». Enfin, l’identité calculée « se compose de chiffres, produits du calcul du système, qui sont dispersés sur le profil de l’utilisateur (par exemple le nombre d’amis, de groupes, score, durée d’activité ou d’inactivité, etc.) » (Georges, 2011). L’identité calculée n’est donc pas renseignée par l’utilisateur directement. C’est « le produit d’une interprétation quantifiée » (Georges, 2009) à partir des signes émis qui sont traités par une suite d’instructions qui commandent les programmes informatiques, autrement dit, par les algorithmes qui président au fonctionnement des plateformes numériques. C’est donc le résultat d’une co-construction qui réunit l’activité humaine au fonctionnement machinique. La présentation de soi est ainsi rendue possible par les collections de traces qui s’agrègent à tout un ensemble de contenus disparates composant les profils des utilisateurs (statuts, liens, vidéos, photos, commentaires, etc.)5 (Coutant, 2011).

3. L’identité numérique au cœur des contenus et de leur transformation

3.1. La performance comme stratégie de création de contenus

Bien connue des sportifs depuis son lancement en 2009, Strava est une plateforme utilisée pour tracker les activités sportives grâce aux données fournies par les différents appareils de mesure connectés ou applications mobiles. Prévue pour analyser les performances des athlètes, qu’ils soient amateurs ou professionnels, la plateforme est conçue comme un carnet d’entraînement en ligne pour aider à définir, suivre et remplir des objectifs en transformant le Smartphone, ou tout autre objet de mesure dédié au sport, en un coach personnel de poche. Grâce aux capteurs équipant le sportif, chaque activité est enregistrée, analysée et segmentée. Des procédures calculatoires sur les données recueillies permettent à l’application de fournir au sportif un résumé précis de sa session, de restituer le tracé des courses et de leur associer un inventaire des performances réalisées par la création automatisée d’indicateurs thématisés : durée de l’activité, distance parcourue, rythme moyen, nombre de calories brûlées, fréquence cardiaque, etc.

Note de bas de page 6 :

Dans sa description du discours numérique, Marie-Anne Paveau appelle « technographisme une production sémiotique associant texte et image dans un composite natif d’Internet » (Paveau, 2017, p. 305).

Note de bas de page 7 :

Inspiré du maillot à pois du meilleur grimpeur sur le Tour de France, le « King of Mountain » ou « Queen of Mountain » récompense l’athlète le plus rapide sur un segment. Par extension, « KOMer », désigne le processus qui réduit l’activité sportive au seul objectif d’un gain de points pour monter au classement.

L’application se dote également des aspects communautaires des réseaux sociaux donnant lieu à différentes options de partage : l’abonnement au suivi des utilisateurs, la création de groupes d’amis, le partage des tracés, les commentaires et « like » sur les parcours. Mais le « Facebook » des athlètes incite surtout à la comparaison des performances entre utilisateurs par le partage de « classements, palmarès, compteurs, cartes, recommandations et notes de toutes sortes » (Cardon, 2015, p. 12) faisant de la plateforme un lieu de compétition en ligne. Selon des procédures automatisées, des technographismes6 viennent en effet agrémenter le profil des utilisateurs par l’ajout de badges « King of Mountain »7 ou de médailles virtuelles pour valoriser la performance réalisée sur un segment. Générés par les algorithmes sur la base des données collectées, ces éléments mettent en visibilité les exploits sportifs en les investissant d’une charge sémantique qui prolonge le culte de la performance observé au sein du mouvement du quantified self. Ils suivent donc une logique de compétition et de surveillance au principe duquel sont régies les conduites individuelles et par lesquelles se façonnent les représentations de soi.

Note de bas de page 8 :

Marie-Anne Paveau « appelle natives les productions élaborées en ligne, dans les espaces d’écriture et avec les outils proposés par Internet » (Paveau, 2017, p. 27).

Les opérations qui transforment les données en statistiques, schémas ou diagrammes à partir desquels sont évalués les progrès de l’utilisateur sont, en partie, à l’origine de ces nouveaux discours numériques natifs8 aux contenus plurisémiotiques. Ils agrémentent les interfaces de visualisation (Paveau, 2017) et attestent la « calculabilité des traces de nos activités » (Cardon, 2015, p. 12) en en faisant des outils de prédiction et des discours de recommandation. Mais surtout, ils prennent part à la co-construction de l’identité numérique de l’utilisateur. On observe en effet que les identités agissantes et calculées ne s’appuient pas exclusivement sur les traces laissées par la présence en ligne de l’utilisateur mais s’agrègent en plus avec les données transmises par les objets connectés. Les utilisateurs accèdent donc à des constructions identitaires et des représentations de soi de sportifs sans que ces derniers n’en soient à l’origine autrement que par leurs activités ou performances sportives. Comme l’ont bien compris les éditeurs de plateforme, sans être ni vraie ni fausse, l’identité numérique est un processus qui fait de l’exposition de soi une technique relationnelle aux multiples stratégies (Cardon, 2010). Et dans la dynamique d’une reconnaissance de soi par les pairs, les signes identitaires (commentaires, performances, photos, etc.) sont à l’origine de la circulation de contenus, au point de devoir relayer une partie de leur création à des algorithmes pour accroître le trafic et monétiser l’audience des plateformes.

3.2. Comment les algorithmes nous fabriquent : la transformation des contenus

Les algorithmes que nous fabriquons nous construisent en retour, nous avertit Cardon, et nos conduites, orientées et mises en discours par « une infrastructure de calculs » (Cardon, 2015, p. 7), apparaissent parfois comme un simulacre, une fiction au cœur du fonctionnement d’une plateforme numérique comme on peut l’observer avec The Beautiful Walk.

The Beautiful Walk se présente comme une course virtuelle de 40 000 km autour du monde, au départ de Paris et jalonnée de 2000 étapes. Si le fonctionnement de la plateforme est similaire à celui de Strava en termes d’exploitation des données liées à l’activité sportive (distance parcourue, date, type d’activité, durée de l’activité), l’athlète en quête d’exploit n’est pas ciblé ici. Pour autant, la notion de performance est bien réelle : elle se manifeste sous la forme d’un classement général indiquant la progression des coureurs (distance totale parcourue, lieu, durée cumulée du parcours et une moyenne du kilométrage effectué par jour), complété d’une feuille de route individuelle qui agrège différents contenus (la meilleure performance km/jour, la moyenne active, la date d’arrivée estimée) et dans laquelle figurent des technographismes, sous forme de barres de progression, pour montrer, par exemple, la distance restante à parcourir avant la prochaine étape.

Note de bas de page 9 :

Bachimont « entend par contenu tout objet physique pour lequel on rencontre l’union d’un support matériel de manifestation et une forme sémiotique d’expression » (Bachimont, 2014, p. 64).

La progression de l’utilisateur dans sa course fictive est obtenue par le cumul des distances parcourues durant ses activités sportives réelles, par synchronisation des données depuis des plateformes comme Strava ou Runkeeper. En des termes différents, se pose alors la question du régime de vérité numérique, soulevée par Rouvroy à la suite de Foucault. Car si « la modélisation algorithmique du réel » (Rouvroy, Stiegler, 2015) est déjà questionnable dans le cas de Strava avec la mise en compétition généralisée des coureurs, que dire du changement de nature qu’opèrent les algorithmes sur les contenus eux-mêmes ? Comme l’explique Bachimont, tous les contenus9 pris en charge par le numérique peuvent recevoir un traitement calculatoire au point qu’ils « peuvent se produire de manière automatisée, se transformer, voire se lire de manière machinique » (Bachimont, 2014, p. 65). Et puisque le numérique « permet de rassembler en son sein des contenus et informations de toute origine, de toute nature, rapportant dans une même homogénéité binaire des informations hétérogènes d’origine diverse » (Bachimont, 2016), on voit s’opérer, à partir de données identiques, les potentialités des transformations automatisées de contenus visant à créer ou modifier l’écriture et la représentation de soi, que des choix éditoriaux arbitrent.

La promesse du quantified self de redonner le pouvoir à l’individu sur ses données « dans un monde qui le menacerait de l'en déposséder » (Gicquel, Guyot, 2015, p. 72) ne semble alors plus respectée si tant est qu’elle l’ait déjà été. En effet, on peut constater que l’objectivation du réel, recherchée dans la technologisation des pratiques de l’automesure, est mise à mal dès lors que les données transitent par les plateformes dont l’objectif est, justement, de les traiter en vue de capter l’attention des utilisateurs par des systèmes de notifications et le partage d’une production croissante de contenus visant à construire une réalité numérique « qui se prétend le monde » (Rouvroy, Stiegler, 2015).

4. Conclusion : la dissipation de la subjectivité dans la marchandisation des données

Au-delà des aspects liés aux activités sportives de ses utilisateurs, la plateforme Strava tire bénéfice des données qu’elle collecte en fournissant aux collectivités des visualisations précises du trafic cycliste à partir des déplacements urbains. Elle développe ainsi ses propres cartes pour identifier les axes les plus empruntés, les temps d’attente aux intersections afin d’aider les collectivités à planifier la croissance du trafic et gérer les infrastructures en conséquence. On comprend que la génération de données par les utilisateurs de la plateforme est encouragée par divers moyens au sein du dispositif numérique, notamment par la segmentation des tracés qui seront empruntés massivement par les utilisateurs toujours encouragés à battre leur record pour figurer en haut du classement général. Cette prise en charge énonciative par des algorithmes montre la pluralité des instances intervenant dans la production et la transformation des contenus (objets connectés, algorithmes, plateforme), caractéristique de l’énonciation éditoriale. Les représentations visuelles issues de la transformation des données en technographismes par le tissage du linguistique et de l’iconique, illustrent par ailleurs une stratégie d’éditorialisation des plateformes, ce que Souchier analyse à propos de l’«  image du texte » comme « une interdétermination du sens et de la forme [...] qui participe activement de l’élaboration des textes » (Souchier, 1998, p. 138).

Dans le cadre d’une « énonciation matérielle visuelle nativement numérique » (Paveau, 2017), on constate alors, d’une part, que les algorithmes ont la capacité de mettre en récit des données pour générer des contenus qui ont vocation à pénétrer les espaces du pouvoir économique et stratégique des entreprises en se présentant comme des outils d’aide à la décision. D’autre part, le traitement calculatoire de ces données a aussi la capacité de façonner en retour des représentations de soi ou des règles de conduites. Il permet aussi de construire des scénarios caractéristiques du régime fictionnel, dans le cas de The Beautiful Walk, en mettant en place une illusion de référentialité dans les stratégies narratives.

Outre les spécificités de chaque plateforme et de leurs utilisateurs, les éditeurs, on l’a vu, mettent en place des stratégies de captation de l’attention pour répondre aux logiques marchandes. Ce sont « de nouvelles formes de tyrannies de la présence » (Georges, 2011), insérées dans un cadre sociotechnique, qui contraignent les utilisateurs à créer et à échanger continuellement des contenus pour maintenir leur exposition en ligne. Mais, aidées par la collecte des données laissées par les utilisateurs, les plateformes ont aussi la capacité de prendre le relais d’une production de contenus entièrement automatisés, lesquels complètent parfois ceux déjà fournis par les utilisateurs. Dans le cadre des plateformes Strava et The Beautiful Walk, c’est une stratégie de mettre en visibilité ce qui doit apparaître comme une performance des utilisateurs que gouverne la mise en récit automatisée de la représentation de soi, par le traitement algorithmique des données. Derrière cette idée, on retrouve les caractéristiques d’une société hypercompétitive dans laquelle « chaque individu hyperindexé […] devient sa propre référence statistique » (Rouvroy, Stiegler, 2015), dissipant sa subjectivité dans des catégorisations élaborées par les données.

« Nos traces identitaires numériques sont dès à présent également marchandisables. À quelle échelle le seront-elles demain et de quel niveau de contrôle disposerons-nous encore sur leur dissémination ? » (Ertzscheid, 2009). Dix ans après la question posée par Ertzscheid, force est de constater que le phénomène du traitement des données en vue de leur marchandisation n’a fait que s’amplifier. En effet, l’individu « devenu un document comme les autres » (Ertzscheid, 2009) est de plus en plus réduit aujourd’hui à une multitude de données calculables et exploitables par les algorithmes, qui dans un même mouvement tend à expurger toutes les traces de la subjectivité car non quantifiables, non calculables, et donc non monétisables.