Table des matières

Chapitre I

Entre présence et absence



La Téléprésence moderne se caractérise par l'augmentation du coefficient charnel dans la communication à distance. Les signes de la présence dans de telles situations s'incarnent, en effet, toujours plus. La Téléprésence n'a pas attendu les réseaux numériques pour se déployer. Mais le mouvement qui augmente, aujourd'hui, la proportion charnelle dans les canaux expressifs est très lisible. L'écriture manuscrite, premier transport à distance du langage, formalise à l'extrême la corporéité de l'auteur, ne la laissant transparaître qu'à travers la calligraphie. L'expansion de l'imprimé réalise ce que l'invention de l'écriture annonçait, mais uniquement comme promesse abstraite : la formation de communautés de lecteurs éparpillés sur un territoire et réunis par les mêmes livres [1]. L'instantanéité de la transmission orale -sans la réactivité- est atteinte grâce au télégraphe. Avec le téléphone qui assimile les canaux vocaux et auditifs, la simultanéité de l'émission et de la réception épouse un peu plus le modèle de la communication en "face à face". L'émission de l'image, et sa réception instantanée, charge la relation d'une dimension visuelle incontournable. Sur les réseaux numériques s'expérimente, pour la première fois, une communication collective, éventuellement anonyme, rappelant l'échange multipolaire des groupes rassemblés dans un même lieu et rompant avec le modèle pyramidal des massmedia. Enfin, dans le sillage de la Réalité Virtuelle, la télévirtualité immerge les partenaires dans le même espace virtuel. Elle ajoute le canal gestuel au canaux visuels et sonores et ouvre à l'échange kinesthésique.

Le partage commun de "l'ici et maintenant", modèle principal de la relation humaine, se transpose ainsi dans l'espace et devient la référence de la communication à distance. Ce partage, on le sait, ne se limite pas à l'échange de signes verbaux et non verbaux. Il est tissé de gestes, de contacts corporels concrets ou potentiels et de manipulations conjointes d'objets. Cette dimension "haptique" (du grec haptein, toucher) lutte contre l'affadissement inévitable d'une communication contrainte à ne s'extérioriser que par le texte, le son, l'image sans pouvoir s'appuyer sur une interaction corporelle, directe ou indirecte. L'enjeu n'est alors plus seulement communicationnel, mais relationnel. Il ne s'agit plus de transmettre des informations mais de créer les conditions d'un partage mutuel d'un univers.

Après avoir posé, dans une première partie, quelques jalons pour une archéologie de la Réalité Virtuelle, nous préciserons les conditions de ce partage, et ceci dans deux directions, le perfectionnement des interfaces de communication et la naissance de nouveaux milieux de présence partagée, tirant profit des ressources abstraites de la télévirtualité. Nous prolongerons, ensuite, cette enquête en interrogeant les craintes d'un éventuel doublage virtuel de notre environnement ; craintes qui, tout en créditant la simulation numérique d'un pouvoir imitatif probablement démesuré, méconnaissent les dimensions proprement créatives des télé-technologies.

A - éléments pour une archéologie de la Réalité Virtuelle [2]

L'essai pamphlétaire de Jean Brun, Le rêve et la machine [3] contribue à dégager une archéologie de la Réalité Virtuelle. Sa thèse centrale se résume ainsi : la science et la technique sont filles de l'activité onirique, tentative de dépassement -vouée à un échec dramatique, selon l'auteur- des cadres spatiaux et temporels propres à l'humain. L'opérationalité des applications, tout comme les motivations apparemment rationnelles des acteurs ne servent, selon lui, que d'alibis à cette tentative. Ce qui est remarquable dans le développement de l'argumentation, c'est l'identification des traits essentiels de la tentative de déplacement sans fin des limites marquant l'existence humaine. Tentative désespérée, pour Jean Brun inspiré par la théorie chrétienne du salut [4]. Le chapitre intitulé "Télé-présences et réalités virtuelles" concentre assez bien les enjeux de l'épopée technicienne considérée comme tentative de sortie de la condition humaine. Se tenir à distance de soi, réaliser l'ubiquité, approcher une transsubstantiation, une désincarnation voire une réincarnation, voilà les objectifs aussi vains (selon Jean Brun) qu'affirmés par la saga technicienne [5]. "Le désir de l'homme de métamorphoser son temps et son espace pour aller habiter d'autres moi, se défaire à nouveau de ceux-ci pour toujours recommencer, témoigne de la détresse de celui qui voudrait s'arracher à lui-même afin de pouvoir tout savoir et pouvoir tout posséder" [6].

L'essence de l'entreprise technologique réside précisément dans la tentative de vivre "plusieurs existences ayant pour auditorium des espaces multidimensionnels" [7] afin d'échapper à l'unicité de la localisation dans l'espace et à la linéarité du déroulement temporel. La dénonciation des transgressions qui en résultent s'accompagne d'une piquante revue d'essais littéraires préfigurant l'actualité des télé-transports et de la Téléprésence. Au XIXe siècle finissant, la naissance des techniques d'enregistrement (photographie, phonographie et cinéma) féconde l'imaginaire littéraire et lui fait entrevoir de somptueuses perspectives. Ce qui est remarquable dans ces fictions, c'est l'anticipation sur le stade, tout juste atteint, de la capture d'empreinte. Comme si l'horizon découvert autorisait tous les vagabondages visionnaires, espérances tangibles d'une poursuite de la vague innovatrice vers toujours plus de réalisme dans la concrétisation des représentations. Avec le développement de la diffusion radiophonique, la prémonition rencontre la réalisation technique. Paul Valéry en tirera immédiatement, et magistralement, les leçons. Dans le cadre du mouvement de la cybernétique, on s'attachera aussi à imaginer des formes de télé-déplacement de substance. On quitte alors le terrain de la fiction ou de l'extrapolation pour investir celui du projet scientifique. Quelques années plus tard, avec les premiers simulateurs numériques de pilotage d'avions, l'informatique commencera à concrétiser ces pressentiments.

D'Apollinaire à Saint-Pol-Roux

Guillaume Apollinaire imagine un procédé d'enregistrement et de transmission d'existence, non plus de l'apparence mais de la vie même. Dans Le toucher à distance, Apollinaire décrit l'étrange appareil qu'utilise le baron d'Ormesan : "De même que la voix peut se transporter d'un point à un autre très éloigné, de même l'apparence d'un corps, et les propriétés de résistances par lesquelles les aveugles en acquièrent la notion, peuvent se transmettre, sans qu'il soit nécessaire que rien relie l'ubiquiste aux corps qu'il projette" [8]. Le baron avait disposé dans huit cent quarante grandes villes des récepteurs de présence (et particulièrement sur les façades des synagogues, puisqu'il souhaitait se faire passer pour le messie). Grâce à son émetteur de présence, il pouvait retrouver sa maîtresse tous les mercredis à Paris alors qu'il se trouvait à Chicago, Jérusalem ou Melbourne. Tout cela finit mal, huit cent quarante fois mal, car le baron assassiné mourra autant de fois que ses doubles délocalisés.

À propos du cinéma, Saint-Pol-Roux poursuit les mêmes desseins avec sa conception "idéoréaliste". Ils s'inscrivent dans le cadre d'un rejet affirmé de l'écrit et d'une valorisation de l'oral que véhiculent les techniques d'enregistrement (phonographie, cinématographie). Saint-Pol-Roux, dans son essai Cinéma vivant : "...le cinéma en est aux Ombres de Platon, il doit sortir de la Caverne. Le prisonnier doit se libérer" [9] et donc le cinéma actuel n'est que "le Cro-Magnon du cinéma futur" [10], "le Destin va se cristalliser, va se corporiser. Le cinéma sera organique" [11]. Son "idéoréalisateur" devrait pouvoir créer des "êtres-images" et les déplacer à distance sous forme d'"ondes carnifiées". "Puisqu'on est parvenu à la photographie à distance, pourquoi n'atteindrait-on pas l'apparition de son original, pourquoi à la chambre noire ne succéderait pas une chambre blanche ?" Le cinéma s'emploiera "à capter le désir collectif et à en objectiver le motif" [12]."On surcréera les autres, on se surcréera soi-même" [13]. L'"idéoplastie" ouvrira le champ du transport spatio-temporel : "on invitera des célébrités chez soi, "dans nos meubles, à notre table, il y aurait à domicile des soirées César, Dante".

On peut noter l'inspiration organique de "l'idéoréalisme". Il s'agit bien d'incarnation, voire de réincarnation. La perspective de Saint-Pol-Roux est en fait assez éloignée d'une recréation artificielle, d'une synthèse. C'est plutôt en radicalisant la photographie qu'il espère engendrer une "surcréation" tridimensionnelle. On soulignera aussi l'énergie révolutionnaire issue du "miracle" photographique, irriguant d'autres projets de transport bien plus audacieux, comme si la séparation de l'apparence et de la forme autorisait l'espoir d'extraire la forme elle-même par un procédé similaire [14].

De Paul Valéry à Norbert Wiener

Jean Brun aurait pu également solliciter Paul Valéry qui a, bien entendu, lui aussi anticipé la télévirtualité. La construction même du célèbre article, La conquête de l'ubiquité, recèle une vision prémonitoire. Avant de décrire et d'analyser la télé-diffusion de la musique et du son, il commence par abstraire la forme fondamentale du phénomène : "Sans doute ce ne seront d'abord que la reproduction et la transmission des oeuvres qui se verront affectées. On saura transporter ou reconstituer en tout lieu le système de sensations (italique ajouté par le rédacteur), -ou plus exactement, le système d'excitations- que dispense en un lieu quelconque un objet ou un événement quelconque" [15]. Pressentant la continuité entre le développement des réseaux énergétiques (eau, gaz, électricité) et des futurs réseaux informationnels, il désigne, après la musique [16], le prochain milieu candidat à la télé-exportation : les images visuelles. "Un soleil qui se couche sur la Pacifique, un Titien qui est à Madrid ne viennent pas encore se peindre sur le mur de notre chambre aussi fortement et trompeusement que nous y recevons une symphonie. Cela se fera" [17]. En cela, Paul Valéry ne se situe plus, comme Apollinaire, sur le terrain de la fiction littéraire mais sur celui de l'extrapolation socio-technique, soutenu par une intelligence profonde du phénomène. Radicalisant encore son pressentiment, il s'interroge : "Je ne sais si jamais philosophe a rêvé d'une société pour la distribution de Réalité Sensible à domicile" [18]. Les majuscules élèvent l'intuition au rang de concept, rejoignant, cinquante ans auparavant, les mêmes marquages typographiques qui affectent la Réalité Virtuelle lorsque les ingénieurs américains des années soixante-dix la baptisèrent et signifièrent ainsi l'invention d'un nouveau milieu de "Réalité Sensible".

Dans Cybernétique et société, paru aux États-Unis en 1950, Norbert Wiener, l'un des principaux créateurs du mouvement de la cybernétique, propose une argumentation visant à établir la possibilité théorique de l'enregistrement et de la transmission du vivant. Il s'agit là d'un tournant dans le projet de transfert de présence, car pour la première fois c'est une argumentation scientifique, et non une spéculation visionnaire, qui est avancée. Indépendamment du degré de pertinence du propos, ce changement de registre mérite d'être souligné. Wiener ne décrit pas simplement le projet, il indique comment il faut le réaliser. L'idée maîtresse, conforme à l'esprit conquérant de la cybernétique, repose sur une conception "immatérielle" du corps, sa définition informationnelle, énergétique. "L'individualité du corps est celle de la flamme plus que celle de la pierre, de la forme plus que celle d'un fragment matériel ; cette forme peut être transmise ou modifiée, ou doublée" [19]. La définition énergétique de la matière annonce sa définition informationnelle : "Nous ne sommes que les tourbillons d'un fleuve intarissable, non-substance qui demeure, mais modèles qui se perpétuent, [...] l'idée selon laquelle on pourrait imaginer non seulement le voyage par train ou par avion, mais aussi par télégraphe, n'est pas absurde en soi, si loin qu'elle doive être de sa réalisation" [20]. L'idée générale est de remplacer un corps humain par son double informationnel, de le transmettre et de le reconstituer à distance par une sorte de synthétiseur de présence. Affirmant que l'obstacle technique n'est que provisoire, il ajoute que cette reconstitution totale d'un organisme vivant ne serait pas "plus radicale que celle subie effectivement par le papillon au cours de sa métamorphose" [21]. Un tel projet se rapproche clairement de la synthèse numérique. Il demeure partiellement organisciste : on s'attache à la constitution d'une matière modélisée, -la comparaison avec la chrysalide atteste qu'il s'agit toujours de mutation organique- et on l'expédie grâce à une transmission substantielle. Mais l'évocation de la synthèse informationnelle rapproche le projet de la logique numérique et même de la Réalité Virtuelle. Observons que les voies imaginées par Wiener ne sont pas du tout, actuellement tout au moins, celles qu'empruntent les ingénieurs de la Téléprésence. Ils oeuvrent dans le champ de la synthèse de la présence perceptive (image, son, tactilité, effort) et n'envisagent pas le moins du monde de se lancer dans des projets de synthèse et de transport substantiel du vivant (aujourd'hui, ils en seraient, de toute manière, bien incapables).

La présence à distance : un concept charnière

La présence est une notion à la fois évidente et floue. Unité de lieu et de temps définissent la présence physique, et encore [22]. Mais les espaces-temps mentaux -ce à travers quoi on est physiquement présent- sont, eux, multiples. Leurs topo- chronologies ne sont pas descriptibles. On n'est jamais là et à l'instant où l'on croit. On s'expatrie continuellement... surtout à l'état immobile. Pour élargir les fondements d'une archéologie de la Réalité Virtuelle, ces quelques références devraient être complétées par de plus amples investigations, relatives notamment :

- à l'espace langagier : mise en commun entre des sujets s'opérant toujours par le détour abstrait d'un tiers symbolisant, et rendant de ce fait illusoire tout espoir d'une communication im-médiate,

- à la notion de marché, ajustement plus ou moins spontané des acteurs économiques sans qu'ils soient directement en contact,

-à la présence divine (vue comme présence à distance) dans ses différentes versions : prophétique et donc portée par le discours ou le texte (tradition juive), incarnée et imagée (tradition chrétienne en n'oubliant pas la position jésuite, moderne avant la lettre : image qui se donne comme telle appelant à être appréciée pour ses qualités sensibles et non pour sa signification).

- au fétichisme : prendre la partie pour le tout est une forme de présence à distance opérant par mobilisation d'un objet partiel remplaçant la totalité (qu'il s'agisse de satisfaction sexuelle, d'opération langagière ou de substitution maternelle grâce à un "objet transitionnel"),

- à l'action à distance : la notion physique de champ de forces (gravitationnel, électrique, magnétique, etc.) concrétise une projection, de la cause, à distance.

Dans notre enquête, nous rencontrerons certaines de ces directions même si nous privilégions plutôt les traits socio- techniques de la Téléprésence.

B - La Téléprésence, une définition

Wiener avait vu juste lorsqu'il préconisait de réaliser le doublage informationnel d'un corps pour, ensuite, le télé-déplacer. Il prévoyait ainsi l'interdépendance entre la simulation informatique et l'expansion des réseaux numériques, qui constituent aujourd'hui les deux cas d'emploi du terme "virtuel" [23]. Mais le cybernéticien, tout comme ses prédécesseurs de l'avant-dernier siècle, demeurait prisonnier d'une vision réaliste du doublage. Il s'agissait bien de reconstitution à l'identique. Or les réalisations actuelles démontrent que la virtualisation ne réplique pas des univers de référence, elle invente, à partir d'eux, de nouveaux mondes. Ainsi exprime-t-elle sa puissance générative. Notre investigation de la Téléprésence est fondée sur un mouvement en quatre temps qui explicite la notion de déplacement informationnel et caractérise ses phases :

- la production d'une représentation formelle de l'objet à déplacer pour qu'il puisse passer par le filtre d'un réseau numérique,

- l'accroissement des caractères incarnés des représentants ainsi obtenus (ajout de l'image au son pour accéder à la visiophonie, passage à la troisième dimension dans Internet, par exemple),

- l'impossibilité, toutefois, de faire coïncider le représentant et l'original, mais poursuite du mouvement pour s'en approcher,

- dans cette tentative mimétique déjouée, naissance d'un espace propice à la création de formes hybrides soumettant le double informationnel de l'objet source -rendu transportable- à de nouvelles modalités cognitives et actives (comme le multifenêtrage, hybride entre la multiplicité des espaces d'un bureau réel et la bi-dimensionalité de l'écran ou encore l'usage du regard pour se déplacer dans les espaces de Réalité Virtuelle).

Il s'agit donc de préciser et d'illustrer ces quatre opérations. Nous envisageons les relations entre les phases d'imitation et d'invention comme une manière d'analyser les réalisations et les projets en cours, de les soumettre à une même interrogation discriminante. Cette interrogation, relève, par ailleurs, d'une problématique beaucoup plus vaste, que nous ne ferons que suggérer, englobant le champ de la dynamique technique, comme mouvement de création en tant que telle : imitation, détournement, inflexion de la nature, par d'autres moyens que la nature, et donc création, de fait, d'un nouveau milieu naturel/artificiel [24].

Modéliser et transporter

La première opération de la Téléprésence consiste à traduire numériquement les composantes appelées à être déplacées (voix, image, éventuellement efforts physiques) [25]. De même, les éléments de l'environnement sujets à interactions sont transcrits (espaces documentaires, lieux de travail comme dans la Bureautique virtuelle). Enfin, les interfaces spécifiques nécessaires sont installées pour animer ces univers (de la définition des zones sensibles dans l'écran aux organes de commandes gestuels tels que les souris et joysticks - jusqu'aux interfaces de Réalité Virtuelle comme les gants de données, casques d'immersion, etc.). Ce premier mouvement s'adosse à la simulation informatique qui affine sans cesse ses capacités à produire des modèles numériques fonctionnels des objets et systèmes qu'elle prend pour cible.

Dans un deuxième temps, on transporte, via des réseaux adaptés, ces éléments modélisés. Une grande variété d'applications concrétise cette double opération qui, de l'enseignement à distance au télétravail en passant par le déplacement d'oeuvres ou de musées et les facultés inédites de travail coopératif à distance, combine différents composants (textes et graphismes avec ou sans image de l'interlocuteur, réception des efforts physiques à distance, etc.). On ne fera pas ici la typologie de ces configurations, nous réservant par la suite d'approfondir certains exemples, en particulier dans le domaine de la Réalité Virtuelle, qui concentre le plus grand nombre de canaux perceptifs.

Déplacement d'existence et déplacement de présence

Simuler et déplacer, ces deux opérations recouvrent les deux cas d'emplois du terme "virtuel". Le premier, la modélisation numérique, désigne une variation d'existence. De la réalité de premier ordre, empirique, on passe à une réalité de deuxième ordre, construit selon les règles de la formalisation physico-mathématique. La deuxième acception du terme"virtuel" relève d'une variation de distance, et c'est là que prend place le transport par réseau. On parle d'entreprises, de casinos, ou de communautés virtuels pour désigner des institutions, ou des personnes, éloignées et qu'on ne peut atteindre qu'à travers le réseau. Et cet éloignement est le fruit de leur modélisation numérique préalable, condition pour qu'ils puissent se glisser dans les mailles du réseau. On entre en rapport effectif avec un ensemble de signes traduisant leur présence (textes, voix, images, etc.) dans une forme mue par des programmes informatiques. Cette animation automatique par programmes donne consistance à l'appellation "virtuel". Sinon, il s'agirait d'une simple télé-communication, comme avec le téléphone. (On peut parler, par exemple, de "casino virtuel" sur Internet parce qu'un modèle de casino fonctionne sur un serveur, à distance). Le "virtuel" de la simulation ne s'oppose pas au "virtuel" des réseaux, il le prépare. Ces accommodations numériques ne sont certes pas anodines et il ne faudrait pas laisser croire qu'elles se contentent de répliquer les phénomènes et les relations situés à leur source. Elles ne se limitent pas à filtrer la communication à distance. Elles sélectionnent, surtout, les matériaux qui se prêtent à une transmission (ainsi l'odorat, malgré les récentes recherches en cours, est couramment délaissé au profit de l'image plus valorisée culturellement et... facilement modélisable). La forme des entités déplacées, tels les "avatars virtuels", est strictement dépendante de ces sélections opérées. Tel "avatar" privilégiera la qualité graphique des costumes, un autre la qualité sonore, un autre encore la conformité photographique du visage. C'est dire si ces transpositions altèrent et redéfinissent les acteurs engagés ainsi que leurs relations.

C - Les interfaces : la commutation homme/univers virtuel

Avec le développement des organes intuitifs de commande des ordinateurs, dans les années quatre-vingt, la notion d'interface a d'abord désigné les organes matériels de communication homme/machine (tels que le clavier, la souris ou les leviers de commande) ainsi que l'organisation dynamique des affichages à l'écran (multi-fenêtrages et menus déroulants). Dix ans plus tard, avec la vague du multimédia, la diffusion du CD-Rom et d'Internet, une autre signification s'y est adjointe, dès lors qu'il devenait possible d'activer directement les objets sur l'écran. La notion d'interface graphique est apparue, désignant à la fois les outils de navigation dans un programme multimédia ainsi que l'organisation logique de l'application, telle qu'elle apparaît sur l'écran.

Nous réservant de reprendre plus avant cette dernière acception de la notion d'interface, nous centrerons, ici, notre analyse sur son versant externe, matérialisé par les équipements de commutation entre l'expression humaine et les univers virtuels, tels que : éditeurs partagés, affichage vidéo, visio et audio-casques, gants capteurs, costumes de données, senseurs, exo-squelettes, systèmes à retour d'efforts ou leviers de commandes multi-usages.

Espaces de travail partagés

Le travail de groupe sur les mêmes sources numériques (architecture, dessin industriel, etc.) a rendu nécessaire la mise au point d'<<éditeurs partagés>> assurant la collectivisation de toute modification individuelle apportée au projet, ceci afin d'échapper à l'imbroglio résultant de la circulation simultanée (par disquette ou courrier électronique) de plusieurs versions d'un même travail. Manipuler des objets communs est une chose, échanger à propos de cette activité en est une autre. Comme l'explique Michel Beaudoin-Lafon, directeur du Laboratoire de Recherche Informatique à l'Université Paris-Sud : "En effet, le processus de production de l'objet est aussi important que le résultat de ce processus, particulièrement dans les tâches à couplage fort (nécessitant une très forte interaction entre les participants, comme dans le brainstorming). Par exemple, lorsque l'on fait un croquis pour expliquer une idée, on fait constamment référence à cette figure par des gestes. Il faut donc donner les moyens à chacun de percevoir les actions des autres et pas seulement le résultat de ces actions" [26]. Plusieurs systèmes prennent en compte cette dernière faculté en affichant sur les documents, les positions des pointeurs activés par les participants ou encore en délimitant, par des dégradés de couleurs, les zones que chacun affiche sur son écran, de telle manière que chacun puisse voir ce que regardent les autres.

Le partage, à distance, d'espace de travail est aussi l'objectif visé par le système ClearBoard [27]. L'image vidéo de l'interlocuteur est superposée à la surface de travail sur l'écran de l'ordinateur, si bien que les deux personnes ont l'impression de travailler à modifier un plan, par exemple, en étant situées de part et d'autre d'une vitre transparente sur laquelle s'affiche ce plan. L'espace de travail se confond alors avec l'espace de communication. C'est l'une des concrétisations de la notion de mediaspace, espace commun de travail à distance sur des ressources multimédia, mobilisant principalement ordinateur, caméra vidéo et microphone, prolongeant des équipements habituels (courrier interne, téléphone, messagerie, etc.).

Ces recherches ont mis en lumière la nécessité de respecter les échelles de disponibilité de chacun des participants à un médiaspace, en particulier lorsque tous partagent des locaux contigus (laboratoire, ensemble de bureaux d'un service, etc.). Dans ces conditions, autant les espaces communs (cafétéria, bibliothèque) sont toujours accessibles, autant les postes de travail personnels peuvent alors être protégés d'une incursion intempestive par de subtiles procédures qui vont de l'affichage d'une porte sur l'écran (ouverte, entrouverte -il faut alors frapper- ou fermée) au "coup d'oeil" lancé vers l'écran d'un collègue pour le saluer brièvement ou vérifier qu'il est disponible. D'autres codes sociaux gouvernant l'établissement d'un contact, telle la graduation de l'approche permettant progressivement l'installation de la relation, se révèlent plus difficile à reproduire. Avec les écrans, les transitions sont difficiles à ménager : l'image apparaît soudainement. Des propositions sont à l'étude pour y remédier.

En tout état de cause, on peut déjà observer que le doublage des relations de proximité ordinaire par des dispositifs techniques, tout en tenant compte des contraintes sociales locales, les modifie en instaurant un double système de relation. Ces systèmes imprégnés des contraintes dues à la séparation physique, inventent de nouvelles mises en forme des espaces de travail ; c'est cela qui les distingue d'une simple télétransmission et qui rend indispensable une modélisation préalable du fonctionnement des interfaces élaborées. On retiendra, de plus, que les mediaspaces -a priori conçus pour donner la sensation d'un espace commun entre des équipes éloignées- sont aussi expérimentés dans des institutions à localisation unique.

Réalité augmentée, réalité ajoutée, doublage virtuel des interfaces

Toute invention d'interface est un nouveau circuit reliant réalité de premier ordre et réalité modélisée. Les exemples qui suivent indiquent différentes voies par lesquelles la commutation réel/virtuel s'établit. On ne saurait trop souligner l'importance de l'une de ces directions : l'alliage de l'objet matériel et de sa modélisation virtuelle. Le projet Karma, développé par une équipe de l'Université de Columbia (New-York) permet d'ajouter à la vision ordinaire d'un équipement, une vue synthétique tridimensionnelle permettant de faire fonctionner celui-ci. L'imprimante tombe-t-elle en panne ? Il suffit de mettre une paire de lunettes, forme simplifiée d'un casque de vision de Réalité Virtuelle. Le squelette fonctionnel apparaît. Il ne reste plus qu'à manoeuvrer les boutons, leviers et autres manettes virtuelles permettant d'ouvrir un capot, faire glisser un tiroir, activer un mécanisme et en observer les conséquences ; le tout en simulation, bien entendu [28]. Ainsi, la Réalité Virtuelle surimpose à la vision ordinaire de l'objet une vue chirurgicale fonctionnelle, autorisant la manipulation simulée de l'objet. Les interfaces matérielles (organes de commandes de l'appareil) ont ainsi été doublés par leurs équivalents virtuels.

Dans le même registre, d'autres recherches ont pour objectif la disparition du support d'affichage lui-même : plus d'écran à regarder ni de lunettes à porter. Dans la filiale européenne du P.A.R.C. de Xerox, installée à Cambridge (Grande-Bretagne), P. Wellner dirige un projet nommé Digital Desk qui élimine les interfaces habituelles (clavier, souris, etc.). Sur le bureau s'affichent directement les données issues d'un projecteur numérique en surplomb relié à un système élaboré de vision artificielle capable d'interpréter certains gestes et de reconnaître des données montrées du doigt sur le bureau, par exemple. Les activités médicales constituent aussi un important champ d'expérimentation pour ces interfaces plus naturelles. Ainsi, un institut allemand a conçu une table de consultation destinée à l'initiation à l'anatomie [29]. Plusieurs étudiants, équipés de lunettes à cristaux liquides, peuvent observer l'un d'entre eux, disposant d'un "gant de données", manipuler une image tridimensionnelle d'un corps humain projeté sur la table lumineuse. Squelette, système circulatoire, respiratoire, etc. peuvent être, tour à tour et simultanément, visionnés ou auscultés. Ici, l'écran individuel a été remplacé par un équipement permettant de collectiviser l'apprentissage.

Réalité animée

Les "réalités prolongées" assouplissent des objets qu'on plie selon nos quatre volontés, c'est-à-dire incorporent certaines dimensions subjectives humaines dans leur mode de manipulation. Dépositaires d'une réactivité, d'un réglage comportemental, ils s'ajustent à nos comportements et s'auto-définissent dans un rapport adaptatif. Les recherches sur les smart rooms et smart clothes élargissent ainsi la notion d'objets interactifs. Citons Alex Pentand, l'un des responsables de ce programme de recherche au Medialab du M.I.T. à Boston : "It is now possible to track people's motion, identify them by facial appareance, and recognize their actions in real time using only modest computational resources. By using this perceptual information we have been able to build smart rooms and smart clothes that have the potential to recognize people, understand their speech, allow them to control computer displays without wires or keyboards, communicate by sign language, and warn them they are about to make mistake" [30]. Au-delà de l'usage d'ordinateurs, de vastes perspectives sont ouvertes pour élaborer des objets sensibles, cartes de crédit qui reconnaissent leur propriétaire, sièges qui s'ajustent pour nous garder éveillés et à l'aise, chaussures qui savent où elles se trouvent. Transformer les objets qui nous entourent en assistants personnels, tel est l'objectif poursuivi.

C'est ce même objectif que visent les "robots chercheurs", dans le domaine documentaire, afin de doter des programmes de capacités à reconnaître et à interpréter les actions de l'opérateur dans le balayage de banques d'informations. On demande, par exemple, à un programme de traiter une requête telle que : "Trouvez-moi les trois livres les plus intéressants sur les nouveaux projets d'interfaces". Connaissant les centres d'intérêt du demandeur, la nature de ses requêtes récentes, les articles qu'il écrit, celui-ci parcourra un ensemble de banques de données, consultera les "abstracts" et autres listes de mots-clés dans les bases de données qu'il jugera les plus appropriées. La mise au point de tels agents "intelligents", dont nous utilisons des versions simplifiées sur Internet, est, depuis plusieurs années, au centre des activités de l'Advanced Technology Group d'Apple visant à enrichir les interfaces graphiques -basées sur le multifenêtrage et les menus déroulants- popularisés par le bureau du Macintosh. Le maître mot est celui de délégation. Ajoutons "de compétence". Il faut pour cela que des programmes puissent avoir accès à nos habitudes et soient en mesure d'acquérir des informations sur nos centres d'intérêt sans que nous soyons obligés de leur faire subir un fastidieux apprentissage sur le modèle des systèmes experts actuels. Eric Hulten, responsable du Human Interface Group dans ce laboratoire d'Apple, explique : "De fait, nos ordinateurs savent déjà bien des choses sur nous : leurs disques durs contiennent les coordonnées de nos interlocuteurs, notre agenda, nos ressources et dépenses... Ils pourraient en apprendre encore plus dans notre courrier électronique" [31].

Ces recherches sont à rapprocher de celles entreprises dans un autre cadre : l'intelligence artificielle distribuée. Il s'agit de fournir à des agents autonomes certaines compétences limitées leur permettant de conduire une activité de manière autonome, l'association de ces conduites pouvant aboutir à résoudre des problèmes (comme le jeu du pousse-pousse ou le Rubix's cube). Dans cette approche, point n'est besoin d'un programme de résolution global. On installe une scénographie et un jeu d'acteurs qui, une fois définies les conditions initiales et l'objectif souhaité, enchaînent eux-mêmes les actions nécessaires pour résoudre le problème. Ces méthodes, dites de programmation multi-agents, sont utilisées, en particulier, pour modéliser l'évolution d'une situation aussi complexe que la vie d'une fourmilière ou étudier la dynamique d'évolution de robots adaptatifs dont la morphologie évoluera en rapport avec l'accomplissement plus ou moins réussi de certaines tâches comme la recherche dans leur environnement et le transport de certains matériaux (minerai, débris, etc.).

Symbolique amplifiée

Parallèlement aux dimensions strictement fonctionnelles, toute une symbolique spécifique s'élabore pour amplifier la portée cognitive des systèmes conçus. Comme l'explique Bertrand Duplat, directeur de Virtools, il faut "...inventer des métaphores intuitives qui permettent une utilisation pragmatique de la réalité virtuelle. Car c'est la simplicité d'utilisation, plus que le recours systématique à l'immersion, qui garantira le développement de ces nouvelles interfaces et donc des applications professionnelles de cette technologie" [32]. Par exemple, dans la transposition virtuelle de la navette spatiale réalisée par la NASA, des flèches stylisées viennent figurer l'écoulement, invisible, de l'air autour de la navette spatiale. Les ingénieurs qui circulent, par immersion virtuelle, au voisinage de cette navette visualisent ces écoulements aérodynamiques sous la forme d'êtres mathématiques répartis dans l'espace.

Autre exemple, l'Institut Français du Pétrole utilise une interface de navigation permettant de circuler dans une base de données scientifiques tridimensionnelle. L'interaction avec un modèle virtuel abstrait permet, en effet, de mieux comprendre le fonctionnement de systèmes complexes tels que la modélisation moléculaire (utilisé chez Glaxo) ou l'analyse de données financières, affichées dans un espace tridimensionnel. La mise au point de ce type d'outil peut ainsi faciliter l'analyse de systèmes à plusieurs paramètres, ce qui est impossible avec tout autre moyen. L'objectif est de maîtriser des systèmes d'informations complexes et de grande dimension (supervision de processus industriel, outils de vigilance ou de décision pour les contrôleurs aériens, etc.) [33]. Ces outils symboliques, loin d'imiter la réalité empirique, donnent forme à des mixages de représentation réalistes et d'espaces cognitifs, radicalisant ainsi ce qu'ont préparé, avant eux, nombre de techniques d'inscription (dessins d'architecture, dessin industriel, etc.). Mais ici la fonction représentative est augmentée d'une mission directement opérationnelle.

Recherches spécialisées, mais orientation généralisable

Nous avons décrit et commenté des recherches avancées qui donnent le sentiment, justifié, qu'il s'agit de prototypes nullement stabilisés sur le plan technique et dont la large diffusion est loin d'être garantie. Nous savons bien que les voies qui conduisent une innovation de laboratoire à un usage étendu sont impénétrables. Mais notre recension n'a pas un objectif prospectif. Elle indique une direction générale, laquelle se concrétisera selon des trames encore mal dessinées. Les jeux vidéos sont, évidemment, l'un des principaux vecteurs de diffusion de l'augmentation sensorielle. Nous en voulons pour preuve, par exemple, la mise sur le marché des jeux vidéos, d'interfaces de " retour d'effort" qui étaient, il y a peu encore, l'apanage de laboratoires ou de professionnels spécialisés [34]. Ainsi, pour les courses d'automobile, le constructeur américain ACT Labs propose un volant sensible qui transmet les moindres cahots du bolide engagé dans l'épreuve. Microsoft, pour sa part, commercialise depuis décembre 1997, le dispositif SideWinder -manche à balai rétroactif contrôlé par repérage de position optique et muni de deux moteurs- qui vibre si l'on roule sur une chaussée déformée et oppose une résistance croissante dans les virages si la vitesse augmente. En simulation de vol, il propage les efforts selon les conditions de vol et le type d'avion utilisé et, dans les jeux guerriers, provoque un recul variable selon qu'on actionne une arme à répétition ou un canon. Dès 1998, une société américaine mettait sur le marché The Intensor Tactile Chair, chaise conçue pour les jeux vidéos. Équipée de haut-parleurs, elle réagit aux différentes phases du jeu grâce à ses vibreurs disposés dans le dos et sous le siège. Dans la même perspective générale, les systèmes de Réalité Virtuelle qui jusqu'à présent demeuraient l'apanage de laboratoires scientifiques ou de lourds équipements de jeux d'arcades, semblent pouvoir se répandre dans les foyers. Des améliorations techniques notables (suppression des retards d'affichage des images lors des mouvements brusques, par exemple) ainsi qu'une spectaculaire baisse des prix [35] laissent entrevoir l'ouverture des marchés grands publics. Déjà en Novembre 1998, IBM présentait un micro-ordinateur portable (moins de trois cents grammes) contrôlable à la voix, avec des lunettes spéciales en guise d'écran d'affichage. Et en décembre 1998, Sony annonçait la mise sur le marché de Glasstron, écran visuel portatif connecté à un DVD, récréant à quelques centimètres des yeux l'impression d'une écran de plus de plus d'un mètre de large, situé à deux mètres de distance ; l'image est paraît-il de grande qualité et l'impression saisissante [36].

Au delà de la maturation et de la sélection des systèmes qu'assure le champ des jeux vidéos ainsi que l'expansion des technologies mobiles (téléphonie évoluée, postes légers de connexion à Internet, etc.) ce qui nous semble pouvoir être retenu, c'est la direction générale prise vers le prolongement virtuel des objets quotidiens d'une part et la multi-sensorialité de l'autre.

D - Le retour du corps

On a souvent mis l'accent sur le versant "immatériel" des technologies du virtuel. En fait, rien de tout cela n'est vraiment immatériel, c'est le type de matérialité qui se modifie : miniaturisation, approche de certaines limites physiques des composants, flux opto-électro-magnétique, vitesse de commutation des états (avec le méga-hertz comme unité), fluidité de l'imagerie informatique. Avec la Réalité Virtuelle, un tout autre volet se découvre. Une partie majeure du savoir-faire des ingénieurs s'investit dans l'invention et la mise au point d'interfaces destinées à assurer la conjonction entre les univers virtuels et notre corps. La liste est longue des trouvailles et autres ingénieux dispositifs qui assurent ces fonctions [37].

Chaque projet d'envergure se doit d'inventer l'équipement de commutation approprié. Par exemple, lorsque les chercheurs de l'Université de Caroline du Nord ont réalisé leur prototype de visite virtuelle d'un vaste espace architectural -en l'occurrence, un hall d'hôtel- ils ont imaginé un tapis roulant, capteur du déplacement longitudinal, muni d'un guidon enregistrant les inflexions directionnelles. Cette solution -la "patinette immobile"- permet de visiter, dans un laboratoire de taille modeste, des espaces de très grande dimension (hall d'exposition d'aéroport, etc.). Ils auraient pu se contenter d'un levier manuel de commande, mais auraient alors perdu la dimension corporelle déambulatoire, indispensable à la restitution des sensations éprouvées lors d'une visite d'un bâtiment.

Bien que ne relevant pas directement de la Réalité Virtuelle, signalons que des logiciels de simulation permettant l'exploration sensible de la résistance d'objets tridimensionnels grâce à la souris sont déjà expérimentés. Équipés de systèmes à retour d'effort, la souris restitue les sensations de résistances lors de l'auscultation d'objets modélisés apparaissant à l'écran.

C'est bien notre corps, considéré comme sujet de la perception, qui revient au centre de ces recherches. La mise en correspondance généralisée avec les environnements simulés par la Réalité Virtuelle souligne l'importance des équipements de connexion, hybridant nos sens aux expériences virtuelles. L'extrême malléabilité des productions simulées (sons, images, mouvement, perception tactile, efforts physiques, etc.) exige des interfaces matérielles, on ne peut plus visibles et palpables.

On doit ici faire mention d'une tendance des recherches actuelles visant à diminuer la lourdeur de ces interfaces : caméras analysant la position tridimensionnelle des mains, dispositifs déterminant la direction du regard, etc. Ce qui retient l'attention, c'est la prise d'information directe sur le flux perceptif : capteurs bio-électriques destinés à enregistrer la contraction des muscles et à en déduire les trajectoires gestuelles, caméras alimentant des réseaux neuronaux pour reconnaître la disposition des mains devant un écran, enregistrement des mouvements oculaires, lasers inscrivant directement l'image sur la pupille. Même s'ils s'allègent, ces appareillages ne pourront s'effacer totalement, car ils organisent la commutation de nos actions perceptives avec les mondes virtuels. Plus on souhaitera affirmer le réalisme des interactions avec ces mondes (et ceci est une logique majeure), plus cette commutation occupera le centre de la scène virtuelle. D'où la vitalité des recherches en matière d'interfaces, recherches qui, dans le même mouvement, inventent des modalités inédites de fréquentation d'univers virtuels.

Il n'est pas étonnant que les investigations artistiques de l'univers de la Réalité Virtuelle, privilégient l'invention, l'adaptation ou le détournement de telles interfaces. L'intelligence sensible de nombre d'artistes s'investit ainsi dans la création de situations propices à induire une suspension du temps ou un trouble dans la situation spatiale. Ces interventions ont souvent en commun d'échanger ou de combiner, grâce aux interfaces conçues, les activités perceptives. Citons, à titre d'exemple, l'installation Handsight d'Agnes Hegedüs [38]. Le visiteur introduit, avec sa main, un globe oculaire dans un globe en Plexiglas vide et transparent. Le globe est, en fait, un capteur qui explore un univers virtuel, décalé d'une bouteille "de patience" de la tradition hongroise (exposée à coté). Les déplacements manuels provoquent le calcul d'images affichées sur un grand écran.

Tenir son oeil au bout de sa main, tel est le collage perceptif que nous propose l'artiste, indiquant ainsi qu'un vaste mouvement d'échange et de combinaison des perceptions est aujourd'hui en cours, sous l'impulsion de leur traduction numérique. Des applications à caractère fonctionnel, dans la communication dite "multi-modale", exploitent les mêmes directions : saisir avec l'oeil (tir des pilotes de chasse) ou commander à la voix.

Avec La plume et le pissenlit d'Edmond Couchot et Michel Bret [39,] le souffle, métaphore de la vie corporelle s'il en est, devient l'interface d'effeuillage de l'image numérique. On aura compris qu'il s'agit de souffler sur un capteur pour détacher les fleurs du pissenlit ou faire s'envoler la plume, qui retombe conformément aux lois de la résistance de l'air. Le souffle, comme le dit Edmond Couchot, "implique le corps de manière discrète mais très profonde".

Le geste et le sens [40]

Claude Cadoz, dans une très intéressante étude sur la place des sensations physiques dans la communication avec l'ordinateur, rappelle les trois fonctions principales du canal gestuel [41]. Outre une mission sémiotique évidente (le geste accompagnant la parole afin de situer la nature du propos), le canal gestuel possède aussi des fonctions épistémiques et "ergotiques". La fonction épistémique prend en charge la "perception tactilo-proprio-kinesthésique". Elle permet d'apprécier des qualités telles que la température, la forme, la texture, les mouvements d'un corps. La dimension "ergotique" (de "ergon", travail en grec) tient à ce que le rapport à notre environnement n'est pas exclusivement informationnel, il est aussi énergétique. Si l'on serre un gobelet en plastique, on le déforme. La spécificité du canal tactile est de modifier l'état de la source qui le stimule.

On semble ici aux antipodes d'une réflexion sur le statut des images si tant est que ce qui caractérise notre relation aux images optiques (aussi bien qu'à celles qui sont faites à la main), c'est précisément l'intégrité dont elles bénéficient lors de tout acte contemplatif. La Réalité Virtuelle assure, de manière emblématique, la jonction entre l'univers informationnel et l'univers énergétique/mécanique, relativisant ainsi la coupure que la cybernétique des années cinquante avait établie entre énergie et information. Les notions d'interaction, de retour d'effort du virtuel vers le réel [42] illustrent notamment ce mouvement. "Il existe des situations communicationnelles où la dépense d'énergie est nécessaire" [43] comme la communication musicale, rappelle Claude Cadoz. De même, dans certaines activités, comme la danse, la fonction ergotique du geste ne peut être séparée de sa fonction sémiotique.

Il est vrai que le toucher, comme le geste, souffre de connotations négatives qui mêlent les interdits sexuels à cette dimension, peut être encore plus fondamentale, d'altération de l'objet. Le primat du contemplatif, de la présence à distance non interventionniste, au détriment du contact physique va de pair avec un certain puritanisme qui n'est plus de mise. L'iconophilie contemporaine se soutiendrait donc, aussi, de ce que la vue est une présence à distance qui respecte, par définition, son objet. L'image actée, -si l'on appelle ainsi une image chaînée avec des actes- constitue un compromis ingénieux entre l'accès direct à l'objet (en fait, à son modèle) et la sauvegarde d'une réalité tenue en retrait. Nouvel âge des représentations, elle renoue avec l'interventionnisme de l'image, stade magique des temps anciens (non totalement révolus), où l'image est une médiation active dans l'accomplissement d'un acte : vengeance, satisfaction d'un désir, aide pour surmonter une épreuve, etc.

E - Graduations de présence

Mobilisant nécessairement des interfaces, aussi simplifiées soient-elles, les transpositions virtuelles échouent à rendre compte pleinement de la simplicité des interactions ordinaires, notamment lorsqu'elles revêtent un caractère collectif. Elles découvrent, en revanche, de nouveaux modes de relation combinant :

- la transmission plus ou moins dégradée des vecteurs de communication (comme la représentation des intervenants par un "avatar" schématique),

- et des procédures abstraites (comme le simple adressage automatique par liste de diffusion sur Internet, jusqu'à l'affichage de la cartographie des échanges entre plusieurs participants).

L'impossibilité d'imiter les relations ordinaires des humains entre eux et avec leur environnement matériel s'allie avec ces procédures abstraites pour donner forme à de nouveaux milieux où la présence ne se conjugue plus au singulier mais selon des graduations. Celles-ci étagent des niveaux de présence selon deux lignes non exclusives :

- une direction extensive (d'une présence, encore assez dégradée, dans les réseaux actuels -téléphone, Télétel, Internet- aux figures plus expressives promises par la Réalité Virtuelle en réseau [44]),

- une direction intensive, avec l'invention d'indicateurs abstraits de présence.

Que sont ces indicateurs ? Il est bien connu que toute communication à distance nécessite des marqueurs spécifiques qui suppléent aux incertitudes nées de l'absence de contacts directs. L'écriture mobilise ses codes graphiques et sémantiques pour diminuer la flottaison du sens (mise en page, respect plus strict de la grammaire, etc.). La communication téléphonique majore les caractères formels de l'échange et use abondamment de la redondance. On le sait, les réseaux actuels (Télétel, Internet) sont encore faiblement incarnés. Mais la tendance à l'augmentation s'affirme nettement [45]. La Téléprésence, quant à elle, met à profit l'ingénierie numérique pour intensifier la présence (capteurs corporels, retour d'effort) en inventant de nouveaux marqueurs. Or, le phénomène le plus radical est encore d'un autre ordre : c'est la combinaison des deux lignes extensives et intensives, aboutissant à la création d'hybrides, mélanges de présences physiques et de traitements abstraits. L'exemple du projet DIVE aidera à les situer.

DIVE ou l'invention de marqueurs relationnels abstraits

Le projet DIVE (Distributed Interactive Virtual Environment), développé au S.I.C.S. en Suède, est un système multi-utilisateur de télévirtualité qui expérimente des mécanismes d'interaction pour des tâches effectuées, en coopération, par des acteurs éloignés. Il vise aussi bien à reconstituer un cadre de travail de bureau (muni des outils bureautiques) qu'un laboratoire de recherche, par exemple. Ainsi que le déclare, Lennart E. Fahlen, l'un des responsable du projet : "Nous proposons un modèle d'interaction qui utilise la proximité dans l'espace, la position et l'orientation comme des mécanismes de traitement de l'information. Nous pensons qu'un système qui correspond aux métaphores naturelles du monde réel sera facile et naturel à utiliser" [46]. Les concepteurs parlent à la fois "d'ensemble de mécanismes fortuits" et de "conventions sociales classiques qui relèvent du <<monde réel>>". L'objectif est de reconstituer un espace de travail commun pour des acteurs humains éloignés, équipés de systèmes de Réalité Virtuelle. DIVE gère leur signalisation respective dans l'espace sous la forme d<<'avatars>> (dans la version actuelle, ils apparaissent avec des corps schématisés surmontés d'une vignette photographique affichant leur visage).

Mais DIVE organise aussi les interactions entre des acteurs humains et des objets (livres, documents, sources audiovisuelles). Ces derniers sont dotés de propriétés qualifiant leurs modalités d'interactions avec les usagers, et entre eux. Des concepts-clés ont été forgés. Par exemple, l'aura est un sous-espace lié à l'objet qui augmente le potentiel d'interaction entre objets. Le focus est le centre d'attention qui agit comme sélecteur d'informations. Le nimbus est "le lieu où un objet met à la disposition des autres objets un aspect de lui-même. Cela peut être une projection de qualité ou de propriété comme la présence, l'identité ou l'activité. Par comparaison avec le monde réel, nimbus rayonne du <<je ne sais quoi>> qui émane de la star de cinéma -ce qui fait que chacun s'arrête et que tous portent attention sur elle" [47]. Des programmes particuliers peuvent transformer les sous-espaces pour amplifier, atténuer ou étendre certains champs.

Ces opérations rapportées au monde réel consisteraient, par exemple, à utiliser un microphone pour amplifier la voix, monter sur une estrade pour se rendre plus facilement visible. Notre ambition n'est pas de décrire, dans le détail, le fonctionnement -complexe- de cet espace coopératif de travail. Elle vise plutôt à montrer en quoi ce travail est exemplaire.

Les concepts, assez abstraits, qui gouvernent DIVE restituent nos habitudes de fréquentation d'univers socio-topologiques. Ils explicitent des mouvements abstraits, ou plus exactement mentaux, qui gouvernent nos rapports à un environnement matériel et humain. Ainsi en est-il de la notion de "centre d'intérêt", ou d'horizon de recherche. Lorsque nous recherchons un dossier dans un bureau, c'est l'image de ce dossier que nous projetons, tel un faisceau lumineux, sur l'environnement. À ce moment, les autres objets (chaise, livres, ordinateur...) se fondent dans un décor vague. Les autres dossiers dispersés, de couleur différentes, jouiront en revanche d'un coefficient de présence plus soutenu. C'est ce genre de rapports que les concepteurs de DIVE tentent de matérialiser dans l'espace commun, et c'est cela qui est novateur. Car il ne s'agit plus de restitution mais d'invention de marqueurs abstraits d'interaction (signes graphiques, protubérances visuelles, accrochées aux "avatars"), pouvant être affiché par programmes informatiques. Par exemple, s'adresser à quelqu'un nécessite d'intercepter son champ visuel -augmenter le potentiel d'interaction avec cette personne, dira-t-on dans le vocabulaire de DIVE. Plus les champs visuels sont interpénétrés, plus l'affinité est importante.

Les relations d'usages, d'intérêts, de même que la fréquence des rapports sont concrétisées, alors que d'ordinaire ces mouvements sont intégrés automatiquement dans notre perception spontanée de la situation. Les acteurs -humains et non-humains- de ce monde virtuel possèdent un différentiel de présence qui traduit la nature et l'intensité des relations qui les unissent (ou les séparent). On voit s'ébaucher une démarche visant à objectiver, à imager métaphoriquement des mouvements subjectifs latents. Une sorte de couche relationnelle est projetée sur la scène matérialisant graphiquement les interactions à l'oeuvre. Cette couche abstraite traduit -partiellement, bien sûr- des investissements psychologiques habituels. Mais elle les exprime à travers des jeux scénographiques agençant les propriétés modélisées des différents acteurs (objets et humains), et ce, grâce à des traitements par programmes.

On peut tirer quelques enseignements à caractère plus général de ce projet. Les concepteurs auraient pu se contenter de dupliquer les conditions du travail coopératif. Ils ont finalement inventé un nouveau milieu d'interaction sociale dont il serait absurde d'imaginer qu'il traduise la souplesse des interactions ordinaires d'une communauté en co-présence mais qui, en revanche, crée des outils formels pour une cartographie dynamique relationnelle. Telles sont bien les limites et la portée de la Réalité Virtuelle, car ici encore faute de reproduire on invente. En effet, on ne peut traduire à l'identique nos activités perceptives (vision, préhension, etc.). Encore moins peut-on espérer restituer ce qui est le plus mobile et fugitif, nos états mentaux. Plutôt que de s'y essayer, les créateurs de DIVE ont défini des instruments, nécessairement rigides et peu malléables, mais qui offrent l'énorme avantage de se prêter au calcul par programme et de se surajouter ainsi à la perception spontanée, qui, il ne faut pas l'oublier, continue à interpréter et à ajuster les interactions à l'oeuvre.

On peut prédire un bel avenir à cette direction de recherche. Restituer les dimensions affectives dans la communication à distance est un objectif partagé par de nombreuses recherches, des désormais célèbres "émotikons" sur Internet au modelage expressif des "avatars" des communautés virtuelles (comme dans l'expérience HABITAT au Japon). Comment traduire un désir d'en savoir plus, une envie, une aversion, une habitude d'usage ? Un passionnant champ de recherche s'ouvre aux "psychomécaniciens" des environnements communautaires afin de traduire la diversité de nos mouvements relationnels. Peut-être leur faudra-t-il spécifier les formes matérielles de ces mouvements selon le degré d'opérationalité souhaité (travail, formation ou relation libre) bien qu'un strict partage entre ces postures soit difficile à imaginer. Il se confirme, en tous cas, que pour faire coopérer des communautés à distance de manière régulière et fructueuse, on ne saurait se limiter à convoyer des informations. Cela exige de prendre en compte les dimensions psychosociales des relations de travail [48], pour ensuite cartographier les interactions à l'oeuvre, en imaginant une ingénierie infographique socio-topologique. On est donc conduit à densifier les fonctions de présence et à ne pas se contenter de les transporter.

Les spect-agents

L'ingénierie de simulation, dans sa quête de densification des relations à distance fait naître une génération d'avatars, doubles, spectres, substituts, représentants numériques, dont la caractéristique essentielle consiste à être animée, à la source, par un agent humain. Nous regroupons ces créatures sous le vocable de spect-agent. Le vocable spect-agent exprime l'alliance de la fluidité du spectre et du caractère actif du représentant lié à son origine humaine mais aussi aux automatismes qui l'animent (on a vu comment des "représentants" peuvent exprimer des fonctions abstraites de présence). Ce néologisme désigne ce qui n'est ni un double, ni une copie dégradée, mais une graduation d'existence. C'est donc une dénomination plus respectueuse de la spécificité de ces représentants que le terme "avatar" (signifiant "copie dégradée") fréquemment employé. Les spect-agents procèdent d'une co-construction, synthétique (mue par les programmes informatiques) et humaine (alimentée par l'activité immédiate d'un sujet), où il s'agit de doubler la vie réelle, et, pour ce faire d'inventer une générativité, due, pour une part, à la résistance qu'oppose le réel à sa duplication mimétique.

Ainsi, dans des projets tels que DIVE, HABITAT au Japon [49] ou "Deuxième monde" en France [50], (intervention par "avatars" interposés), et plus généralement dans les récents travaux utilisant le langage V.R.M.L. [51] sur Internet, on retrouve très nettement les trois mouvements constitutifs de la dynamique inventive : la tentative d'imitation, l'impossibilité intrinsèque d'un tel projet de duplication à l'identique et en dernier lieu, l'ouverture d'un espace de possibles dynamisé par la confrontation avec ces obstacles rédhibitoires. Ces applications et recherches combinent, actuellement, la restitution formelle et empirique (imitation de l'apparence tridimensionnelle et simulation comportementale d'objet) avec la construction inédite d'un milieu cognitif et relationnel objectivé (inscription graphique des relations, des émotions, invention de marqueur des qualités des rapports entre les acteurs et avec les objets).

La ductilité du milieu virtuel permet ces agencements qui allient plusieurs composants. On pourrait parler de greffes mêlant des génotypes différents. Les premiers types de composants sont des formes (agents humains, scènes, objets, dispositifs) analogues à notre niveau de réalité, ainsi que des comportements à vocation imitatifs ou prédictifs (la simulation réaliste, la C.A.O., la modélisation scientifique). Les deuxièmes sont constitués par des interactions ouvrant à ce qu'on pourrait appeler une perception synthétique. Celle-ci associe librement les vecteurs perceptifs et effectifs de l'action humaine (déplacement par le regard, vision qui se poursuit en action comme dans le tir par viseur tête haute où repérer la cible sur la visière virtuelle permet de déclencher le tir par la voix). Enfin, les troisièmes types de composants pour la synthèse en milieu virtuel sont les dimensions affectives, cognitives, relationnelles entre spect-agents d'une part, objets et dispositifs simulés de l'autre, matérialisant ainsi certains états mentaux (intention, disposition affective comme les Kansei d'HABITAT [52]). Signalons que dans le domaine des jeux vidéos, les game designers ne jurent plus que par l'autonomie comportementale des acteurs virtuels injectés dans la scène. Le joueur les rencontrera et il devra comprendre, pragmatiquement, leurs caractères (recherche d'affection, par exemple) et leurs spécificités comportementales (serviabilité,agressivité, etc.) ; ceci pour s'en faire des alliés, par exemple. L'intelligence des dimensions socio-affectives deviendra alors un enjeu essentiel pour participer au jeu... et gagner.

De même, dans une perspective d'apprentissage, les premières réalisations de séquences de formation mobilisant des "enseignants virtuels" dits "intelligents", promettent de renouveler les relations entre apprenants et systèmes informatiques. Créatures anthropomorphes, ces agents incarnent -au sens propre du terme- des formateurs présents dans la scène et médiatisent les démarches cognitives. Capables de répondre aux questions de l'élève, possédant une "intelligence" du domaine (dépannage d'un dispositif, diagnostic et intervention médicale, apprentissage d'une langue, par exemple), "l'enseignant virtuel" devient un véritable tuteur personnalisé, toujours disponible. L'un des objectifs consiste même à inverser le processus afin de faire apprendre à l'agent de nouvelles tâches en observant les gestes d'un instructeur humain. De même, s'agira-t-il de permettre à "l'enseignant virtuel", de percevoir et de réagir aux comportements non-verbaux de l'élève (expressions du visage, attitudes, gestes, etc.). Conçus en Réalité Virtuelle, sur plate-forme locale, ces agents commencent à être déclinés, de manière simplifiée, pour être accessibles à distance, via Internet [53].

D'une manière générale, les communautés virtuelles ainsi réunies sont, comme toutes les associations humaines, des assemblées d'agents humains et non humains (objets, environnements, etc.). La communication médiatisée par des spect-agents transcrits -de manière souvent encore assez frustes- des actions humaines (comme le ferait la visioconférence, par exemple) mais ajoute la plasticité de la sphère non-humaine (modifications de l'environnement, expérience à distance sur les mêmes objets, etc.). Un ingrédient original -des oxymores spect-agents, qui naissent dans, et par, le milieu virtuel- vient donc s'ajouter à la scénographie, déjà complexe, de la communication à distance.

F - Simulation, restitution et illusion

Produire, avec les moyens actuels de l'ingénierie numérique, une représentation formelle du monde pose tout simplement la question de son caractère prétendument illusoire. Aucun esprit occidental ne confond le portrait photographique d'une personne avec cette personne elle-même, ni n'envisage d'adresser la parole à un acteur sur l'écran dans une salle de cinéma. (La suppression de cette impossibilité est précisément la trame du chef-d'oeuvre de Woody Allen, La rose pourpre du Caire). Il faut à la fois établir la différence radicale de l'imagerie informatique interactive avec les techniques d'enregistrement, et penser cette distance comme un écart non moins important avec notre niveau habituel de réalité.

L'émergence du "virtuel" dans la culture visuelle contemporaine mêle deux évolutions simultanées, coordonnées et parfois divergentes. Le mouvement d'imitation exacte de la réalité, initié par le dessin perspectiviste et radicalisé par la photographie, trouve dans la numérisation un outil providentiel. Mais le stade numérique (digitalisation de la réalité visuelle, et aussi, symétriquement, simulation de modèles idéels rendus ainsi visibles) manifeste une rupture avec le stade "indiciel" propre à l'enregistrement. L'image affaiblit son lien privilégié avec le passé, sa fonction de témoignage -témoignage mental, travaillé par l'imaginaire dans le dessin et la peinture, plus instrumental avec l'invention des techniques d'enregistrement- pour devenir une forme de contact avec une néo-réalité numériquement modélisée. Elle constitue alors une interface de manipulation d'objets virtuels, dont elle affiche des vues contrôlables.

L'image de synthèse, une extinction du référent ?

Si on prend pour argent comptant la vocation substitutive du "virtuel", comme nous y invite une vulgate répandue, on est conduit à durcir la ligne qui sépare la simulation numérique de l'enregistrement indiciel. Par exemple, s'interrogeant sur les rapports respectifs qu'entretiennent la photographie et l'image de synthèse avec la mort, Chantal de Gournay se demande : "Car si l'image (photographique, cinématographique) est ce miroir de l'invisible qui nous aide à faire le deuil de nos morts, de nos terreurs, de nos ethnocides ou de nos crimes contre la nature, de quoi peut-on faire le deuil avec une image de synthèse ?" [54] Le présupposé de cette question affirmative consiste à considérer qu'une image de synthèse serait, par essence, totalement réductible aux procédés logico-mathématiques qui la constituent, et par là, à l'abri de toute contagion référentielle. La gestation algorithmique tracerait une barrière définitive avec l'autre régime de l'image, indiciel, qui enregistre la réalité, telle qu'elle est, avant même tout regard, toute mise en forme langagière. L'indicialité, serait la seule modalité où les scories du réel, ce qui échappe à toute formulation, viennent s'inscrire, s'imprimer sur le support, et s'offrir, subrepticement, à notre appréhension. Le mode de production de l'image informatique, réductible à la maîtrise technique, la projetterait hors du cycle vivant et de l'altération qui en résulte.

Il y a lieu de douter de telles vues. D'où viendrait ce statut d'exception de l'image informatique qui, production humaine, pourrait miraculeusement effacer cette origine pour sembler ne provenir que de froides procédures (elles aussi absolument auto-engendrées, inhumaines ?). C'est ignorer le singulier commerce qu'entretiennent les réalisateurs d'image de synthèse avec leur production [55]. Maîtrise ? Peut-être, mais singulièrement malaisée. Comment peut-on imaginer une telle activité où s'abîmerait, par miracle ou par décret, l'imaginaire du réalisateur, ses évaluations intermédiaires, ses hésitations. Croit-on à l'automatisation intégrale d'une telle production ? (Et encore, serait-elle automatisée, qu'il conviendrait de remonter la chaîne des investissements, d'interroger le choix du dispositif, des logiciels, le travail de programmation, etc.). Mais ici nul automatisme à l'oeuvre dans le dessin des formes, le choix des textures, la réalisation éventuelle de maquettes en dur, la sélection des éclairages, des points de vues, etc. Pas plus d'automatisme dans les arrangements temporaires, les graduations de finitions possibles et la décision d'arrêt. Il ne s'agit pas, pour autant, de dissoudre la spécificité des images ainsi obtenues, de négliger les moments de dépossession, de surprise. Il ne faudrait pas non plus sous-estimer l'automaticité partielle de la production (lancer une procédure de calcul d'une ombre, animer une forme par un programme, etc.) et surtout tenir pour négligeable l'usage de procédures programmatiques [56]. Mais pourquoi décider de supprimer les moments d'évaluation humaine et de choix, moments omniprésents dans une telle élaboration ? S'il faut invoquer un deuil impossible, ce serait bien, paradoxalement, celui de la tentative de se passer d'une référence à la réalité. Si tant est que la simulation n'est pas effacement du réel mais seulement tentative. Affirmer sa réussite est un acte de foi aussi arbitraire que commode, car ainsi le grand partage entre réel et virtuel devient possible. Tout comme avec l'image enregistrée, on fait, ici aussi, le deuil de l'invisible source des projets, de l'impossibilité de les terminer, des mille décisions qui président à leurs naissances et qui demeureront opaques.

Qui se tient attentif au processus de création d'une "image de synthèse", ne peut ignorer à quel point elle métabolise "les scories du réel" qui l'assaillent de toutes parts et ceci à toutes les phases de sa constitution. Ces scories, on les pressent dès le projet initial (toujours une idée accrochée au fil d'une histoire individuelle et collective). On les sent dans les méthodes et outils : lancer de rayon et autres artifices constructifs, morphogénétiques. Ces méthodes matérialisent des théories expérimentales sur le fonctionnement de la réalité qu'il s'agisse de croissance de plantes ou de vagues croulant sur une plage. On insiste, parfois à juste titre, sur le versant abstrait de l'opération modélisatrice. Il est vrai que l'étude de phénomènes non visibles en tant que tels -comme le comportement d'équations mathématiques- trouve, dans la mise en image des modèles, un vecteur d'étude irremplaçable. Mais bien souvent, aussi, la simulation informatique, loin de se borner à étudier le comportement futur d'un système, devient une manière d'éclairer, d'ausculter la réalité, et non pas de construire une néo-réalité à vocation substitutive [57]. Enfin, on ressent les "scories" dans le résultat final, livré à l'appréciation de sensibilités humaines. Ajoutons enfin, qu'une image de synthèse peut sombrer dans l'oubli ou le mystère d'une intangibilité pour peu qu'on ait laissé s'éteindre les lignées technologiques (ordinateurs, systèmes d'exploitation, interfaces) qui permettent de l'afficher, ce qui arrive plus souvent qu'on ne le croit.

L'imagerie numérique joue avec la notion de limite, multipliant les actualisations, décuplant les cheminements. Comme dans une fête foraine, on ne sait où donner de la tête, mais dont quelques heures plus tard et après moult déambulations, on s'est mentalement fabriqué un plan. Assouplissant les repères, ces scénographies intensifient la question. Toujours déçu, mais toujours en quête de recul des bornes, nous ne finissons pas d'éprouver les paradoxes croisés du désir de liberté, des sentiments d'inquiétude devant ces conquêtes et aussi des déceptions face aux contraintes ressenties. Croire en l'immanence des montages numériques, c'est les magnifier, leur attribuer un surcroît de puissance, celui d'abolir les limites. Oserait-on suggérer qu'ainsi s'investit l'espoir qu'ils détiendraient un tel pouvoir ? Le pouvoir faustien de nous placer hors d'atteinte de la ruine, de la mort si, comme l'affirme Chantal de Gournay, " [...] le monde virtuel de l'ordinateur, régi par la logique de la simulation et du simulacre, est un monde placé hors d'atteinte de la mort [...]" [58]. Résultat considérable, si toutefois c'était le cas. Mais là encore, heureusement, nous serons déçus.

Du souci d'imitation à l'invention d'un nouveau milieu perceptif

Malgré les apparences, ce n'est pas l'illusion du réel que visent les techniques de Téléprésence -elles en sont bien incapables- et surtout, on manquerait leur spécificité en leur assignant cet objectif. À première vue, on viserait une restitution, au plus près possible de la réalité. Mais, sa réalisation, on l'a vu, se heurte à des obstacles permanents et surtout découvre des horizons inattendus, engageant la construction d'ordres spécifiques de réalités plutôt que la substitution du niveau empirique.

La notion de dimension offre une entrée intéressante dans la thématique de l'imitation. Cette fameuse troisième dimension, présentant la profondeur sur la surface est au fondement de l'illusion. Mais pourquoi parle-t-on d'<<illusion perspectiviste>> ? Est-ce parce que la troisième dimension est figurée sur le tableau ou bien, plutôt, parce que le tableau se rapproche de l'image visuelle ? "L'illusion" se situerait plus en référence à l'acte de vision qu'à son objet, la réalité. Comme le signale Louis Marin [59], l'enjeu de la perspective n'est pas de donner l'illusion de la présence, en trois dimensions, des personnages couchés sur la toile, mais de former son regard dans la vision d'autrui, en référence à une organisation "transcendantale" de la vision qui permet la formation d'une communauté d'observateurs. Tout en semblant viser une "construction légitime" de l'image respectant le fonctionnement de la vision, la perspective invente un autre monde visuel, et par là une expérimentation potentielle de l'espace. Elle devient alors machine à fabriquer d'autres machines intellectuelles et matérielles (de la géométrie descriptive au dessin industriel).

La Réalité Virtuelle poursuit ce programme en le radicalisant puisqu'elle fonctionne selon les principes dynamiques de la vision. Même pour ce qui est des fonctions purement "mécaniques" -car la vision humaine est avant tout un acte mental -c'est, évidemment, grâce au corps qu'une saisie oculaire est possible. Notre vision s'effectue par le déplacement corporel dans l'épaisseur d'une durée et elle s'hybride aux autres acquisitions perceptives effectuées simultanément (audition, olfaction, toucher, etc.). On oublie trop souvent que tout l'intérêt de la Réalité Virtuelle réside dans un transfert de support : de la réalité vers le visio-casque, pour le dire sommairement. Et, dans ce transfert, les interfaces sont le véritable lieu de la transubstantialisation. Nourrit par le projet d'imitation, un nouveau milieu perceptif s'invente qui outrepasse cet objectif initial pour inaugurer d'autres configurations liant vision, action, perception et connaissance.

L'hypothèse domiciliaire

Affirmer la croissance de la Téléprésence n'implique nullement d'augurer une vie sociale totalement organisée par des télé-relations, substituant progressivement le contact à distance à la co-présence hic et nunc. Nous rejoignons Bernard Miège lorsqu'il écrit : " [...] ce qui frappe dans les approches contemporaines, c'est la conviction fortement partagée que nous serions entrés dans une ère nouvelle (ou en tous cas que le processus serait bien engagé), caractérisé désormais par la prégnance des techniques de l'information et de la communication et corrélativement par la réduction des occasions de communiquer en face à face... Il nous apparaît que cette perspective est, stricto sensu, indémontrable,  [...]" [60]. Bernard Miège a parfaitement raison de signaler qu'il ne peut s'agir d'une perspective quantitative où des relations in situ seraient systématiquement substituées par des contacts à distance. S'il fallait tenir une comptabilité, elle serait extraordinairement complexe et des études récentes ont montré qu'évidemment, les groupes sociaux qui font le plus fréquemment usage de techniques de communication sont aussi ceux qui ont des relations sociales les plus denses. Il est significatif qu'un quartier central de Paris comme le Sentier, carrefour des entreprises de la confection depuis longtemps, devienne la plaque tournante des entreprises du Web. Proche de la Bourse et des grandes agences de presse (dont l'A.F.P.), le Sentier est le quartier de Paris où s'échange le plus d'information. Nul étonnement à voir les moteurs de recherche Yahoo, Lokace, Lycos ou Nomade s'y installer aux côtés d'une myriade de petites entreprises du multimédia. Trier et fabriquer de l'information dans le cyberespace déterritorialisé exige de fréquenter les mêmes cafés et restaurants, c'est-à-dire d'être physiquement aux côtés les uns des autres. Dans la même perspective, Marc Guillaume signale, par exemple, que l'activité de salles de marché, structurée par le recours permanent aux réseaux spécialisés, est néanmoins localisée dans les quartiers d'affaires. Les agents ne peuvent se passer des rumeurs, échanges et confrontations ; aliments indispensables pour prendre le pouls d'une situation [61]. Plus généralement, le constat du développement de la Téléprésence et l'intensité croissante des relations à distance, engage à s'interroger sur les incidences de cette situation en regard des relations de visu, c'est-à-dire sur la combinaison des deux modalités de rapport et non pas leur prétendue équivalence.

"Double réalité" de l'image et métaprésence

Platon définissait l'art comme mimesis, imitation qui a conscience d'elle-même. On peut étendre cette conception au principe de la représentation, qui, espace clivé, présente toujours simultanément le contenu et le procédé, l'illusion et ses moyens. Perspective, photographie, cinéma et aujourd'hui image numérique relient, à chaque fois singulièrement, sujet humain et dispositif scénographique. Toute présence s'appuie sur un horizon de métaprésence combinant présence et oubli du lieu de la présence, savoir et sensation mêlés de la mise en scène spectaculaire, accommodation au dispositif artificiel [62]. Dans toutes les formes de présence à distance, ce savoir/sensation est actif. Une sorte d'arrière-fond de l'expérience du dispositif transactionnel (lecture, téléphone, groupe de discussion sur Internet, Réalité Virtuelle), non directement perceptible, à la fois constamment rappelé et oublié. Expérience du dispositif qui, par exemple, permet le transport dans le récit selon des modes différents selon qu'il s'agit d'un livre, d'un film ou d'un multimédia.

Avec le déplacement de la présence par réseau numérique, il ne s'agit donc pas d'une immédiation. Dans le réseau, le média tente de se faire oublier par toutes sortes de perfectionnement (adjonction du son, de l'image animée, puis de l'immersion et de la synthèse des perceptions kinesthésiques). Mais, plus la médiation mime la transparence, plus la prégnance de sa fonction est massivement ressentie et plus ses logiciels et ses matériels deviennent complexes et substantiels. C'est pourquoi la présence à distance n'est pas une réalisation de la présence. Se tenir en contact passe toujours par une médiation. Et si on recherche la transparence, on interposera toujours plus d'interfaces sophistiquées pour concrétiser cette transparence. Chaque pas qui fait avancer ce projet éloigne alors d'autant la cible.

La Téléprésence, une donnée anthropologique

On peut établir une analogie de principe entre le mouvement de naturalisation des représentations et la notion de "tendance technique" qu'élabore André Leroy-Gourhan [63], comme mouvement universel traversant les cultures et les ethnies et que chacune d'elles interprète et développe à leur manière. Mais au delà de ces variations, la tendance déploie ses principes et "pousse le silex tenu à la main à acquérir un manche" [64]. On pourrait affirmer que, de la même manière, la tendance à l'incarnation croissante pousse la photographie à se doter du mouvement et celle-ci à s'émanciper de l'enregistrement en devenant, avec la simulation, une libre exploration de l'espace puis un univers d'expérience physique.

Rappelons que l'une des idées maîtresses qui orientent le travail du célèbre préhistorien, mais aussi anthropologue, établit que le processus d'hominisation se caractérise par la domestication du temps et de l'espace grâce à la symbolisation, elle-même chevillée à l'émergence de l'outil et du langage. Si l'on entend par symbolisation la capacité de faire valoir une chose pour une autre, on comprend en quoi le langage (mettre des sons à la place des choses), l'outillage (mettre des instruments à la place du corps) ou encore la figuration graphique (dessiner des formes à la place des animaux) sont des processus solidaires et qui expriment une proto-Téléprésence. Le rôle du piège du chasseur est à cet égard paradigmatique. On peut certes considérer le piège comme un pur système opératoire, mais on laisse alors de côté l'essentiel. Installer un piège engage le chasseur dans une pratique de substitution. Le piège fonctionne à sa place, le libère du contrôle de l'espace, de l'assignation territoriale ainsi que de l'affectation temporelle. C'est le premier dispositif automatique de l'humanité, qui plus est, cybernétique, puisque c'est l'énergie potentielle ou cinétique de l'animal qui permet son auto-capture. Le piège suppose et secrète une symbolisation portant sur le sujet humain lui-même (remplacer le chasseur).

Là, avec l'inscription dans un dispositif artificiel d'un projet formé à l'avance, pré-vu, s'originent, par exemple, les principes de la programmation, au sens littéral (pro-gramme signifie "inscrit à l'avance") [65]. Le système artificiel de capture est un puissant instrument de Téléprésence, qui à la fois engage -dans une perspective téléologique, on dirait "qui secrète automatiquement"- les pratiques de contrôle du temps et de l'espace et les intériorise comme horizon de la conscience humaine. Affirmer que l'hominisation est co-extensive à la Téléprésence n'est en rien céder à un effet de mode, tout au plus ajuster le vocabulaire à ce que les temps actuels développent de manière extrême.

Promesses de la Téléprésence

Lorsqu'on porte un regard rétrospectif sur l'histoire des technologies de Téléprésence, on peut y découvrir un principe d'analyse liant les étapes successives : chaque invention majeure tient la promesse de la précédente et annonce une promesse qu'elle ne peut tenir. L'écriture étend la mémoire sociale que la phonation langagière tenait emprisonnée dans les capacités mnésiques individuelles (avant qu'on la note, conserver la parole exigeait de la mémoriser, souvent en la liant à des séquences de gestes). Par la multiplication à l'identique d'un original, l'imprimerie tient la promesse d'une inscription permanente que l'écriture manuscrite, faiblement distribuée, n'avait qu'esquissée. La photographie concrétise l'exactitude de la prise de vue exprimée par la peinture réaliste et concrétise l'instant comme élément du mouvement. Par l'animation, le cinéma amplifie la saisie vivante du monde que la photographie maintenait figée, tout en annonçant (grands écrans, spatialisation du son, etc.) l'immersion dans l'image. L'image tridimensionnelle interactive réalise la promesse de la perspective et des techniques d'enregistrement, d'un libre parcours à l'intérieur de l'image. La simulation numérique matérialise la sortie hors de la représentation audiovisuelle vers l'expérimentation empirique de l'environnement. Le réseau multimédia ne peut tenir la promesse de l'expérience corporelle partagée, ce que la Réalité Virtuelle en réseau laisse entrevoir.

Pour rendre cette lecture rétrospective plus affinée, il conviendrait d'y ajouter quelques boucles historiques : par exemple, bien avant les écrans panoramiques du cinéma, la perspective circulaire antique pratiquait déjà l'immersion dans l'image. Ce travelling historique ne présente aucun caractère téléologique. Tout au plus permet-il de questionner les développements actuels. Quelle promesse la Téléprésence actuelle ne peut-elle tenir ? Elle demeure, par exemple, prisonnière de la modélisation préalable des univers d'interaction, si bien que toute surprise est déjà inscrite dans les formes de transpositions choisies qui déterminent les genres d'imprévisibilités possibles. Il faudra suivre, ici, les développements futurs de la modélisation automatique d'objets, de scènes déjà engagée dans certains domaines (comme la capture tridimensionnelle automatique d'objets architecturaux, de sites préhistorique ou...de formes corporelles [66]). Passera-t-on au stade de l'enregistrement automatique de modèle comportementaux de systèmes en évitant leur formalisation physico-mathématique ? La Téléprésence maintient une distance entre description informationnelle et existence concrète des objets qu'elle manipule et transporte. Ces limites sont-elles inamovibles ? On retrouve ici, les espoirs d'un Norbert Wiener prophétisant l'analyse et la reconstruction moléculaire, à distance, des corps. Mais peut-être la formulation de la question sur les promesses de la Téléprésence véhicule-t-elle une métaphysique du redoublement à l'identique, que je dénonce, par ailleurs, comme une aporie ?


[1] Dans son remarquable travail sur l'imprimerie, (La révolution de l'imprimé dans l'Europe des premiers temps modernes, La Découverte, Paris, 1991), Elisabeth L. Eisenstein analyse les effets de mise à distance provoqués par le livre imprimé. Elle cite par exemple Isaac Joubert, professeur de médecine à Montpellier au XVI [e] siècle, qui parlant des livres les qualifient "d'instructeurs silencieux qui, de notre temps, portent plus loin que les cours publics" (op. cit., p. 118) ou encore Malesherbes, dans son discours de réception à l'Académie : "Les Gens de Lettres sont au milieu du public dispersé ce qu'étaient les orateurs de Rome et d'Athènes au milieu du peuple assemblé "(op. cit., p. 120). Elle signale aussi, que, a contrario, les évangélistes et autres discoureurs publics virent leur public s'élargir du fait de la disponibilité d'annonces imprimées.

[2] Cette amorce d'archéologie de la Réalité Virtuelle provient d'une partie d'un article déjà publié : L'augmentation tendancielle du taux de présence à distance, in Terminal ndeg. 69, automne 95, L'Harmattan, Paris, pp. 69/83.

[3] Jean Brun, Le rêve et la machine, La Table ronde, Paris, 1992.

[4] Il n'entre pas dans nos objectifs de réfuter, ici, les thèses de Jean Brun sur la signification du fait technique. Disons, pour faire court, que nous nous situons dans une perspective assez différente de celle de cet auteur. Nous analysons plutôt la tentative de débordement, par la technique, des cadres spatio-temporels hérités, comme constitutifs, et non corruption, du monde humain. Il n'en demeure pas moins que le livre de Jean Brun nous intéresse parce qu'il présente et radicalise, de manière richement illustrée, la thèse de la corruption.

[5] On ne peut s'empêcher de penser que Jean Brun discrédite, par avance, toute forme réalisée de Téléprésence, baigné qu'il est par une Téléprésence divine autrement prometteuse.

[6] Op. cit, p. 221.

[7] Op. cit, p. 224.

[8] Guillaume Apollinaire, L'hérésiarque et cie, "L'amphion faux messie ou histoires et aventures du baron d'Ormesan". Cité par Jean Brun, op. cit., p. 226.

[9] Saint-Pol Roux, Cinéma vivant, Rougerie, 1972, p. 96 - cité par Jean Brun, op. cit., p.229.

[10] Op. cit., p. 58.

[11] Op. cit., p. 62.

[12] Op. cit., p. 63.

[13] Op. cit., p. 94.

[14] Certains dispositifs actuels de numérisation automatique de formes tridimensionnelles par auscultation laser concrétisent, timidement encore, cette voie.

[15] Paul Valéry, La conquête de l'ubiquité, In Œuvres II, Bibliothèque de la Pléiade, NRF Gallimard, Paris, 1960, p. 1284. Rappelons que Paul Valéry écrit cet article en 1928, quelques années seulement après les premières expériences de diffusion radiophoniques.

[16] Nulle incitation romantique dans l'évocation de la nouvelle mobilité de la musique. Mais plutôt le sentiment que la disponibilité d'écoute conquise rapproche des conditions vivantes de la création du compositeur. Paul Valéry écrira même que le travail de l'artiste musicien trouve dans l'enregistrement "la condition essentielle du rendement esthétique le plus haut", op. cit., p. 1286.

[17] Paul Valéry, op. cit., p. 1286.

[18] Paul Valéry, op. cit., p. 1285.

[19] Norbert Wiener, Cybernétique et société, coll. 10-18, 1962, p. 212 cité par Jean Brun, Le rêve et la machine, p. 231.

[20] Op. cit., pp. 118,126.

[21] Op. cit., pp. 128.

[22] Le travail effectué par Henri Bergson, notamment dans Matière et mémoire, est ici incontournable. Il montre à quel point, dans l'attention présente, le souvenir et la perception se co-définissent sans qu'il soit possible, à la limite, de les distinguer. Nous y reviendrons au chapitre VI, à propos de l'étude de Gilles Deleuze sur le cinéma, L'image-Temps, où nous verrons comment la notion de cristal actuel/virtuel s'appuie sur la théorie bergsonienne de la temporalité dans ses rapports à l'action, la perception et la mémoire.

[23] L'une des premières recherches pour la Réalité Virtuelle, réalisée par la NASA à la fin des années soixante-dix, fut la télé-robotique spatiale basée sur le couplage des mouvements d'un opérateur au sol et de son exo-squelette virtuel dans l'espace. Dans ce projet, simulation numérique interactive et déplacement informationnel étaient déjà condition l'un de l'autre.

[24] Le courant de recherche pratique et épistémologique autour de la "vie artificielle" porte aujourd'hui cette interrogation à un point critique.

[25] Certaines activités se limitent à une phase de traduction/codification numérique pour rendre possible une télé-relation. Par exemple, un groupe de musiciens dispersés aux quatre coins du monde, peuvent jouer ensemble en se connectant à Internet, réseau à bande passante pourtant faible. Il leur faut utiliser un logiciel d'interconnexion musicale, tel que Distributed Real Groove Network, véhiculant des compositions réalisées sur un clavier aux normes Midi.

[26] Michel Beaudoin-Lafon, Les habits neufs du travail en équipe, Collecticiels et médiaspace au service de la communication formelle et informelle, in L'ordinateur au doigt et à l'oeil, Spécial La Recherche, ndeg. 285, Mars 1996, p. 50.

[27] Ce système a été développé par H. Ishii aux laboratoires de N.T.T., au Japon. Voir l'article de Michel Beaudoin-Lafon déjà cité.

[28] Voir l'interview de Steven Feiner, in SVM MAC, avril 1994, ndeg. 50, p. 130.

[29] Ces travaux ont été réalisés par le département de "visualisation scientifique" du Supercomputer Center au German National Research Center for Computer Science, près de Bonn.

[30] Alex Pentand, "Smart rooms, smart clothes", in Actes d'Imagina, Monaco, 21 au 23/02/1996, p. 176. (Il est maintenant possible de suivre les mouvements de quelqu'un, de l'identifier en reconnaissant son visage et de reconnaître ses actions, en temps réel, en ne mobilisant que de modestes ressources informatiques. En utilisant cette information perceptive, nous avons pu mettre au point des "chambres intelligentes" et des "vêtements intelligents" qui peuvent reconnaître des gens, comprendre leur langage, leur permettre de contrôler des affichages sur écran sans câbles ni claviers, de communiquer par signes, et de les avertir lorsqu'ils sont sur le point de commettre des erreurs.) Sans doute peut-on rapprocher ces recherches de celles, encore plus prospectives menées au Xerox Center de Palo Alto, sur les "sensors", mini-puces communiquantes dotées de capteurs, micro-machines et autres piézo-matériaux, qui pourraient se fondre dans les composants élémentaires d'un pont pour éviter qu'il ne s'effondre lors d'un tremblement de terre ou revêtir les ailes d'un avion d'une sorte de peau capable de stabiliser l'appareil en toute circonstance. Il s'agit, en fait, de diffuser l'informatique au coeur même de la matière pour que les objets s'adaptent d'eux- mêmes aux conditions ambiantes par des ajustements "intelligents" sans dépendre d'un ordinateur central.

[31] L'ordinateur, délégateur zélé, in SVM MAC, avril 1994, ndeg. 50, p. 127.

[32] Franck Barnu, Programmer le virtuel, in La Recherche, mai 1994, p. 506.

[33] Avec le Dataland, le M.I.T. a développé depuis le début des années quatre-vingt, une interface gérant des sources d'informations multiples et complexes.

[34] Ces interfaces ont été présentées à Electronic Entertainment Exhibition, Salon international du jeu vidéo à Atlanta (États-Unis), 17/20 Juin 1997. Signalons aussi la Feedback Racer de Guillemot International, comportant 14 boutons de contrôle et des capteurs qui repèrent la position des mains sur le volant et transmet les chocs côté gauche ou droit de la route ou encore les sensations de cisaillage provoquées par les joints métalliques lorsqu'on franchit un pont.

[35] La société californienne au nom évocateur de Retinal Displays prépare la commercialisation, qui sera assurée par Philips et des industriels japonais, d'un appareil léger et performant pour environ 800 dollars. Elle travaille déjà à la prochaine génération de systèmes immersifs, prévue pour l'an 2000, qui inscrira l'image directement sur la rétine grâce à un dispositif de projection holographique. À voir...

[36 ]Ce dispositif est connectable à un micro-ordinateur ainsi qu'à une console Playstation. Philips propose pour sa part Scuba, casque de Réalité Virtuelle qui s'adapte sur les principales consoles de jeux.

[37] On en trouvera une description détaillée sous la plume de Jean Segura, La panoplie du virtuel, in La recherche, Mai 1994, Ndeg. 265, p. 499/503.

[38] Réalisé au Zentrum für Kunst und Medien de Karlsruhe (Allemagne), Handsight a été présenté à Artifices 3, Saint-Denis, décembre 1994.

[39] Installation présentée à l'Espace Landowski à Boulogne-Billancourt, décembre 1998.

[40] Cette partie provient de notre article "Les images hybrides : virtualité et indicialité, in Image & média, sous la direction de Bernard Darras, MEI ndeg.7, L'Harmattan, Paris, 1998.

[41] Claude Cadoz, "Réintroduire les sensations physiques", in La Recherche, ndeg. spécial, ndeg.285, Mars 1996, p. 80.

[42] Plusieurs laboratoires utilisent de tels systèmes. Citons le programme GROPE, à l'Université de Caroline du Nord : un bras articulé à six degrés de liberté permet de manipuler des objets virtuels sur un écran et de restituer les forces d'interaction entre les objets déplacés, tels que des molécules par exemple. A l'Université de Rutgers dans le New Jersey, le projet "Rutgers Portable Force Feedback Master" permet à un ordinateur de régler la pression dans des petits pistons à air comprimé afin d'exercer une force entre la paume et l'extrémité des quatre doigts. En fin le Laboratoire ACROE à Grenoble a développé plusieurs systèmes à finalité musicale dont le clavier rétroactif modulaire (CRM). Des informations détaillées sont fournies sur ces recherches dans l'article précité.

[43] Claude Cadoz, op. cit., p. 82.

[44] La spatialisation du son est un bon exemple de ce mouvement extensif, c'est-à-dire qui vise à imiter toujours au plus près la communication hic et nunc. Le téléphone, comme la télévision restitue le son de manière directionnelle, à partir de haut-parleurs. La stéréophonie, et d'autres procédés comme le Dolby, le dote d'un certain relief. Mais seule la Réalité Virtuelle parvient à spatialiser réellement le son, c'est-à-dire à calculer, en temps réel, la position relative de l'auditeur et des sources d'émission dans l'espace, pour diffuser, dans chaque oreille, des sons modulés selon ces positions.

[45] La possibilité de créer des espaces interactifs tridimensionnels sur Internet grâce aux applications V.R.M.L. en est un exemple frappant.

[46] Lennart E. Fahlen, Actes d'Imagina 1994, INA, p. 218.

[47] Lennart E. Fahlen, Op cit., p. 219.

[48] Cette prise en compte entre en résonance avec l'importance que de nombreux courants de la sociologie du travail attachent aujourd'hui au facteur subjectif dans les relations de travail. D'où le développement de recherches sur ces dimensions subjectives exigées et valorisées dans la nouvelle configuration productive post-fordiste, marquée par l'accentuation du caractère coopératif du travail, l'importance des ajustements interindividuels et la croissance du travail intellectuel. Citons, à titre d'exemple, Philippe Zarafian, La nouvelle productivité, Paris, L'Harmattan, 1991, le très stimulant livre de Christian Marazzi sur le rôle directement productif du travail linguistique, La place des chaussettes, L'éclat, Paris, 1997 ainsi que le Ndeg.16 de Futur antérieur, Paradigmes du travail, Paris, L'Harmattan, 1993/2.

[49] L'expérience HABITAT au Japon, "communication médiatisée par ordinateur" ainsi que la définisse ses concepteurs, a initié la présence visuelle des intervenants sur un réseau. Ceux-ci composent leur "avatar", sortes de marionnettes graphiques, habillées, personnalisées, sexuées. Pour une description approfondie de ce projet, patronné par Fujitsu, voir Alsuya Yoshida et Hajime Nonogaki, Habitat, in Actes d'Imagina 1994, pp. 249/254.

[50] Cette application, réalisée par Cryo Interactive, modélise le centre historique de Paris sur un CD-Rom et permet, via une connexion Internet, à plusieurs participants d'entrer en relation dans cet espace par l'intermédiaire "d'avatars" graphiques. L'objectif est de concrétiser, dans un monde virtuel parallèle, la plupart des relations sociales urbaines (rencontres, commerce, éducation, participation politique, etc.).

[51] Devenu une "coqueluche" du Web, V.R.M.L. (pour Virtual Reality Modeling Language) est un langage qui permet de créer des espaces virtuels tridimensionnels interactifs dans lesquels on peut circuler, que l'on peut meubler d'objets avec lesquels une interaction collective devient possible. Voir notre article : "Internet, un récit utopique", in B.P.I. en Actes (sous la direction de Jean-Pierre Balpe), Actes de l'Observatoire des lectures hypermédias, Centre Georges Pompidou, Paris, 1997.

[52] Le kansei désigne, dans HABITAT, une "personnalité électronique", basée, de manière très sommaire, sur les expressions non-verbales, mimiques faciales et marques intentionnelles.

[53] Voir Michel Alberganti, "Steve et Adele, enseignants virtuels", in Le Monde interactif, supplément au Monde, 13/01/99, p. IV.

[54] Chantal de Gournay, Le deuil de l'image, in Réseaux Ndeg.61, L'Harmattan, 1993, p. 129/130.

[55] Voir à ce sujet notre article déjà cité, "Les images hybrides : virtualité et indicialité" (revue MEI, Ndeg.7, L'Harmattan, Paris, 1997) où sont distingués les différents types d'accouplement entre les images produites par capture indicielle et les traitements numériques. La Réalité Virtuelle, notamment, y est soumise à un questionnement sémiotique où il apparaît qu'un certain type d'indicialité trouve, indirectement, à s'y exprimer.

[56] Procédures qu'on désigne souvent par le terme ambigu de "langage de programmation", l'ambiguïté tenant à ce qu'il leur manque l'essence d'une langue naturelle, sa polysémie et sa transformation permanente par l'usage social.

[57] Jean-Louis Boissier est l'un des premiers qui ont éclairé cette importante question. Voir par exemple, "Bambous : pour que poussent les images", in Les chemins du virtuel, Centre Georges Pompidou, Flammarion, Paris, 1989.

[58] Chantal de Gournay, loc. cit.

[59] Louis Marin, De la représentation, Gallimard - Le Seuil, Paris, 1994.

[60] Bernard Miège, La société conquise par la communication, Tome 2 : La communication entre l'industrie et l'espace public, Presses Universitaires de Grenoble, 1997, p. 142.

[61] Marc Guillaume (sous la direction de), Où vont les autoroutes de l'information ?, Descartes et Cie, Paris, 1997. Voir en particulier p 111/128, où il est montré qu'en milieu urbain les réseaux ajoutent des fonctions de "commutations" à celles qui existent déjà (transports, équipements culturels, etc.). De ce fait, ils augmentent le pouvoir attracteur des grandes métropoles.

[62] Voir Jacques Aumont : "Ce que nous dit cette théorie (celle de la double réalité de l'image) par conséquent, c'est que le spectateur a affaire principalement à l'espace illusoire de la représentation ; mais que cela n'est complètement possible que s'il garde en même temps, et subsidiairement, conscience des moyens de cette illusion." L'oeil interminable, Séguier, 1989, p. 142, cité par Kamel Regaya, Du cinéma à la télévision : quel régime perceptif ? in Télévisions, L'Harmattan, Paris, 1995, p. 35. Sur la même question et traité d'un autre point de vue, voir aussi le passionnant article d'Octave Mannoni, Je sais bien, mais quand même... in Clefs pour l'Imaginaire, Points-Seuil, Paris, 1969.

[63] André Leroy-Gourhan, L'homme et la matière, Albin Michel, 1973.

[64] André Leroy-Gourhan, op. cit., p. 27.

[65] Bernard Stiegler a consacré les deux tomes de La technique et le temps, à la discussion approfondie de ces questions (Galilée, Paris, T. I, 1994 et T. II 1996).

[66] Il n'est pas sans intérêt de remarquer qu'une véritable industrie de la capture volumique est en passe d'éclore avec les cabines d'essayage qui, scannant notre corps, permettent de le revêtir de vêtements virtuels, en haute résolution. La marine française a déjà utilisé ce procédé pour réaliser les uniformes de 70 000 marins. Une nouvelle vie pour le sur-mesure... Voir Clive Cookson, La prêt-à-porter veut en finir avec les cabines d'essayage, in Courrier International, ndeg. 425-426, 23/12/1998, p. 47.