L'ÉVOLUTION DE L'OUTIL INFORMATIQUE A L'UNIVERSITÉ

POITIERS 1988


Quels sont les besoins des Sciences Humaines en Informatique...
et les Sciences Humaines ont-elles vraiment besoin d'Informatique ?


Gérard VERROUST
CNRS/LIVRE Université Paris VIII
2, rue de la Liberté. 93526 SAINT DENIS. France
EARN/BITNET : VERROUST@FRP8V11

Résumé

Après avoir proposé une définition à la fois précise et générale du champ épistémologique de ce qu'on appelle « Sciences Humaines et Sociales », nous nous sommes livrés à une enquète étendue aux disciplines les plus diverses...
Notre enquète et notre propre expérience montrent l'existence d'une spécificité de l'usage de l'Informatique dans les Sciences Humaines, conduisant à définir un ensemble de principes, de méthodes et de moyens matériels et logiciels à mettre en oeuvre.
Dépassant la réduction encore trop fréquente de l'ordinateur à une simple machine à calculer, les Sciences Humaines font appel aux techniques les plus évoluées de l'Informatique (Interactivité, banques multimédia, E/S graphiques, raisonnement artificiel, etc...) d'aujourd'hui et de demain.
L'usage correct de l'Informatique dans pratiquement toutes les disciplines des Sciences Humaines peut conduire à des progrès considérables pratiquement partout à condition que soient parfaitement comprises par les chercheurs en Sciences Humaines un certain nombre de notions philosophiques et techniques de base. Et que par ailleurs soient surmontées les difficultés financières propres aux disciplines dites «littéraires».
En retour l'Informatique peut attendre de ces applications des progrès techniques et conceptuels décisifs.

De quoi parlons-nous ?

Nous allons d'abord nous demander de quoi nous parlons. Et d'abord, qu'est-ce que c'est que les Sciences Humaines ?

Je prendrai pour Sciences Humaines ce qu'on appelle ainsi maintenant au CNRS et à l'Université :
L'ensemble des savoirs structurés qui traitent de l'homme dans ses organisations, ses manifestations, ses productions, ses traces ; qui traitent de l'homme dans sa spécificité dans l'évolution universelle.
Cette définition est à la fois précise et générale. Nous verrons qu'elle est féconde pour ce qui nous concerne. Je n'en développerai pas ici tous les aspects mais je signalerai par exemple qu'elle exclut la médecine et la physiologie qui traitent de l'homme dans ses propriétés animales mais inclut psychologie et psychanalyse qui étudient les propriétés intellectuelles de l'homme.
Évidemment je ne parlerai pas des définitions subtiles qui conduisent à fonder la légitimité épistémologique de telle ou telle branche des Sciences Humaines et Sociales...
Je rappelerai que c'est en 1958 que les Lettres devinrent « Lettres et Sciences Humaines » comme le Droit devint « Droit et Sciences Économiques », dans la lancée, il est vrai, d'une lecture réductionniste du structuralisme.
Cette définition des Sciences Humaines nous permettra de comprendre en quoi l'utilisation de l'Informatique y pose des problèmes spécifiques étrangement semblables dans des disciplines souvent très éloignées.

Mais il nous faut nous demander : Qu'est-ce que l'Informatique?

Je pourrais bêtement prendre la définition de l'Académie Française. Je ne le ferai pas. Oui, est-ce une science originale, une technique, une branche des mathématiques ? En fait maintenant je crois que c'est clair au bout de nombreuses années d'une bataille dont les enjeux ne furent pas toujours innocents. Il s'agit d'une branche d'une science nouvelle, originale, qui se développe dans notre siècle et qui se caractérise par ce qu'on pourrait appeler une intelligence artificielle au sens large :

La Science des processus de direction, de commande
et de l'information qui les représente.

On réemploie à ce propos le terme de cybernétique ridiculisé à tort autrefois. Et la Société savante française d'Informatique et d'Automatique, l'AFCET 1 redevient fière de sa dénomination. On peut remarquer en passant que c'est la science des automates et non celle du calcul qui fonde l'Informatique. Nous y reviendrons.
Il nous faut aussi signaler que cette science nouvelle est au c&oe.ur de cette Révolution Scientifique et Technique du XXème siècle qui est un des bouleversements les plus fondamentaux de l'histoire de l'humanité depuis ses origines. Il importe d'en être conscient.
Nous parlerons ici de l'Informatique en tant que science de la conception et de l'usage des ordinateurs d'aujourd'hui, classe particulière d'automates logiques, ou Machines de Von Neumann. Automates dont les propriétés sont celles d'une classe particulière bien définie d'opérations intelligentes qu'on appelle algorithmes.
Ce préambule est important car il fonde une compréhension correcte pour tous les utilisateurs des possibilités et des limites qualitatives et quantitatives des méthodes et outils utilisés.
Par ailleurs, il faut réinsister sur l'originalité épistémologique de l'Informatique qui n'est pas une branche des mathématiques et dont certaines méthodes propres s'apparentent à celles de certaines Sciences Humaines. Nous illustrerons ce propos par une remarque. Ayant été amené à collaborer depuis de nombreuses années avec des scientifiques de pratiquement toutes les branches : sciences dures ou « molles », c'est chez des historiens qu'à deux reprises nous avons rencontré une excellente compréhension spontanée du bon usage de l'Informatique...

Donc, nous parlerons de l'usage des machines automatiques qui manipulent des codes selon des systèmes de règles formalisées. Nous voudrions à ce propos rappeler trois paradoxes qui permettent de comprendre ce qu'est vraiment un ordinateur en dénonçant des erreurs communes :



1/ L'ordinateur n'est pas une machine binaire.
Tout système de numération peut convenir. Mais pour des raisons de commodité technique on emploie des dispositifs physiques à deux états pour lesquels la numération binaire est la plus simple d'emploi.

2/ L'ordinateur n'est pas une machine électronique.
C'est une structure d'automate qui peut être réalisée dans toute technologie permettant d'effectuer certaines opérations. Mais c'est l'électronique qui a permis de réaliser des ordinateurs performants et en retour les ordinateurs ont suscité les progrès techniques de l'électronique.

3/ L'ordinateur n'est pas une machine à calculer.
C'est un automate à manipuler des codes selon certaines règles. Mais parmi ces manipulations il y a le calcul et pour des raisons d'utilité sociale on emploie massivement les ordinateurs pour faire des calculs.

Donc si l'ordinateur n'est pas une machine à calculer, la réduction par l'histoire et la pratique sociale à cet usage (qu'il fait fort bien) a nui à l'appréciation exacte de ses possibilités réelles.
Dans les sciences dites exactes, les ordinateurs ont été presque exclusivement utilisés pour du calcul (au détriment il faut le dire d'autres possibilités qui restent encore souvent à développer).

Dans les Sciences Humaines nous rencontrons deux grandes classes d'usages :
° -- Le calcul, oui, comme dans les sciences classiques. Essentiellement du calcul numérique pour l'accès par le traitement de données statistiques à des lois non mesurables directement, ainsi que des modélisations numériques. Ou encore, et cela devient très important, du calcul logique.
° -- Mais aussi et surtout des usages consistant en saisie, stockage, analyse, classement, traitement, édition, diffusion de tous les types d'informations non numériques, de codes, de signes, etc.
Et c'est ce second aspect qui y est le plus important et conduit précisément aux usages de l'Informatique générateurs de progrès fondamentaux. En effet, les Sciences Humaines constituent un des deux grands domaines qui posent à l'Informatique un problème essentiel : celui de la relation entre toute la complexité et la polysémie de l'univers réel et le milieu bien formalisé, rassurant, de l'automate logique. Ces deux domaines sont:

- L'Informatique en Temps Réel, l'automatique, la conduite de processus,
- L'utilisation des ordinateurs en Sciences Humaines, culture, création.

Et précisément dans ces deux domaines il est indispensable sous peine d'errements graves, d'aberrations ou de désastres de comprendre et de maîtriser un certain nombre de concepts de base indispensables au bon usage des outils et méthodes :
- Information, codage, modélisation, représentation des connaissances.
- Algorithmes et méthodes numériques.
- Limites des automates logiques et de la logique formelle.
- Etc.



Un historique des mésaventures de l'Intelligence Artificielle depuis 30 ans illustrerait à merveille les conséquences parfois dramatiques de l'ignorance ou de la méconnaissance de ces concepts fondamentaux. Par exemple l'histoire de la traduction automatique et de ses déboires dus à des illusions sur les possibilités des automates logiques alliées à une vision réductionniste des langues naturelles.
Examinons donc à partir de nos définitions quels sont les outils informatiques dont ont besoin les Sciences Humaines.

Saisie, codage, stockage, consultation, diffusion, archivage.

Les Sciences Humaines travaillent sur des objets de la plus grande diversité et toujours polysémiques. On sait que tout système de description est partiel voire partial et n'extrait du réel qu'une partie du sens.
On doit donc saisir et stocker sans appauvrissement les collections d'objets les plus divers : Textes, alphabets, idéogrammes, sons, partitions, images, sculptures, outils, etc.
La constitution, le stockage, la diffusion de grands corpus de documents de toutes sortes sur des supports en permettant tous les modes de traitement automatique constituent une tâche prioritaire. Cette tâche doit obéir à un ensemble de règles essentielles. La constitution d'un corpus doit:
- Être la plus totale possible
- Être munie d'un système de repérage objectif indépendant des supports et des sens,
- Être associée aux informations naturelles objectives indépendantes des supports,
- Être effectuée sur des supports et sous des formes normalisés.

La nature des informations à coder et à stocker conduit à définir des outils de saisie universels adaptables à tel ou tel usage particulier (Scanners universels, consoles adaptables à tout alphabet ou jeu d'idéogrammes, systèmes graphiques, numériseurs de sons, etc...).
Remarquons à ce propos que la dispersion des applications informatiques en Sciences Humaines dans un très grand nombre de petites disciplines isolées est préjudiciable à tous. Pourquoi des consoles spécialisées distinctes pour l'Arabe, le Chinois, les hiéroglyphes... alors qu'une console universelle multialphabets construite en grande série rendrait de très grands services à tous pour un prix très bas et trouverait chaque jour de nouvelles applications ?
Attention, la saisie de données, nécessaire en général avant tout traitement automatique est une tâche énorme souvent sous-estimée. Elle porte souvent sur des documents de grande valeur culturelle qui intéressent plusieurs disciplines et les générations futures. Elle ne doit pas avoir à être refaite.
D'où l'importance du respect des règles ci-dessus. Il faut en particulier se méfier des saisies spécialisées appauvrissantes faites en vue d'un traitement très particulier. Une mauvaise saisie peut à court terme causer des erreurs scientifiques graves et à long terme contraindre à de coûteux réenrichissements, nécessairement interactifs.
La saisie d'un corpus culturel doit être définitive. C'est un trésor dont il faut assurer la pérennité. A ce sujet il faut signaler que l'émiettement actuel conduit à des gâchis. Je viens d'apprendre que de précieux corpus sur cartes perforées sont détruits sans être recopiés par des laboratoires qui veulent gagner de la place dans leurs locaux.
Nous avons la chance de connaitre en ce moment un très grand progrès technique : celui des mémoires optiques qui apportent des moyens de stockage (DON) et de diffusion (CD-ROM & Vidéodisque) d'une puissance considérable pour des coûts très bas.
Il faut insister sur le problème des standards de représentation. C'est une question capitale qui doit préoccuper tout le monde. et une bonne standardisation suppose la participation active des utilisateurs finaux qui posent les vrais problèmes.
On sait que les standards des modes de stockage/accès se définissent par niveaux conceptuels (qu'on retrouve en communication sous forme de couches).

Le niveau 0 (physique) nous échappe. Par chance le vidéodisque (Laservision) et le CD-ROM font l'objet de standards universels.

Le niveau 1 (codage, adressage et mode d'accès) dépend des systèmes d'exploitation qui évoluent. Mais les outils de conversion existent toujours. Encore faut-il que les conversions soient faites.

Le niveau 2 (classes de données : texte, musique, typographie, etc.) concerne à la fois les responsables de l'Informatique en Sciences Humaines et tous les chercheurs car il y va de l'intérêt de tous et des compétences de tous ordres doivent y être mises en &oe.uvre. Il y a un gros travail à faire. Par exemple, il n'y a toujours pas de standards universels pour représenter les partitions musicales, le Chinois, etc.

Dialogue Homme-Machine et interactivité

On aura compris que la juste appréciation des compétences propres de l'homme et de la machine logique impose sous peine de déboires, de gâchis ou d'errements un mode de travail interactif , ce qui conduit à des outils matériels et logiciels bien adaptés.

Cette répartition correcte des tâches entre l'homme et la machine suppose :

- Que les utilisateurs aient tous quelques notions fondamentales de science de l'information; notions simples mais nécessaires pour éviter illusions ou appauvrissements.

- Qu'existent les organes matériels ergonomiquement bien conçus.

- Que des outils matériels et logiciels spécifiques permettent une utilisation simple, naturelle , transparente et correcte des moyens informatiques par les chercheurs, les libérant des tâches que l'ordinateur fait très bien. On voit là une notion fondamentale d'ergonomie : l'image conceptuelle doit représenter tout l'outil et rien que l'outil.

Cela implique la mise en &oe.uvre de méthodes de travail fondées sur la collaboration pluridisciplinaire. Les difficultés d'utilisation de certains logiciels doivent nous interpeller, nous, informaticiens. On n'a pas plus à être expert en informatique pour utiliser un logiciel d'application qu'à être mécanicien pour utiliser une automobile. Nous devons avoir l'honnêteté et l'humilité de refuser le trop facile terrorisme technique à l'encontre des utilisateurs. Cette attitude se retourne en fin de compte contre nous-mêmes et toute l'Informatique.

Une remarque essentielle : dans tout projet, toute réalisation, il faut définir exactement la frontière entre ce que peut faire la machine et ce qui relève nécessairement de décision humaine:
- Indécidabilités logiques,
- Choix culturels.

De la définition correcte et précise de cette frontière homme-automate dépendront rigueur, efficacité et aussi facilité voire plaisir d'utiliser la machine.

La Pluridisciplinarité et ses problèmes

Je ne développerai pas ici les nombreux aspects (et problèmes) politiques, administratifs, organisationnels et humains de la collaboration pluridisciplinaire.
Je voudrais insister sur le fait que plusieurs progrès décisifs dans quelques branches des Sciences humaines ont été dus à la mise en &oe.uvre correcte autant qu'exceptionnelle de collaborations pluridisciplinaires avec des informaticiens.
Je voudrais aussi mettre en garde contre l'illusion qu'on est devenu informaticien parce qu'on a écrit un petit programme ou qu'on sait jouer avec son microordinateur,
... et, réciproquement,
qu'on est devenu un artiste parce qu'on a programmé le tracé d'un bouquet de fleurs sur son imprimante à aiguilles.

Chacun son métier : un bon sociologue n'a pas à devenir un mauvais informaticien et les informaticiens doivent se garder d'incursions naïves dans d'autres disciplines.
Toutefois quelques grands problèmes seraient résolus par des actions visant à combler le gouffre épistémologique existant entre quelques disciplines traitant souvent du même objet. Je pense de manière précise à la linguistique et au traitement informatique des langues naturelles où on pourrait faire ce qui a été fait (difficilement) pour trouver un langage commun entre l'informatique et l'automatique classique.
On ne peut ignorer les difficultés causées par les terribles problèmes financiers des Lettres et Sciences Humaines qui ne sont censées utiliser que du papier et des crayons.

Nous voudrions ici insister sur un besoin généralement ressenti mais qui n'a jamais pu être réellement satisfait : celui d'un vrai Centre Informatique au service des besoins propres des Sciences Humaines. Un Centre construit autour d'une machine spécifique (ayant plutôt l'architecture d'un système de gestion) de moyenne puissance de calcul mais équipée de l'ensemble des logiciels et périphériques originaux que requiert cette classe d'applications. Un Centre animé par une équipe permanente pluridisciplinaire d'ingénieurs de haut niveau. Un lieu où ces classes importantes mais très particulières d'utilisateurs que nous avons définis recevraient aide, assistance, formation bien adaptées à leurs vrais besoins. Un lieu de communication, d'information, d'échange d'expériences, de méthodes. Un lieu où les animateurs de diverses associations isolées (Histoire & Informatique, Informatique Géographique, ATALA, Informatique musicale, Informatique juridi-que, Art & Informatique, etc.) pourraient se retrouver.
Ce Centre serait aussi le lieu idéal pour concevoir et réaliser des logiciels et matériels nouveaux dont le besoin apparaitrait nécessairement, en collaboration naturelle avec l'Industrie. Bien entendu il pourrait être logiquement conduit à jouer un rôle important dans l'élaboration des normalisations tant espérées.
On connait maintenant l'importance de ces Centres informatiques spécialisés de moyenne puissance dédiés à une classe particulière d'utilisateurs, qui sont reliés d'un côté aux indispensables micro-ordinateurs/stations de travail et donnent accès de l'autre côté aux ressources des gros Centres nationaux (Gros calculs, Calculs vectoriels, Banques de données communes, Commun-ications avec les réseaux internationaux, etc.).

L'Importance pour l'Informatique

Une part essentielle des progrès de l'Informatique résulte de la confrontation des systèmes artificiels intelligents encore rudimentaires qu'on sait réaliser aujourd'hui avec la polysémie du monde réel.
Et en outre les processus de l'intelligence naturelle et de ses productions constituent des défis mobilisateurs.
Aussi n'est-il pas exagéré de dire que les Sciences Humaines font faire à l'Informatique des progrès décisifs.
On sait que les progrès de l'Informatique depuis 30 ans, outre l'abaissement des coûts, se sont dirigés vers deux directions rendues possibles par les progrès techniques (qu'en retour l'Informatique a suscités) :
° - La solution de grands problèmes par l'exécution de très grands algorithmes, ° - Et surtout le rapprochement de la machine et de l'homme de trois manières :
° * Géographiquement par le télétraitement mettant les ressources sur le lieu de la richesse sémantique des données, ° * Temporellement grâce au traitement interactif immédiat des données, ° * Structurellement en échangeant des informations sous des formes et dans des modes adaptés aux sens humains (dialogue littéraire, sonore ou graphique).

Pour prendre un exemple actuel, les importants travaux théoriques et pratiques actuels sur les hypertextes et hypermédias ont eu pour origine le défi posé par la mise en &oe.uvre dans des machines des processus humains intelligents de classement et de consultation des informations les plus diverses.

Pourquoi cette question aujourd'hui, une mode passagère ?

Oui, pourquoi ce problème en notre siècle ? Nous devons mesurer l'importance de ce qui se passe. Il faut être conscient que nous vivons un des bouleversements les plus fondamentaux de l'histoire de l'humanité. Aussi important que l'invention du feu et plus que celle de l'imprimerie.

Pour la première fois l'homme sait reproduire certains des mécanismes de sa pensée dans des systèmes qu'il construit et met à son service. Cela conduit à un changement profond des relations de l'homme avec le monde.

On ne fait plus, on fait faire par des machines où on incorpore une partie de son savoir-faire.

Toutes les activités humaines sont concernées et nous vivons l'émergence d'une nouvelle civilisation. Je rappelle qu'on la caractérise en particulier par une fusion permanente de trois activités humaines :
-- Production et création
-- Enseignement
-- Recherche et développement

Mais aussi ceci conduit à un redécoupage épistémologique des savoirs qui fait justement jouer aux Sciences Humaines un rôle fondamental. On ne peut plus les considérer comme des activités marginales attendrissantes, divertissantes voire un peu futiles mais comme des activités sociales essentielles.
Par ailleurs, cette Révolution Scientifique et Technique contemporaine pose à l'enseignement et à la recherche des défis nouveaux :
° - À l'éducation qui doit communiquer massivement un nouveau savoir qui ne se réduit pas à l'usage d'un microordinateur... On a parlé de nouvelle alphabétisation. Et tous les enseignants d'aujourd'hui et de demain sont concernés. ° - À la recherche qui doit remettre en cause certaines de ses méthodes, non pas pour se mutiler mais au contraire pour réaliser des progrès considérables (activité sociale collective, interdisciplinarité et globalité, changements de priorités et ouverture à de nouveaux savoirs) Il s'agit en fait par exemple d'étendre a d'autres disciplines les méthodes modernes d'organisation de la recherche introduites en France par Frédéric Joliot-Curie pour la Physique Nucléaire dans les années 50.

Pour conclure, dans la recherche et l'enseignement dans les Sciences Humaines, comme dant toutes les activités humaines, le bon usage de l'Informatique doit conduire à :
° Des progrès considérables en productivité, efficacité et rigueur,
° Une humanisation du travail, l'enseignant chercheur pouvant se consacrer entièrement aux tâches essentiellement humaines.


Dans un ouvrage d'Informatique publié il y a maintenant de nombreuses années, nous avions d'ailleurs intitulé de manière un peu provocante le chapitre consacré à l'usage de l'Informatique dans les Sciences : «Quand l'Ordinateur travaille, le Savant peut réfléchir».
Il est aussi absurde et suicidaire aujourd'hui de se passer de l'Informatique qu'il l'aurait été au XVIIème siècle d'ignorer l'imprimerie.

Que nos littéraires abandonnent leur plume d'oie et se réalisent pleinement avec les moyens d'aujourd'hui et de demain.

Notes

1) AFCET : Association Française pour la Cybernétique Economique et Technique.

Bibliographie

- FONT J.M., QUINIOU J.C., VERROUST G., «Les Cerveaux non humains / Introduction à l'Informatique»,Denoël (Paris), 1970.
- PERRIAULT J., « Éléments pour un dialogue avec l'informaticien », EPHE/Mouton (Paris), 1971.
- VERROUST G., Projet d'Organisation et de Développement du Centre Informatique des Sciences Humaines du CNRS à Paris, Note interne, Février 1975.
- VERROUST G., « Informatique & Sciences Humaines (Méthodes, Problèmes, Moyens, Besoins) », Centre de Calcul de l'Université de Strasbourg, Mai 1975.
- NELSON Ted, « Computer Lib/Dream Machines », Hugo's (Chicago), 1975.
- BORILLO M., « Informatique pour les Sciences de l'Homme », Mardaga (Bruxelles), 1984.
- VERROUST G., « La Révolution Informationnelle du XXème Siècle, une étape fonda-mentalement nouvelle de l'histoire des hommes », European Philosophy Conference, Athènes, Juin 1985.
- RAHTZ S. Ed., « Information Technology in the Humanities », Wiley & Sons Ltd. (Chichester), 1987.
- VUILLEMIN A., « Informatique et traitement de l'information en Lettres et Sciences Humaines », Masson (Paris), 1987.
- ANSART P. Ed., «Usages et Mésusages de l'Informatique dans l'Enseignement et la Recherche en Sciences Sociales », Centre de Coopération interuniversitaire franco-québécoise, Publications de la Sorbonne (Paris), 1988.

-=O=-