| sommaire | littérature et informatique | Jean Clément | Cours du 20/1/99 |

Générateur de haïkus


Le problème du sens dans la génération automatique

On a étudié des systèmes capables de générer du texte à partir d'une base de données constituée de phrases.
Le fait d'utiliser des phrases toutes faites permet d'éviter des problèmes de syntaxe et de sens. L'ordinateur ne se charge pas de construire les phrases puisqu'elles lui sont fournies. Faire écrire des phrases à la machine est beaucoup plus compliqué. Cela nécessite un lexique et une grammaire de niveau infraphrastique.
On se heurte toujours, en génération, au problème du sens.
Comment une machine peut-elle produire du sens ?
top

Exemple d'un générateur de haïkus

Le haïku
Il s'agit d'un genre littéraire japonais très ancien. Tous les ans ont lieu au Japon des concours de haïkus.
C'est un genre bref et flou. C'est probablement le genre littéraire le plus répandu sur le web. En effet, les poèmes brefs se prêtent bien à l'aspect "atelier" de l'internet.
top

L'esprit du haïku
Il a pour objet un élément d'un paysage contemplé par le poète; l'acte de contemplation suggère une philosophie de la vie, un sentiment de la destinée ou une réflexion métaphysique.
top

La structure du haïku
Le haïku a une structure en 3 vers, qui obéit à une organisation stricte.
Le premier vers (A) situe le paysage qui est l'objet de la contemplation du poète (complément de lieu prépositionnel).
Le second vers (B) décrit ce qui se passe dans le paysage (phrase canonique du type sujet-verbe-complément).
Le troisième vers (C) est une espèce de conclusion qui traduit ce que la contemplation du paysage déclenche chez le poète (substantif ou groupe nominal ou phrase nominale).
La variante ACB est aussi possible.
On va essayer de constituer le premier vers à partir d'un lexique et de règles sémantico-grammaticales. Il faut tenir compte du monde extérieur, on aura donc des contraintes physiques à respecter (découpage de l'expérience du réel).
top

Découpage de l'espace
0 espace englobant/1 espace englobé
0 volume haut/1 bas/2 médian
3 surface vaste haute/4 basse/5 médiane
6 surface restreinte haute/7 basse/8 médiane

Choix des prépositions

  1. dans
  2. près de
  3. à côté de
  4. au milieu de
  5. sur
  6. au dessus-de
  7. aux alentours de
  8. sous
  9. à fleur de
  10. à l'abri de
  11. au bas de
  12. loin de
  13. en face de

Choix des noms de lieux

  1. bosquet
  2. pré
  3. village
  4. fourré
  5. horizon
  6. jardin
  7. fûtaie
  8. buisson
  9. champ
  10. mont
    ...

L'ordinateur choisit un nom de lieu au hasard puis va chercher la préposition qui va avec, selon qu'il s'agit d'un espace englobant/englobé, d'un volume haut ou bas etc.
top

Quelles perspectives pour la génération automatique ?

On se heurte toujours aux problèmes du sens et de la reproduction de la réalité.
Dans La machine littérature, l'écrivain Italo Calvino développe l'idée selon laquelle les machines ne feront vraiment de la création littéraire que le jour où elles s'affranchiront des règles que les humains leur ont imposées.
Pour l'instant, il faut essayer de donner des règles qui permettent d'avoir le plus de possibilités.
top