Henri Prade / La question de la représentation de la littérature à l'intelligence artificielle
une étude de "Bing" de Samuel Beckett

Henri Prade est chercheur au CNRS, il a fondé à l'Institut de Recherche en Informatique de Toulouse un laboratoire réservé aux questions de l'intelligence artificielle

le dossier Beckett de remue.net, avec le texte original de Bing

e-mail / courrier pour Henri Prade


retour remue.net

Ce qui frappe d'abord dans “Bing” (ou dans “Sans”, publié également dans le recueil “Têtes-Mortes”, Les Éditions de Minuit, 1972), c'est le flux continu des mots, leur quasi-agglutination ; c'est l'absence de ponctuation, de toute indication de séparations facilitant l'identification de ce qui pourrait constituer des "unités lexicales indépendantes". Très peu d'articles, même indéfinis, qui restent en général associés à des entités abstraites ("un sens", "une issue", "un mètre", "une seconde", "un peu moins", "toujours la même", "toujours les mêmes"), à de très rares exceptions près ("seuls les yeux", "les chairs blessées roses", "invisibles rencontres des faces") ; pas non plus de possessifs (sauf "chacun sa trace").

Le texte apparaît comme une suite d'énonciations réduites à l'essentiel, incomplètes ; d'énonciations par bribes, reprises, amplifications, retours, alternances, expansions, répétitions. Sans donner pour autant l'impression d'une litanie.

Il s'agit de dire le réel, son étrangeté aussi bien que son caractère familier, de le déconstruire et de le reconstituer, peut-être aussi d'instituer une distance entre le ‘scripteur' / le lecteur et le réel ... La littérature est ici déchiffrement du monde, comme elle a pu être dans d'autres contextes plutôt affaire, de dé-scription, de devisement, ou encore de re-création du monde par exemple.

Ayant en tête les liens privilégiés de Beckett avec la peinture (et des peintres comme Bram van Velde, notamment), on est frappé par une certaine analogie avec le travail du peintre qui procède par touches et reprises successives, les couleurs et les formes se fondant les unes dans les autres. Le texte est d’ailleurs "ponctué" d’un grand nombre d’indications de couleurs: "blanc", "bleu pâle", "gris pâle", "rose", "gris", "noir et blanc", … On peut penser aussi à l'activité du regard qui découvre progressivement un tableau, à la suite des impressions qui traversent l'esprit du ‘regardeur'. Ceci est d’ailleurs assez proche, me semble-t-il, de la manière dont Beckett regardait les peintures de Bram van Velde (cf. le court texte de Beckett dans le livre d’hommages à Bram van Velde, “Celui qui ne peut se servir des mots”, publié par Fata Morgana en 1975).

Le travail d'écriture met ici en œuvre une combinatoire, par la répétition des groupes de mots qui se répondent. Mais cette combinatoire est bien différente de celles, contemporaines, à l'œuvre dans les expérimentations de l'OuLiPo, ou de "Mille Milliards de Poèmes" de Queneau.

Il y a aussi, semble-t-il, une volonté de représentation minimale, où tout superflu est gommé (malgré l'apparente énorme redondance des expressions !).

Ce texte, écrit en 1966, est aussi contemporain de tout un ensemble de préoccupations scientifiques qui commencent alors à émerger, ce qui n'est peut-être pas totalement fortuit (même si Beckett n'y prêtait pas un intérêt particulier). En effet, dès les années 60, l'intelligence artificielle s'est préoccupée de la représentation des connaissances, des images, de l'information. Mais dans une perspective radicalement différente !

En effet, la science, de manière générale, est affaire, si on peut dire, de "chiffrement" du monde. Il y est donc question de "codage", de "calcul" (logique), afin de déduire, de diagnostiquer, de reconnaître, de retrouver, de prédire, de synthétiser, de structurer, d'organiser, de planifier, de rechercher des solutions, ...

Ainsi, la représentation logique de descriptions en langage naturel vise en intelligence artificielle essentiellement à identifier ce que veut dire un locuteur dans des situations pratiques données, ou encore à identifier le sujet d’un article de journal, voire à en fournir des éléments de résumé.

Ainsi, les représentations formelles existantes ne feraient sans doute pas de différence entre les formulations dans l’exemple suivant :
- Un homme se tient assis à une table près d'un mur blanc.
- L’homme se tient assis à une table près d'un mur blanc.
- Un homme. Il se tient assis, à une table près d'un mur, blanc.
- Un homme. Il se tient près d'un mur blanc, assis à une table.
- Blanc. Près du mur, un homme. A une table assis.
- Blanc table près du mur homme assis.

Une représentation standard en logique du premier ordre en serait
{homme(a), assis(a), devant(a, b), table(b), près-de(b, c), mur(c), blanc(c)}
ce qui est rigoureusement équivalent à, par exemple
{blanc(c), homme(a), mur(c), devant(a, b), table(b), près-de(b, c), assis(a)}
En effet, cette représentation exprime que ‘a’ est un homme, que ‘a’ est assis, que ‘a’ est devant ‘b’, que ‘b’ est une table, que ‘b’ est près de ‘c’, que ‘c’ est un mur, que ‘c’ est blanc.

On peut introduire de l’indétermination, en n’ ‘instantiant’ pas certaines variables ‘x’, ‘y’, ‘z’, qui restent ‘libres’. Ce qui donne, par exemple
{homme(a), assis(a), devant(x, b), table(b), près-de(b, y), mur(c), blanc(z)}
Et qui signifie qu’un homme (‘a’) est assis, que quelqu'un/chose est devant une table (‘b’) qui est près de quelqu'un/chose (autre?), qu’il y a un mur (‘c’) , que quelqu'un/chose est blanc.

On pourrait aussi introduire de l’incertitude, des croyances, des intentions, de la temporalité, etc., et les représenter.

Par contre, on pourrait essayer de partiellement décrire, comment un texte comme ‘Bing’ ou ‘Sans’, se constitue par expansion, révision progressives, à partir de ‘motifs premiers’ p, q, r, s, t, u, v (chaque motif est constitué d’un groupe de mots toujours réutilisés dans le même ordre dans le texte)

Ainsi partant par exemple de
pqrstu
- on produit par une suite d’opérations “ élémentaires ” un texte,
ainsi en répétant ‘q’ :
pqrstuq
- puis ‘stu’, une chaîne déjà présente en tant que telle :
pqrstuqstu
- puis en introduisant un nouveau motif ‘v’ :
pqrstuqstuv
- puis en répétant la séquence pq* (où ‘q*’ dénote une légère modification de ‘q’) :
pqrstuqstuvpq*
- puis en ajoutant la chaîne ‘rstu’ , amputée de ‘s’, on obtient finalement :
pqrstuqstuvpq*rtu
- etc.

Bien sûr, cela ne dit rien sur le choix des motifs initiaux, la façon de les regrouper, les règles de choix gouvernant l’ajout de motifs, ou de groupes de motifs, leurs modifications, etc...

L’identification de ces motifs peut aussi conduire à une nouvelle mise en page du texte, qui en offre une autre lecture (que n’aurait peut-être pas voulue Samuel Beckett!).

Quelque chose comme un ‘Dépliement’ de Bing:

à lire en PDF : un "dépliement" de Bing

 

N. B. Le texte présenté via le lien ci-dessus en PDF constitue l’intégralité de “Bing”. Sa mise en page diffère cependant complètement de l’original. La disposition des mots sur la page voudrait identifier les motifs, puis leur fusion progressive ; l'emploi ci-après de l'italique s'efforce de repérer la répétition des motifs ou des suites de motifs, à quelques oublis près vraisemblablement.