logo Essonne

TIC et littérature : un mariage heureux

Les chercheurs en littérature s'intéressent de très près aux technologies de l’information et de la communication. Internet et logiciels spécifiques ouvrent des horizons inattendus pour leurs recherches. Un site, l'Atelier Bovary, permet par exemple d'accéder à tous les manuscrits de ce roman de Flaubert.

Extrait du manuscrit Madame Bovary - G. FlaubertExtrait d'un brouillon du manuscrit de Madame Bovary, écrit par Gustave Flaubert.
© Collections Bibliothèque municipale de Rouen. Photographie Thierry Ascencio-Parvy

Si les technologies de l’information et de la communication (TIC) sont utilisées depuis vingt-cinq ans par les chercheurs en littérature, on assiste depuis le début des années 2000 à une formidable accélération du phénomène, liée aux progrès informatiques ainsi qu’à la mise en réseau qui se développe grâce à Internet. Alors que cet univers virtuel nous fait entrer dans un nouvel âge de l’écriture, les manuscrits anciens suscitent un véritable engouement, chez les amateurs comme dans le milieu scientifique. D’autant que les nouvelles technologies permettent de valoriser un patrimoine jusque-là confiné dans les réserves des bibliothèques et peu exploité : il n’était consultable que sur autorisation, souvent réservé à des étudiants ou spécialistes du sujet.

Les TIC facilitent l'accès à des travaux d'érudition sur les textes. Ainsi, le site de l'équipe de recherche Hubert de Phalèse de l'université Paris 3 Sorbonne nouvelle, dont la mission est de développer les études littéraires assistées par ordinateur, facilite la diffusion de ces nouveaux savoirs. Autre exemple, l’association Fabula rassemble autour de son site Internet de nombreux chercheurs qui s'intéressent à l'articulation entre théorie et histoire littéraire. Dernier exemple, sur le site LexoTor, on peut examiner tous les contextes d'un mot, d'un nom de lieu ou de personne, dans un ensemble de textes issus de la bibliothèque électronique de Lisieux.

Les TIC permettent aussi aux thèses les plus controversées de trouver un espace d'expression : ainsi, un site Internet présente le dossier toujours plus complet de l'affaire Molière/Corneille, selon lequel ce serait Pierre Corneille, l’auteur du Cid, qui aurait écrit les chefs-d’œuvre signés Molière.

Bref, on trouve de tout sur les nombreux sites consacrés à la littérature. Mais un des domaines particulièrement porteurs est celui de la mise en ligne des manuscrits. C’est ainsi que, confiés en héritage à la bibliothèque de Rouen, les brouillons de Madame Bovary sont restés pendant des années stockés dans les archives. Il faut dire que, transcrits et mis en pages, ces six volumes manuscrits représenteraient quelque 9 000 pages imprimées… Quel éditeur se serait lancé dans le projet ? Et qui aurait acheté l’ouvrage impossible à ranger dans sa bibliothèque et pour le moins difficile à feuilleter ? L'arrivée des TIC change la donne et permet à des passionnés, en lien avec l'université de Rouen, de s’adonner à la transcription du chef d’œuvre de Flaubert (chapitre 1).

De leur côté, des laboratoires de recherche mènent également des projets de numérisation. Spécialiste en la matière, l’Institut des textes et manuscrits modernes (ITEM) travaille aussi, entre autres, sur des brouillons de Flaubert : ceux de l’Éducation sentimentale et des Trois contes. Grâce aux TIC, ils mettent au point des techniques et des logiciels spécifiques pour assurer la plus grande fidélité possible aux manuscrits et permettre une découverte plus riche des écrivains (chapitre 2). Ainsi, d’ici quelques années, une quantité considérable d’œuvres sera entièrement numérisée et accessible à tous sur Internet. Tel est, en effet, le projet de la Bibliothèque nationale de France (BNF) et celui de la bibliothèque numérique européenne (chapitre 3).

01.Un exemple de projet collaboratif sur le web : l'Atelier Bovary

Portrait de Gustave FlaubertGustave Flaubert, auteur né à Rouen le 12 décembre 1821, connu notamment pour les romans Madame Bovary (1857), L'Éducation sentimentale (1869) ou Salammbô (1862).
© Bridgeman Giraudon / Ken Welsh
Flaubert, Stendhal… Les plus grands auteurs de la littérature française sont désormais à portée de clic ! Non seulement leurs œuvres, mais aussi les manuscrits non publiés deviennent accessibles à tous grâce aux nouvelles technologies. C’est ainsi qu’a vu le jour l’Atelier Bovary, un projet ambitieux visant à transcrire l’ensemble des brouillons de Madame Bovary. Initiée par la bibliothèque de Rouen en partenariat avec le Centre Flaubert (dirigé par Yvan Leclerc), de l’université de Rouen, l’idée a immédiatement séduit Danielle Girard, chercheur associé au CÉRÉdI (Centre d’études et de recherche "Éditer-Interpréter" de l'université de Rouen), habituée à utiliser les nouvelles technologies pour ses recherches en littérature. Restait à trouver des transcripteurs prêts à s’investir bénévolement dans le projet. Des appels sont lancés sur Internet et, quelques centaines d’e-mails plus tard, une petite équipe se constitue et s’étoffe progressivement, jusqu’à rassembler 130 bénévoles d’une quinzaine de pays différents, de la Nouvelle-Zélande à Tahiti en passant par les États-Unis, le Japon et le Ghana. Parmi eux, quelques spécialistes de Flaubert, mais surtout des amateurs passionnés ainsi que des professeurs de français désireux de faire plancher leurs élèves sur les manuscrits : en seconde, le thème du "travail de l’écrivain" est en effet au programme et 17 classes se sont attachées à transcrire les célèbres brouillons.

Pendant deux ans et demi, tous ces bénévoles se sont donc penchés sur les quelque 4 546 feuillets noircis (on parle de "folios") d’une écriture fine et serrée, dont le classement a été réalisé par Marie Durel, qui a soutenu en 2000, à l’université de Rouen, une thèse sur la genèse de Madame Bovary. Son travail permet de présenter les transcriptions numérisées des brouillons sous forme de tableau génétique, c'est-à-dire dans l'ordre dans lequel ils ont été écrits (pour découvrir un exemple, cliquez ici). Ils sont interrogeables grâce à un moteur de recherche conçu par Jean-Eudes Trouslard, informaticien.

Pour les transcripteurs, la première difficulté a été de déchiffrer ces brouillons largement raturés et de vérifier des mots inconnus, la langue de Flaubert mêlant à plaisir termes rares, vocabulaire technique et normandismes (termes du patois normand, dont l'atelier Bovary a dressé une liste). Madame Bovary - G. Flaubert" width="301" height="193" />Exemple de transcription d'un passage du roman Madame Bovary, écrit par Gustave Flaubert (chapitre 2, folio 25).
© Manuscrits de Madame Bovary / Bibliothèque de Rouen / Centre Flaubert de l’université de Rouen
Par exemple, "boc" pour voitures à chevaux, ou "crassineux" pour "temps de crachin". Ici, les nombreux dictionnaires en ligne, en particulier le prestigieux Trésor de la langue française ou le Dictionnaire de l’Académie française, ont facilité la tâche dans la mesure où, comme le souligne Danielle Girard "tout le monde n’a pas une bibliothèque aussi fournie chez lui, ni même à côté de chez lui !"

Si les TIC ont permis de s’attaquer à un chantier aussi vaste que celui des brouillons de Madame Bovary, les transcripteurs, même assidus, n'étaient pas tous des spécialistes de Flaubert et de la langue du XIXe siècle. Comment faire pour que ce travail de bénévoles puisse avoir une réelle rigueur scientifique ?

Les transcriptions, dans leur première mouture, ont été achevées en septembre 2006. "Depuis, des relectures systématiques sont faites par une équipe de transcripteurs, que la fréquentation quotidienne des manuscrits pendant quatre années a rendu experts, commente Danielle Girard. Nous avons constamment fait des vérifications, soit en utilisant le moteur de recherche interne, pour voir si un mot “suspect” est employé par Flaubert à d’autres endroits du corpus des manuscrits, soit en interrogeant l'ensemble de l'œuvre de Flaubert avec Discotext, CD Rom de l'Inalf (Institut national de la langue française), soit en consultant des érudits rouennais." Danielle Girard met en avant la "perfectibilité de cette édition numérique où les corrections sont toujours possibles." S'il y a des erreurs, elles peuvent être soulignées et rectifiées par les uns et les autres au gré de leurs relectures. "Nous avons réalisé et mis à la disposition de tous un outil qui ne demande qu’à être utilisé, corrigé, enrichi", insiste Danielle Girard.

Des relectures sélectives ont permis d’élaborer des dossiers qui faciliteront les études littéraires : l’index des noms propres (il y en a plus de 1 100 dont près de 900 références à des œuvres ou des auteurs) ; le relevé des notes de régie, où Flaubert se donne à lui-même des consignes sur la manière d'organiser ou d'écrire tel ou tel passage ; le relevé des pronoms qui signalent la présence d’un narrateur qui participe à l'action ou la commente (on parle de voix narrative), comme le célèbre "NOUS étions à l’étude quand le Proviseur entra" de la première phrase du roman ; les normandismes - presque tous supprimés au final – comme "chucoter" pour "chuchotter", "donner un galop" pour "adresser une forte réprimande",… ; et les noms de lieux, reportés sur des cartes établies à l’époque de Madame Bovary.

Le site de l'Atelier sera complété prochainement par "le site Bovary" qui présentera les images des manuscrits associées aux transcriptions. Mais d’ores et déjà, les élèves et leurs professeurs, les simples passionnés et les chercheurs peuvent se plonger dans cette mine d’informations. Pour faire des recherches par thèmes, personnages, lieux… Entre les index et le moteur de recherche, auxquels s’ajoutent de nombreux documents complémentaires, cartes ou illustrations, il n’y a que l’embarras du choix ! L'ergonomie du site a été pensée pour être extrêmement simple, l'idée est bien que chacun, expert ou non, puisse y trouver son compte.

L’Atelier Bovary a été présenté au colloque international de Rouen devant des chercheurs internationaux venant d’une quinzaine de pays, au ministère de l’Éducation nationale devant les interlocuteurs académiques et le doyen des Inspecteurs généraux de Lettres, devant les chercheurs du centre CÉRÉdI de l'université de Rouen, qui a financé le moteur de recherche.

02.Des manuscrits auscultés en laboratoire

Carte à jouer annotée par RousseauCarte à jouer annotée par Rousseau et étudiée au sein de l'ITEM. Après sa mort, vingt-sept cartes ont été trouvées dans ses papiers. Au cours de ses promenades, il y notait des idées destinées aux Rêveries du promeneur solitaire (texte écrit au crayon, repassé à l'encre).
© Bibliothèque publique et universitaire de Neufchâtel
S’ils sont source de découverte et de plaisir pour les bibliophiles amateurs, les manuscrits passionnent également les chercheurs en littérature. Référence en la matière, l’Institut des textes & manuscrits modernes (ITEM) s’intéresse au processus de la genèse des œuvres. Ce laboratoire du CNRS rassemble une centaine de spécialistes d’auteurs et de siècles différents, qui étudient actuellement une vingtaine de corpus. "Chaque écrivain a ses méthodes de travail : certains, comme Stendhal, ont envie de s’étonner eux-mêmes et ne conçoivent pas de plan préétabli. Ils écrivent plutôt au fil de la plume, alors que d’autres, comme Flaubert, échafaudent au contraire des scénarios précis, explique Pierre-Marc de Biasi, directeur de l’ITEM. Nous nous efforçons de mettre au jour ce travail de création à travers divers programmes de recherche."

L’un d’eux, baptisé Optima, a été lancé en janvier 2007 pour une durée de trois ans et concerne des brouillons de Flaubert, Proust, Valéry et de l’historien Fernand Braudel. Financé par l’Agence nationale de la recherche (ANR), ce projet vise à créer des outils théoriques et techniques afin d’établir les conditions pérennes et scientifiques d’une édition en ligne de manuscrits. "Un travail qui aurait été impossible sans les TIC", précise Pierre-Marc de Biasi.

Pour la transcription proprement dite, la compétence du spécialiste reste indispensable. En effet, si les multiples dictionnaires et encyclopédies aident le chercheur, la familiarité de l’auteur et de son œuvre est fondamentale pour identifier un mot douteux : "L’habitude du style d’un écrivain, la connaissance de ses tics de langage mais aussi de son imaginaire se combinent comme un système de possibles et permettent de s’orienter plus vite vers la bonne solution", souligne Pierre-Marc de Biasi. Pour l’instant, aucune machine ne peut transcrire automatiquement des manuscrits, mais le directeur de l’ITEM n’exclut pas que dans l’avenir, des ordinateurs puissent effectuer ce travail : "Avec des laboratoires informatiques, nous étudions la possibilité de modéliser le fonctionnement de l’esprit humain pour apprendre aux logiciels à utiliser des connexions intellectuelles."

En attendant cette révolution informatique, les TIC vont déjà permettre de résoudre les problèmes d’édition de manuscrits. Jusqu’à présent, la reproduction de la mise en page originale se faisait en effet de manière un peu artisanale par les chercheurs. Il n'était pas simple de reproduire dans un fichier de traitement de texte classique des lignes qui pouvaient être désordonnées sur le papier, déborder sur la marge, etc. Dans le cadre du projet Optima, deux laboratoires informatiques, ceux de Rouen et de Paris Nord, travaillent à la mise au point de logiciels spécifiques capables de délimiter différentes zones d’écriture. Ceci permettrait de respecter la disposition originale du manuscrit dans sa transcription sur une page informatique. Au-delà du problème d’édition, il s’agit aussi de permettre une juste interprétation du texte, en explicitant les signes de renvois et en clarifiant l’ordre dans lequel le texte a été écrit.

Dans l’édition en ligne, la coexistence de la transcription et de l’image du manuscrit sera une garantie de la fidélité de la transcription pour le lecteur. Quant aux incertitudes, "elles seront codées par le transcripteur, ce qui rendra le travail perfectible, avance Pierre-Marc de Biasi : les futurs chercheurs pourront directement situer ces conjectures dans le texte et améliorer les transcriptions grâce aux nouveaux éléments dont ils disposeront."

L’objectif du projet Optima dépasse en outre la mise en ligne des transcriptions : grâce à l’outil multimédia, il s’agit en effet de créer une plateforme globale qui rassemblera les versions successives du texte, mais aussi la biographie de l’auteur, les documents sur lesquels il s’est appuyé pour écrire, les références à son travail dans sa correspondance, ou encore les critiques de son œuvre, de son vivant jusqu’à nos jours… "Derrière ce projet, confie Pierre-Marc de Biasi, il y a le rêve fou de la connaissance intégrale de la vie créative d’un écrivain. En tout cas, nous essayons de tendre vers cela !"

03.La BNF à l'heure de la numérisation

Bibliothèque nationale de FranceLa Bibliothèque nationale de France (BNF, site Richelieu) numérise en priorité les manuscrits les plus fragiles, afin de pouvoir les conserver au mieux. Des œuvres majeures du patrimoine seront prochainement accessibles, gratuitement, sur le site internet Gallica 2.
© Jean-Christophe Ballot / BNF
Formidable réserve du patrimoine national à travers ses multiples collections constituées au fil des siècles, la Bibliothèque nationale de France ne pouvait passer à côté de la révolution numérique. Pour la conservation des manuscrits, les microfilms qui étaient traditionnellement utilisés sont progressivement remplacés par des documents numérisés : "La production de nouveaux microfilms va s’arrêter dès l’été 2008, tandis que les microfilms existants seront numérisés", affirme Matthieu Bonicel, conservateur responsable de l'informatisation et de la numérisation au département des Manuscrits. Si bien qu’en 2014, il n’y aura plus de microfilms à la BNF.

Les avantages du numérique sont clairs : tout en offrant une meilleure qualité que les microfilms et une manipulation plus facile, les TIC permettent une diffusion extrêmement large, à distance et sans risque de détérioration. Reste tout de même une incertitude sur la durée de vie des documents numérisés et l’évolution des technologies, mais la BNF s’est équipée d’un système de sauvegarde perfectionné de façon à mettre les précieux documents à l’abri.

Pour l’instant, seule une infime partie des 200 à 250 000 manuscrits qui couvrent les 22 kilomètres de rayonnages de la BNF est numérisée. Mais des programmes ont été lancés pour accélérer ce mouvement. D’une part, les conservateurs sélectionnent les manuscrits les plus fragiles que la numérisation va permettre de mieux conserver. D’autre part, une "Galerie des Trésors" de la bibliothèque doit voir le jour fin 2008-début 2009 : entièrement accessible gratuitement sur Internet, elle présentera les manuscrits numérisés des grandes œuvres du patrimoine. Une application informatique permettra au public de "feuilleter", sur son ordinateur, les plus belles pages originales des romans de la Table ronde, des Liaisons dangereuses ou de La Chartreuse de Parme.

Pour retrouver l’intégralité des œuvres, les lecteurs n’ont qu’à se rendre sur le site de Gallica, la version numérique de la BNF qui rassemble aujourd’hui quelques manuscrits mais surtout des textes imprimés : "Les logiciels actuels savent en effet reconnaître automatiquement les caractères imprimés, explique Matthieu Bonicel. Grâce aux TIC, on peut donc désormais procéder à une numérisation de masse tout en respectant les documents." C’est ainsi qu’en décembre 2007 a été lancé le "programme des 100 000", qui prévoit de numériser 100 000 textes par an pendant trois ans. Les partenariats avec d’autres bibliothèques, comme celles du CNAM ou du Centre d’études supérieures de la Renaissance (CESR) à Tours, vont aussi être poursuivis pour enrichir la collection.

Dans le même temps, une équipe d’informaticiens et de chercheurs travaille sur une version bêta d'un nouveau site, actuellement en test. Baptisée Gallica 2, cette nouvelle version - inspirée des interfaces du web 2.0 - offre en particulier la possibilité de créer son espace personnel : outre un moteur de recherche plus performant, le portail Gallica offrira à terme la possibilité d’ouvrir gratuitement un compte et de stocker dans son panier des documents que l’on pourra télécharger, copier ou même annoter au moyen d’"étiquettes", sortes de marque-pages virtuels. Autant d’informations adaptées à chacun, qui seront conservées d’une connexion sur l’autre.

Et, alors qu'en 2004 Google annonçait son projet de numérisation de quinze millions d'ouvrages, et qu'un certain nombre de livres sont déjà disponibles sur Google Book Search, Gallica 2 s’inscrit dans le très vaste projet de la bibliothèque numérique européenne Europeana. En effet, tous les documents de la BNF ont vocation à être versés dans cette gigantesque bibliothèque virtuelle, dont une première version avec deux millions de documents verra le jour à la fin de l’année 2008. En attendant 2010, où pas moins de dix millions de documents devraient être accessibles à tous, grâce à la mise en réseau des patrimoines de tous les pays.

Restez connecté

Suivez-nous : Page Facebook Page Twitter

Lettre d'information :

Vidéo

Cette vidéo nécessite le plug-in gratuit Flash 8.
Il semble que vous ne l'avez pas.
Cliquer ici pour le télécharger

Interview de Xavier Raepsaet - La propulsion nucléaire spatiale

Portraits d'experts

  • Romina Aron Badin, les primates au coeur
  • Jacques-Marie Bardintzeff, une vie consacrée aux volcans
  • Catherine Charlot-Valdieu :  Home sweet home
  • Didier Labille, l’astronomie en amateur professionnel