Paroles de Gallicanautes

0
1 janvier 2013

L'été dernier, vous avez été très nombreux à participer à l'enquête d'usage et de satisfaction de Gallica, et nous vous en remercions ! Les résultats de cette enquête sont aujourd'hui disponibles sur le site bnf.fr : vous pouvez les consulter ici.

Le questionnaire mis en ligne au mois de juin 2011 a suscité près de 4 000 réponses accompagnées pour la plupart de commentaires détaillés dont nous donnons ici des extraits. Souvent enthousiastes, parfois critiques, toujours passionnées, vos remarques et suggestions ont montré que, si vous êtes largement satisfaits de l'offre de Gallica, vous manifestez de fortes attentes sur différents plans. La recherche dans les collections numérisées, l'explicitation de la politique de numérisation de la BnF ou encore le téléchargement et la visualisation des documents constituent selon vous autant de points à améliorer. Nous en tiendrons compte dans les évolutions à venir de votre bibliothèque numérique.

Le moteur de recherche

"Bonjour, j'utilise souvent Gallica que je recommande, pour mes recherches historiques. Mais je trouve que le moteur de recherche n'est pas sélectif lorsque l'on met plusieurs mots"

"Dans le moteur de recherche simple, on me permet de chercher un mot, puis d'en chercher un autre dans les résultats trouvés. Je voudrais chercher un mot, puis en exclure un dans les résultats trouvés. Merci."

"La "recherche simple" manque de souplesse et la "recherche avancée" est complexe. Apparemment, il manque un stade intermédiaire permettant de rechercher simplement plusieurs mots combinés (X et/ou Y). Si cette fonction existe, elle n'est pas facile à trouver et devrait donc être mieux signalée."

La pertinence du moteur de recherche actuel de Gallica fait l'objet de réserves récurrentes de la part des Gallicanautes qui s'expliquent en partie par le fait qu'une requête simple suscite une recherche d'occurrence à la fois dans les métadonnées des documents (titre, auteur, notice, etc.) et dans le plein texte des documents quand ceux-ci sont disponibles en mode texte. Certaines pistes avancées dans vos commentaires, telle une recherche "intermédiaire" permettant de choisir, à partir de la barre de recherche de la page d'accueil, le champ sur lequel porterait la requête (auteur, titre, notice, plein texte), vont être étudiées.

Vous êtes nombreux à mentionner à ce sujet les moteurs de recherche comme Google ou Bing. Ces moteurs, qui ont pour ambition d'indexer l'ensemble du web, privilégient certains contenus au détriment d'autres : ils tiennent compte à la fois de l'historique des recherches effectuées sur un sujet donné et de la popularité des contenus consultés. Le moteur de recherche de Gallica n'a pas vocation à s'aligner sur ces pratiques et à favoriser certains documents plutôt que d'autres.

Reste que son efficacité doit être améliorée, notamment dans les requêtes contenant des séquences de mots : pour cela, la BnF travaille depuis mars 2011 avec la société Exalead afin de développer un nouveau moteur de recherche pour Gallica. Celui-ci permettra d'améliorer la pertinence des listes de résultats ; il offrira en outre des fonctionnalités avancées (aide à la saisie, suggestions de correction orthographique, élargissement de la recherche, etc.). Vous serez invités d'ici quelques semaines à tester ce nouveau moteur de recherche sur une plateforme provisoire, avant son intégration définitive dans Gallica fin 2012.

L'enrichissement de l'offre numérisée et la politique de numérisation

"Je suis un fan de Gallica. Je souhaite que vous continuiez à enrichir votre offre (livres anciens, presse, manuscrits). J'aimerais que vous numérisiez davantage d'éditions originales, davantage de recueils bibliographiques (Bulletin du bibliophile, par exemple)."

"Gallica is a fantastic resource for academics. My only complain is that there are far too few manuscripts."

"Beaucoup plus d'images s'il vous plaît (les dessins, les estampes, les cartes)."

"Il faut poursuivre absolument la numérisation des fonds de presse de la BnF. Le travail effectué est un bon début, mais il est encore trop partiel. Il manque des titres fondamentaux du XIXe siècle comme L'Eclair, Le Journal ou la Libre Parole. Publiez le programme de numérisation  !"

Vos commentaires le montrent, il y a autant de souhaits en matière de numérisation des collections qu'il y a de Gallicanautes ! Aussi est-il difficile de répondre à tous les désirs... Néanmoins, dans vos contributions, la numérisation de la presse, des manuscrits et des images est évoquée de façon récurrente.

Pour ce qui est de la presse : les différentes campagnes de numérisation de masse initiées par la BnF au milieu des années 2000 ont permis d'accroître considérablement la présence de la presse dans Gallica, riche aujourd'hui de plus de 1 200 titres. Le programme de numérisation de la presse, qui a été lancé en 2005 et qui se poursuit aujourd'hui, permet notamment l'accès à plusieurs dizaines de quotidiens nationaux et régionaux. Le nombre de titres de presse disponibles dans Gallica va continuer à s'enrichir dans les années qui viennent. Un point sur les collections de presse dans Gallica sera prochainement mis en ligne sur ce blog ; en attendant, vous pouvez visiter sur le site de la BnF l'exposition virtuelle consacrée à la presse ou consulter le numéro spécial presse de Chroniques.

Pour ce qui est des manuscrits, des livres rares et précieux et des images (estampes, photographies, cartes) : le programme de numérisation des collections dites "spécialisées", lancé fin 2009, a déjà permis de faire entrer dans Gallica de nombreux trésors des départements des Manuscrits, des Estampes et de la Photographie, des Cartes et plans et de la Réserve des livres rares de la BnF. Ce programme se poursuit aujourd'hui et se traduit par la mise en ligne, chaque semaine, de plusieurs centaines de documents précieux (pour être avertis des nouvelles mises en ligne, vous pouvez souscrire aux fils RSS de Gallica).

Par ailleurs, les grands axes de la politique de numérisation ainsi que les différents marchés en cours gagneraient, comme vous le suggérez, à être davantage présentés aux Gallicanautes. Nous allons en tenir compte !

L'orientation au sein des collections numérisées

"Le principal défaut de Gallica fait partie de ses qualités: on est un peu perdu dans la masse de ce qui est proposé. Peut-être lier davantage, ou une sorte de page annuaire, sobre, de simples liens qui recensent le contenu."

"Ce qui manque le plus à Gallica est pour moi un accès "rayonnage", qui puisse permettre de réellement flâner dans le fonds documentaire."

"Gallica est un bel outil mais il y a des marges de progrès pour rendre plus simple l'accès aux documents : dans l'ancienne version je parvenais facilement à trouver les manuscrits enluminés désormais je n'y arrive plus par exemple, je me souviens de parcours de découverte thématiques aussi."

La croissance rapide du volume des collections numérisées, passées de 160 000 documents en 2005 à plus de 1, 7 million aujourd'hui, a radicalement changé la bibliothèque numérique et l'approche que ses premiers utilisateurs pouvaient en avoir. Aujourd'hui, vous êtes nombreux à souhaiter l'instauration de repères au sein de cette masse documentaire en constante augmentation qu'est Gallica.

La refonte prochaine de la page d'accueil prendra en compte la nécessité de donner un accès clair aux différents corpus, collections et fonds qui constituent Gallica. Par ailleurs, certains dossiers font actuellement l'objet d'un travail de remaniement complet, tant sur le fond que sur la présentation. Ces projets s'inscrivent dans un chantier plus large, celui de l'éditorialisation de Gallica, qui vise à permettre la valorisation des collections numérisées au sein de la bibliothèque numérique.

La consultation des documents en ligne

"Améliorer la lecture des documents en ligne (mauvaise adaptation à l'écran, possibilité de tourner les pages avec le clavier)."

"Quand on veut changer de page d'un document, cela prend beaucoup de temps. Ne serait-il pas possible de faire une présentation qui "descende", comme quand on lit un pdf ? En tout cas, j'ai toujours trouvé les documents dont j'avais besoin, et c'est formidable quand on n'est pas de Paris."

"Il faut absolument que vous trouviez un moyen pour que la consultation des ouvrages avec le lecteur Flash consomme moins d'énergie, car sur un portable, la batterie est précieuse."

"J'aimerais une visualisation avec une meilleure résolution pour la presse, les images. Un bouton "Haute résolution" pour avertir d'un temps de chargement plus long."

Gallica propose actuellement trois visualiseurs différents pour la consultation des documents : le visualiseur simple (qui permet d'afficher le document en mode normal ou en mode mosaïque), le visualiseur Flash (qui permet de feuilleter le document en double page, de le consulter avec un ascenseur vertical ou d'en avoir un aperçu en mode mosaïque) et le visualiseur JPEG 2000 (qui permet de zoomer dans le document et d'exporter une sélection d'image en haute résolution). La mise en place de ces différents visualiseurs s'explique par la présence dans Gallica de types de documents variés auxquels correspondent différents modes de consultation (le zoom en JPEG 2000 permet ainsi, par exemple, une meilleure visualisation des documents de grand format comme la presse quotidienne ou les cartes anciennes).

L'évolution récente des formats de données du web, avec le développement du langage HTML5, permet aujourd'hui d'envisager, à moyen terme, l'implémentation dans Gallica d'un visualiseur unique qui permettrait d'optimiser la navigation au sein des documents, quel que soit leur format d'origine. On pourrait alors aussi bien feuilleter un document (au clic, avec les touches du clavier ou avec le doigt sur les supports tactiles) que le dérouler avec un ascenseur vertical, zoomer sur certains de ses détails en bénéficiant d'une haute résolution d'image, etc. Plusieurs solutions sont actuellement à l'étude.

Le mode texte et l'océrisation

"Merci à Gallica - que je fréquente depuis longtemps - d'apporter toutes ces pages en accès libre à ma faim gargantuesque, sans me déplacer... Je parle de Gallica autour de moi, toujours en disant "à la BnF, j'ai trouvé....". Un défaut, pas suffisamment d'ouvrages anciens en mode texte correct."

"Je souhaiterais que les OCRisations soient plus systématiques, en particulier dans les ouvrages et périodiques anciens (XIXe siècle)."

"La presse ancienne OCRisée est une mine aux trésors !"

"More OCR texts that can be downloaded for annotating on own computer, snipped for taking notes on own computer, searched, etc."

Vous êtes nombreux à demander davantage de documents accessibles en mode texte, en particulier lorsque vos recherches vous conduisent à consulter la presse. Quand la BnF a entamé la numérisation d'imprimés au début des années 1990, les techniques de conversion automatique par reconnaissance optique de caractères (OCR), étaient peu satisfaisantes ; aussi la numérisation s'est-elle d'abord effectuée uniquement en "mode image". Ces techniques ont progressivement évolué et ont été prises en compte au fur et à mesure dans le processus de numérisation adopté par la BnF ; aussi Gallica est-elle aujourd'hui le produit de strates technologiques successives qui se traduisent par des différences qualitatives au sein de la masse documentaire.

Désormais, pour ce qui concerne les imprimés, la numérisation se fait en couleurs et en 400 dpi, avec un taux de reconnaissance de caractères de l'ordre de 98,5% (au mot). 20% des documents bénéficient d'un traitement de l'OCR en haute qualité (99,9% au mot). Parallèlement, la BnF a lancé un marché d'océrisation rétrospective (conversion en mode texte de documents déjà numérisés en mode image) qui permettra, à terme, de répondre en partie aux souhaits que vous exprimez.

Les documents numérisés dans le cadre des précédents marchés de numérisation peuvent donc comporter un certain nombre d'erreurs au sein du plein texte. Un tri par qualité du mode texte vous permet de faire apparaître au début de la liste des résultats les documents dont le mode texte est de meilleure qualité - mais il faut garder à l'esprit que le mode texte a été adopté au départ pour faciliter la recherche dans le plein texte et non pour permettre la lecture suivie des documents dans Gallica.

Le téléchargement des documents

"Si vous pouviez amener la qualité des documents téléchargés au niveau de celle des documents consultés ce serait formidable."

"Il serait intéressant de pouvoir télécharger les documents numérisés dans des formats moins lourds que le .pdf ; certains docs (Archives Parlementaires par ex.) pèsent près de 100mo."

"I'm a librarian and Gallica is a lifesaver to me for personal research in 19th-c French literature, but it took me awhile to learn how to download and save.  I haven't figured out how to download color digital books that you now have - tried but it failed.  Merci bien !"

"A mon avis, un point noir est l'impossibilité de télécharger en haute résolution des images comme des estampes (sans droits d'auteur)."

Les remarques liées au téléchargement des documents de Gallica reviennent fréquemment dans vos contributions et montrent que vous êtes nombreux à utiliser Gallica pour constituer votre propre bibliothèque numérique. Plusieurs points sont abordés dans vos commentaires :
-la question du téléchargement des images, des cartes et des enregistrements sonores : la BnF a fait le choix de ne pas favoriser le téléchargement des enregistrements sonores, ainsi que celui des images et des cartes en haute résolution. Vous pouvez commander un tirage des documents ou le fichier numérique en haute définition auprès du département de la Reproduction de la BnF. La mise en place du zoom en JPEG 2000 vous permet par ailleurs d'exporter des détails extraits d'images en haute résolution à partir de cartes, d'estampes ou de photographies.
-la question des problèmes rencontrés lors du téléchargement de certains documents : nous sommes conscients du fait que certains d'entre vous rencontrent, pour des raisons diverses, des difficultés avec le téléchargement des fichiers de Gallica. Ce point fait partie des éléments actuellement à l'étude au sein de l'équipe Gallica : nous vous en dirons plus sur ce blog prochainement.

La prise en compte des nouveaux supports de lecture

"Je voudrais pouvoir télécharger vos documents ou les lire sur mon iPhone ou mon iPad. Merci de me faire savoir si c'est possible et quand ?"

"Je souhaiterais vous voir développer un fonds de numérisation en format epub. Je suis presque entièrement passé à la lecture sur liseuse depuis que j'en ai une. Merci encore et longue vie à Gallica !"

"Cher Gallica, mon plus grand souhait pour l'avenir, serait de pouvoir utiliser le format epub sur tous les documents numerisés de Gallica, pour des raisons pratiques d'utilisation comme les tablettes de toutes tailles. Les seuls formats PDF ou texte sont insuffisants. Merci et vive le savoir !"

"J'attends avec impatience une application pour l'Ipad qui est un formidable outil de lecture."

L'essor récent des supports mobiles de lecture (smartphones, liseuses, tablettes), invite à adapter la bibliothèque numérique à ces nouveaux usages, tant en termes d'interface qu'en termes de formats de téléchargement des documents.

Les nouveaux outils que sont les liseuses et les tablettes exigent des formats de fichiers plus souples que les formats PDF, JPEG ou txt que Gallica mettait jusqu'à présent à disposition des internautes. Des fichiers en format epub (format particulièrement adapté à la lecture sur tablette) ont récemment fait leur entrée dans Gallica. Cette offre, limitée aujourd'hui à 159 livres, est amenée à s'enrichir : 20 % des livres numérisés par la BnF dans les mois à venir seront ainsi disponibles dans ce format de téléchargement.

Par ailleurs, la BnF travaille actuellement au développement d'une application Gallica pour tablettes et smartphones. Cette application sera disponible à l'automne 2012 sur l'App Store et à la fin de l'année 2012 sur le marché Android.

N'hésitez pas à nous faire part de vos remarques et suggestions concernant Gallica sur ce blog, en vous adressant à gallica@bnf.fr ou en nous contactant sur les réseaux sociaux via la page Facebook et le fil Twitter de Gallica !

Publié initialement le 24 avril 2012.