Nouvelle fonction pour Gallica : Le rapport de recherche

0
Publié par Matthieu Gioux le 9 janvier 2017 dans Services et nouvelles fonctionnalités

Une nouvelle fonctionnalité est désormais en ligne dans Gallica : le rapport de recherche. Elle permet d’améliorer le dépouillement des résultats d'une recherche.

Le rapport de recherche a pour vocation de faciliter le traitement des résultats du moteur de recherche. Il permet :

  • de visualiser dans de petites portions de page ("snippets") l'ensemble des occurrences d'un mot dans un document

02_rapp_texte.jpg

  • d'exporter ce rapport en PDF ou CSV pour l'imprimer, le conserver et retravailler sur celui-ci régulièrement.

Le rapport de recherche est mis à disposition pour chaque document ou groupe de documents (périodiques, ouvrages multi-volumes)  via la fonction « Voir tous les extraits dans le rapport de recherche ».

01_rapp_clic.jpg

Il est aussi accessible pour l'ensemble d'une recherche via l'onglet "exporter" et la fonction "Votre rapport de recherche vous sera fourni au format HTML et pourra être exporté au format .pdf ou .csv"

exporter.jpg

Plusieurs aspects doivent être notés :

  • Le document doit être accessible dans Gallica. Les documents dits « moissonnés » et donc consultables sur un autre site ne sont pas concernés par cette fonctionnalité.
  • Le rapport est disponible seulement si le moteur de recherche trouve des occurrences de la requête dans le texte « océrisé », les tables des matières (ou index) et les légendes des documents. Les données bibliographiques ne sont pas concernées.
  • Plus la recherche sera précise, plus le rapport de recherche sera efficace. Dans le cas d’un très grand nombre de résultats, l'utilisation  de la recherche avancée de Gallica pour affiner les critères sera utile.

 

Un cas d’usage grâce à la recherche avancée permet de faire des recherches ciblées.

 

Dans Le petit parisien, le Gallicanaute recherche les occurrences d’abracadabra entre 1910 et 1920

abracadabra.jpg

Lien vers la recherche

Rapport de recherche

abracadabra2.jpg

 

Le rapport peut être exporté au format PDF et CSV. Dans le cas de résultats avec plusieurs documents, l’export est limité à 50.  

Dans le cas du PDF,  il y a plusieurs usages possibles :

  • Le rapport peut être imprimé
  • Grâce aux liens interactifs du fichier vers les documents Gallica, le fichier peut être conservé et éventuellement annoté.

Attention : c'est une fonctionnalité nouvelle, en fonction du nombre de résultats de la recherche, l’export peut être long.

Dans le cas de l'export CSV, le fichier créé permettra de compter le nombre d'occurrences dans le document ou le groupe de documents sélectionnés.

Par exemple, combien y a-t-il d'occurrences du mot "poisson" dans Les travailleurs de la mer de Victor Hugo ?

Recherche

Rapport de recherche

Réponse : 14 occurrences de "poisson"

Dans ce cas, la recherche doit être effectuée pour les différentes formes du mot (comme le pluriel qui n'est pas pris en compte avec les guillemets). Il faut être vigilant aux éventuelles erreurs liées à la qualité de reconnaissance de texte (OCR) qui peuvent donner un résultat inexacte. C'est une estimation.

Cette première version sera améliorée au fil des prochains mois et proposera de meilleures performances et des fonctionnalités nouvelles.

 

Ajouter un commentaire

Plain text

  • Aucune balise HTML autorisée.
  • Les adresses de pages web et de courriels sont transformées en liens automatiquement.
  • Les lignes et les paragraphes vont à la ligne automatiquement.