>   Accueil   >   Aide en ligne

Quelles sont les technologies de développement utilisées ?

Le site Gallica 2 est développé en technologie J2EE (Java 2 Enterprise Edition) avec, pour certaines briques, des logiciels libres.

Quel est le moteur de recherche utilisé ?

Gallica 2 utilise pour outil de recherche un logiciel libre de la fondation Apache, Lucene.

Ce moteur dispose d'un certain nombre de fonctionnalités nouvelles : la recherche plein texte, la recherche dans les notices, le classement des résultats. D'autres fonctionnalités, recherche avancée, opérateurs booléens, outils sémantiques, seront mises en oeuvre progressivement dans les versions successives de Gallica 2 (pour en savoir plus, voir Quel est le rapport avec Gallica ? et Quel est le rapport avec Europeana ?).

Comment les documents sont-ils numérisés ?

Les documents de la Bibliothèque nationale de France sont numérisés par des entreprises privées dans le cadre de marchés publics passés avec la BnF.

Les formats de numérisation demandés par la BnF dans sa charte technique de numérisation sont :

  • le TIFF noir et blanc compressé pour les imprimés en mode image.
  • le TIFF niveaux de gris ou couleurs, ou le JPEG niveaux de gris ou couleurs, pour les pages d'illustration.
  • le XML pour la version OCR et les tables des matières.

La résolution n'est jamais inférieure à 300 dpi.

Ces formats sont ensuite transformés pour la consultation dans Gallica 2 : la consultation en mode image se fait au format PNG, la consultation en mode texte en HTML, et le téléchargement et l'impression au format PDF (image et texte).

Quel est le format de description des documents ?

Les documents sont décrits selon le format de métadonnées Dublin Core simple.

Pour les ouvrages numérisés par la BnF, ces données descriptives sont disponibles sur le serveur "Collections numériques" de la BnF où elles peuvent être téléchargées en XML selon le protocole OAI-PMH (Open archive initiative-Protocol for metadata harvesting).

Par exemple, les données descriptives de l'ouvrage portant l'identifiant ark:/12148/bpt6k1097542 dans Gallica 2 sont accessibles à l'adresse URL :
http://oai.bnf.fr/oai2/OAIHandler ?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:bnf.fr:gallica/ark:/12148/bpt6k1097542.

Ces données sont réutilisables dans les conditions fixées par le protocole OAI-PMH, en particulier en mentionnant la provenance ("Bibliothèque nationale de France").