Le Blog
Gallica
La Bibliothèque numérique
de la BnF et de ses partenaires

Retour sur le Hackathon BnF 2017

0

Dans le cadre de la Semaine de l’innovation publique, la BnF a organisé son deuxième hackathon les 25 et 26 novembre 2017. Pendant 24 heures de travail non-stop, les hackathoniens ont investi le site François-Mitterrand pour développer 8 projets autour du thème de la musique à partir des données fournies par la BnF et ses partenaires pour l’événement, Deezer, la Sacem, l'Ina ou le projet Doremus

Hackathon BnF 2017 ; copyright Laurent Julliand/BnF

 
À l’issue des restitutions des projets, le prix du hackathon BnF a été remis à l’équipe Musiviz, qui a développé un prototype offrant une visualisation enrichie des documents sonores de Gallica.

Retour en détail sur cet événement en compagnie de quatre experts mobilisés pendant ce week-end pour accompagner les hackathoniens : Aude Le Moullec-Rieu, adjointe à la cheffe de produit data.bnf.fr au département des Métadonnées de la BnF, Jérôme Dupont, ingénieur au Département des Systèmes d’information de la BnF, Valère Etienne, coordonnateur de la numérisation au Département de la Musique de la BnF et Mickaël Arcos, ingénieur chez Deezer.  

 
Qu'avez-vous pensé de cette deuxième édition du hackathon BnF ?

Aude Le Moullec : L’enjeu était de dépasser l’effet de nouveauté de la première édition et j’ai été ravie de constater que la dynamique autour de l’événement s’établissait dans la durée. La grande nouveauté était l’organisation de conférences et d’ateliers, pour toucher tous nos publics sur le thème des données, et je regrette de ne pas avoir pu en profiter parce que j’étais accaparée par les questions des hackathonien·nes. De notre côté, nous avons consolidé ce que nous avions déjà mis en place l’année dernière pour l’assistance des hackathonien·nes, avec l’ouverture du portail api.bnf.fr, qui recense tous les accès à nos web services et leur mode d’emploi et centralise nos jeux de données téléchargeables. Les premiers retours confirment que l’utilité de ce portail dépasse largement le cadre de l’événement !

Valère Etienne : C'était une nouvelle réussite, incontestablement ! Les participants se sont mobilisés pendant 24h d'affilée dans une ambiance à la fois sérieuse et festive autour de projets qui se sont tous avérés inventifs, intéressants et aboutis. Dès leur accueil dans l'enceinte de la BnF le samedi après-midi, nous avons été frappés de voir comment le dialogue s'est vite engagé entre eux et comment leurs idées, nombreuses, se sont partagées et ont permis la constitution des équipes. Certains hackathoniens étaient d'ailleurs déjà présents lors de l'édition 2016 et donc bien rôdés à l'exercice. L'expérience de l'année dernière nous a bien servi pour anticiper le déroulement des 24h et savoir comment accompagner les participants, et, surtout, l'engagement du personnel BnF avant et pendant l'événement a encore une fois été décisif.
Il faut souligner que le hackathon 2017 a été en plus un succès public : les animations organisées en parallèle de l'événement (ateliers et conférences autour des outils et des collections numériques de la BnF, concerts, rencontres) n'ont pas désempli et le public, qui n'a pas hésité à s'approcher des tables où étaient installés les hackathoniens, a paru très intéressé par le spectacle. On aura rarement vu une telle effervescence en l'espace d'un week-end dans les deux halls de François-Mitterrand !

Jérôme Dupont : Très bien. Tous les projets ont réussi à mener leur idées à terme, avec leurs moyens, même les équipes sans développeur !
 
Mickaël Arcos : La BnF est un merveilleux écrin pour avoir des idées, créer et échanger. C'est par essence un lieu d'échange, et à fortiori d'échange d'information de données. Le hackathon s'est parfaitement intégré dans cette verve et a été très bien orchestré par les différents personnels, des plateaux repas à l'élection du projet lauréat. Nous en gardons un souvenir très positif.
 

Les hackathoniens ont-ils été inspirés par le thème choisi cette année, la musique ?

Jérôme Dupont : Oui plutôt. Et dans des directions complètement différentes pour chaque projet.

Valère Etienne : Manifestement, oui ! Le thème était suggéré et non imposé, mais toutes les équipes l'ont suivi et ont conçu des projets qui portaient sur nos collections musicales. Les participants tendaient à avoir ce double profil de férus d'informatique et de musiciens, le public était donc cette fois un peu plus ciblé ; cela explique peut-être que le nombre de participants n'ait pas énormément progressé par rapport à l'an dernier, mais en contrepartie des affinités étaient là d'emblée entre eux avec ce thème qui les passionnait tous et leur a permis de se réunir d'autant plus facilement autour de projets communs.
L'idée, de notre côté, était de mettre en valeur l'ensemble des collections musicales de la BnF, extrêmement riches et diverses et qui ne sont pas forcément les plus connues (même si certains des hackathoniens les connaissaient remarquablement bien !). De ce point de vue l'opération a été réussie puisque les projets développés ont tenu compte à la fois des deux grands ensembles que sont nos fonds de partitions et nos collections audio (y compris sur des documents rares comme les Archives de la Parole, qui constituent le cœur historique des collections sonores de la BnF).
Beaucoup de partenaires ont en plus été partie prenante de l'événement autour de ce thème et présents sur les lieux : l'INA, la Sacem, Deezer, notamment, qui ont été fréquemment sollicités par les hackathoniens et leur ont donné des conseils et des idées souvent déterminants.

Mickaël Arcos : Oui, absolument. Tous les projets y étaient liés et on a retrouvé des thèmes phares associés à des usages très bien définis. Il ne s'agissait pas que de technique ou que d'idées de produit, mais bien une association des deux.

Aude Le Moullec : Il n’y avait aucune obligation pour les participant·es à se saisir du thème de la musique, et pourtant tous les groupes se sont appropriés le thème avec beaucoup d’inventivité. Le choix d’un thème est aussi une chance pour nous de mieux cibler la préparation en amont et de mettre en avant des collections – pas nécessairement « musicales » - et les données qui les décrivent. Pour ce travail, la connaissance des collections et la recherche de passerelles entre ces dernières sont essentielles et la sollicitation du réseau des correspondant·es hackathon dans chaque département de collections indispensable. Cette préparation reste un travail ingrat, parce qu’à l’aveugle, mais très riche, puisqu’il engage un dialogue entre ceux et celles qui connaissent les données parce qu’ils ou elles participent à leur production et ceux et celles qui connaissent les technologies pour diffuser ces données et aident les hackathonien·es à se les approprier.
 

Parmi les projets présentés, y en a-t-il un qui vous a particulièrement intéressés ?

Aude Le Moullec : Je pense que le projet « Tous au concert », à savoir partir d'une programmation de concert à la Philharmonie de Paris ou Radio-France et découvrir l'environnement des œuvres musicales qui y sont jouées, répond à un vrai cas d’usage et que l’exploitation des données est riche, ambitieuse et pertinente. Les données de la programmation des concerts ont été produites dans le cadre du projet DOREMUS, auquel participe la BnF. Il est possible de récupérer les liens des œuvres jouées vers les notices de la BnF, pour récupérer certaines informations dans data.bnf.fr en exploitant la structure des données liées. Cela permet d’offrir la lecture d’extraits sonores depuis Gallica, mais également de renvoyer vers les extraits des journaux qui parlent de l'œuvre en question au moment de sa création. Les alignements fournis par data.bnf.fr permettent d’enrichir la navigation par des informations de Wikipedia ou de base plus spécialisée comme MusicBrainz. L’enjeu est enfin d’utiliser les identifiants comme pivot pour faire le pont avec des applications plus grand public comme Deezer. Je suis particulièrement intéressée par ces croisements qui mettent en valeur la richesse de nos données à l’extérieur du monde des bibliothèques.

Mickaël Arcos : J'ai également beaucoup aimé l'augmentation des programmes de concerts de la Philharmonie. Au concert, la Philharmonie propose des programmes papier d'excellente qualité, très bien documenté et d'une grande pertinence musicologique. En revanche, sur le web c'est assez léger. Assembler les différentes sources pour enrichir le programme est une idée astucieuse. C'est selon moi une étape intermédiaire de choix pour qu'un musicologue éditorialise et enrichisse ensuite manuellement ces données par exemple, en imaginant un produit fini pour la philharmonie ou pour toute salle de programmation de concert.
La lecture automatique de partition par ORM développée par l'équipe RIM (Recherche intelligente musicale) est un sujet extrêmement bien identifié pour une collection de partitions en ligne, en particulier pour des ouvrages qui ne sont pas forcément enregistrés au disque, ou difficile à trouver. Parcourir des partitions sans les "entendre" paraîtrait presque archaïque après la présentation d'un tel projet.

Valère Etienne : J'en retiendrai plusieurs, dont le projet RIM (Recherche intelligente musicale), qui visait à ajouter à Gallica un dispositif d'OMR (reconnaissance optique des caractères musicaux) permettant de transposer sous forme codée toutes les partitions numérisées présentes dans la base, pour en obtenir par exemple une exécution audio instantanée. Il se trouve que nous réfléchissions depuis quelques temps à la possibilité d'un tel système et aux moyens techniques de le réaliser, et le fait de voir que cette idée est partagée et correspond aux aspirations des utilisateurs est tout à fait encourageant pour nous.
Je pense aussi à l'équipe Galligames, qui proposait de développer un ensemble de jeux mono ou multijoueurs autour des enregistrements sonores de Gallica : quizz, blind test, jeu  de course permettant de faire jouer les pistes audio au rythme du déplacement de son personnage, etc. Cette approche plus ludique et détendue des collections était bienvenue, et l'équipe a réussi à mettre au point dans le temps qui lui était imparti une version prototype de l'application, que le jury et le public ont eu le plaisir de tester au moment de la présentation finale.

Jérôme Dupont : La lecture sonore des partitions musicales, qui, même si elle ne remplacera jamais l'interprétation par un vrai musicien, est bluffante techniquement.
 

Qu'avez-vous pensé du projet primé ?

Valère Etienne : Après une longue concertation, le jury a retenu le projet Musiviz : cette équipe proposait d'ajouter une dimension visuelle aux enregistrements musicaux présents dans Gallica, sous la forme à la fois d'un spectrogramme constitué à partir de la piste audio (et propre à donner des informations immédiatement visualisables sur le morceau : rythme, fréquence, intensité sonore, etc.) et d'un kaléidoscope formé d'autres documents de Gallica en rapport avec la musique que l'on écoute : partitions, portraits et images, articles de presse...
C'était un projet équilibré, raisonnablement ambitieux, qui faisait un usage pertinent des outils de la BnF (dont certains encore trop peu connus, comme la base data.bnf.fr conçue pour mettre en relation l'ensemble de nos données par l'intermédaire de liens sémantiques), et techniquement réalisable – un critère important dans la mesure où la BnF s'engageait à développer le projet qui serait récompensé. Je pense que le choix du jury a été bon, même si, bien sûr, il était regrettable de ne devoir retenir qu'un projet au détriment des autres, tous de grande qualité !

Mickaël Arcos : C'est un choix logique pour la BnF et il récompense le projet qui a été le plus loin et le plus convaincant dans l'association des données, de la technique et du produit. J'ai beaucoup aimé la visualisation dynamique de contenus associés, comme les images. En réalisant le projet, la BnF va véritablement enrichir ses pages musicales. C'est un excellent choix, et l'équipe a été impressionnante dans l'appropriation du sujet.

Jérôme Dupont : La question d'avoir le pendant de la vignette pour les document sonores pour avoir une première appréhension visuelle de leur contenu apporte un vrai plus. De même, faire défiler des images des collections Gallica autour d'un document sonore est intéressante.

Aude Le Moullec : Le projet primé présente toutes les qualités : le prototype réalisé en peu de temps est déjà fonctionnel, il offre une augmentation de la navigation dans les collections ainsi valorisées, et a pour ambition l’enrichissement de données grâce à un autre mode de visualisation. L’enjeu pour nous est désormais de prendre le temps pour enrichir le service, en raffinant l’utilisation des données au-delà de ce que permet un développement en 24h.
 

De quelle manière allez-vous réutiliser certaines des idées de ce hackathon dans votre travail ou vos projets futurs ?

Aude Le Moullec : Bien sûr je suis intéressée par les idées de services à construire à partir des données de la BnF, qui sont une source d’inspiration. Mais, au sein des services de diffusion des métadonnées, nous sommes encore plus intéressé·es par le contact direct avec les réutilisateur·es de nos données que permet le hackathon. Même si nous en connaissons déjà certain·es, celui que nous créons avec ces réutilisateur·es est simple et concret. Nous avons aussi des questions de personnes qui utilisent déjà nos données pour d’autres projets et n’avaient pas encore osé ou pris le temps de nous contacter. Nous avons essayé d’observer comment les hackathonien·nes s’appropriaient nos données et les technologies pour les récupérer, pour améliorer ce que nous proposons déjà, en termes de contenus et de documentation.

Valère Etienne : D'une façon générale, nous avons pu constater que les idées des hackathoniens allaient souvent dans le même sens que les réflexions et les efforts que nous menons à la BnF depuis un certain nombre d'années maintenant – et qui sont dans l'air du temps : décloisonnement des catalogues et des bases de données, mise en conformité de nos données avec l'architecture du Web sémantique qui permet leur mise en lien, leur partage et leur intégration au big data, etc. Beaucoup des projets proposés fonctionnaient selon ce principe, ce qui tend à nous conforter dans nos efforts tout en nous soufflant de précieuses idées pour leur mise en forme.
Bien sûr, ce hackathon aura superbement mis en valeur nos collections musicales mais les idées qui ont germé pendant ces 24h pourront trouver à s'appliquer aux collections de la BnF dans leur ensemble. Nous avons eu la confirmation que nos idées étaient partagées par les utilisateurs et correspondaient aussi à des aspirations de leur côté. C'est dans ces circonstances que l'on a le sentiment que les choses sont prêtes à évoluer. Le rendez-vous est pris pour l'année prochaine !

Jérôme Dupont : Ne travaillant pas sur Gallica, je ne suis pas forcément concerné. Par contre, voir leur façon d'utiliser l'api de data donne des idées pour la  rendre  plus accessible aux réutilisateurs des données de la BnF.

Mickaël Arcos : J'ai beaucoup appris sur les données que manipulent les institutions culturelles, à la fois sur leur contenu, leur quantité, leur manière de stockage et leur requêtage. Deezer est un acteur issu de l'industrie et a aidé les projets à s'interfacer avec son API, dont les données sont structurées et servies différemment. Nous avons été agréablement surpris de voir que les participants se sont emparé de cet outil aussi bien que ceux des institutions, ce qui confirme qu'ils sont complémentaires et fonctionnent bien ensemble. Certaines informations sont plus ou moins accessibles chez nous, et plus ou moins importantes. Le hackathon de la BnF nous a permis de les remettre en perspective et d'identifier lesquelles pourraient et devraient être alignées avec d'autres données dans le but que notre produit reste à la pointe et soit aussi inventif que les projets issus de ce hackathon.

 

L'équipe Musiviz, lauréat du Prix du Hackathon 2017 ! copyright Laurent Julliand/BnF

Ajouter un commentaire

Plain text

  • Aucune balise HTML autorisée.
  • Les adresses de pages web et de courriels sont transformées en liens automatiquement.
  • Les lignes et les paragraphes vont à la ligne automatiquement.