Découvrabilité : Wikipédia, Wikidata et données liées

Par Communauté Avantage numérique
12 juin 2020 — Découvrabilité, Données liées, Wikidata, Wikipédia — 5 min

La découvrabilité. Un mot qui se retrouve sur toutes les lèvres dans le secteur culturel depuis quelques années. En quoi consiste la découvrabilité exactement? Selon le Grand dictionnaire terminologique, il s’agit du


potentiel pour un contenu, un produit ou un service de capter l'attention d'un internaute de manière à lui faire découvrir des contenus autres. On peut y lire également la note suivante : L'emploi, notamment de métadonnées, d'algorithmes de recherche, de mots-clés, d'index, de catalogues augmente la découvrabilité d'un contenu, d'un produit ou d'un service.

Un vaste sujet qui a été abordé lors du Forum Avantage Numérique par Jean-Robert Bisaillon, analyste sénior au pôle culture et numérique chez Espaces Temps et co-directeur du LATTICE (Laboratoire de recherche sur la découvrabilité et les transformations des industries culturelles à l’ère du commerce électronique) dans un atelier de type workshop intitulé «Activer la découvrabilité selon les principes de communs numériques».

Le LATTICE a également développé sa propre définition : 

Alors que pour plusieurs, la découvrabilité pourrait s’exprimer simplement par une rédaction web incluant les bonnes pratiques SEO (optimisation pour les moteurs de recherche) ou encore une présence soutenue et récurrente sur le web et les médias sociaux, la découvrabilité, au sens où on l’entend, va au-delà de cette perspective. Bien que non exclue, la découvrabilité se déploie au-delà de ce qui est visible sur le web. On parle plutôt de construire des données structurées, ouvertes et liées pour que le contenu soit repérable par les moteurs de recherche et lisible par les robots. Ici, entre en piste la notion de métadonnées, autrement dit les données qui documentent ou décrivent un contenu.

Un exemple vaut 1000 mots. Prenons le cas de la chanteuse Coeur de Pirate. Lorsque l’on recherche Coeur de Pirate sur Google, on peut voir dans les résultats de recherche une boîte qui contient une quantité d’informations sur Coeur de Pirate.

De quelle façon se déploie la découvrabilité?

Dans cette fiche nous retrouvons toute une série d’informations supplémentaires au sujet de Coeur de pirate qui va au-delà des résultats de recherche : photos de l’artiste, distribution de sa musique sur les différentes plateformes d’écoute, un extrait de sa fiche Wikipédia, quelques pièces musicales, la liste de ses prochains spectacles et des albums qu’elle a enregistrés. Cette fiche est produite grâce à des informations recueillies par le Knowledge Graph de Google et puisée dans Wikipédia et dans Wikidata ainsi que dans différentes sources.

Ce sont ces données documentées qui favorisent la découvrabilité sur une information dite neutre, qui n’est pas orientée par les algorithmes des résultats de recherche.

 


La découvrabilité d'un contenu se réfère à sa disponibilité en ligne et à sa capacité à être repéré parmi un vaste ensemble par un internaute qui n’en faisait pas précisément la recherche. 
— (UQAM-CEIM-LATICCE - 2019)

Alimenter Wikipédia pour favoriser la découvrabilité

Wikipédia est une grande encyclopédie universelle, alimentée par plusieurs contributeurs à travers le monde. La documentation des sources s’avère une composante importante de la crédibilité et de l’objectivité des informations contenues sur Wikipédia. En effet, comme tout un chacun peut y contribuer, il pourrait y avoir des contributeurs aux mauvaises intentions, mais heureusement, la communauté globale wikipédienne veille au grain!

Chacun peut devenir contributeur, il n’y a pas de sélection qui se fait «à l’entrée». Il suffit simplement de se créer un compte. Dès la création de votre compte, une série d’articles est suggéré afin d’adopter de bonnes pratiques de contribution. Le type de contribution est variable : enrichir une fiche existante, corriger une information incomplète ou erronée, ajouter des sources, créer une nouvelle fiche, etc. Tel qu’il a été mentionné précédemment, Wikipédia étant une source considérée par le Knowledge Graph de Google, faire partie des fiches de cette grande encyclopédie universelle est une façon de contribuer à la découvrabilité d’un contenu.

ISNI, Wikimédia, Wikidata et Shema.org pour encore plus de découvrabilité

Dans la présentation de Jean-Robert Bisaillon, il y indique que «Les données ouvertes et liées (LOD – Linked Open Data) constituent l’écosystème des connaissances librement accessibles et ré-utilisables sur lequel toutes les propositions de mutualisation de données et de découvrabilité sont fondés. Pour le philosophe, sociologue et chercheur Pierre Levy, cet écosystème fait appel à l’intelligence collective, une notion qu’il travaille à incarner dans une logique mathématique universelle : le langage IEML (Information Economy MetaLanguage)».

Au delà de Wikipédia, il y a une structure qui compose l’écosystème Wiki. À titre d’exemple, Wikimédia qui constitue une base de données de médias (photos, vidéos, images) libres de droit qui peuvent alimenter une fiche Wikipédia, mais aussi servir de document source pour une autre utilisation dans l’espace public numérique. 

Ensuite, Wikidata qui est une base de données libre, collaborative, multilingue qui collecte des données structurées pour alimenter Wikipédia pour n’importe qui de par le monde. Contribuer à cette base de données est également possible, mais demande des connaissances un peu plus poussées. Afin de faciliter la découvrabilité dans le domaine des données liées, une des premières étapes est de créer un ISNI. L’ISNI est un identifiant permanent qui permet d’inscrire les individus (artistes) et organismes culturels dans le Web des données ouvertes et liées. Ce type d’inscription est un pré-requis pour pouvoir ultérieurement faciliter la découvrabilité.  

Toutefois, il est d’abord préférable de vérifier l’existence ou non d’un ISNI pour une personne :  http://www.isni.org/search. À partir de juin 2020, il sera possible de créer un ISNI via la BAnQ : https://isni-m.oclc.org ou à isni@banq.qc.ca.

Pour pousser encore plus le loin le concept des données structurées et liées, on peut s’intéresser à la plateforme schema.org qui traite les micro-données. Les micro-données permettent de créer et d’offrir du contenu sémantique qui aide les moteurs de recherche à fournir des informations supplémentaires sur le contenu d’un site web et permettent aux robots d’indexation de mieux extraire le contenu d’un site web et de l’afficher dans un résultat de recherche par exemple. 

 

Cet exemple démontre un résultat de recherche enrichi par des données structurées sur le modèle de schema.org. La recherche vague – événements petit théâtre – donne un résultat précis et structuré sur les événements qui auront lieu prochainement* au Petit Théâtre du Vieux-Noranda.

Beaucoup d’éléments à comprendre, à apprendre, à maîtriser, mais la découvrabilité, elle se découvre petit à petit!

 

* Cet article a été rédigé avant le déploiement des règles sanitaires imposées par la COVID-19

Compléments de lecture : 

État des lieux sur les métadonnées relatives au contenu culturel, Institut de la statistique du Québec.

Métamusique, les meilleures pratiques pour activer la découvrabilité de votre musique. 

Sérenpidité – mutations, modèles et usages numériques, le blogue de Josée Plamondon,  cyberbibliothécaire et spécialiste des données.

 

Auteure : 

Marika Laforest
Conseillère numérique | Transformation – Stratégie – Médias sociaux (Consultante)
Je navigue depuis près de 20 ans dans l’univers du numérique, du web et des médias sociaux. J’ai participé activement à la planification, la gestion et l’application de différents plans stratégiques et de communications des organisations pour lesquelles j’ai travaillé, en lien avec leurs objectifs stratégiques. J’ai œuvré dans plusieurs domaines tels que les secteurs industriel, du commerce de détail, de la construction, des technologies, de l’éducation, du tourisme, de la télé et de la culture. Sur Facebook, je co-administre les communautés Les arts, la culture et le numérique ainsi qu’un groupe de Gestionnaires de communauté.