Peut-être tout d’abord quelques définitions pour pouvoir comprendre et essayer de déplacer ce débat.
On parle de folksonomie quand l’annotateur n’est pas contraint à une terminologie prédéfinie mais qu’il adopte les termes qu’il veut. Elle est liée à l’effet communautaire : tout le monde peut contribuer et voit les contributions des autres participants. C’est d’une utilisation facile, multidirectionnelle. C’est une indexation qui est peu coûteuse. Elle permet à l’internaute qui indexe de mettre du contenu sur le Web et de partager aussi ses opinions. Le consensus entre les différents contributeurs n’est pas nécessaire puisque elle est centrée non pas sur le document indexé mais sur le contributeur et l’utilisateur. D’une certaine manière, la folksonomie permet d’observer les habitudes des internautes : quels mots choisissent-ils pour trouver leur information ?
Un thésaurus, par contre, est une liste organisée de termes contrôlés et normalisés. Ces termes sont reliés entre eux par des relations de synonymie, de hiérarchie et d’association. Les termes, une fois sélectionnés, ne peuvent être modifiés. L’indexation ne dépend plus de la culture de l’annotateur. Mettre en place un thésaurus, c’est mettre en place une certaine homogénéité. Un thésaurus sert aussi dans la phase d’interrogation de l’utilisateur puisqu’il doit utiliser ces mots-clés pour pouvoir retrouver l’information. S’il en utilise d’autres, il est renvoyé vers la liste prédéfinie.
Un thésaurus comprend, pour faire simple, trois type de termes :
- le descripteur, qu’on utilise pour l’indexation.
- le non-descripteur qui sert pour la recherche.
- les mots outils qui ne peuvent être utilisés seuls mais toujours coordonnés avec un autre mot.
Un thésaurus de 3000 descripteurs se fabrique entre 6 et 8 mois. Cela prend donc du temps.
Qu’en est-il de l’indexation collaborative généalogique ? Dans quelle catégorie nous situons-nous ? Essayons de déplacer le débat dans le domaine des sciences de l’information pour comprendre ce qui se passe. Où peuvent se situer les craintes des uns et des autres.
Prenons l’exemple des Morts pour la France. Quand vous voulez vous inscrire, vous avez accès à des règles de saisie avant même cette inscription. Dans ces règles sont précisées des consignes, des orientations, des recommandations. Un exemple de recommandation : » indexez les termes sur lesquels vous n’avez pas de doute ni de problème de lecture. » Consignes et orientations sont dans des info-bulles pour chacun des champs proposés.
Pour chacun des champs, une liste de termes est proposée. Si un terme n’est pas présent, l’annotateur peut le signaler au webmestre, en utilisant l’icône enveloppe « Signaler une erreur ». L’annotateur n’a vraiment la main que sur les communes, qu’il peut rajouter directement. Et encore doit-il respecter des règles. Ainsi pour les communes dont le nombre de caractères est inférieur à 4, il faut ajouter le terme. La règle la plus simple consiste à créer le terme en majuscule non accentué et inscrire son numéro de département entre parenthèses sur 2 ou 3 chiffres.
Pour ce qui est de la classe, des matricules au recrutement, une règle est imposée à tous. De même pour les décès en mer. Les dates se saisissent d’une seule manière.
Pour tout problème d’indexation, de terme non trouvé, mal orthographié, erreur de saisie, doublon, …, il faut contacter le webmestre en utilisant là encore l’icône en forme d’enveloppe « Signaler une erreur ». En retour, le webmestre invitera l’annotateur, en fonction de la demande, à lui faire parvenir un justificatif. Cela ne se fait donc pas n’importe comment.
Visiblement, nous ne sommes pas du tout dans une folksonomie. Tout le monde peut contribuer, certes, ce serait bête de se priver des bonnes volontés, mais il y a des règles, des mots prédéfinis qu’on ne peut pas changer. Il est possible de demander des rajouts mais pas d’enlever des termes. Pour moi, nous sommes bien dans la création d’un thésaurus. Ce n’est pas l’annotateur qui compte, c’est la manière dont le document indexé va être ensuite retrouvé.
Si ça marche pour les Morts pour la France, il n’y a pas de raison que cela ne fonctionne pas ailleurs, pour d’autres indexations, de la même manière, membres d’associations ou pas, professionnels ou pas. En tout cas, a priori, je ne vois pas de raisons contraires. Il suffit juste d’avoir une réflexion sur les mots que l’on veut utiliser. Et si l’indexation est déjà lancée, de se mettre tous autour d’un table pour faire du tri, vérifier chaque terme et le mettre dans une catégorie. Je pense que c’est possible sans trop de difficultés.