Ma position sur DMOZ (désormais Curlie) en 2015

Voici un article que j’ai envie de faire depuis quelque temps, motivé à l’idée de faire connaitre DMOZ, ce dinosaure du web, démotivé justement à cause de ce côté désuet voire le sentiment de participer à une œuvre qui devenait de moins en moins utile. Mais récemment, ce sentiment a changé.

dino-156509_640Tout d’abord, je dois présenter brièvement ce qu’est DMOZ. DMOZ pour Directory Mozilla, anciennement Open Directory Project (ODP). Ce site, créé en 1998 (!), est un annuaire de sites web. International, multi-langues, multi-thématique et surtout ouvert et collaboratif. Ouvert dans le sens où tout le monde peut se servir de son contenu pour créer son propre annuaire, collaboratif dans le même esprit que Wikipédia (pour le meilleur ou pour le pire… Où l’esprit se confronte souvent à la lettre). Ce site devait être une bénédiction à une époque où les moteurs de recherche n’étaient pas si courants et pas aussi efficaces que maintenant (Google 1998, Lycos 1994, Yahoo 1995, Altavista 1995, etc.). L’idée était de trier parmi les sites existants pour ne proposer que le meilleur ou du moins éviter les sites boiteux.

DMOZ a connu son heure de gloire quand Google a ré-utilisé le contenu de l’annuaire DMOZ pour entretenir son propre annuaire et les sites présents dans l’Annuaire Google jouissaient d’une meilleure visibilité dans les résultats de recherche. Or, être en première position ou dans la première page des résultats de Google jouant sur les bénéfices des sites internet marchands (ou sur le succès d’un site non marchand), la plupart des webmasters souhaitaient être sur l’Annuaire Google et donc sur DMOZ.

Ce fut mon cas, et comme la plupart des éditeurs DMOZ (= bénévoles/volontaires/contributeurs), j’ai découvert DMOZ et j’y suis rentré, en 2005, d’abord pour proposer mon site et j’y suis resté parce que j’étais séduit par le projet. Et à l’époque où DMOZ semblait aussi important pour soigner le positionnement d’un site web, les candidatures et les éditeurs étaient nombreux tout comme les sites web référencés dans l’annuaire.

Mais voilà, à cette époque, où je venais à peine de m’y pointer, le concept de DMOZ atteignait plusieurs limites : le projet avait été racheté par AOL et on craignait que DMOZ devienne un produit marchand, le système était attaqué « de toute part » sur la pertinence de son management, de sa partialité et surtout de sa structure. C’était le talon d’Achille du système en 2005, le web grossissait et évoluait plus rapidement que DMOZ qui fonctionne toujours avec une bonne vieille et austère structure en arbres hiérarchiques pas du tout taillée pour être visible sur les moteurs de recherche qu’il doit complémenter. Google était déjà roi et Wikipédia son dauphin : tu cherches un truc précis sur Google et tu tombes sur l’encyclopédie Wikipédia ou directement sur la page officielle du truc, fin de l’histoire. Ajoutons à ça que Google change et re-change son algorithme et supprime son annuaire dépendant de DMOZ et aux yeux des référenceurs, l’intérêt pour le projet diminue jusqu’à stagner :

Evolution du nombre de sites ajoutés à DMOZ au fil des années.

De mon côté, j’évolue, je m’occupe d’abord de la petite catégorie (lien Curlie.org) pour laquelle j’avais postulé, je cherche, trouve et trie tous les sites qui y correspondent. Puis j’évolue dans la catégorie-mère, la catégorie-grand-mère, puis une autre et encore une autre. Mais je suis submergé par le boulot à abattre : en étant positif, disons que la moitié des sites proposés sont des tentatives d’arnaques sans vergogne de webmasters qui veulent placer le site de leur client dans les pages de DMOZ avec le plus haut pagerank même si elles n’ont pas de rapport avec le site, qu’un quart sont des sites quasiment vides (genre forum de pré-ados, je frémis à l’idée de ce à quoi correspondait les catégories de blog à l’époque de Skyblog >_< Il doit y en avoir encore…), mal ou pas décrits et/ou placés au mauvais endroit par erreur. Il reste un quart de sites proposés par des webmasters consciencieux pour lesquels il n’y a quasiment plus qu’à cliquer. Plus on monte dans l’arborescence, on se rend compte que ce qui fait avancer plus vite la tâche à accomplir, ce n’est pas de valider/invalider les sites à la pelle mais de structurer les catégories, mieux les décrire pour que les webmasters ne s’y perdent pas tout en ménageant l’internaute usager (puisque c’est lui le public visé, pas les webmasters ni les idéologues de l’ontologie). Mais cette structuration engendre des débats, toujours polis mais où on n’a pas souvent gain de cause. La masse de travail et cette nécessité de débattre trop souvent m’a lassé et j’ai délaissé « mes » catégories (que j’ai abandonnées) pour passer à autre chose.

Mais voilà, plusieurs années après mon départ, mes activités sur internet, mes centres d’intérêt, ont changé tout comme le web lui-même. On nous prédisait en 2006 un web toujours plus pratique, des moteurs de recherche toujours plus performants… que dalle ! Au delà des premiers résultats de recherche, on se croirait en 2004-2005 quand on était assommés de liens commerciaux, de comparatifs et de comparatifs de comparatifs. J’en ai pris conscience en deux étapes : je fais de la généalogie, je m’intéresse à l’histoire de certains petits patelins et j’ai besoin de fouiller des milliers de résultats de requêtes pour avoir un aperçu quasi-exhaustif de ce que je cherche : les gens qui créent ce contenu n’ont pas conscience des stratégies SEO pour optimiser leurs sites web et peuvent proposer du contenu incontournable dans un site immonde et/ou invisible pour les moteurs de recherche. La publication web s’est certes professionnalisée mais la production de contenu est toujours encore très populaire : le plus souvent, le spécialiste de tel ou tel sujet pointu n’est ni webmaster, ni suffisamment riche pour s’en payer un. Pensez-vous, même certaines mairies n’ont pas de budget ou la présence d’esprit d’avoir un site web !

Donc pour certains thèmes de recherche pointus ou quand on a besoin d’un certain degré d’exhaustivité, je trouve qu’aucun moteur de recherche actuel n’est à la hauteur. Le clou a été enfoncé ces derniers jours quand j’ai testé quelques moteurs comme Framabee, Startpage, DuckDuckGo, etc. Je fais une veille sur tout ce qui concerne Villemoustaussou (village d’Aude de 4000 habitants) et il a fallut que j’utilise Google, Bing, Yahoo et DuckDuckGo jusqu’au dernier onglet pour trouver l’ensemble des 25 sites villemachois (pas de lien pour l’instant, je mouline tout ça). Dans la foulée, j’ai fait la même recherche pour quelques villages voisins et le constat est le même : c’est un calvaire d’être exhaustif avec les moteurs de recherche actuels et ce serait un bienfait que le travail effectué ne soit plus à refaire. En 2015, on a toujours besoin d’un annuaire web et je suis intimement persuadé que DMOZ, même si la communauté est dans un sommeil léger, est toujours la meilleure solution. Il y a moins de feedback que les années précédentes mais le système est toujours fonctionnel, il y a même quelques outils supplémentaires pour assister le nettoyage des catégories (il y a toujours eu pas mal d’outils d’aide à la décision pour assister les éditeurs). J’ai aussi l’impression que le vide relatif dans les effectifs des éditeurs est une opportunité pour les nouveaux entrants d’y imprimer leur empreinte plus profondément qu’il y a dix ans.

Donc si vous êtes passionné de trucs divers comme les mods pour Quake Arena, que vous trouvez qu’il manque une tripotée de guides-conférenciers bordelais sur Dmoz, que vous êtes un brittophone et que vous connaissez d’autres sites brittophones qui traitent du Finistère, que DMOZ mériterait une sous-catégorie consacrée au Bitcoin, etc. postulez ! Normalement, tout est indiqué sur la manière de procéder (j’y suis bien arrivé un jour…) et une fois sur place, le seul engagement à tenir est d’être réglo. Si vous abandonnez au bout d’une semaine, les trois sites que vous avez proposés pour postuler seront toujours ça de pris.