YaCY un service pertinent?

Bonjour \o/

Dans son dernier bulletin, la Free Software Foundation (FSF) cite le projet YaCY :

« Even Google’s dominance on Web queries could be challenged by deploying federated search software, such as YaCy. »

https://www.fsf.org/blogs/community/a-tech-antitrust-hearing-misses-the-point

Pour rappel, YACY est un moteur de recherche distribué. C’est à dire que vous participez aux tâches du moteurs (index, crawling, etc.) et que les données sont éparpillées.

Quelques liens :
https://fr.wikipedia.org/wiki/YaCy
https://linuxfr.org/users/tisaac/journaux/yacy-david-s-contre-googliath

Pensez-vous qu’une instance YaCY pourrait être pertinente dans le cadre CHATONS ? Vos avis ? Des expériences ?

4 Likes

Salut :slight_smile:
Je ne sais pas si tu as testé YaCy, pour ma part ça fait quelques années que je suis d’un oeil ce projet, et que je l’installe régulièrement pour voir ou ça en est. Mon retour perso c’est que le moteur de recherche est à des années lumière des moteurs de recherche qu’on utilise au quotidien. Je ne dis pas que c’est moins bien, c’est juste hyper méga différent. Et il faut bien l’avouer, le nombre de page indexé bien moins important aussi.

Pour moi ça fait sens de proposer ce service que si les chatons participent activement à l’indexation (ce n’est pas obligatoire). Et en travaillant à l’inclusion de cet outils pour les recherches interne aux sites par exemples. Et en faisant le choix des sites indexé ça peut devenir un chouette moteur de recherche thématique.

Note que je suis à fond pour que la communauté francophone s’en empare :slight_smile:

2 Likes

Salut

Intéressant comme projet, je vais installer une instance pour voir ce que ça donne et je vous ferai un retour :slight_smile:

2 Likes

Très volontiers. J’en ai installé une de mon côté et pour l’instant, ce n’est pas vraiment top :

Dans les points positifs :

  • indiquer ses propres listes de sites, c’est une sensation merveilleuse ;
  • nombreux paramétrages ;
  • une certaine efficacité sur les sites indexés ;
2 Likes

je passe par la et je gratte un peu la litière.

Vous en êtes où de vos expérimentation / pertinence de Yacy? J’ai lâché le projet en 2019 faute de « pertinence des résultats » (dans mon cas d’usage) et donc un service qui occupe pas mal de ressources sans efficiences visibles.

Et vous?

Je n’ai pas ré-expérimenté depuis l’avis ci-dessus :yum:

1 Like

J’avais fait un essai aussi sur le côté centralisé, il y a plus d’un an. Je m’étais concentré sur la création d’un index pour les nouvelles françaises, sur stackoverflow et wikipedia. Le but étant d’avoir un index intéressant dès le début pour faire sur crawling plus libre par la suite. Pour les nouvelles, j’avais aussi utilisé les flux RSS pour alimenter en nouvelles fraîches. J’ai constitué un index d’environ 50Go.

J’ai passé beaucoup de temps à administrer le crawler et je pense que c’est une tache qui demande beaucoup d’attention. C’est passionnant, il y a déjà beaucoup d’outils mis en place par Yacy, mais ça n’est pas encore suffisant selon moi.

J’étais pas toujours déçu des résultats, il y avait toujours des trucs intriguant, qui ne seraient jamais sorti sur un moteur de recherche classique. Parce qu’issue de sites sans notoriété. Je trouvais ce point-là intéressant.

Mais, mais, il y avait de vrais soucis de performance, parfois le moteur s’emballait et une requête prenait beaucoup de temps. C’est un peu dommage.

1 Like