core-techs2.png
Ë
By Core-Techs • juillet 17, 2015

Optimiser les fonctions de recherche sur un site Web

moteur de recherche sémantique

Ce besoin de moteur de recherche devient également critique lorsque la masse de contenu proposé devient trop imposante pour être exposée à plat, selon une logique d’annuaire.
Enfin, dans certains cas métiers, il est nécessaire de pouvoir proposer différents critères et filtres de recherche pour donner un accès rapide et immédiat à des contenus caractérisés par de nombreuses métadonnées.
De manière générale, l’ambition principale d’un moteur de recherche est de réduire au maximum ce qu’on appelle « le bruit ». Le bruit documentaire vient gêner l’activité de recherche et retarder l’obtention du/des documents souhaités. On considère traditionnellement que ce « bruit documentaire » est la conséquence de deux causes : 
  • L’utilisateur lui-même ne formule pas bien sa requête (ou ne sait pas bien la formuler)
  • Le système dispose d’une mauvaise indexation : les éventuels « mots-clé » ou « critères » saisis ne renvoient pas les contenus correspondants
Ces deux facteurs ne sont pas toujours simples à améliorer : on ne peut former tous les internautes à l’usage d’un moteur de recherche, et l’amélioration de l’index est souvent  une somme de travail considérable. Aussi, dans une perspective de schématisation, les moteurs de recherche actuels tentent de pallier les éventuels manques de formulation des internautes et à la mauvaise qualité de l’index.
Si les outils pour aider l’internaute à formuler ses requêtes sont aujourd’hui communément répandus, les questions d’optimisation d’index sont plus ardues.
Voyons déjà dans un premier temps tous les éléments nécessaires à l’optimisation des requêtes des internautes :

La gestion d’un moteur de recherche à facette

Ce sont les moteurs de recherche des sites d’ecommerce (et les bibliothèques) qui ont, les premiers,  popularisé cette fonctionnalité. A partir d’un simple mot-clé, l’outil propose, dans la liste des résultats de recherche, d’affiner la recherche avec différents critères. Selon les capacités du moteur, ces critères seront toujours les mêmes, quelles que soient les requêtes, ou bien le moteur saura de lui-même proposer les critères les plus pertinents au regard du mot-clé saisi. Par exemple, vous êtes sur un site de vente en ligne généraliste : si vous recherchez des chaussures, les facettes vous proposent de filtrer par pointure, mais si vous recherchez des sommiers, les facettes vous proposent de filtrer par taille de sommier.

La proposition de mots-clés alternatifs

Google vous propose souvent  d’essayer votre recherche avec un autre mot-clé. Dans le cas de Google, il s’agit essentiellement de suggestions lorsque vous avez fait une faute de frappe ou d’orthographe. Néanmoins, cette fonction est particulièrement intéressante dans le cas où le mot-clé utilisé est polysémique ou non technique. Il est ainsi possible d’étendre ce concept de suggestion à :

  • Des propositions de mots-clés alternatifs issus du même univers lexical et/ou sémantique,
  • Des propositions de mots-clés alternatifs à partir de l’analyse statistique des termes fréquemment retrouvés dans l'environnement des mot-clé recherchés. Exemple : Vous recherchez le mot-clé  « ballade », dans l’index, le mot-clé « ballade » est souvent associé à « ballade à vélo », l’interface de résultat vous proposera donc « ballade à vélo ».

La suggestion de termes de recherche ou «auto-complétion »

Lorsque vous tapez les premières lettres de votre requête, le moteur vous propose des termes commençant par les premières lettres saisies. Dans le cas de Google Suggest, le fonctionnement de cette suggestion est particulière, puisque ces suggestions sont statistiques : ce sont les termes les plus fréquemment saisis par l’internaute qui vous sont ici proposés. Ainsi, Google a été plusieurs fois condamné pour suggestion de termes attentatoires à la réputation des personnes. Le fonctionnement de ces suggestions de recherche peut reposer également sur d’autres principes :

  • Suggestion de termes les plus pertinents d’après une analyse statistique / sémantique / lexicale
  • Suggestion de termes volontairement sur-pondérés
  • Le surlignement des termes recherchés dans les résultats de recherche avec une mise en contexte. Pour faciliter le choix d’un résultat de recherche, la restitution du mot-clé recherché dans son contexte donne des éléments complémentaires d’appréciation de la pertinence du contenu à l’internaute. Cette contextualisation passe aussi par l’affichage de métadonnées relatives au contenu : date de publication, type de contenu, auteur, …
  • Les fonctions de tri : par date, par ordre alphabétique, par pertinence, … Attention, dans le cas du tri par pertinence, c’est souvent un fourre-tout mal compris des internautes. Le tri par pertinence ne doit être proposé que si cette pertinence est déjà réfléchie et optimisée (par pondération, statistique, … - voir la seconde partie de ce billet) 
 
moteur de rechercheD’autres outils, non forcément spécifiques aux moteurs de recherche, et de l’ordre de la considération ergonomique, viennent également changer la perception des résultats de recherche : 
  • Faut-il ou non afficher une pagination ? Est-il pertinent d’afficher un « infinite scroll » ?
  • Propose t-on à l'utilisateur d'enregistrer des alertes et des outils de veille ?
  • De quelle côté met-on les facettes ? A droite ou à gauche comme d'habitude
  • Comment restitue t-on les facettes dans un environnement Responsive Web Mobile ?
Enfin, dernière remarque au sujet de la question des moteurs de recherche avancée : ces derniers ont été longuement décriés pour leur absence criante d’ergonomie et l’inefficacité des résultats proposés. Il est aujourd’hui nécessaire de tempérer cette approche avec trois considérations : 
  • Les facettes peuvent constituer déjà des éléments de recherche avancée,
  • Certains comportements métier (ex : recherche de billets d’avion, recherche de locations, …) nécessitent toujours en première approche des outils de recherche avancée,
  • La généralisation des interfaces riches et dynamiques rend aujourd’hui plus efficace et simple les manipulations de formulaires complexes 
Voici déjà les quelques éléments liés à l’ergonomie et aux capacités de restitution d’un moteur. Nous verrons dans une deuxième étape les outils d’expansion sémantique, d’alignement et d’amélioration de la pertinence des index des moteurs de recherche.