core-techs2.png
Ë
Par Core-Techs • mardi 19 mai 2015

Structured data : le salut de votre contenu ?

Structurer le contenu d'une page web pour le rendre compréhensible à la fois pour un être humain et une machine, telle est la base du web sémantique, de plus en plus couru par les agences Web. Diverses initiatives ont vu le jour pour porter cet objectif :

  • RDF,
  • schema.org,
  • etc

Si les données structurées (structured data) ont été pensées pour servir les objectifs du web sémantique (dégager du sens à partir de contenus textuels afin des les intégrer et de les connecter avec des référentiels plus larges), les moteurs de recherche y ont également trouvé un vaste champ d'application. En effet, pour un moteur de recherche, l'un des objectifs qualitatifs principaux consiste à proposer des résultats de recherche multidimensionnels. Par exemple, vous recherchez "Bob Dylan", le moteur va vous proposer la discographie de Bob Dylan avec les couvertures de chaque album, un lien vers sa biographie sur Wikipedia, les offres de réservations pour ses concerts à proximité de votre localisation dans une période proche.

Qu'est-ce que le structured data?

Le structured data est une technique qui consiste à cartographier le contenu d'une page pour l'inscrire dans une structure de contenu standard. Par exemple : votre page parle d'un événement, vous allez alors indiquer dans le code source de la page les endroits où sont affichés la date de l'évènement, sa description, sa localisation, son prix, etc.

Pour réaliser cette cartographie, il faut :

  • Choisir un standard de balisage (schema.org, RDF, etc),
  • Implémenter ce standard : ajouter le balisage requis par le standard à la structure HTML de la page.

Il existe différents standards de structuration :

  • RDF (ou RDFa pour la syntaxe HTML) : il s'agit du standard de base du web sémantique porté par le W3C,
  • Microdata (avec schema.org notamment) : il s'agit du standard porté par le cartel des moteurs de recherche (Google, Bing, Yahoo).

Le principe du structured data consiste à enrichir le code HTML de vos pages avec des attributs spécifiques au standard retenu (RDF, schema.org ou autre).

Par exemple, voici la structuration d'un évènement en RDFa :

<div class="event-presentation" typeof="cal:Vevent">
  <h2 property="cal:summary">Les données structurées</h2>
  <div clas="datetime" property="cal:dtstart" content="2015-06-12T16:30:00+02:00" datatype="xsd:dateTime">Le 12/06/2015 à 16h30</div>
  <div class="location"><span property="cal:location">Paris, France</span></div>
</div>

et en Microdata :

<div class="event-presentation" itemscope itemtype="http://schema.org/Event">
  <h2 itemprop="name">Les données structurées</h2>
  <div clas="datetime" itemprop="startDate" content="2015-06-12T16:30:00+02:00">Le 12/06/2015 à 16h30</div>
  <div class="location" itemprop="location" itemscope itemtype="http://schema.org/Place"><span itemprop="address name">Paris, France</span></div>
</div>

Rich snippets : valoriser son contenu sur les pages de résultat de recherche

Le premier intérêt du structured data se trouve dans la présentation de notre page dans les résultats de moteur de recherche. Tous les éléments de description de notre contenu seront extraits par le moteur de recherche et celui-ci sera présenté de façon valorisée dans les résultats de recherche.

Prenons l'exemple du fil d'Ariane :

Résultat dans Google sans données structurées :

Résultat de recherche sans structured data

Résultat dans Google avec données structurées :

Résultat de recherche avec structured data

Pour un contenu de type évènement, par exemple, les métadonnées de l'évènement sont directement affichées dans les résultats de recherche :

Affichage pour évènement structuré

Cette présentation dans la page des résultats de recherche améliore la visibilité notre page (davantage de données sont représentées et les plus importantes sont mises en avant).

Pour vous aider à baliser à vos pages, Goole a publié un outil dédié : Outil d'aide au balisage

Quel impact sur le ranking Pour les agences web ?

Cependant, au-delà du simple aspect cosmétique, la question se pose de savoir si présenter son contenu de façon structurée améliore ou non le ranking de nos pages (c'est-à-dire le positionnement de notre page dans la liste des résultats de recherche).

De nombreux acteurs décrivent une amélioration sensible de leur ranking lorsque des données structurées sont présentes sur leurs pages. Cependant, il n'existe aucune donnée objective permettant d'évaluer l'impact du structured data sur le niveau de ranking. Google aurait même tendance à dire que celui-ci est sans conséquence (même si la structuration des données est fortement encouragée...) :

Côté CMS, quelle approche?

  • Drupal bénéficie d'une prise en charge native de RDF (le module "RDF" est livré avec le coeur depuis la Drupal 7). Il existe également le module "Schema.org" qui permet le paramétrage du balisage au format microdata,
  • eZ publish ne propose pas de module spécifique, l'implémentation doit donc se faire manuellement dans les templates,
  • Wordpress dispose de plusieurs plugins : LH RDF pour le support RDF et All in One Schema.org pour schema.org.

Au-delà du SEO

Au-delà des considérations de SEO, le structured data, et plus largement le web sématique, n'est-il pas tout simplement le futur du web ? En effet, le web n'a-t-il pas intérêt à évoluer d'une masse de contenus non structurée vers un ensemble de référentiels dotés de structures sandardisées et interconnectables? En la matière, les éditeurs et producteurs de contenus ont une reponsabilité totale et les avancées sur cette question semblent malheureusement timides. Alors, web sémantique, vœu pieux? Personnellement, j'espère le contraire car les enjeux en matière d'applications sont immenses. 

 

Par Louis Sicard (@lsicard)