<C²: webløg />

Courriel - email address

Avatar Denis

dimanche 02 janvier 2005
par Denis Boudreau

Le mérite de la sémantique HTML, le retour

Que nenni chers lecteurs, le sujet est loin d'être clos. Enfin, peut-être le sera t-il un peu plus suite à la lecture de ce billet. Avant d'aller plus loin, je tiens à vous rapeller que je ne suis en aucun cas un expert du référencement, art plutôt obscur qui implique forcément des messes noires et le sacrifice d'une chèvre ou de jeunes vierges pré-pubères, compte tenu du mystère entourant le principal intéressé.

Toujours en quête d'une soit-disant vérité (et en réponse un peu tardive à l'ami Hadrien qui abordait le sujet sur son site dernièrement) j'aimerais vous faire part d'une observation toute personnelle sur la valeur ajoutée de la sémantique HTML, rendue possible par l'entremise d'une petite expérience récente avec Google. Quoique empiriquement tout à fait non-fondée, celle-ci s'avère néanmoins résolument significative. Assez du moins pour achever de me convaincre du bien fondé de mes intuitions par rapport à l'importance accordée par Google à la conformité aux standards et tout particulièrement à la sémantique HTML.

Vous qui me lisez régulièrement vous souviendrez peut-être d'un billet rédigé à la fin novembre, suite à ma découverte d'un groupe québécois très intéressant nommé " Mes Aïeux ". Pour ma part, c'était la première fois que je faisais mention d'eux sur ce site, la première fois même que j'utilisais le terme " aïeux " sur C². Pourtant, quelques semaines plus tard, sur plus de 36 000 résultats de recherche, me voilà en deuxième place juste derrière... le groupe lui-même ! Et pour y parvenir, rien de plus que deux misérables petites répétitions du terme, une dans un <h3>, l'autre dans un simple <p>.

Pas de méta-informations, dans de Dublin Core, pas de cloaking, pas de sacrifices humains, pas de petits tours de passe-passe pour tromper les moteurs de recherche et surtout, pas la moindre intention de me démarquer. Juste un code (plutôt) propre et sémantiquement (plutôt) bien structuré. On ne parle pas ici de pertinence du contenu, un critère que l'on sait autrement très important. Dans une page de près d'une centaine d'octets de texte, deux misérables occurences ne pourraient pas, à elles seules, permettre une aussi bonne " performance " d'indexation. Il faut forcément qu'il y ait autre chose.

Et que reste t-il ? De la sémantique HTML, voilà tout. Pour ma part, voilà qui me suffit amplement à me faire une tête sur le sujet, faute d'obtenir des réponses précises à mes questions (et croyez-moi, j'ai essayé, celles envoyées aux développeurs chez Google étant demeurées sans réponses). Mais bon, j'arrête de parler d'eux dès maintenant, de peur de m'emparer de la première place... car voilà qui serait plutôt insultant pour le groupe.

Et comme je les aime beaucoup...

Denis Boudreau | 2005.01.02 @ 12:11

Alors, qu'en pensez-vous ?

Voici ce que vous aviez à en dire... vos impressions, recueillies à vif.

2005.01.02 @ 12:33 par Olivier

Et ta (toute relative *ahem*) popularité ne fait rien ?

Google attachant une valeur au Page Rank, nul doute que ton PR=6 ait fait aussi des siennes ;)

Tu ne pousses pas la recherche suffisament loin pour être crédible à mon avis :D ahh ahh !

Haut retour au début de la page

2005.01.02 @ 13:09 par DenisB.

pppppppppppppfffffffffffftttttttttttt... ;)

Je ne suis qu'un misérable vermisseau dans l'univers grouillant du Web. Je doute qu'un PR de 6 (sob, il était de 7 hier encore) ne vaut pas vraiment grand chose dans l'étendue des sites répertoriés par le grand Google.

Haut retour au début de la page

2005.01.02 @ 14:05 par Monique

Bonjour,

Loin d'être experte en référencement, je préfère me taire que de dire une grosse bêtise...
Je peux cependant te faire part d'une constatation qui date juste de ce matin : 'le principal intéressé' semble vraiment t'adorer, Denis ;-)
En effet, ce matin je reçois des alertes Actualité Google, une pour 'accessibilité Web' et une autre pour 'Mozilla', toutes les deux annonçant un billet de Cybercodeur !
D'un geste automatique, je clique sur la première 'La genèse de CYBERcodeur' qui, à ma grande surprise m'entraîne en 2003 !
J'y regarde d'un peu plus près et je me rends compte que les deux alertes de Google concernaient des billets présents dans ta liste 'À pareille date, par le passé....' ;-)
Bon, l'actualité date un peu c'est vrai, mais Google a quand même dû suivre les liens et lire tes billets pour déceler celui qui contenait le mot accessibilité !

Amicalement,
Monique

Haut retour au début de la page

2005.01.02 @ 16:00 par DenisB.

Ah oui ? Voilà qui est intéressant ! Au prix que je paie pour soudoyer Google, c'est la moindre des choses qu'il me 'plogue' de temps en temps... Plus sérieusement, comment expliquer cette 'popularité' ? Simplement par une question de pagerank ?

Haut retour au début de la page

2005.01.02 @ 17:15 par S.F.

Moi j'ai eu droit à mon (bref) passage en deuxième page sur 'histoire de cul' (vu les termes, la performance est remarquable). Eh oui, j'avais 'histoire' dans un titre de billet (donc, répété à plusieurs endroits sur le site), et 'cul-de-jatte' dans un texte, seule occurence du mot 'cul' dans tout le site...

Haut retour au début de la page

2005.01.02 @ 23:54 par Olivier

Je ne met pas cette 'popularité' uniquement sous le compte du PR (auquel je n'attache pas une grande importance), je dis juste que tu n'as à mon avis pas analyser suffisament de facteurs, le PR en étant un parmi d'autres.

Personnelement, je suis d'avis que le respect de la sémantique web apporte un plus au niveau du référencement, même si les 'pros' semblent penser le contraire, mais il faudrait mener une étude sérieuse sur le long terme sur suffisament de critères pour s'assurer que c'est bien le cas. Et ce ne sont pas les mangeurs de cigognes ou seraphim proudelbouck qui le permettrons, ce ne sont vraiment pas des exemples de référencement à suivre à mon avis, parceque répéter 350 fois le même mot dans un lien hypertexte sur une page de 500 mots, ça n'a aucun sens.

En tout cas, personelement, j'étais relativement surpris de me retrouver relativement bien positioné sur 'pseudo frames php' pendant un temps (encore maintenant peut être ?) alors que je n'ai fait qu'un simple tuto et que le sujet est plutôt bien documenté sur le net. Faut il mettre ceci aussi sur le compte de la sémantique web respectée un minimum ? (Une petite recherche rapide m'apprend que je suis descendu en page 4 désormais sur cette recherche (longtemps dans les 1ers résultats), j'ai par ailleurs changé la page des tutos et supprimé l'ancienne, la sémantique est-elle moins respectée sur la nouvelle page ? Et bien non, peut être que ce facteur est alors à exclure ?

Pourquoi ne voit on jamais (ou presque) de sites conformes et sémantiquement bien codé en premiers résultats sur google ?
Un mystère de google à éclaircir...

Haut retour au début de la page

2005.01.03 @ 12:24 par Daniel

Je ne suis pas expert du tout, mais je gère un gros site et l'une des pages d'actualités avait un PR de 5 il y a encore un mois. Entre temps j'ai fait un gros effort pour qu'elle soit codée plus sémantiquement (gros effort car il faut sensibiliser et habituer les rédacteurs qui la mettent à jour). Eh bien ce matin je constate que son PR est passé à 7!! Je doute que beaucoup de liens aient été faits vers cette page en peu de temps. Ca n'a peut-être aucun rapport, mais c'est tout de même troublant...

Haut retour au début de la page

2005.01.03 @ 12:32 par DenisB.

Je pense que tes efforts ne peuvent pas nuire. Mais sache que Google a parti sa gigue du premier de l'An ces derniers jours et que beaucoup de sites ont vu leur PR changer... celui de C2, entre autres, a dégringoler d'un point alors que ceux de certains copains ont bondi de trois et même quatre points en une nuit !

Haut retour au début de la page

2005.01.04 @ 13:52 par FlorentG

Je viens de lancer un test histoire de voir toute cette agitation sur Google et la Sémantique.

Le phénomène 'mes aïeux' m'a donné une idée, visible ici : http://lecastor.homeip.net/

La page parle d'elle-même, on verra bien ce que ça donne... Faudrait après la refaire sans aucune sémantique pour voir la différence.

Haut retour au début de la page

2005.01.04 @ 14:45 par DenisB.

L'expérience que tu t'apprêtes à faire n'est pas sans rappeler le concours mangeur-de-cicogne qui, à l'époque, avait clairement permi à Éric Daspet de démontrer la valeur de la sémantique HTML (jusqu'à ce que le concours ne se transforme en foire aux backlinks).

Haut retour au début de la page

2005.01.06 @ 09:21 par Sylvain LELIEVRE

Je me demande encore pourquoi certains essaient de démontrer qu'une page proprement codée est appréciée par Google, alors que Google lui-même le dit dans ses conseils aux webmasters :
http://www.google.fr/intl...
Il y est conseillé de créer des pages au contenu clair et précis, d'utiliser du texte plutôt que des éléments graphiques pour décrire le contenu important, de renseigner les attributs alt et title de manière précise, de 'vérifier la qualité du code HTML', de tester le site avec un navigateur non graphique, etc.

Bref, c'est limite pas s'ils balancent un lien vers le W3C…

Haut retour au début de la page

2005.01.17 @ 22:56 par Olivier

Vraiment pas scientifique comme raisonnement.
Je me souviens d'avoir trouvé des 'pages' en première position ne contenant que du Javascript. Ou même des PDF et des DOC en 1ère position. Un exemple n'est pas suffisant pour affirmer quelque chose, mais un contre-exemple suffit pour infirmer.

Haut retour au début de la page

2005.01.27 @ 10:16 par sebastien billard

Attention Denis il ne faut pas tout mettre sur le dos de la seule semantique, même si je suis le 1er à dire que le respect des standards facilite beaucoup le référencement en levant les obstacles à l'indexation et présentant une structure logique.

Ce qui explique en grosse partie ton bon positionnement :

-La faible concurrence de la requête (36.000 résultats c'est rien du tout).
-La popularité de ton site.
-Probablement le fait que ton fil RSS soit affichés par d'autres blogs et aggregateurs publics. Tu a donc eu plein de liens pointant vers toi avec 'aieux' dans le texte du lien (une google bombinette en quelque sorte)

Les meta-donnée ne servent pratiquement à rien, et encore moins les Dublin Core qui ne sont pas prises en compte par les moteurs majeurs.

Ceci dit l'usage correct des balises h1, p, strong sont un plus indéniable au niveau référencement.

Haut retour au début de la page

Les commentaires et trackbacks sont désormais fermés. Pour toute remarque, vous pouvez toujours nous contacter.

Pisteur (Trackback)

Carnet: Web Standards propaganda &amp; moteurs de recherche
Extrait: Le balisage sémantique ne compromet pas votre classement par...
Weblog: Blog &amp; Blues
Traqué le: 2005.01.04 @ 20:58