Google Décodé Tome 1

Google Décodé Tome 1

-

Documents
80 pages
Lire
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Fonctionnement général de Google Composition des pages de résultats

Sujets

Informations

Publié par
Nombre de visites sur la page 20
Langue Français
Signaler un problème
a le plaisir de vous offrir ce guide
Google Décodé Tome 1
Fonctionnement général de Google Composition des pages de résultats
Si nous distribuons ce guide gratuitement, imaginez les trésors que vous trouverez dans la version payante de l'étude Auteur: Raphaël richard Webmarketing Academy
Google Décodé
Présentation de l'étude « Google décodé »_________________________________5
Des centaines de livres, des milliers de blogs sur le SEO.................................................................................5
Mais Google évolue très vite..............................................................................................................................5
Les experts livrent difficilement leurs secrets...................................................................................................5
1ère partie gratuite: le fonctionnement de Google début 2011.........................................................................6
2ème partie: 237 critères de classement et conditions d'indexation, 25 critères de personnalisation, 26 pénalités, 9 sanctions.........................................................................................................................................6
Le fonctionnement de Google en 5 minutes_________________________________9
Comment Google établit le classement des résultats.......................................................................................9
Auteur et Méthodologie de l'étude_________________________________________12 Auteur de l'étude..............................................................................................................................................12 Méthodologie de l'étude...................................................................................................................................12 Structure de l'étude..........................................................................................................................................13
Section 1____________________________________________________________________14
Comment Google comprend les mots clés tapés__________________________14
Qu'est-ce qui se cache derrière Google ?........................................................................................................14
Les chiffres clés de Google..............................................................................................................................16
Google ne comprend pas le sens d'une requête..............................................................................................16
Les employés de Google connaissent-ils tous ses secrets ?..........................................................................17
Comprendre la philosophie de Google.............................................................................................................17
Section 2 ___________________________________________________________________19
Comment Google sélectionne les résultats d'une recherche ordinaire___19
Introduction......................................................................................................................................................19
Comment Google découvre les nouveaux documents ....................................................................................19
Comment Google comprend les pages web qu'il découvre............................................................................22
Comment Google comprend les autres documents.........................................................................................23
Comment Google classe les documents en fonction de leur pertinence........................................................24
Comment Google compose ses pages de résultats.........................................................................................32
Comment Google met à jour ses données.......................................................................................................34
Section 3 ___________________________________________________________________36 Traitement des recherches spécifiques et recherche universelle________36 Introduction......................................................................................................................................................36 Détail de la composition des pages.................................................................................................................38 a. Recherches ordinaires..................................................................................................................................38 b. Recherche de produits.................................................................................................................................39 c. Recherche sur des sujets d'actualité...........................................................................................................41 d. Recherche sur des personnes publiques.....................................................................................................45
e. Recherche sur des personnalités.................................................................................................................46
f. Recherche de sociétés..................................................................................................................................47
g. Recherches géolocalisées............................................................................................................................51
h. Recherche de commerces spécifiques........................................................................................................54
i. Recherche de films........................................................................................................................................58
h. Recherche concernant des opérations mathématiques..............................................................................59
Recherche sur des questions abondamment traitées dans les forums de discussions ou sites collaboratifs61
Les moteurs de recherche alimentant la recherche universelle.....................................................................62
Google Adresses (Google Maps).......................................................................................................................62
Google Shopping...............................................................................................................................................62
Google Livres/Books.........................................................................................................................................63
Google Actualité................................................................................................................................................63
Google Blogs.....................................................................................................................................................63
Google Realtime (en Temps Réel) ....................................................................................................................63
Section 4 ___________________________________________________________________65
Le système de protection et de sanctions de Google_____________________65
Le Web spam (spamdexing, search spam).......................................................................................................65
Les 4familles de référenceurs........................................................................................................................65
La milice de Google..........................................................................................................................................66
Section 5 ___________________________________________________________________68
Personnalisation des résultats_____________________________________________68 Pourquoi Google personnalise les résultats.....................................................................................................68 Pourquoi Google enregistre des informations sur les internautes..................................................................68 L'impact de la personnalisation sur les résultats............................................................................................69 Les différences de résultats entre data centers..............................................................................................69
Section 6____________________________________________________________________71
Les professionnels qui doivent lire ________________________________________71 le tome 2 de l'étude « Google Décodé »___________________________________71 Les propriétaires de sites internet qui ont internalisé le référencement........................................................71 Les propriétaires de sites qui ont confié le référencement à une agence......................................................72 Le référenceur amateur....................................................................................................................................73 Le référenceur professionnel junior (1 à 3 années d'expérience)...................................................................74 Le référenceur professionnel senior (4 à 10 années d'expérience)................................................................75 L'agence web qui sous traite le référencement à une agence de référencement..........................................76
Le chercheur d'emploi en reconversion...........................................................................................................77
Annexes_____________________________________________________________________78
Les mythes à propos de Google.......................................................................................................................78
Présentation de l'étude « Google décodé »
Google est devenu en 12 ans, une marque mondialement connue, mais reste un mystère pour de nombreux internautes et laisse perplexes de nombreux webmasters qui tentent, avec plus ou moins de succès de hisser leur en tête de résultats. En effet, Google en plus d'être devenu une sorte d'encyclopédie universelle est aussi devenu le premier fournisseurs de visiteurs et de clients des 100 millions de sites web qui existent à l'heure actuelle.
Le mystère qui entoure le fonctionnement de Google est savamment orchestré par ses propriétaires pour deux raisons: empêcher les nombreux concurrents de le copier, mais surtout empêcher les spécialistes du marketing dans les outils de recherche (référenceurs) de manipuler son algorithme de classement afin d'obtenir la première position. Au niveau mondial, on peut estimer à 500 000, le nombre de personnes qui travaillent à plein temps ou à temps partiel à optimiser le référencement de leur site ou de ceux de leurs clients.
Des centaines de livres, des milliers de blogs sur le SEO
Des centaines d'ouvrages ont déjà été écrits sur l'art du SEO (Search Engine Optimizaton ou art du référencement dans Google). Des milliers de sites se consacrent à la veille sur l'évolution des technologies de Google et sur les dernières techniques de référencement.
Mais la complexité et la rapidité de l'évolution de l'algorithme de classement de Google est telle que, non seulement, les livres sont dépassés peu après leur impression, mais qu'en outre, il est difficile, pour le profane, de discerner les véritables experts au fait des dernières évolutions, des simples spécialistes qui recopient des thèses qu'ils ont lue sur le web et qu'ils propagent sans les avoir vérifiées.
Mais Google évolue très vite
Par ailleurs, les véritables experts qui rédigent des livressur le référencement ne listent pas, de façon exhaustive, l'ensemble des règles de fonctionnement de Google et pour cause: Google annonçait en 2009 qu'il en existaient près de 200. L'auteur de cette étude estime que 30 nouvelles règles apparaissent tous les ans tandis que les 200 précédentes sont en permanence remise en cause. Les ingénieurs de Google indique sur le code de Google évolue tellement rapidement qu'il est renouvelé pour moitié tous les six mois. Autrement dit, même si un expert parvient à décoder à un instant T 100% du fonctionnement de Google et publie le résultat de ses travaux, 6 mois plus tard, la moitié du code de Google a évolué, de façon majeure. Les experts livrent difficilement leurs secrets Du point de vue économique, un expert n'a donc pas intérêt à prendre les 8 semaines que nécessitent l'écriture d'un ouvrage d'expert sur le référencement qui vulgariserait un savoir faire durement acquis: il peut espérer, en effet, gagner avec la vente de l'ouvrage, entre 5000 et 10000 euros, alors qu'il monnaie sa journée de consulting entre 900 et 1200 euros. L'auteur de l'étude Google décodé a décidé de révéler tout ce qu'il sait du fonctionnement de Google pour deux raisons: %l'opération est économiquement très intéressante pour lui, %l'opération est économiquement intéressante pour les clients de cette étude car elle leur permettra d'améliorer sensiblement les performances en référencement, d'augmenter leur trafic et leur chiffre d'affaires.
Page 5 / 80
1ère partie gratuite: le fonctionnement de Google début 2011 Cette première partie diffusée gratuitement est destinée aux utilisateurs ordinaires de Google et aux débutants en référencement. Elle leur permettra de comprendre ce qui se cache derrière une page de résultats. Elle permettra aussi aux directions marketing, directions commerciales et directions générales de se construire une vision synthétique du fonctionnement de Google et de dépasser les discours souvent très techniques des spécialistes du référencement. Cette première partie peut librement être reproduite sur n'importe quel site web sous quatre conditions: 1°) Obtenir, au préalable, l'accord de l'auteur de cette étude, qui peut être contacté à l'adresse suivante: richard@planete-commerce.comou sur directement par téléphone au 01 48 24 35 80 2°) N'apporter aucune modification à ce document, ni sur le fonds (contenu), ni sur la forme (PDF, mise en page). 3°) Attribuer clairement la paternité de l'étude à Raphaël Richard et à la Webmarketing Academy, 4°) Insérer le lien hypertexte suivant sur la page permettant de la télécharger: <a href= »http://www.google-decode.com »>Google Décodé</a>, étude de <a href= »http://www.raphaelrichard.net »Raphaël Richard</a>, <a href= »http://www.webmarketingacademy.com »>Webmarketing Academy</a> Des dizaines de webmasters indélicats ayant plagié, par le passé, d'autres ouvrages de l'auteur de cette étude, ce dernier publiera sur son site, sur la page «spécialistes du piratage», une liste de toutes les personnes reproduisant l'étude de façon non autorisée, en partie ou en totalité. 2ème partie: 237 critères de classement et conditions d'indexation, 25 critères de personnalisation, 26 pénalités, 9 sanctions 227 critères concernant le moteur généraliste 147 critères de classement 26 pénalités 9 sanctions prise par Google 25 critères de personnalisation 70 critères associés aux modules de recherche universelle.
Cette partie s'intitulait initialement les « 200 critères de classement de Google ». En la rédigeant, l'auteur s'est aperçu que elle n'avait pas de sens s'il ne décrivait pas aussi: %la façon dont Google indexe chaque type de contenu (texte, image, video, fiche produit, actualité...) %la façon dont Google choisit les éléments composant une page de résultats (vidéo, actualité , blogs) en fonction de la recherche réalisée %l'éventail de sanctions qui guettent les référenceurs trop zélés
Page 6 / 80
%la façon dont Google personnalise les pages de résultats en fonction du profil des internautes. La seconde partie de l'étude s'adresse, donc, aux professionnels directement concernés par le référencement: ·Responsable marketing, ecommerce, webmarketing souhaitant acquérir des connaissances leur permettant de discuter d'égal à égal avec les spécialistes du référencement ·Agences de communication et web souhaitant acquérir des connaissances leur permettant de discuter d'égal à égal avec les spécialistes du référencement et être certaines de créer des sites web préparés pour le référencement. ·Webmasters souhaitant devenir des spécialistes du référencement naturel, ·Agences web souhaitant discuter d'égal à égal avec ·Référenceurs juniors souhaitant connaître l'intégralité du fonctionnement de Google améliorer leur performance ·Référenceurs senior souhaitant se mettre à niveau sur les toutes dernières évolutions. ·Webmarketeurs multispécialistes qui n'ont pas le temps de mettre à niveau leurs connaisances sur le référencement ·Chercheurs d'emploi engagés dans un cycle de reconversion « webmarketing » La seconde partie de l'étude est un tableur excel composé de 10 feuilles décrivant A- Les critères d'indexation des bases de données spécialisées (Google Actualité, Google images...) B- Les critères de positions généraux ·Code ·Structure ·Contenu ·Netlinking ·Confiance/autorité ·Pénalités ·Sanctions ·Gestion des problèmes de sécurité Les critères relatifs à Google Actualité ·Critères de classement des résultats à l'intérieur d'un bloc Google Actualité ·Critères de classement des résultats lors d'une recherche dans Google Actualité Les critères de positionnement Google Adresses/Maps ·Critères de classement des résultats à l'intérieur d'un bloc Google Adresses ·Critères de classement des résultats lors d'une recherche dans Google Adresses Les critères de positionnement Google Images ·Critères de classement des résultats à l'intérieur d'un blog Google Images
Page 7 / 80
·Critères de classement des résultats lors d'une recherche dans Google Actualité Les critères de positionnement Google Vidéo ·Critères de classement des résultats à l'intérieur d'un bloc Google Vidéo ·Critères de classement des résultats lors d'une recherche dans Google Vidéo Les critères de positionnement Google Blogs ·Critères de classement des résultats à l'intérieur d'un bloc Google Blogs sur une page de résultats ordinaire ·Critères de classement des résultats lors d'une recherche dans Google Blogs Les critères de positionnement Google Mise à Jour / Updates ·Critères de classement des résultats à l'intérieur d'un bloc Google Mise à Jour sur une page de résultats ordinaire ·Critères de classement des résultats lors d'une recherche dans Google Mise à jour Les critères de positionnement Google Shopping ·Critères de classement des résultats à l'intérieur d'un bloc Google Shopping sur une page de résultats ordinaire ·Critères de classement des résultats lors d'une recherche dans Google Shopping
Page 8 / 80
Le fonctionnement de Google en 5 minutes
Voici une synthèse du système de classement du moteur de recherche permettant à n'importe quel internaute de comprendre la logique d'analyse de pertinence de Google. Dans la réalité, le fonctionnement est beaucoup plus complexe. Aussi, il faut considérer cette synthèse comme un outil de vulgarisation.
Comment Google établit le classement des résultats
1. Google analyse la pertinence de la page web. Chaque page web possède un score de pertinence pour chaque mot clé recherché. En effet, il est aisé de comprendre qu'une page très pertinente pour un mot clé, peut être non pertinente sur un autre mot clé. NDLR: dans le jargon internet, un mot clé désigne, en réalité, une expression d'un ou plusieurs mots. 250 critères de classement sont pris en compte Ce score de pertinence est déterminé par plus de 250 critères de classement: par exemple, la présence du mot clé dans la page, le nombre de répétitions du mot clé, le fait que le mot apparaisse dans le titre de la page.... D'une certaine manière, à chaque fois qu'une page satisfait un critère, elle marque despoints de pertinence. Mais chaque critère ne permet pas de marquer autant de points et d'augmenter le score de pertinence dans les mêmes proportions. Exemple: la présence du mot clé recherché dans le titre de la page permet de marquer un grand nombre de points (admettons 200 points), tandis que la présence du mot, dans le nom d'une image se situant sur la page permet de gagner un faible nombre de points (admettons 5 points). Comme la présence du premier critère (mot clé dans le titre), permet de marquer plus de points, nous dirons que ce critère de classement possède un poids plus élevé. Le score de chaque critère peut varier Les représentants de Google ont indiqué, en septembre 2010, que, pour chacun des 200 critères, il pouvait exister jusqu'à 50 variations. Ce concept n'a volontairement pas été détaillé par Google, afin de préserver le secret de son fonctionnement. La communauté des webmasters s'interroge encore sur le concept de variations. Voici l'interprétation que l'auteur de cette étude en fait. Admettons que lorsqu'un mot clé figure dans le titre d'une page web, le score de pertinence augmente de 100
Page 9 / 80
points. La seconde fois où le mot clé est répété dans le titre, le score de pertinence augmente encore de 100 points. Mais la troisième fois où le mot clé est répété dans le titre, le score de pertinence n'augmente plus. Il n'existe donc deux variations pour le critère « Mots clé dans le titre »
Il existe des variations différentes pour chaque critère
En revanche, la limite est différente pour le critère « présence du mot clé dans le texte ». Dans ce cas, le score de pertinence augmente probablement jusqu'à la 50ième répétition.
Il existe donc 50 variations pour le critère « Présence du mot clé dans le texte ».
Si le nombre de points de pertinence pour la première et la cinquantième répétition est de 5 points, une page présentant 50 répétitions du même mot clé obtient un score de 250 points, soit au final plus élevé que les 200 points maximum marqués par la présence du mot clé dans le titre.
Le score de pertinence est une somme
Le score de pertinence brut sur ces deux critères est donc de 200 + 250 = 450 points.
Pour les férus de maths, voici une formule qui pourrait résumer le principe:
Score de pertinence=[PoidsCritère1]x[Nbre de variations Critère1]+[PoidsCritère2]X[Nbre de variations Critère2].
Comme il existe 250 critères de classement, le score total de pertinence est composé de 250 termes.
Score de pertinence brut= [PoidsCritère1]x[Nbre de variations Critère1]+[PoidsCritère2]X[Nbre de variations Critère2] …....+ [PoidsCritère199]x[Nbre de variations Critère199]+[PoidsCritère200]X[Nbre de variations Critère200]
Les points marqués diminuent avec la variation
Il faut, cependant, apporter une précision, à ce calcul: le nombre de points marqués n'est pas directement proportionnel au nombre de variations. Ainsi, si le mot clé est présent une fois dans le titre, le score de pertinence augmente de 100 points, mais la seconde fois où il est présent, le score n'augmente plus que de 50 points.
Certaines variations font diminuer le score
Enfin, il faut également tenir compte que Google pénalise les sites qui ont un comportement «anormal ». Google tient à jour des statistiques pour déterminer dans quelle mesure le score d'un site « normal » peut varier: un site ordinaire ne va pas répéter 10 fois de suite le même mot clé dans le titre à moins de...vouloir fausser les classements de Google. C'est pourquoi dans le cas où la variation dépasse la «normalité »,le score de pertinence sur un critère donné peut être négatif.
Des sanctions et des bonus permettent d'ajuster le score de pertinence brut
Le score de pertinence brut est minoré si des techniques de manipulations grossières de l'algorithme de classement de Google sont utilisées par le webmaster, mais le site peut également recevoir des bonus lui permettant d'augmenter son score. Ces bonus ou sanctions peuvent être attribués automatiquement ou manuellement par des employés de Google.
Score de pertinence net = Score de pertinence brut+ Bonus -Sanctions
2. Google compare le score avec celui des autres pages
Le score de pertinence net de chaque page est calculé. Puis, Google compare le score de toutes les pages pertinentes, pour établir un premier classement que nous nommerons « classement absolu». C'est celui que verront la plupart des internautes.
3. Google personnalise la page de résultats
Mais, depuis quelques années, Google personnalise, de plus en plus, l'ordre d'apparition des résultats en fonction de l'historique de l'internaute (mots clés tapés, sites visités). Google conserve, en effet, de traces des recherches
Page 10 / 80
effectuées par chaque internaute.
4. Google redirige vers l'un des Data Center
Enfin, le « classement final » qui s'affiche sur l'ordinateur de l'internaute dépend du Data Center sur lequel se connecte l'internaute.
Un Data Center est un bâtiment très protégé où sont stockés des dizaines de milliers d'ordinateurs travaillant pour Google: chaque bâtiment comporte des dizaines de pièces. Chaque pièce comporte des dizaines d'armoires (métalliques). Chaque armoire comporte 10 à 20 ordinateurs.
Ce sont au total des centaines de milliers d'ordinateurs qui parcourent et indexent une partie du web et qui doivent s'échanger régulièrement des informations de mise à jour. C'est pourquoi il existe des décalages entre les informations dont dispose chaque Data Center et qu'un même ordinateur portable avec le même historique, affichera des résultats différents si on le connecte à partir d'Annecy ou d'Orléans.
Pour aller plus loin
Un Data Center (n'appartenant pas à Google)
 Photoprise parGregory MaxwellGFDL.et disponible sous licence
La suite du tome 1 de l'étude approfondi ces différents points et précise la façon dont Google détecte les documents qui rentrent dans sa base de données.
Le tome 2 de l'étude, payante, détaille l'ensemble des critères de classement (poids et variations de chaque critère), le système de sanctions, de personnalisation et de tracking de Google. Elle s'adresse, donc, à tous les professionnels qui ont besoin de connaître les leviers que l'on peut activer pour améliorer de façon significative le référencement de son site.
Page 11 / 80