jeudi, 29 juillet 2021

La mort des mots-clés et la montée des sujets dans le référencement

Tabulation

  1. Peser les mots-clés en fonction de leur pertinence
  2. TF-IDF est toujours important mais problématique
  3. 3 choses que les mots-clés ne prennent pas en compte
  4. Commutation Des mots-clés aux entités
  5. Quelle est l’idée derrière les entités ?
  6. Pourquoi le suivi des mots-clés perd du terrain
  7. Sujets : les nouveaux mots-clés
  8. D’actualité Recherche par rapport à l’étude de recherche sur les mots clés
  9. Les clusters thématiques et l’avenir du référencement

Pendant des siècles, l’optimisation des moteurs de recherche (SEO) était tout au sujet des mots clés. Ils sont un élément fondamental du processus de recherche d’informations. C’était donc parfaitement logique : les moteurs de recherche ont exploré, découvert, indexé et classé le contenu en fonction de mots-clés.

Les mots-clés sont toujours importants dans le fonctionnement du référencement, bien qu’à un degré moindre. À son niveau le plus primitif, le signal crucial pour classer la pertinence d’un élément de matériel – et nonobstant tous les autres signaux – est basé sur la façon dont le mot-clé est généralement signalé sur une page.

Peser les mots-clés Pour l’Importance

C’est ce qu’on appelle « TF » ou « fréquence des termes ».

Le problème est que les mots vides comme « le », « a », « et », « dans,  » « à », et ainsi de suite apparaissent tous beaucoup plus régulièrement. Un autre processus est nécessaire. Il s’agit de comparer la fréquence des termes de tous les autres termes avec la fréquence à laquelle ils sont utilisés dans d’autres fichiers.

Cela évite que les mots vides ne soient catégorisés comme plus pertinents.

Appelée « fréquence inverse des termes » ou « IDF », cette formule examine la fréquence des mots-clés et la compare à la fréquence d’autres termes dans un ensemble de travaux (comme le d’un site Web, par exemple). Étant donné que les mots vides apparaissent proportionnellement plus régulièrement, ils sont éliminés.

Appelée TF * IDF, ce qui implique « la fréquence des termes (augmentée par) la fréquence des fichiers inversée », cette formule fournit à un mot-clé un poids numérique particulier.

Au départ, il pèse combien de fois un mot-clé est signalé sur une seule page. Ensuite, en pesant le mot-clé sur toutes les autres pages (et en le comparant au poids d’autres mots-clés), la page avec la fréquence la plus élevée obtiendra un score – et pour cette raison un classement – plus élevé.

Le La formule est appliquée pour comprendre l’importance d’un document donné au sein d’un groupe de documents, comme la pertinence d’une page concernant un mot-clé spécifique par rapport à l’importance de toutes les autres pages d’un site, par exemple.

C’est la raison pour laquelle, pendant très longtemps, le référencement ne s’est pas seulement concentré sur les mots-clés mais aussi, comme une bonne pratique, a prescrit un mot-clé principal (ou « mot-clé focalisé ») pour chaque page. De nombreux outils et plugins de référencement que les développeurs de matériel utilisent toujours suivent cette norme.

TF-IDF est toujours essentiel mais problématique

Là où TF-IDF est particulièrement bénéfique, c’est lorsqu’il est utilisé pour comparer le poids d’un mot-clé à d’autres au sein d’un plus grand corpus de travail – comme l’ensemble de l’Internet. C’était la base de la façon dont le moteur de recherche en ligne classerait des pages spécifiques de plusieurs sites Web. C’est toujours le cas dans une certaine mesure.

La formule est plus compliquée que ce que je décris ici, mais en gros c’est simple : lors de la recherche d’un mot-clé, la page avec le poids beaucoup plus lourd sera mieux classée.

Étant donné sa création en 1972, TD-IDF reste la procédure de base de récupération d’informations et d’évaluation de son importance. En vérité, aujourd’hui, il est utilisé dans l’apprentissage automatique et la construction de systèmes experts (IA) en offrant aux applications logicielles avancées une base de travail.

En soi, cette formule crée un problème.

À l’époque primitive du Web, l’augmentation de la fréquence des mots-clés dans une page était l’une des méthodes les plus simples et les plus fiables pour obtenir un classement élevé. Ceci, en soi, n’est pas un problème. Inclure un mot-clé supplémentaire ici ou là ne fait pas de mal.

Mais avec le temps, au fur et à mesure que de plus en plus de propriétaires de sites Web s’en aperçoivent, cela a créé un risque d’abus. Cela a alimenté un jeu de surenchère, où des pages bourrées de mots-clés qui n’avaient guère de sens remplissaient les résultats des moteurs de recherche en ligne. Cela a considérablement affecté l’expérience utilisateur.

Malgré le fait que TF-IDF détermine l’importance, ce n’est pas un signe formidable de qualité – la qualité du contenu dans lequel le mot-clé apparaît. Ce moteur de recherche en ligne pressé d’évoluer pour mieux comprendre ce que les pages signifient et déterminer leur importance au-delà des mots-clés.

Les principales mises à jour de l’algorithme de diminuent l’importance (ou bien mieux, la dépendance à l’égard) des mots-clés. contenu, ce qui rend ironiquement TF-IDF moins pertinent.

La notation des mots-clés seuls ne tient pas compte des nuances et de la profondeur.

Trois choses que les mots-clés ne prennent pas en compte

Les mots clés sont pondérés en fonction de leur importance. Mais la pertinence seule ne suffit pas. Il y a 3 limitations considérables avec la technologie TF * IDF en ce qui concerne les mots-clés :

1. Elle ne tient pas compte de la signification du mot-clé.

TD-IDF se concentre uniquement sur les mots-clés. Il ne pense pas aux variations de mots-clés, aux mots-clés associés sémantiquement et à la relation entre les mots-clés. Il ne parvient pas à examiner les synonymes et les mots liés en fonction de thèmes ou de contexte.

Par exemple, indiquez que votre mot clé est « savon ». Vous avez du savon de bain, du savon pour lave-vaisselle, du savon à lessive, du savon de nettoyage, du savon à barbe, etc. Vous disposez également de divers types de savon, tels que du savon artisanal, du savon parfumé, du savon pour bébé, du savon médicamenteux, du savon à la glycérine, etc.

. Ce problème s’intensifie lorsque vous pensez aux différents types de savon, comme le shampoing liquide, le détergent à lessive, le gel douche, la crème à raser, le bain moussant, etc. Il existe également des  » feuilletons « , une émission télévisée  » Soap « ,  » to soap  » (pour flatter) et SOAP (Simple Item Access Protocol).

Les possibilités sont presque infinies.

Sans penser au contexte, tel que les variations de mots-clés, leur position dans le matériel, l’interdépendance entre les mots-clés et les méthodes les mots-clés s’intègrent et se connectent au reste de la page, les mots-clés seuls peuvent être plutôt trompeurs.

2. Il néglige la signification du mot-clé.

TF-IDF vise à déterminer la pertinence d’un mot clé, mais cesse de fonctionner pour évaluer l’importance de cette signification. Que faire si un autre mot clé est plus approprié mais apparaît moins régulièrement ? Et si une autre page avec différents mots-clés offrait plus de valeur basée sur exactement le même mot-clé ?

En termes simples, TF-IDF ne tient pas compte non seulement de la manière dont les mots-clés s’intègrent dans le contexte de la page, mais aussi dans le reste de le site. Par conséquent, d’autres pages peuvent contenir exactement les mêmes mots-clés qui apparaissent moins régulièrement, mais leur contenu peut être plus pertinent et adapté au sujet.

Une bien meilleure façon de le dire, c’est que la pertinence ne l’est pas. valeur égale.

Un mot clé peut être jugé pertinent parce qu’il est utilisé plus fréquemment, mais cela n’indique pas qu’il augmente la valeur de la page sur laquelle il se trouve. D’autres mots-clés, sans parler d’autres pages, sont peut-être plus appropriés, malgré la fréquence du mot-clé ou le score TF-IDF.

Par exemple, une page avec le mot-clé « savon médicamenteux » a une meilleure note de pertinence par rapport à autres pages. Mais une page moins appropriée peut parler de savon antibactérien, antifongique et antimicrobien de manière plus approfondie, ce qui pourrait être plus approprié sur le plan thématique.

Semblable à la limitation précédente, d’autres mots clés et variantes de mots clés (et les mots clés associés qui sont connectés mais dissemblables) peuvent être découverts sur d’autres pages qui peuvent être plus pertinentes pour l’utilisateur que le document TF-IDF est en train d’analyser.

3. Il néglige la fonction du mot-clé.

Il y a la partie la plus essentielle de la formule. Cela ne fait même pas du tout partie de l’équation TF-IDF. Quel est l’utilisateur.

TF-IDF peut fournir une idée de ce que la page pourrait être. Cependant, il peut être trop basique ou trop spécifique pour ce que l’utilisateur souhaite. De même, TF-IDF pourrait la comparer à des pages complètement différentes qui peuvent servir divers publics ou atteindre divers objectifs.

Toutes ces autres pages, malgré leur objectif, sont regroupées dans l’équation. Par exemple, TF-IDF peut comparer un mot-clé sur un article de blog au mot-clé sur une page d’achat, une FAQ ou une page ciblant un marché totalement différent.

En substance, ce que la page est censée faire do joue un rôle essentiel et doit être pris en compte pour déterminer son importance. Le simple fait d’examiner les mots clés ne permet pas de penser aux différents types de pages qui pourraient ne pas correspondre à l’intention de recherche de l’utilisateur.

Certes, certains mots clés plus longs donnent une idée de l’intention de recherche, comme les préoccupations ou les qualificatifs de mots clés ( Par exemple, « Combien coûte le savon Ivory ? » ou « Le meilleur savon médicamenteux pour peau sèche »).

Mais en se basant uniquement sur TF-IDF, cela éliminerait simplement les mots vides, extrairait divers mots-clés (par exemple, « savon médicamenteux » ou « peau sèche »), et comparez-les à d’autres mots-clés sur des pages diverses et potentiellement sans importance, telles que les ventes en gros de savons ou des didacticiels sur la fabrication de savons.

Comprendre les mots-clés en tant qu’entités est basé sur le contexte et les relations.

Passer des mots-clés aux entités

Heureusement, la fréquence n’est qu’une des nombreuses mesures qui entrent dans la pondération des mots-clés. De plus, d’autres éléments de classement jouent un rôle dans la détermination de la pertinence d’un mot clé particulier.

Cependant, au cours des dernières années, l’intelligence artificielle et un processus appelé « traitement du langage naturel » (NLP) ont changé la façon dont nous jetez un œil aux mots-clés. Bien qu’ils soient toujours cruciaux, de tout nouveaux algorithmes examineront et essaieront de comprendre les mots-clés à un niveau plus profond et plus nuancé.

Pour résoudre les trois inconvénients soulignés précédemment, l’application logicielle de moteur de recherche a désormais l’intention de comprendre mots-clés en apprenant comment ils sont utilisés en langage naturel. Pour ce faire, il considère l’utilisation, le contexte et la relation des mots-clés.

Ceci permet à l’application logicielle de déterminer les subtilités et les complexités d’un mot-clé. Bien qu’ils soient encore techniquement des mots-clés, sur la planète de la PNL, ils sont appelés « entités ».

Les entités deviennent progressivement importantes, en particulier dans le numérique, car elles modifient la méthode que nous considérons comme le référencement. En proposant des mots-clés indiquant qu’ils peuvent changer en fonction de divers éléments, nous ne pouvons plus simplement améliorer le matériel basé uniquement sur des mots-clés.

La signification d’un mot-clé peut varier considérablement en fonction de son contexte, de son utilisation et de sa position. dans le matériel (c’est-à-dire le texte qui l’entoure et d’autres aspects de la page). Il peut même complètement modifier le sens du passage ou du matériel lui-même, lui donnant un contexte entièrement différent.

Comme le dit l’expression, qui utilise complètement le référencement d’aujourd’hui :

Contenu, sans contexte, ne vaut rien.

Quel est le concept derrière les entités ?

Les entités sont des mots-clés qui, selon le contexte, indiquent quelque chose de spécifique. Il peut s’agir de « noms », de « types » ou de « caractéristiques ». Ils peuvent se rapporter à d’autres idées. En les regroupant, ils aident à identifier de manière unique une personne, un objet ou une occasion.

Le « savon antibactérien » est une entité tandis que le « désinfectant pour les mains » en est une autre. Ce dernier n’est peut-être pas un type de savon différent du premier, mais ils sont toujours associés. Selon le contexte, les deux sont différents types de « nettoyants désinfectants » (une autre entité).

Pour pousser cet exemple plus loin, dans un court article sur « COVID-19 » (également une entité), « antibactérien savon » a une signification diverse du fait de celle du contexte. C’est pourquoi « savon antibactérien », en tant que mot-clé, ne veut pas dire grand-chose. Cependant, en tant qu’entité, elle a une importance, une importance et un objectif.

Au lieu de considérer les mots clés comme directs ou sur un spectre, vous pouvez les considérer comme apparaissant dans un groupe de concepts connectés les uns aux autres, un peu comme une roue à moyeu et à rayons. (Google les appelle « branches » et « nœuds » et les mappe ensemble dans ce qu’il appelle un « graphique de compréhension. »)

Prenez la « tête » et les « épaules ». Ce sont 2 mots-clés différents. « Tête et épaules » est également un mot-clé différent. Mais « Head & Shoulders » est un nom de marque. C’est une entité. De même, « pellicules », « shampoing » et « shampoing anti-pelliculaire » sont également des entités – et associées les unes aux autres.

Les entités sont beaucoup plus complexes que ce que je veux dire dans cet article , et ils ont encore plus d’implications et d’applications potentielles que je ne peux en décrire de manière appropriée.

La chose cruciale à garder à l’esprit est que le comportement de recherche a changé, qu’on le veuille ou non. Par la suite, le référencement a réellement progressé et continue à se développer. Pour cette raison, il va de soi que la pratique et les praticiens du référencement, ainsi que les destinataires des services de référencement, devraient changer avec lui.

Pourquoi le suivi des mots clés perd du terrain

Avant , les requêtes de recherche consistaient généralement en un ou plusieurs mots enchaînés. Mais les résultats des moteurs de recherche n’ont pas pris en compte la complexité du langage humain.

Les résultats de recherche étaient partout. Obtenir la réponse que vous vouliez était principalement un jeu d’opportunités. (En mentionnant cela, c’est probablement l’une des raisons pour lesquelles a introduit le bouton « Je me sens chanceux » comme moyen de contourner toutes les pages de résultats de recherche ou les SERP.)

Dans un effort pour obtenir de meilleurs résultats, les utilisateurs inclurait plus de mots-clés à leurs demandes de renseignements. Cela se retournerait souvent contre eux : Google examinerait les mots-clés individuels dans la question et traiterait des résultats différents pour chacun. Il classerait alors n’importe quoi, malgré la parenté.

Cependant, étant donné que l’introduction de la recherche orientée entité (un terme inventé par l’ancien scientifique de Google Kriszrtian Balog), les mots-clés deviennent intrinsèquement dénués de sens. Ou bien mieux dit, se concentrer sur les mots-clés et leur classement est devenu une quête inutile.

Les mots-clés sont toujours importants, comme pour mener une étude de recherche. Mais optimiser le contenu avec des mots-clés spécifiques et essayer de les classer en fonction de ceux-ci devient de plus en plus obsolète.

Aujourd’hui, avec les assistants numériques, les appareils intelligents et la recherche vocale donnant aux utilisateurs la possibilité de poser des questions longues et complexes, et des préoccupations nuancées, la recherche de mots-clés particuliers n’a pas de sens.

Comme l’a écrit le professionnel du référencement Christian Stobitzer dans « Entity First » (2020): « La navigation par mot-clé standard finit par devenir de moins en moins importante, tout comme le référencement basé uniquement sur des mots-clés. . »

Le référencement d’aujourd’hui examine les sujets et les sous-sujets, pas les mots-clés privés.

Sujets : les nouveaux mots-clés

Auparavant, le processus consistait à améliorer le contenu autour d’un mot-clé populaire. Soit cela, soit commencez par le mot-clé et écrivez du contenu autour de celui-ci. Cependant, les deux méthodes négligent ce que le mot-clé implique ou comment il s’intègre dans le reste du matériel, encore moins le site.

Ces stratégies sont vulnérables aux abus, qui ont tendance à rendre le matériel illisible ou inutilisable. Mais, plus particulièrement, ils ignorent l’aspect le plus important du matériel : le lecteur.

Au lieu de mots-clés, concentrez-vous sur des sujets.

En utilisant l’exemple précédent, le terme « anti- shampooing antipelliculaire » est plus qu’un simple mot-clé. C’est un sujet. Il peut s’agir d’un sujet général sur le contrôle des pellicules, ou il peut s’agir d’un sous-sujet dans un court article sur les différents types de « shampooings ». Quoi qu’il en soit, le contexte est essentiel.

En se concentrant sur des sujets, la lutte pour des mots clés particuliers finit par être sans importance. Il n’est plus nécessaire de faire des backflips en essayant de forcer des mots-clés irréguliers, non naturels et fréquemment mal orthographiés dans le contenu simplement pour essayer de les classer car ils sont populaires.

Essayer de s’adapter au « meilleur covid soap toronto » dans une phrase, tel quel, est inutile, sans parler d’une dureté abrutissante. C’est encore pire s’il est dupliqué plusieurs fois sur la page.

Si l’étude de la recherche de mots clés est toujours cruciale, il vaut mieux comprendre quels sujets l’utilisateur veut connaître, quels sujets sont déjà couverts (ou pas), et les sujets sur lesquels bloguer à ce sujet offriront également tous les détails nécessaires pour améliorer les signaux de recherche.

Recherche thématique vs étude de recherche sur les mots clés

Le processus se résume à ces étapes nécessaires :

  1. Tout d’abord, découvrez un point douloureux que le lecteur rencontre, une préoccupation qu’il pose ou un sujet spécifique qui l’intéresse – un sujet sur lequel il pourrait faire des recherches lui-même.
  2. Regardez les résultats qui se présentent et comparez. La recherche étudie les types de contenu existants qui couvrent le sujet (ou comment ils cessent de travailler pour le couvrir correctement).
  3. Avant tout, produire un objectif pour le contenu, qui a du sens à la fois pour le lecteur et le site Web. Couvrez le sujet en pensant à la fois à l’utilisateur et à cet objectif.
  4. En utilisant le sujet comme un guide (plutôt qu’un mot-clé particulier comme objectif), se compose de mots-clés connexes, qui apparaîtront naturellement et sans effort tout au long du pièce.

Bien entendu, des étapes supplémentaires peuvent aider, mais elles ne sont pas obligatoires. Par exemple, choisissez les mots-clés les plus couramment consultés qui relèvent du sujet. Incorporez ces mots-clés dans les titres et les sous-titres, ainsi que dans le code HTML de la page.

Si le sujet montre ce qui intéresse réellement le lecteur et ce qu’il recherche, tout le reste se mettra en place naturellement, consistant en l’idéal mots clés. Du point de vue du référencement, tout ce qui reste à faire est de s’assurer que le matériel est structuré de manière appropriée.

La relation entre les sujets et le contenu est ce qui est très important. Certains sujets sont plus vastes et plus inclusifs que d’autres. Les autres peuvent être des sous-thèmes ou des thèmes associés.

Un contenu peut couvrir un thème général selon 2 méthodes. Il peut le diviser en sous-thèmes sur une seule page pour s’assurer qu’il couvre le sujet en profondeur. Ou il peut inclure plusieurs éléments, où chacun couvre des sous-thèmes distincts liés entre eux.

Les clusters thématiques et l’avenir du référencement

Semblable à la carte des nœuds et des branches discutée ci-dessus avec entités et le Knowledge Graph, les clusters thématiques ressemblent à des roues, avec des centres et des rayons également.

Auparavant, les mots-clés étaient organisés et arrangés selon des classifications ou des silos. Bien que cela puisse toujours fonctionner pour structurer le contenu, c’est linéaire et non pas la façon dont les sujets (et les relations entre eux) ont tendance à fonctionner. Pensez à une carte mentale, par exemple.

Alors que le référencement à l’ancienne était basé sur des mots-clés et leur popularité (pour le moteur de recherche en ligne), le référencement d’aujourd’hui est basé sur des sujets et leur valeur. (au lecteur).

Les précédents auteurs obligeaient les auteurs à créer d’abord du contenu pour les moteurs de recherche en ligne et les utilisateurs en dernier. Maintenant, ce n’est pas seulement inversé mais également structuré puisque le moteur de recherche en ligne est comme l’utilisateur.

En d’autres termes, les algorithmes d’apprentissage automatique aident les moteurs de recherche à devenir plus sophistiqués. , apprendre et comprendre le langage comme le fait un humain. Cela n’a plus de sens d’écrire pour les moteurs de recherche. Ce n’est pas nécessaire.

C’est comme essayer de traduire quelque chose qui finira par être retraduit de toute façon. Cette procédure n’est donc pas seulement redondante, mais elle peut aussi être destructrice car des choses peuvent se perdre dans la traduction.

En fin de compte, il est bien mieux d’écrire pour l’utilisateur. Concentrez-vous sur les ravir. Offrez-leur le meilleur contenu possible et la meilleure expérience possible lors de la consommation de ce matériel.

Si vous écrivez pour votre public, vous composez également pour Google. Faites-le et, à votre tour, vous enverrez tous les bons signaux de recherche. Vous allez inclure des mots-clés, créer des liens, gagner des points, construire une autorité, générer du bouche à oreille, bien vous classer et générer du trafic. Naturellement.

C’est le référencement de la nouvelle école.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici