Searchmetrics explică: Ce este un factor de clasificare?

În grafic, sunt prezentate patru exemple de corelații și curbele respective.

Factor A: Corelație zero – curbă liniară, orizontală / medie mare
Factor B: Corelație pozitivă (cea mai mare) – funcție exponențială, în scădere
Factor C: Corelație negativă (cea mai mică) – curbă liniară, în creștere
Factor D: Corelație negativă (cea mai mică) – curbă liniară, în creștere
Factor D: Corelație pozitivă – curbă neregulată, în scădere

Explicație: Calculul corelației și abordări de interpretare
Algoritmii motoarelor de căutare și factorii de clasificare ai Google & Co.
Black Hat SEO: Keyword Stuffing, Cloaking & Co.
Cauzalitate ≠ Corelație
„Cum hoc ergo propter hoc” – Falsitatea logică și corelațiile iluzorii
Baza de date pentru Searchmetrics Ranking Factors
Factori binari și numerici – specificare versus existență
Valori de corelație versus valori medii și curbe
Factorul de marcă
Intenție: De ce Ranking Factors?

Explicație: Calculul corelației și abordări de interpretare

Axa y indică valoarea medie pentru toate cele 10.000 de URL-uri studiate la poziția X (axa x). Factorii cu valoarea „zero”, conform analizei noastre, indică faptul că nu există o corelație măsurabilă între rezultatele Google bune și rele. Cu cât valoarea unei corelații este mai mare, cu atât diferențele dintre poziții sunt mai mari și mai regulate. Valorile într-un interval negativ sunt cel mai bine înțelese cu afirmația opusă interpretată pozitiv.

Simplu spus, cu cât sunt mai mari diferențele de la poziția 1 la 30, cu atât este mai mare valoarea corelației. Pentru a interpreta factorii, se folosesc întotdeauna valorile medii. De exemplu, factorii B și C din graficul de mai sus au aceeași valoare de corelație (adică: 1), dar sunt complet diferiți în ceea ce privește curbele lor respective. Cu toate acestea, pentru factorul A, valoarea medie este de 95 (axa y) pentru fiecare poziție (axa x), dar ar putea fi chiar la 5 (axa y). Valoarea corelației ar rămâne identică la 0, dar interpretarea factorului ar fi complet diferită.

Algoritmii motoarelor de căutare și factorii de clasificare ai Google & Co.

Motoarele de căutare funcționează prin utilizarea de algoritmi pentru a evalua site-urile web în funcție de subiect și relevanță. Această evaluare este utilizată pentru a structura paginile din indexul motorului de căutare, ceea ce duce în cele din urmă la afișarea în cele mai bune poziții posibile a rezultatelor afișate în urma interogărilor utilizatorilor. Criteriile de evaluare a paginilor web și de producere a acestei clasificări sunt denumite, în general, factori de clasificare.

Motivele sunt simple: creșterea exponențială a numărului de documente de pe internet – și din indexul de căutare – face imposibilă clasificarea acestor pagini fără un algoritm automat, în ciuda existenței unor „evaluatori de calitate” umani. Acest algoritm este atât obligatoriu (ordinea, la urma urmei, necesită un tipar), cât și, în același timp, cel mai bine păstrat secret în afacerea internetului, deoarece, pentru motoarele de căutare, este esențial ca factorii care stau la baza algoritmului să rămână strict confidențiali.

Acest secret inerent are mai puțin de-a face cu concurența dintre motoarele de căutare decât cu motive mai de bază: Dacă modalitățile de obținere a unor clasamente bune ar fi cunoscute pe scară largă, acestea ar deveni irelevante, deoarece ar fi în mod constant manipulate. Nimeni în afară de Google nu știe care sunt adevărații factori de clasificare. Noi analizăm datele prin intermediul analizei de corelație a rangurilor pentru a produce concluziile noastre pe baza proprietăților rezultatelor de căutare organice existente. Din acestea, concluzionăm care ar putea fi Factorii de clasificare și ponderile lor respective. Baza noastră imensă de date oferă o bază fiabilă pentru aceste analize.

Black Hat SEO: Keyword Stuffing, Cloaking & Co.

La începutul erei motoarelor de căutare, Google a considerat că paginile sunt relevante pentru subiecte specifice în cazul în care termenii de căutare (cuvinte cheie) asociați subiectului erau frecvent utilizați. Operatorii de site-uri au profitat curând de aceste cunoștințe și au obținut poziții foarte bune în SERP prin „umplerea” paginilor cu cuvinte-cheie, permițând ca paginile lor, adesea nerelevante, să se găsească pe poziții bine plasate pentru termenii de căutare intenționați.

Aceasta a generat nu numai o concurență reală între motoarele de căutare și SEO, ci a produs și mitul factorului de clasificare. Obiectivul căutării semantice a creat o rețea de criterii care inițial erau strict tehnice (de exemplu, numărul de backlink-uri), dar la care s-au adăugat componente mai puțin tehnice (de exemplu, semnalele utilizatorilor).

Această dezvoltare, împreună cu urmărirea rezultatului optim, a culminat cu evoluția constantă a factorilor de clasificare. Bucla nesfârșită de feedback a ciclurilor de actualizare permanente-iterative este concepută pur și simplu pentru a genera rezultate de căutare care să ofere îmbunătățiri constante pentru fiecare căutător în parte. Structura și complexitatea factorilor de clasificare, la care se adaugă puternica influență a semnalelor utilizatorului, este concepută pentru a produce cel mai relevant conținut pentru utilizator.

Din punct de vedere comercial, succesul pe termen lung poate fi obținut prin utilizarea unei strategii comerciale durabile bazate pe încorporarea unor factori de calitate relevanți pentru a menține poziții puternice în căutări. Această abordare înseamnă o desconsiderare a opțiunilor de influență negativă și o concentrare clară asupra conținutului relevant, combătând, în același timp, spam-ul și scurtmetrajul.

Cauzalitate ≠ Corelație

Noi nu suntem Google. Analiza și evaluarea factorilor de clasificare cu ajutorul datelor noastre se bazează pe o interpretare bine fundamentată – nu pe speculații – a faptelor; și anume evaluarea și structurarea proprietăților site-urilor web cu poziții înalte în rezultatele căutărilor.

Evaluările de clasificare ale Searchmetrics sunt exacte, proaspete și bazate pe multe date. Noi, la Searchmetrics, agregăm lunar miliarde de puncte de date – și iată întrebarea de 64 de milioane de dolari: Ce factori diferențiază site-urile bine plasate de cele cu poziții inferioare în rezultatele de căutare Google?

Comparăm proprietățile paginilor web cu suma pozițiilor lor la Google și obținem o listă structurată de factori mai mult sau mai puțin ponderați. Astfel, dacă în primele poziții ale SERP-urilor investigate, de exemplu, multe pagini conțin cuvântul cheie în eticheta de titlu, atunci recunoaștem aceasta ca fiind o corelație ridicată cu o clasare bună. Prin urmare, aceste corelații pot oferi concluzii cu privire la paginile afișate în primele liste de rezultate de căutare care au caracteristici similare.

Totuși, este necesar să subliniem că corelațiile nu sunt sinonime cu relațiile de cauzalitate și, prin urmare, nu există nicio garanție că factorii respectivi au, de fapt, vreun impact asupra clasamentului – sau că sunt vreodată utilizați de Google ca un semnal. Ceea ce facem noi la Searchmetrics, totuși, este să interpretăm aceste corelații.

„Cum hoc ergo propter hoc” – Falsitatea logică și corelațiile iluzorii

Plantele se ofilesc când nu primesc apă: casa este caldă când dai drumul la încălzire – și pentru că un site are multe semnale sociale, urcă pe locul 1? Stop!

Există multe exemple de corelații sau evaluări iluzorii care sunt denumite „eroare logică” (Cum hoc ergo propter hoc – vezi Wikipedia). Ca exemplu, co-apariția unor fenomene precum numărul de berze și natalitatea mai mare în anumite zone, sau relația dintre vânzările de înghețată și incidența crescută a arsurilor solare în timpul verii. Dar chiar se fac arsuri solare de la înghețată? Bineînțeles că nu. Aceste exemple arată o corelație (iluzorie), nu o relație de cauzalitate. (Găsiți mai multe exemple aici)

Vrem să evităm cu orice preț falicile logice și corelațiile iluzorii, iar experiența noastră arată că este prea ușor să evaluăm un factor de clasificare ca având o semnificație cauzală acolo unde nu există. Preferăm să lucrăm cu ajutorul unui „coeficient de corelație de rang”, iar acest lucru necesită o interpretare evaluată și o bază de date solidă.

Baza de date pentru Searchmetrics Ranking Factors

Analiza noastră se bazează pe rezultatele căutărilor pentru un set foarte mare de cuvinte cheie de 10.000 de termeni de căutare pentru Google U.S.. Grupul de pornire este întotdeauna primii 10.000 de termeni de căutare în funcție de volumul de căutare, dar din care sunt extrase cuvinte-cheie specifice orientate spre navigare pentru a nu denatura evaluările. Deoarece căutările de cuvinte-cheie orientate spre navigare sunt considerate a fi cele în care toate rezultatele, cu excepția unuia, sunt mai mult sau mai puțin irelevante pentru persoana care le caută (de exemplu: „Facebook Login”).

Baza noastră de date pentru analizele privind factorii de clasificare sunt întotdeauna primele trei pagini de rezultate ale căutărilor organice. Seturile de cuvinte cheie din anii consecutivi coincid în proporție de peste 90 la sută cu baza de date din anul precedent, de regulă. Aici am căutat o cale de mijloc, pentru a ține cont de doi factori, și anume păstrarea „celui mai mare numitor comun” ca bază optimă de comparație cu studiul anterior și, pe de altă parte, luarea în considerare a cuvintelor cheie noi, care au crescut în volum de căutare în primele 10.000.

Baza de date de la Searchmetrics este întotdeauna actuală. Prin urmare, pentru analizele curente se folosesc cuvinte-cheie noi și relevante, cum ar fi „Samsung Galaxy S5” sau „iPhone 6”, care nu existau anterior.

Factori binari și numerici – specificare versus existență

Factori examinați sunt împărțiți în caracteristici binare și numerice. Acest lucru înseamnă că există o diferență inerentă de natură a factorilor utilizați în această analiză. Această diferență nu trebuie neglijată în interpretarea valorilor.

Elementele care sunt descrise cu ajutorul factorilor binari – cum ar fi o metadescriere pe pagină – sunt fie prezente, fie absente. Nu există gradații. Există, de asemenea, elemente cu caracteristici gradate care se modifică în grade diferite. De exemplu, un URL poate avea zero sau șase mii de backlink-uri – dar fiecare valoare intermediară este, de asemenea, posibilă.

Acești factori numerici sunt, într-un anumit sens, „mai buni” pentru studiile care utilizează calcule de corelație, cum ar fi Spearman, cu rânduri și/sau principii de clasificare bazate pe gradații. Când vine vorba de interpretări bazate doar pe valoarea pură a corelației, afirmațiile pentru factorii numerici sunt adesea mai semnificative.

Pentru a susține validitatea corelațiilor caracteristicilor binare din studiul nostru, prin urmare, trebuie specificată în regulă o valoare medie. De exemplu, în ceea ce privește factorul „Existența descrierii”, s-ar putea să existe doar o corelație apropiată de zero cu clasamentele, dar, de fapt, aproape 100% din toate URL-urile au o descriere (a se vedea exemplul de corelație pentru factorul A de mai sus).

Valori de corelație versus valori medii și curbe

Valorile de corelație reprezentate sub formă de bară sunt întotdeauna calculate pe baza tuturor datelor disponibile pentru fiecare caracteristică, astfel încât, pentru unul sau 10.000 de cuvinte cheie, fiecare linie a graficului are 30 de valori pentru fiecare cuvânt cheie.

Valorile medii sunt calculate din aceste valori medii ale curbei, care, de asemenea, lasă deoparte primele cinci procente din fiecare caracteristică pentru a permite o curbă cât mai netedă posibil și o scară gestionabilă (axa Y), altfel nu s-ar vedea unele medii mai mici din curbele respective. De asemenea, valorile mediane și medii individuale sunt calculate pentru caracteristicile care fac abstracție de primele cinci procente din constatări.

Factorul de marcă

Una dintre constantele studiilor privind factorii de clasificare este o particularitate interesantă a datelor pe care am numit-o „factorul de marcă”, prezentă în mulți factori și observații.

La ce ne referim prin factorul de brand este observația că site-urile web ale unor branduri de profil sau cu o anumită autoritate ocupă, în general, primele poziții în clasament, chiar dacă nu țin cont de anumiți factori la care aderă URL-urile care se clasează puțin mai jos.

De exemplu, în medie, brandurile tind să nu aibă un h1-tag pe pagina lor, conținutul lor are un număr mai mic de cuvinte și cuvântul cheie nu se regăsește la fel de des în descrierea meta-titlului. Pe scurt: din punct de vedere SEO, acestea sunt mai puțin optimizate. Pe de altă parte, site-urile web ale mărcilor prezintă, de obicei, mult mai multe backlink-uri și semnale sociale decât alte URL-uri.

Google este deja foarte eficient în identificarea mărcilor din anumite sectoare și în alocarea unui clasament preferențial pentru URL-urile acestora. Valori precum recognoscibilitatea, încrederea utilizatorilor și imaginea de marcă sunt, de asemenea, reflectate într-o anumită măsură în SERPs.

Intenție: De ce Ranking Factors?

Este corect să spunem că nici măcar Google însuși nu știe cum este alcătuit propriul său algoritm, atât de complexe au devenit metricile de evaluare.

Obiectivul studiilor Searchmetrics „Ranking Factors” nu este acela de a produce o evanghelie a adevărului absolut. În schimb, considerăm studiile Searchmetrics ca fiind o analiză metodologică dintr-o perspectivă interpretativă. Ceea ce înseamnă că ne propunem să oferim industriei online un acces facil la un set de instrumente de date. Prin utilizarea acestei cutii de instrumente, industria poate lua decizii în cunoștință de cauză pe baza cercetărilor noastre intensive pe un spectru larg de criterii.

La studiu: Ranking Factors 2018: Analiză țintită pentru mai mult succes pe Google și pe piața dumneavoastră online.