Nel grafico sono mostrate quattro correlazioni di esempio e le rispettive curve.
- Fattore A: Correlazione zero – curva lineare, orizzontale / media alta
- Fattore B: Correlazione positiva (più alta) – funzione esponenziale, in calo
- Fattore C: Correlazione negativa (più bassa) – curva lineare, in aumento
- Fattore D: Correlazione positiva – curva irregolare, in calo
- Spiegazione: Approcci di calcolo e interpretazione della correlazione
- Algoritmi dei motori di ricerca e fattori di ranking di Google & Co.
- Black Hat SEO: Keyword Stuffing, Cloaking & Co.
- Causazione ≠ Correlazione
- “Cum hoc ergo propter hoc” – Fallacia logica e correlazioni illusorie
- Database per i fattori di ranking di Searchmetrics
- Fattori binari e numerici – Specificazione contro esistenza
- Valori di correlazione contro valori medi e curve
- Il fattore marchio
- Intenzione: Perché Ranking Factors?
Spiegazione: Approcci di calcolo e interpretazione della correlazione
L’asse y indica il valore medio per tutti i 10.000 URL studiati nella posizione X (asse x). I fattori con il valore “zero”, secondo la nostra analisi, indicano nessuna correlazione misurabile tra i buoni e i cattivi risultati di Google. Più alto è il valore di una correlazione, maggiori, e più regolari, le differenze tra le posizioni. I valori in una gamma negativa sono meglio compresi con l’affermazione opposta interpretata positivamente.
In parole povere, maggiori sono le differenze dalla posizione 1 alla 30, maggiore è il valore di correlazione. Per interpretare i fattori, si usano sempre i valori medi. Per esempio, i fattori B e C del grafico precedente hanno lo stesso valore di correlazione (cioè: 1), ma sono completamente diversi per quanto riguarda le loro rispettive curve. Per il fattore A, invece, il valore medio è 95 (asse y) per ogni posizione (asse x), ma potrebbe anche essere a 5 (asse y). Il valore di correlazione rimarrebbe identico a 0, ma l’interpretazione del fattore sarebbe completamente diversa.
Algoritmi dei motori di ricerca e fattori di ranking di Google & Co.
I motori di ricerca funzionano utilizzando algoritmi per valutare i siti web per argomento e rilevanza. Questa valutazione è usata per strutturare le pagine nell’indice del motore di ricerca, che alla fine si traduce in query dell’utente che visualizzano il miglior ranking possibile della visualizzazione dei risultati. I criteri per la valutazione delle pagine web e per produrre questo ranking sono generalmente indicati come fattori di ranking.
Le ragioni di ciò sono semplici: il numero esponenzialmente crescente di documenti su Internet – e nell’indice di ricerca – rende impossibile classificare queste pagine senza un algoritmo automatico, nonostante l’esistenza di “quality raters” umani. Questo algoritmo è sia obbligatorio (l’ordine, dopo tutto, richiede un modello), sia, allo stesso tempo, il segreto meglio custodito nel business di Internet, perché per i motori di ricerca è essenziale mantenere strettamente riservati i fattori sottostanti che compongono l’algoritmo.
Questa segretezza intrinseca ha meno a che fare con la competizione tra motori di ricerca che con ragioni più elementari: Se i modi per ottenere un buon posizionamento fossero ampiamente conosciuti, diventerebbero irrilevanti perché verrebbero costantemente manipolati. Nessuno tranne Google sa quali sono i veri fattori di ranking. Analizziamo i dati tramite l’analisi di correlazione dei ranghi per produrre le nostre conclusioni basate sulle proprietà dei risultati di ricerca organici esistenti. Da questi, concludiamo quali potrebbero essere i fattori di ranking e le loro rispettive ponderazioni. Il nostro immenso database fornisce una base affidabile per queste analisi.
Black Hat SEO: Keyword Stuffing, Cloaking & Co.
All’inizio dell’era dei motori di ricerca, Google considerava le pagine rilevanti per argomenti specifici dove i termini di ricerca associati all’argomento (parole chiave) erano usati frequentemente. I gestori dei siti approfittarono presto di questa conoscenza e raggiunsero ottime posizioni nelle SERP “riempiendo” le pagine di parole chiave, permettendo alle loro pagine, spesso non pertinenti, di essere trovate in posizioni ben posizionate per i termini di ricerca previsti.
Questo ha generato non solo una vera e propria concorrenza tra motori di ricerca e SEO, ma ha prodotto il mito del fattore di ranking. L’obiettivo della ricerca semantica ha creato una rete di criteri che inizialmente erano strettamente tecnici (ad esempio il numero di backlink), ma sono stati aggiunti da componenti meno tecnici (ad esempio i segnali degli utenti).
Questo sviluppo, insieme alla ricerca del risultato ottimale, è culminato nella costante evoluzione dei fattori di ranking. Il ciclo di feedback infinito di cicli di aggiornamento permanenti-iterativi è progettato esclusivamente per generare risultati di ricerca che offrono miglioramenti costanti al singolo ricercatore. La struttura e la complessità dei fattori di ranking, aggiunti alla forte influenza dei segnali degli utenti, è progettata per produrre il contenuto più rilevante per l’utente.
Da una prospettiva di business, il successo a lungo termine può essere raggiunto utilizzando una strategia di business sostenibile basata sull’incorporazione di fattori di qualità rilevanti per mantenere forti posizioni di ricerca. Questo approccio significa ignorare le opzioni di influenza negativa e concentrarsi chiaramente sui contenuti rilevanti, combattendo allo stesso tempo lo spam e il breve termine.
Causazione ≠ Correlazione
Noi non siamo Google. L’analisi e la valutazione dei fattori di ranking utilizzando i nostri dati si basa sull’interpretazione fondata – non sulla speculazione – dei fatti; vale a dire la valutazione e la strutturazione delle proprietà dei siti web con posizioni elevate nei risultati di ricerca.
Le valutazioni di ranking di Searchmetrics sono precise, fresche e basate su molti dati. Noi di Searchmetrics aggregiamo miliardi di punti dati su base mensile – ed ecco la domanda da 64 milioni di dollari: Quali fattori distinguono i siti ben posizionati da quelli con posizioni più basse nei risultati di ricerca di Google?
Confrontiamo le proprietà delle pagine web con la somma delle loro posizioni su Google e ricaviamo una lista strutturata di fattori più o meno pesati. Così, se nelle prime posizioni delle SERP analizzate, per esempio, molte pagine contengono la parola chiave nel tag del titolo, allora riconosciamo un’alta correlazione con un buon posizionamento. Queste correlazioni possono quindi offrire conclusioni su quali pagine visualizzate nelle prime posizioni dei risultati di ricerca hanno caratteristiche simili.
Tuttavia, è necessario sottolineare che le correlazioni non sono sinonimo di relazioni causali, e quindi non vi è alcuna garanzia che i rispettivi fattori abbiano effettivamente un impatto sul ranking – o siano mai utilizzati da Google come segnale. Quello che facciamo a Searchmetrics, tuttavia, è interpretare queste correlazioni.
“Cum hoc ergo propter hoc” – Fallacia logica e correlazioni illusorie
Le piante appassiscono quando non ricevono acqua: la casa è calda quando si accende il riscaldamento – e perché un sito ha molti segnali sociali, sale al #1? Basta!
Ci sono molti esempi di correlazioni o valutazioni illusorie che vengono definite “fallacia logica” (Cum hoc ergo propter hoc – vedi Wikipedia). Per esempio, la co-apparizione di fenomeni come il numero di cicogne e la maggiore natalità in certe zone, o la relazione tra le vendite di gelati e la maggiore incidenza di scottature solari in estate. Ma ci si scotta davvero con il gelato? Ovviamente no. Questi esempi mostrano una correlazione (illusoria), non una relazione causale. (Trova altri esempi qui)
Vogliamo evitare a tutti i costi le fallacie logiche e le correlazioni illusorie, e la nostra esperienza mostra che è troppo facile valutare un fattore di classifica come avente un significato causale dove non esiste. Preferiamo lavorare usando un “coefficiente di correlazione di rango”, e questo richiede un’interpretazione valutata e un solido database.
Database per i fattori di ranking di Searchmetrics
La nostra analisi si basa sui risultati di ricerca per un set di parole chiave molto ampio di 10.000 termini di ricerca per Google U.S.. Il pool di partenza è sempre i primi 10.000 termini di ricerca per volume di ricerca, ma da cui vengono estratte specifiche parole chiave orientate alla navigazione per non distorcere le valutazioni. Poiché le ricerche con parole chiave orientate alla navigazione sono considerate come quelle in cui tutti i risultati tranne uno sono più o meno irrilevanti per il ricercatore (ad esempio: “Facebook Login”).
Il nostro database per le analisi del Ranking Factor sono sempre le prime tre pagine dei risultati organici di ricerca. I set di parole chiave di anni consecutivi coincidono per più del 90% con il database dell’anno precedente, come regola. Qui abbiamo cercato una via di mezzo, per prendere in considerazione due fattori, vale a dire la conservazione del “massimo comune denominatore” come base ottimale per il confronto con lo studio precedente, e d’altra parte, prendere in considerazione nuove parole chiave, che sono cresciute in volume di ricerca nella top 10.000.
Il database di Searchmetrics è sempre attuale. Pertanto, per le analisi attuali vengono utilizzate nuove parole chiave rilevanti, come “Samsung Galaxy S5” o “iPhone 6”, che non esistevano in precedenza.
Fattori binari e numerici – Specificazione contro esistenza
I fattori esaminati sono divisi in caratteristiche binarie e numeriche. Questo significa che c’è una differenza intrinseca nella natura dei fattori usati in questa analisi. Questa differenza non dovrebbe essere trascurata nell’interpretazione dei valori.
Gli elementi che sono descritti utilizzando fattori binari – come una meta descrizione sulla pagina – sono presenti o non presenti. Non ci sono gradazioni. Ci sono anche elementi con caratteristiche graduate che cambiano in gradi diversi. Per esempio, un URL può avere zero o seimila backlink – ma ogni valore in mezzo è anche possibile.
Questi fattori numerici sono in un certo senso “migliori” per gli studi che utilizzano calcoli di correlazione come Spearman, con righe e/o principi di ranking basati su gradazioni. Quando si tratta di interpretazioni basate sul solo valore di correlazione pura, le affermazioni per fattori numerici sono spesso più significative.
Per sostenere la validità delle correlazioni di caratteristiche binarie nel nostro studio, quindi, un valore medio deve essere specificato nella regola. Per esempio, per quanto riguarda il fattore “Esistenza della descrizione”, può essere che ci sia solo una correlazione vicina allo zero con le classifiche, ma in realtà quasi il 100% di tutti gli URL hanno una descrizione (vedi l’esempio di correlazione per il fattore A sopra).
Valori di correlazione contro valori medi e curve
I valori di correlazione tracciati come una barra sono sempre calcolati sulla base di tutti i dati disponibili per caratteristica, quindi per una o 10.000 parole chiave, ogni linea del grafico ha 30 valori per parola chiave.
I valori medi sono calcolati a partire da questi valori medi delle curve, che tralasciano anche il cinque per cento superiore di ogni caratteristica per consentire una curva più liscia possibile e una scala gestibile (asse Y), altrimenti alcune medie inferiori nelle rispettive curve non sarebbero visibili. Inoltre, i valori mediani e medi individuali sono calcolati per le caratteristiche trascurando il primo cinque per cento dei risultati.
Il fattore marchio
Una delle costanti negli studi sui fattori di ranking è un’interessante peculiarità nei dati che abbiamo chiamato “fattore marchio”, presente in molti fattori e osservazioni.
Quello che intendiamo per fattore di marca è l’osservazione che i siti web di marche di alto profilo o con una certa autorità occupano generalmente le primissime posizioni nel ranking, anche se non tengono conto di particolari fattori a cui aderiscono gli URL che si classificano leggermente più in basso.
Per esempio, in media le marche tendono a non avere un h1-tag sulla loro pagina, il loro contenuto ha un numero di parole inferiore e la parola chiave non si trova così spesso nella descrizione del meta-titolo. In poche parole: da una prospettiva SEO sono meno ottimizzati. D’altra parte, i siti web di marca hanno tipicamente molti più backlink e segnali sociali di altri URL.
Google è già molto efficiente nell’identificare le marche di particolari settori e nell’assegnare ai loro URL un ranking preferenziale. Valori come la riconoscibilità, la fiducia degli utenti e l’immagine del marchio si riflettono anche nelle SERP in una certa misura.
Intenzione: Perché Ranking Factors?
E’ giusto dire che nemmeno Google stesso sa come è composto il suo algoritmo, tanto complesse sono diventate le metriche di valutazione.
L’obiettivo degli studi Searchmetrics “Ranking Factors” non è quello di produrre un vangelo di verità assoluta. Invece, consideriamo gli studi Searchmetrics come un’analisi metodologica da una prospettiva interpretativa. Ciò significa che miriamo a fornire all’industria online un facile accesso a una cassetta degli attrezzi di dati. Utilizzando questa cassetta degli attrezzi, l’industria può prendere decisioni informate basate sulla nostra ricerca intensiva su un ampio spettro di criteri.
Allo studio: Ranking Factors 2018: Analisi mirata per un maggiore successo su Google e nel tuo mercato online.
.