Ranking Factor

V grafu jsou zobrazeny čtyři příklady korelací a příslušné křivky.

  1. Faktor A: Nulová korelace – lineární křivka, horizontální / vysoký průměr
  2. Faktor B: Kladná korelace (nejvyšší) – exponenciální funkce, klesající
  3. Faktor C: Záporná korelace (nejnižší) – lineární křivka, stoupající
  4. Faktor D: Kladná korelace – nepravidelná křivka, klesající

Vysvětlení: Výpočet korelace a přístupy k interpretaci

Osa y udává průměrnou hodnotu pro všech 10 000 zkoumaných adres URL na pozici X (osa x). Faktory s hodnotou „nula“ podle naší analýzy nepoukazují na žádnou měřitelnou korelaci mezi dobrými a špatnými výsledky Google. Čím vyšší je hodnota korelace, tím větší a pravidelnější jsou rozdíly mezi pozicemi. Hodnoty v záporném rozmezí je nejlépe chápat s opačným tvrzením interpretovaným pozitivně.

Zjednodušeně řečeno, čím větší jsou rozdíly mezi pozicemi 1 až 30, tím vyšší je hodnota korelace. K interpretaci faktorů se vždy používají průměrné hodnoty. Například faktory B a C z výše uvedeného grafu mají stejnou hodnotu korelace (tedy: 1), ale jsou zcela odlišné, pokud jde o jejich příslušné křivky. U faktoru A je však průměrná hodnota 95 (osa y) pro každou polohu (osa x), ale může být i na úrovni 5 (osa y). Hodnota korelace by zůstala stejná jako 0, ale interpretace faktoru by byla zcela odlišná.

Algoritmy vyhledávačů a faktory hodnocení společnosti Google & Co.

Vyhledávače pracují pomocí algoritmů, které hodnotí webové stránky podle tématu a relevance. Toto hodnocení slouží ke strukturování stránek v indexu vyhledávače, což v konečném důsledku vede k tomu, že uživatelské dotazy zobrazují nejlepší možné pořadí zobrazení výsledků. Kritéria pro hodnocení webových stránek a pro vytvoření tohoto pořadí se obecně označují jako faktory hodnocení.

Důvody jsou prosté: exponenciálně rostoucí počet dokumentů na internetu – a v indexu vyhledávače – znemožňuje hodnocení těchto stránek bez automatického algoritmu, a to i přes existenci lidských „hodnotitelů kvality“. Tento algoritmus je jednak povinný (pořadí koneckonců vyžaduje vzor), jednak je zároveň nejlépe střeženým tajemstvím v internetovém byznysu, protože pro vyhledávače je nezbytné udržet základní faktory, které algoritmus tvoří, v přísném utajení.

Toto neodmyslitelné utajení nesouvisí ani tak s konkurencí mezi vyhledávači, jako spíše se základními důvody: Kdyby byly způsoby získávání dobrých pozic všeobecně známé, staly by se irelevantními, protože by se s nimi neustále manipulovalo. Nikdo kromě společnosti Google neví, jaké jsou skutečné faktory hodnocení. Data analyzujeme pomocí korelační analýzy pořadí, abychom na základě vlastností existujících, organických výsledků vyhledávání vytvořili naše závěry. Z nich vyvozujeme, jaké by mohly být Faktory řazení a jejich příslušné váhy. Naše obrovská databáze poskytuje spolehlivý základ pro tyto analýzy.

Black Hat SEO:

Na počátku éry vyhledávačů Google považoval stránky za relevantní pro určitá témata, u nichž byly často používány s daným tématem související vyhledávací výrazy (klíčová slova). Provozovatelé stránek brzy využili této znalosti a dosáhli velmi dobrých pozic v SERP tím, že stránky „napěchovali“ klíčovými slovy, čímž umožnili, aby se jejich často nerelevantní stránky ocitly na dobře hodnocených pozicích pro zamýšlené vyhledávací výrazy.

Tím vznikla nejen skutečná konkurence mezi vyhledávači a SEO, ale vytvořil se i mýtus faktoru hodnocení. Cíl sémantického vyhledávání vytvořil síť kritérií, která byla zpočátku přísně technická (např. počet zpětných odkazů), ale byla doplněna o méně technické složky (např. signály uživatelů).

Tento vývoj spolu se snahou o optimální výsledek vyústil v neustálý vývoj faktorů řazení. Nekonečná smyčka zpětné vazby permanentně-iterativních aktualizačních cyklů je určena výhradně k vytváření výsledků vyhledávání, které nabízejí neustálé zlepšování pro jednotlivé vyhledávače. Struktura a komplexnost faktorů řazení, doplněná o silný vliv uživatelských signálů, je navržena tak, aby vytvářela co nejrelevantnější obsah pro uživatele.

Z obchodního hlediska lze dlouhodobého úspěchu dosáhnout pomocí udržitelné obchodní strategie založené na začlenění relevantních kvalitativních faktorů pro udržení silných pozic ve vyhledávání. Tento přístup znamená přehlížení možností negativního ovlivňování a jasné zaměření na relevantní obsah a zároveň boj proti spamu a krátkodobému působení.

Příčinná souvislost ≠ korelace

Nejsme společnost Google. Analýza a hodnocení faktorů řazení pomocí našich dat je založena na fundované interpretaci – nikoliv spekulaci – faktů; konkrétně na hodnocení a strukturování vlastností webových stránek s vysokými pozicemi ve výsledcích vyhledávání.

Vyhodnocení řazení Searchmetrics jsou přesná, čerstvá a založená na mnoha datech. My ve společnosti Searchmetrics měsíčně agregujeme miliardy datových bodů – a zde je otázka za 64 milionů dolarů:

Srovnáváme vlastnosti webových stránek se součtem jejich pozic ve vyhledávači Google a odvozujeme strukturovaný seznam více či méně vážených faktorů. Pokud tedy na předních pozicích zkoumaných SERPů například mnoho stránek obsahuje klíčové slovo v title tagu, pak to uznáme jako vysokou korelaci s dobrým umístěním. Tyto korelace tedy mohou nabídnout závěry o tom, které stránky zobrazené v předních výpisech výsledků vyhledávání mají podobné vlastnosti.

Je však nutné zdůraznit, že korelace nejsou synonymem kauzálních vztahů, a proto není zaručeno, že příslušné faktory mají skutečně nějaký vliv na pořadí – nebo že je Google vůbec používá jako signál. Co však v Searchmetrics děláme, je interpretace těchto korelací.

„Cum hoc ergo propter hoc“ – Logický klam a iluzorní korelace

Rostliny usychají, když nedostávají vodu: v domě je teplo, když zapnete topení – a protože má jeden web mnoho sociálních signálů, vyšplhá se na první místo? Stop!“

Existuje mnoho příkladů iluzorních korelací nebo hodnocení, které se označují jako „logický klam“ (Cum hoc ergo propter hoc – viz Wikipedie). Jako příklad lze uvést souběh jevů, jako je počet čápů a vyšší porodnost v určitých oblastech nebo vztah mezi prodejem zmrzliny a zvýšeným výskytem spálenin v létě. Ale opravdu se člověk spálí od zmrzliny? Samozřejmě že ne. Tyto příklady ukazují (iluzorní) korelaci, nikoliv kauzální vztah. (Další příklady najdete zde)

Chceme se za každou cenu vyhnout logickým klamům a iluzorním korelacím a naše zkušenosti ukazují, že je příliš snadné vyhodnotit faktor hodnocení jako faktor s kauzálním významem tam, kde žádný neexistuje. Raději pracujeme s „koeficientem korelace pořadí“, a to vyžaduje vyhodnocenou interpretaci a solidní databázi.

Databáze faktorů pořadí Searchmetrics

Naše analýza je založena na výsledcích vyhledávání pro velmi rozsáhlý soubor 10 000 klíčových slov pro vyhledávač Google U.S.. Výchozím souborem je vždy 10 000 nejvyhledávanějších výrazů podle objemu vyhledávání, ze kterého jsou však vyčleněna konkrétní klíčová slova zaměřená na navigaci, aby nedošlo ke zkreslení hodnocení. Za navigačně orientovaná klíčová slova jsou považována taková vyhledávání, u nichž jsou všechny výsledky kromě jednoho pro hledajícího víceméně irelevantní (např.: „Facebook Login“).

Naší databází pro analýzy Ranking Factor jsou vždy první tři stránky organických výsledků vyhledávání. Sady klíčových slov z následujících let se zpravidla z více než 90 procent shodují s databází z předchozího roku. Zde jsme hledali střední cestu, abychom zohlednili dva faktory, a sice zachování „největšího společného jmenovatele“ jako optimálního základu pro porovnání s předchozí studií, a na druhé straně zohlednění nových klíčových slov, u kterých vzrostl objem vyhledávání v prvních 10 000.

Báze u Searchmetrics je vždy aktuální. Proto jsou pro aktuální analýzy používána nová relevantní klíčová slova, například „Samsung Galaxy S5“ nebo „iPhone 6“, která dříve neexistovala.

Binární a číselné faktory – specifikace versus existence

Zkoumané faktory jsou rozděleny na binární a číselné funkce. To znamená, že existuje vnitřní rozdíl v povaze faktorů použitých v této analýze. Tento rozdíl by neměl být při interpretaci hodnot zanedbáván.

Prvky, které jsou popsány pomocí binárních faktorů – například meta popis na stránce – jsou buď přítomny, nebo ne. Neexistuje žádné odstupňování. Existují také prvky s odstupňovanými charakteristikami, které se mění v různé míře. Například adresa URL může mít nula nebo šest tisíc zpětných odkazů – ale každá hodnota mezi nimi je také možná.

Tyto číselné faktory jsou v jistém smyslu „lepší“ pro studie využívající korelační výpočty, jako je Spearman, s řádky a/nebo principy řazení založenými na gradacích. Pokud jde o interpretace založené pouze na čisté hodnotě korelace, jsou často významnější výroky pro číselné faktory.

Pro podporu platnosti korelací binárních znaků v naší studii je proto třeba v pravidle uvést průměrnou hodnotu. Například pokud jde o faktor „Existence popisu“, může se stát, že existuje pouze téměř nulová korelace s pořadím, ale ve skutečnosti má téměř 100 % všech adres URL popis (viz příklad korelace pro faktor A výše).

Hodnoty korelace versus průměrné hodnoty a křivky

Hodnoty korelace vynesené jako sloupec jsou vždy vypočítány na základě všech dostupných údajů pro každý rys, takže pro jedno nebo 10 000 klíčových slov má každá linie grafu 30 hodnot pro každé klíčové slovo.

Z těchto průměrných hodnot křivek jsou vypočítány průměrné hodnoty, které také vynechávají horních pět procent každé funkce, aby bylo možné dosáhnout co nejhladší křivky a zvládnutelného měřítka (osa Y), jinak by některé nižší průměry v příslušných křivkách nebyly vidět. Také jednotlivé mediány a průměrné hodnoty jsou vypočteny pro rysy bez ohledu na horních pět procent zjištění.

Faktor značky

Jednou z konstant při studiu faktorů hodnocení je zajímavá zvláštnost v datech, kterou jsme nazvali „faktor značky“, přítomný v mnoha faktorech a pozorováních.

Faktorem značky rozumíme pozorování, že weby značek s vysokým profilem nebo s určitou autoritou zpravidla obsazují v žebříčku úplně nejvyšší pozice, i když neberou v úvahu určité faktory, které dodržují URL adresy, které se umisťují o něco níže.

Značky například v průměru nemají na svých stránkách značku h1, jejich obsah má nižší počet slov a klíčové slovo se v popisu meta-titulu nevyskytuje tak často. Stručně řečeno: z hlediska SEO jsou méně optimalizované. Na druhou stranu webové stránky značek obvykle obsahují mnohem více zpětných odkazů a sociálních signálů než ostatní adresy URL.

Google již velmi efektivně identifikuje značky z určitých odvětví a přiděluje jejich adresám URL přednostní hodnocení. Hodnoty jako rozpoznatelnost, důvěra uživatelů a image značky se do určité míry odrážejí i v SERP.

Záměr:

Dá se říci, že ani sám Google neví, jak je jeho vlastní algoritmus sestaven, tak složité se staly hodnotící metriky.

Cílem studií Searchmetrics „Ranking Factors“ není vytvořit evangelium absolutní pravdy. Místo toho považujeme studie Searchmetrics za metodologickou analýzu z interpretačního hlediska. To znamená, že naším cílem je poskytnout online průmyslu snadný přístup k souboru datových nástrojů. Pomocí této sady nástrojů může odvětví činit informovaná rozhodnutí na základě našeho intenzivního výzkumu v širokém spektru kritérií.

K studii: Ranking Factors 2018:

: Cílená analýza pro větší úspěch na Googlu a na vašem online trhu.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.