I grafen er vist fire eksempler på korrelationer og de respektive kurver.
- Faktor A: Nul korrelation – lineær kurve, horisontal / højt gennemsnit
- Faktor B: Positiv korrelation (højeste) – eksponentiel funktion, faldende
- Faktor C: Negativ korrelation (laveste) – lineær kurve, stigende
- Faktor D: Positiv korrelation – uregelmæssig kurve, faldende
- Forklaring: Korrelationsberegning og fortolkningsmetoder
- Søgemaskinealgoritmer og Google & Co.
- Black Hat SEO: I begyndelsen af søgemaskinealderen betragtede Google sider som relevante for bestemte emner, hvor de emnetilknyttede søgeord (nøgleord) blev brugt hyppigt. Webstedsoperatører udnyttede hurtigt denne viden og opnåede meget gode placeringer i SERP’erne ved at “fylde” sider med søgeord, hvilket gjorde det muligt for deres ofte ikke-relevante sider at blive fundet på velplacerede placeringer for de tilsigtede søgeord.
- Kausalitet ≠ Korrelation
- “Cum hoc ergo propter hoc” – Logisk fejlslutning og illusoriske korrelationer
- Database for Searchmetrics Ranking Factors
- Binære og numeriske faktorer – specifikation kontra eksistens
- Korrelationsværdier versus gennemsnitsværdier og kurver
- Brand-faktoren
- Intention: Hvorfor Ranking Factors?
Forklaring: Korrelationsberegning og fortolkningsmetoder
Y-aksen angiver den gennemsnitlige værdi for alle 10.000 undersøgte URL’er på position X (x-aksen). Faktorer med værdien “nul” peger ifølge vores analyse på, at der ikke er nogen målbar korrelation mellem gode og dårlige Google-resultater. Jo højere værdien af en korrelation er, jo større og mere regelmæssige forskelle er der mellem positionerne. Værdier i et negativt interval forstås bedst med det modsatte udsagn positivt fortolket.
Simpelt sagt, jo større forskellene fra position 1 til 30 er, jo højere er korrelationsværdien. Til fortolkning af faktorerne anvendes altid gennemsnitsværdier. F.eks. har faktorerne B og C fra ovenstående graf den samme korrelationsværdi (dvs.: 1), men er helt forskellige med hensyn til deres respektive kurver. For faktor A er gennemsnitsværdien imidlertid 95 (y-aksen) for hver position (x-aksen), men den kan endda ligge på 5 (y-aksen). Korrelationsværdien ville forblive identisk på 0, men fortolkningen af faktoren ville være helt anderledes.
Søgemaskinealgoritmer og Google & Co.
Søgemaskinerne fungerer ved hjælp af algoritmer til at vurdere websteder efter emne og relevans. Denne evaluering bruges til at strukturere siderne i søgemaskinens indeks, hvilket i sidste ende resulterer i, at brugernes forespørgsler vises med den bedst mulige placering af resultatvisningen. Kriterierne for vurderingen af websider og for at frembringe denne rangordning kaldes generelt for rangordningsfaktorer.
Grundene til dette er ligetil: Det eksponentielt stigende antal dokumenter på internettet – og i søgeindekset – gør det umuligt at rangordne disse sider uden en automatisk algoritme, selv om der findes menneskelige “kvalitetsbedømmere”. Denne algoritme er både obligatorisk (orden kræver trods alt et mønster) og samtidig den bedst bevarede hemmelighed i internetbranchen, fordi det for søgemaskinerne er vigtigt at holde de underliggende faktorer, som algoritmen består af, strengt fortrolige.
Denne iboende hemmeligholdelse har mindre at gøre med konkurrencen mellem søgemaskinerne end med mere grundlæggende årsager: Hvis metoderne til at opnå gode placeringer var almindeligt kendt, ville de blive irrelevante, da de konstant ville blive manipuleret. Ingen andre end Google ved, hvad de virkelige ranglistefaktorer er. Vi analyserer data via rangkorrelationsanalyse for at producere vores resultater baseret på egenskaberne af eksisterende, organiske søgeresultater. Ud fra disse konkluderer vi, hvad Ranking Factors og deres respektive vægtninger kunne være. Vores enorme database giver et pålideligt grundlag for disse analyser.
Black Hat SEO: I begyndelsen af søgemaskinealderen betragtede Google sider som relevante for bestemte emner, hvor de emnetilknyttede søgeord (nøgleord) blev brugt hyppigt. Webstedsoperatører udnyttede hurtigt denne viden og opnåede meget gode placeringer i SERP’erne ved at “fylde” sider med søgeord, hvilket gjorde det muligt for deres ofte ikke-relevante sider at blive fundet på velplacerede placeringer for de tilsigtede søgeord.
Dette skabte ikke blot en reel konkurrence mellem søgemaskiner og SEO’er, men skabte også myten om rankingfaktoren. Målet om semantisk søgning skabte et netværk af kriterier, der oprindeligt var strengt tekniske (f.eks. antallet af backlinks), men som blev suppleret med mindre tekniske komponenter (f.eks. brugersignaler).
Denne udvikling har sammen med jagten på det optimale resultat kulmineret i en konstant udvikling af rankingfaktorer. Det uendelige feedback loop af permanent-iterative opdateringscyklusser er udelukkende designet til at generere søgeresultater, der tilbyder konstante forbedringer for den enkelte søger. Rankingfaktorernes struktur og kompleksitet er sammen med den stærke indflydelse fra brugersignalerne designet til at producere det mest relevante indhold for brugeren.
Fra et forretningsperspektiv kan der opnås langsigtet succes ved at anvende en bæredygtig forretningsstrategi baseret på indarbejdelse af relevante kvalitetsfaktorer for at opretholde stærke søgepositioner. Denne tilgang betyder en tilsidesættelse af negative indflydelsesmuligheder og et klart fokus på relevant indhold, samtidig med at spam og kortsigtethed bekæmpes.
Kausalitet ≠ Korrelation
Vi er ikke Google. Analysen og vurderingen af rankingfaktorer ved hjælp af vores data er baseret på velbegrundet fortolkning – ikke spekulation – af fakta; nemlig vurdering og strukturering af websideegenskaber med høje placeringer i søgeresultaterne.
Søgmetrics’ rankingvurderinger er nøjagtige, friske og baseret på mange data. Hos Searchmetrics aggregerer vi milliarder af datapunkter på månedlig basis – og her er det 64-millioner-dollar-spørgsmålet: Hvilke faktorer adskiller velplacerede websteder fra dem med lavere placeringer i Googles søgeresultater?
Vi sammenligner websidernes egenskaber med summen af deres placeringer hos Google og udleder en struktureret liste over mere eller mindre vægtede faktorer. Så hvis der f.eks. i de forreste positioner i de undersøgte SERP’er er mange sider, der indeholder søgeordet i titletagget, så anerkender vi det som en høj korrelation med en god placering. Disse korrelationer kan derfor give konklusioner om, hvilke sider, der vises i de øverste søgeresultatlister, der har funktioner, der ligner hinanden.
Det er dog nødvendigt at påpege, at korrelationer ikke er ensbetydende med årsagssammenhænge, og derfor er der ingen garanti for, at de respektive faktorer rent faktisk har nogen indflydelse på ranglisten – eller nogensinde bliver brugt af Google som et signal. Det vi gør hos Searchmetrics er derimod at fortolke disse korrelationer.
“Cum hoc ergo propter hoc” – Logisk fejlslutning og illusoriske korrelationer
Planter visner, når de ikke får vand: Huset er varmt, når du skruer op for varmen – og fordi et site har mange sociale signaler, kravler det op på #1? Stop!
Der er mange eksempler på illusoriske sammenhænge eller vurderinger, der betegnes som “logiske fejlslutninger” (Cum hoc ergo propter hoc – se Wikipedia). Som eksempel kan nævnes den samtidige forekomst af fænomener som antallet af storke og den højere fødselsrate i visse områder, eller sammenhængen mellem salget af is og den øgede forekomst af solskoldning om sommeren. Men får man virkelig solskoldning af is? Selvfølgelig ikke. Disse eksempler viser en (illusorisk) korrelation, ikke en årsagssammenhæng. (Find flere eksempler her)
Vi ønsker for enhver pris at undgå logiske fejlslutninger og illusoriske sammenhænge, og vores erfaring viser, at det er for let at vurdere en rangordningsfaktor som havende en kausal betydning, hvor der ikke findes nogen. Vi foretrækker at arbejde med en “rangkorrelationskoefficient”, og det kræver en vurderet fortolkning og en solid database.
Database for Searchmetrics Ranking Factors
Vores analyser er baseret på søgeresultater for et meget stort søgeordssæt på 10.000 søgeord for Google U.S.. Udgangspuljen er altid de 10.000 bedste søgetermer efter søgevolumen, men hvorfra specifikke navigationsorienterede søgeord er udtrukket for ikke at forvride evalueringerne. Da navigationsorienterede søgeordssøgninger anses for at være søgninger, hvor alle resultater undtagen ét er mere eller mindre irrelevante for den søgende (f.eks.: “Facebook Login”).
Vores datagrundlag for Ranking Factor-analyserne er altid de tre første organiske søgeresultatsider. Sættene af søgeord fra på hinanden følgende år er som regel sammenfaldende med databasen fra det foregående år med mere end 90 procent. Her har vi søgt en mellemvej, for at tage hensyn til to faktorer, nemlig på den ene side at bevare “den største fællesnævner” som det optimale sammenligningsgrundlag i forhold til den foregående undersøgelse, og på den anden side at tage hensyn til nye søgeord, som er vokset i søgevolumen i top 10.000.
Databasen hos Searchmetrics er altid aktuel. Derfor anvendes nye, relevante søgeord til aktuelle analyser, som f.eks. “Samsung Galaxy S5” eller “iPhone 6”, som ikke fandtes tidligere.
Binære og numeriske faktorer – specifikation kontra eksistens
De undersøgte faktorer er opdelt i binære og numeriske funktioner. Det betyder, at der er en iboende forskel i karakteren af de faktorer, der anvendes i denne analyse. Denne forskel bør ikke negligeres i fortolkningen af værdierne.
Elementer, der beskrives ved hjælp af binære faktorer – som f.eks. en metabeskrivelse på siden – er enten til stede eller ikke. Der er ingen gradueringer. Der findes også elementer med graduerede egenskaber, der ændrer sig i forskellig grad. F.eks. kan en URL have nul eller seks tusinde backlinks – men hver værdi midt imellem er også mulig.
Disse numeriske faktorer er i en vis forstand “bedre” for undersøgelser, der anvender korrelationsberegninger som Spearman, med rækker og/eller rangordningsprincipper baseret på gradueringer. Når det drejer sig om fortolkninger baseret på den rene korrelationsværdi alene, er udsagnene for numeriske faktorer ofte mere betydningsfulde.
For at understøtte gyldigheden af korrelationerne af binære træk i vores undersøgelse skal der derfor angives en gennemsnitsværdi i reglen. For eksempel med hensyn til faktoren “Eksistens af beskrivelse” kan det være, at der kun er en korrelation tæt på nul med rangeringer, men faktisk har næsten 100 % af alle URL’er en beskrivelse (se eksempelkorrelationen for faktor A ovenfor).
Korrelationsværdier versus gennemsnitsværdier og kurver
Korrelationsværdierne, der er plottet som en søjle, er altid beregnet på grundlag af alle tilgængelige data pr. funktion, så for et eller 10.000 nøgleord har hver graflinje 30 værdier pr. nøgleord.
Gennemsnitsværdierne beregnes ud fra disse gennemsnitlige kurveværdier, som også udelader de øverste fem procent af hver funktion for at muliggøre en så glat kurve som muligt og en håndterbar skala (Y-akse), da man ellers ikke ville kunne se nogle lavere gennemsnit i de respektive kurver. Desuden beregnes individuelle median- og middelværdier for funktioner, hvor der ses bort fra de øverste fem procent af resultaterne.
Brand-faktoren
En af konstanterne i studierne af rangordningsfaktorer er en interessant ejendommelighed i dataene, som vi har døbt “brand-faktoren”, der er til stede i mange faktorer og observationer.
Det, vi mener med brand-faktor, er den observation, at websites fra højt profilerede brands eller med en vis autoritet generelt indtager de allerøverste positioner i ranglisterne, selv om de ser bort fra bestemte faktorer, som de URL’er, der rangerer lidt lavere, overholder.
For eksempel har brands i gennemsnit tendens til ikke at have et h1-tag på deres side, deres indhold har et lavere antal ord, og nøgleordet findes ikke så ofte i beskrivelsen af meta-titlen. Kort sagt: Ud fra et SEO-perspektiv er de mindre optimerede. På den anden side har brand-websteder typisk mange flere backlinks og sociale signaler end andre URL’er.
Google er allerede meget effektiv til at identificere brands fra bestemte sektorer og til at tildele deres URL’er en fortrinsstilling. Værdier som genkendelighed, brugernes tillid og brand image afspejles også til en vis grad i SERP’erne.
Intention: Hvorfor Ranking Factors?
Det er rimeligt at sige, at selv Google selv ikke ved, hvordan dets egen algoritme er sammensat, så komplekse er evalueringsmetrikkerne blevet.
Målet med Searchmetrics “Ranking Factors”-undersøgelser er ikke at producere et evangelium af absolut sandhed. I stedet betragter vi Searchmetrics-studier som en metodologisk analyse ud fra et fortolkningsmæssigt perspektiv. Det betyder, at vi sigter mod at give onlinebranchen nem adgang til en værktøjskasse med data. Ved at bruge denne værktøjskasse kan branchen træffe informerede beslutninger på baggrund af vores intensive forskning på tværs af et bredt spektrum af kriterier.
Til undersøgelsen: Ranking Factors 2018: Målrettet analyse for mere succes på Google og på dit onlinemarked.