In de grafiek zijn vier voorbeeld correlaties en de respectievelijke curven weergegeven.
- Factor A: Nul Correlatie – lineaire curve, horizontaal / hoog gemiddelde
- Factor B: Positieve Correlatie (hoogste) – exponentiële functie, dalend
- Factor C: Negatieve Correlatie (laagste) – lineaire curve, stijgend
- Factor D: Positieve Correlatie – onregelmatige curve, dalend
- Uitleg: Correlatie Berekening en Interpretatie Benaderingen
- Search Engine Algorithms And Ranking Factors Of Google & Co.
- Black Hat SEO: Keyword Stuffing, Cloaking & Co.
- Causation ≠ Correlation
- “Cum hoc ergo propter hoc” – Logical Fallacy And Illusory Correlations
- Database voor Searchmetrics Ranking Factors
- Binaire en numerieke factoren – Specificatie Versus Bestaan
- Correlatiewaarden Versus Gemiddelde Waarden En Curven
- De merkfactor
- Intentie: Waarom Ranking Factors?
Uitleg: Correlatie Berekening en Interpretatie Benaderingen
De y-as geeft de gemiddelde waarde aan voor alle 10.000 bestudeerde URL’s op positie X (x-as). Factoren met de waarde “nul” wijzen, volgens onze analyse, op geen meetbare correlatie tussen goede en slechte Google-resultaten. Hoe hoger de waarde van een correlatie, hoe groter, en regelmatiger, de verschillen tussen posities. Waarden in een negatief bereik worden het best begrepen met de tegenovergestelde verklaring positief geïnterpreteerd.
Simpel gezegd, hoe groter de verschillen van positie 1 tot 30, hoe hoger de correlatiewaarde. Voor de interpretatie van de factoren worden altijd gemiddelde waarden gebruikt. Bijvoorbeeld, de factoren B en C uit de bovenstaande grafiek hebben dezelfde correlatiewaarde (dat wil zeggen: 1), maar zijn totaal verschillend wat hun respectieve curven betreft. Voor factor A daarentegen is de gemiddelde waarde 95 (y-as) voor elke positie (x-as), maar zou zelfs op 5 (y-as) kunnen liggen. De correlatiewaarde zou identiek blijven op 0, maar de interpretatie van de factor zou totaal verschillend zijn.
Search Engine Algorithms And Ranking Factors Of Google & Co.
Zoekmachines werken door gebruik te maken van algoritmen om websites te evalueren op onderwerp en relevantie. Deze evaluatie wordt gebruikt om pagina’s in de zoekmachine-index te structureren, wat uiteindelijk resulteert in zoekopdrachten van gebruikers met de best mogelijke rangschikking van de resultatenweergave. De criteria voor de evaluatie van webpagina’s en om deze rangschikking tot stand te brengen worden in het algemeen rangschikkingsfactoren genoemd.
De redenen hiervoor zijn eenvoudig: het exponentieel toenemende aantal documenten op het Internet – en in de zoekindex – maakt het onmogelijk deze pagina’s te rangschikken zonder een automatisch algoritme, ondanks het bestaan van menselijke “quality raters”. Dit algoritme is zowel verplicht (orde vereist immers een patroon), als tegelijkertijd het best bewaarde geheim in de Internet-business, omdat het voor zoekmachines van essentieel belang is de onderliggende factoren waaruit het algoritme is opgebouwd strikt geheim te houden.
Deze inherente geheimhouding heeft minder te maken met concurrentie tussen zoekmachines dan met meer fundamentele redenen: Als de manieren om goede rankings te verkrijgen algemeen bekend zouden zijn, zouden ze irrelevant worden omdat ze voortdurend gemanipuleerd zouden worden. Niemand behalve Google weet wat de echte Ranking Factors zijn. Wij analyseren data via rangcorrelatie analyse om onze bevindingen te produceren gebaseerd op de eigenschappen van bestaande, organische zoekresultaten. Hieruit concluderen we wat de Ranking Factoren, en hun respectievelijke wegingen, zouden kunnen zijn. Onze immense database biedt een betrouwbare basis voor deze analyses.
Black Hat SEO: Keyword Stuffing, Cloaking & Co.
Aan het begin van het zoekmachinetijdperk beschouwde Google pagina’s als relevant voor specifieke onderwerpen waarbij de aan het onderwerp gekoppelde zoektermen (keywords) veelvuldig werden gebruikt. Site-exploitanten maakten al snel gebruik van deze kennis en bereikten zeer goede posities in de SERP’s door pagina’s te ‘vullen’ met trefwoorden, waardoor hun vaak niet-relevante pagina’s op goed gerangschikte posities voor de bedoelde zoektermen te vinden waren.
Dit genereerde niet alleen echte concurrentie tussen zoekmachines en SEO’s, maar produceerde ook de mythe van de ranking-factor. Het doel van semantisch zoeken creëerde een netwerk van criteria die aanvankelijk strikt technisch waren (bijv. het aantal backlinks), maar werden aangevuld met minder technische componenten (bijv. gebruikerssignalen).
Deze ontwikkeling, samen met het streven naar het optimale resultaat, heeft geleid tot de voortdurende evolutie van rankingfactoren. De eindeloze feedback loop van permanent-iteratieve update cycli is puur ontworpen om zoekresultaten te genereren die constante verbeteringen bieden aan de individuele zoeker. De structuur en complexiteit van ranking factoren, toegevoegd aan de sterke invloed van gebruikerssignalen, is ontworpen om de meest relevante inhoud voor de gebruiker te produceren.
Vanuit een zakelijk perspectief, kan succes op lange termijn worden bereikt door het gebruik van een duurzame bedrijfsstrategie gebaseerd op het incorporeren van relevante kwaliteitsfactoren om sterke zoekposities te behouden. Deze benadering betekent een veronachtzaming van negatieve beïnvloedingsmogelijkheden en een duidelijke focus op relevante inhoud, waarbij tegelijkertijd spam en kortetermijndenken worden bestreden.
Causation ≠ Correlation
Wij zijn Google niet. De analyse en evaluatie van ranking factoren met behulp van onze gegevens is gebaseerd op gefundeerde interpretatie – geen speculatie – van de feiten; namelijk de evaluatie en structurering van website-eigenschappen met hoge posities in de zoekresultaten.
De ranking evaluaties van Searchmetrics zijn exact, vers en gebaseerd op veel data. Wij bij Searchmetrics aggregeren miljarden datapunten op een maandelijkse basis – en hier is de 64-miljoen dollar vraag: Welke factoren onderscheiden goed geplaatste sites van die met lagere posities in de Google zoekresultaten?
We vergelijken de eigenschappen van webpagina’s met de som van hun posities bij Google en leiden daaruit een gestructureerde lijst af van meer of minder gewogen factoren. Dus, als bijvoorbeeld in de voorste posities van de onderzochte SERP’s veel pagina’s het trefwoord in de title-tag bevatten, dan herkennen we dat als een hoge correlatie met een goede ranking. Deze correlaties kunnen dus conclusies bieden over welke pagina’s die worden weergegeven in de top zoekresultaten lijsten kenmerken hebben die vergelijkbaar zijn.
Het is echter noodzakelijk om erop te wijzen dat correlaties niet synoniem zijn met causale relaties, en er is dus geen garantie dat de respectieve factoren daadwerkelijk invloed hebben op de ranking – of ooit worden gebruikt door Google als een signaal. Wat we bij Searchmetrics wel doen, is deze correlaties interpreteren.
“Cum hoc ergo propter hoc” – Logical Fallacy And Illusory Correlations
Planten verdorren als ze geen water krijgen: het huis is warm als je de verwarming hoger zet – en omdat een site veel sociale signalen heeft, klimt hij naar #1? Stop!
Er zijn veel voorbeelden van illusoire correlaties of beoordelingen die worden aangeduid als “logical fallacy” (Cum hoc ergo propter hoc – zie Wikipedia). Bijvoorbeeld het samen voorkomen van fenomenen als het aantal ooievaars en het hogere geboortecijfer in bepaalde gebieden, of het verband tussen de verkoop van ijsjes en het vaker voorkomen van zonnebrand in de zomer. Maar krijg je echt zonnebrand van een ijsje? Natuurlijk niet. Deze voorbeelden tonen een (illusoir) verband aan, geen oorzakelijk verband. (Meer voorbeelden vindt u hier)
We willen logische drogredenen en illusoire correlaties ten koste van alles vermijden, en onze ervaring leert dat het te gemakkelijk is om een rangordefactor te beoordelen als een factor met een causale betekenis waar die niet bestaat. Wij geven er de voorkeur aan te werken met een “rangcorrelatiecoëfficiënt”, en dit vereist een geëvalueerde interpretatie en een degelijke database.
Database voor Searchmetrics Ranking Factors
Onze analyse is gebaseerd op zoekresultaten voor een zeer grote trefwoordenset van 10.000 zoektermen voor Google U.S.. De startpool is altijd de top 10.000 zoektermen naar zoekvolume, maar waaruit specifieke navigatie-georiënteerde zoekwoorden worden geëxtraheerd om de evaluaties niet te vertekenen. Aangezien navigatie-georiënteerde trefwoord zoekopdrachten worden beschouwd als waar alle resultaten, behalve één, niet relevant zijn voor de zoeker, min of meer (bijv.: “Facebook Login”).
Onze database voor de Ranking Factor analyses zijn altijd de eerste drie organische zoekresultaten pagina’s. De keyword sets van opeenvolgende jaren vallen in de regel voor meer dan 90 procent samen met de database van het voorgaande jaar. Hier is gezocht naar een middenweg, om rekening te houden met twee factoren, namelijk enerzijds het behoud van de “grootste gemene deler” als optimale basis voor vergelijking met het vorige onderzoek, en anderzijds het rekening houden met nieuwe trefwoorden, die in zoekvolume zijn gegroeid in de top 10.000.
De database bij Searchmetrics is altijd actueel. Daarom worden nieuwe, relevante zoekwoorden gebruikt voor de huidige analyses, zoals “Samsung Galaxy S5” of “iPhone 6”, die eerder niet bestonden.
Binaire en numerieke factoren – Specificatie Versus Bestaan
De onderzochte factoren zijn onderverdeeld in binaire en numerieke kenmerken. Dit betekent dat er een inherent verschil is in de aard van de factoren die in deze analyse worden gebruikt. Dit verschil mag niet worden verwaarloosd bij de interpretatie van de waarden.
Elementen die met binaire factoren worden beschreven – zoals een metabeschrijving op de pagina – zijn aanwezig of niet. Er zijn geen gradaties. Er zijn ook elementen met gradaties die in verschillende mate veranderen. Een URL kan bijvoorbeeld nul of zesduizend backlinks hebben – maar elke waarde daartussen is ook mogelijk.
Deze numerieke factoren zijn in zekere zin “beter” voor studies die correlatieberekeningen zoals Spearman gebruiken, met rijen en/of rangordeprincipes op basis van gradaties. Als het gaat om interpretaties op basis van de zuivere correlatiewaarde alleen, zijn de uitspraken voor numerieke factoren vaak significanter.
Om de geldigheid van de correlaties van binaire kenmerken in onze studie te ondersteunen, moet daarom een gemiddelde waarde in de regel worden gespecificeerd. Bijvoorbeeld met betrekking tot de factor “Bestaan van beschrijving”, kan het zijn dat er slechts een bijna nul correlatie is met rankings, maar in feite heeft bijna 100% van alle URL’s een beschrijving (zie het voorbeeld correlatie voor factor A hierboven).
Correlatiewaarden Versus Gemiddelde Waarden En Curven
De correlatiewaarden uitgezet als een balk zijn altijd berekend op basis van alle beschikbare gegevens per kenmerk, dus voor één of 10.000 trefwoorden, heeft elke grafieklijn 30 waarden per trefwoord.
Gemiddelden worden berekend uit deze gemiddelde curvewaarden, waarbij ook de bovenste vijf procent van elk kenmerk wordt weggelaten om een zo vloeiend mogelijke curve en een hanteerbare schaal (Y-as) mogelijk te maken, anders zouden sommige lagere gemiddelden in de respectieve curven niet te zien zijn. Ook worden individuele mediaan- en gemiddelde waarden berekend voor kenmerken zonder rekening te houden met de bovenste vijf procent bevindingen.
De merkfactor
Een van de constanten in de rangschikkingsfactorstudies is een interessante eigenaardigheid in de gegevens die wij de “merkfactor” hebben genoemd, aanwezig in vele factoren en waarnemingen.
Wat we bedoelen met de merkfactor is de waarneming dat websites van bekende merken of met een bepaalde autoriteit over het algemeen de allerhoogste posities in de rankings innemen, zelfs als ze bepaalde factoren buiten beschouwing laten waaraan de URL’s die iets lager ranken, zich wel houden.
Zo hebben merken gemiddeld de neiging om geen h1-tag op hun pagina te hebben, heeft hun inhoud een lager aantal woorden en komt het zoekwoord niet zo vaak voor in de beschrijving van de meta-titel. In een notendop: vanuit een SEO perspectief zijn ze minder geoptimaliseerd. Aan de andere kant hebben merkwebsites doorgaans veel meer backlinks en sociale signalen dan andere URL’s.
Google is al heel efficiënt in het identificeren van merken uit bepaalde sectoren en in het toekennen van een preferentiële ranking aan hun URL’s. Waarden als herkenbaarheid, gebruikersvertrouwen en merkimago komen ook tot op zekere hoogte terug in de SERP’s.
Intentie: Waarom Ranking Factors?
De eerlijkheid gebiedt te zeggen dat zelfs Google zelf niet weet hoe zijn eigen algoritme in elkaar zit, zo complex zijn de evaluatiemetrieken geworden.
Het doel van Searchmetrics “Ranking Factors” studies is niet om een evangelie van absolute waarheid te produceren. In plaats daarvan beschouwen we Searchmetrics-studies als een methodologische analyse vanuit een interpretatief perspectief. Wat dit betekent is dat we ernaar streven om de online industrie te voorzien van gemakkelijke toegang tot een data toolbox. Door deze toolbox te gebruiken, kan de industrie geïnformeerde beslissingen nemen op basis van ons intensieve onderzoek over een breed spectrum van criteria.
Naar de studie: Ranking Factors 2018: Gerichte Analyse voor meer Succes op Google en in uw Online Markt.