Kuviossa on esitetty neljä esimerkkikorrelaatiota ja vastaavat käyrät.
- Faktori A: Nollakorrelaatio – lineaarinen käyrä, vaakasuora / korkea keskiarvo
- Faktori B: Positiivinen korrelaatio (korkein) – eksponenttifunktio, laskeva
- Faktori C: Negatiivinen korrelaatio (matalin) – lineaarinen käyrä, nouseva
- Faktori D: Positiivinen korrelaatio – epäsäännöllinen käyrä, laskeva
- Selitys: Correlation Calculation And Interpretation Approaches
- Hakukonealgoritmit ja Googlen ranking-tekijät & Co.
- Black Hat SEO: Keyword Stuffing, Cloaking & Co.
- Syy-yhteys ≠ korrelaatio
- ”Cum hoc ergo propter hoc” – Looginen harhaluulo ja näennäiset korrelaatiot
- Searchmetrics Ranking Factors -tietokanta
- Binääriset ja numeeriset tekijät – määrittely vs. olemassaolo
- Korrelaatioarvot vs. keskiarvot ja käyrät
- Bränditekijä
- Aikomus: Miksi Ranking Factors?
Selitys: Correlation Calculation And Interpretation Approaches
Y-akseli osoittaa kaikkien 10 000 tutkittujen URL-osoitteiden keskiarvon paikassa X (x-akseli). Tekijät, joiden arvo on ”nolla”, viittaavat analyysimme mukaan siihen, että hyvien ja huonojen Google-tulosten välillä ei ole mitattavissa olevaa korrelaatiota. Mitä suurempi korrelaation arvo on, sitä suuremmat ja säännöllisemmät ovat sijoitusten väliset erot. Negatiivisella alueella olevat arvot ymmärretään parhaiten päinvastainen väittämä positiivisesti tulkittuna.
Lyhyesti sanottuna, mitä suuremmat ovat erot sijoista 1-30, sitä korkeampi on korrelaation arvo. Kertoimien tulkinnassa käytetään aina keskiarvoja. Esimerkiksi yllä olevan kuvaajan tekijöillä B ja C on sama korrelaatioarvo (eli 1), mutta ne ovat täysin erilaisia käyränsä suhteen. Tekijän A osalta keskiarvo on kuitenkin 95 (y-akseli) jokaisessa asennossa (x-akseli), mutta se voi olla jopa 5 (y-akseli). Korrelaatioarvo pysyisi identtisenä 0:ssa, mutta faktorin tulkinta olisi täysin erilainen.
Hakukonealgoritmit ja Googlen ranking-tekijät & Co.
Hakukoneet toimivat algoritmien avulla, jotka arvioivat verkkosivustoja aiheen ja relevanssin mukaan. Tätä arviointia käytetään hakukoneiden hakemiston sivujen jäsentämiseen, mikä lopulta johtaa siihen, että käyttäjän kyselyt näyttävät parhaan mahdollisen sijoituksen tulosnäytössä. Verkkosivujen arviointiperusteita ja tämän paremmuusjärjestyksen tuottamista kutsutaan yleisesti paremmuusjärjestystekijöiksi.
Syyt tähän ovat yksinkertaiset: Internetissä – ja hakuindeksissä – olevien asiakirjojen eksponentiaalisesti kasvava määrä tekee mahdottomaksi näiden sivujen sijoittamisen paremmuusjärjestykseen ilman automaattista algoritmia, vaikka inhimillisiä ”laadunarvioijia” on olemassa. Tämä algoritmi on sekä pakollinen (järjestyshän edellyttää kaavaa) että samalla Internet-liiketoiminnan parhaiten varjeltu salaisuus, koska hakukoneiden on välttämätöntä pitää algoritmin perustana olevat tekijät ehdottoman luottamuksellisina.
Tämä luontainen salassapitovelvollisuus ei liity niinkään hakukoneiden väliseen kilpailuun kuin perustavanlaatuisempiin syihin: Jos keinot hyvien sijoitusten saamiseksi olisivat yleisesti tiedossa, niistä tulisi merkityksettömiä, koska niitä manipuloitaisiin jatkuvasti. Kukaan muu kuin Google ei tiedä, mitkä ovat todelliset sijoitustekijät. Analysoimme tietoja sijoituskorrelaatioanalyysin avulla, jotta voimme tehdä havaintojamme olemassa olevien, orgaanisten hakutulosten ominaisuuksien perusteella. Näiden perusteella päättelemme, mitkä voisivat olla ranking-tekijät ja niiden painotukset. Valtava tietokantamme tarjoaa luotettavan perustan näille analyyseille.
Black Hat SEO: Keyword Stuffing, Cloaking & Co.
Hakukoneiden aikakauden alussa Google piti sivuja relevantteina tietyistä aiheista, joissa aiheeseen liittyviä hakusanoja (avainsanoja) käytettiin usein. Sivustojen ylläpitäjät hyödynsivät pian tätä tietoa ja saavuttivat erittäin hyviä sijoituksia SERP-listoilla ”täyttämällä” sivuja avainsanoilla, jolloin heidän usein epäoleelliset sivunsa löytyivät hyvin sijoittuneilta paikoilta aiotuilla hakusanoilla.
Tämä synnytti todellista kilpailua hakukoneiden ja hakukoneoptimoijien välille, mutta tuotti myös myytin ranking-tekijästä. Semanttisen haun tavoite loi kriteerien verkoston, joka oli aluksi puhtaasti tekninen (esim. backlinkkien määrä), mutta jota täydennettiin vähemmän teknisillä osatekijöillä (esim. käyttäjäsignaaleilla).
Tämä kehitys yhdessä optimaalisen tuloksen tavoittelun kanssa on huipentunut ranking-tekijöiden jatkuvaan kehittymiseen. Pysyvien ja toistuvien päivityssyklien loputon palautesilmukka on suunniteltu puhtaasti tuottamaan hakutuloksia, jotka tarjoavat jatkuvia parannuksia yksittäiselle hakijalle. Sijoitustekijöiden rakenne ja monimutkaisuus lisättynä käyttäjäsignaalien voimakkaalla vaikutuksella on suunniteltu tuottamaan käyttäjälle merkityksellisintä sisältöä.
Yritysnäkökulmasta katsottuna pitkän aikavälin menestys voidaan saavuttaa käyttämällä kestävää liiketoimintastrategiaa, joka perustuu merkityksellisten laatutekijöiden sisällyttämiseen vahvojen hakupaikkojen säilyttämiseksi. Tämä lähestymistapa tarkoittaa negatiivisten vaikutusmahdollisuuksien huomiotta jättämistä ja selkeää keskittymistä relevanttiin sisältöön, samalla kun torjutaan roskapostia ja lyhytnäköisyyttä.
Syy-yhteys ≠ korrelaatio
Me emme ole Google. Ranking-tekijöiden analyysi ja arviointi tietojemme avulla perustuu tosiasioiden perusteltuun tulkintaan – ei spekulointiin – eli sellaisten verkkosivujen ominaisuuksien arviointiin ja jäsentelyyn, joilla on korkeat sijat hakutuloksissa.
Searchmetricsin ranking-arvioinnit ovat täsmällisiä, tuoreita ja perustuvat moniin tietoihin. Me Searchmetricsissä keräämme kuukausittain miljardeja datapisteitä – ja tässä on 64 miljoonan dollarin kysymys:
Vertaamme verkkosivujen ominaisuuksia niiden Google-sijoitusten summaan ja johdamme jäsennellyn luettelon enemmän tai vähemmän painotetuista tekijöistä. Jos siis esimerkiksi tutkittujen SERP-tulosten etusijoilla monet sivut sisältävät avainsanan otsikkotunnisteessa, tunnistamme sen korkeaksi korrelaatioksi hyvän sijoituksen kanssa. Näiden korrelaatioiden perusteella voidaan siis tehdä johtopäätöksiä siitä, mitkä hakutuloslistojen kärjessä näkyvät sivut ovat ominaisuuksiltaan samankaltaisia.
On kuitenkin huomautettava, että korrelaatiot eivät ole kausaalisuhteiden synonyymejä, eikä näin ollen ole mitään takeita siitä, että kyseisillä tekijöillä todella on vaikutusta sijoittumiseen – tai että Google koskaan käyttää niitä signaalina. Me Searchmetricsissä kuitenkin tulkitsemme näitä korrelaatioita.
”Cum hoc ergo propter hoc” – Looginen harhaluulo ja näennäiset korrelaatiot
Kasvit kuihtuvat, kun ne eivät saa vettä: Talo on lämmin, kun lämmitys kytketään päälle – ja koska jollakin sivustolla on paljon sosiaalisia signaaleja, se kiipeää sijalle 1? Lopeta!
Tulehduksellisista korrelaatioista tai arvioinneista on monia esimerkkejä, joita kutsutaan ”loogiseksi harhaluuloksi” (Cum hoc ergo propter hoc – ks. Wikipedia). Esimerkkinä ilmiöiden samanaikaisuus, kuten haikaroiden määrä ja korkeampi syntyvyys tietyillä alueilla, tai jäätelön myynnin ja auringonpolttamien lisääntyneen esiintyvyyden välinen yhteys kesällä. Mutta saako jäätelöstä todella auringonpolttamia? Ei tietenkään. Nämä esimerkit osoittavat (näennäisen) korrelaation, eivät syy-yhteyttä. (Lisää esimerkkejä löytyy täältä)
Haluamme kaikin keinoin välttää loogisia virheitä ja näennäiskorrelaatioita, ja kokemuksemme osoittaa, että on liian helppoa arvioida ranking-tekijällä olevan kausaalista merkitystä siellä, missä sitä ei ole. Työskentelemme mieluummin ”rankkorrelaatiokertoimen” avulla, ja tämä edellyttää arvioitua tulkintaa ja vankkaa tietokantaa.
Searchmetrics Ranking Factors -tietokanta
Analyysimme perustuu hakutuloksiin, jotka on saatu hyvin laajasta, 10 000 hakusanaa käsittävästä hakusanajoukosta Googlen USA:ssa. Lähtöaineistona on aina 10 000 hakusanaa, jotka ovat hakumäärän mukaan suurimmat, mutta joista on poimittu tiettyjä navigointiin liittyviä avainsanoja, jotta arvioinnit eivät vääristyisi. Navigointipainotteisina hakusanoina pidetään hakuja, joissa kaikki tulokset yhtä lukuun ottamatta ovat enemmän tai vähemmän merkityksettömiä hakijalle (esim. ”Facebook Login”).
Ranking Factor -analyysejä varten käyttämämme tietokanta on aina kolme ensimmäistä orgaanista hakutulossivua. Peräkkäisten vuosien avainsanakokonaisuudet ovat pääsääntöisesti yli 90-prosenttisesti yhteneväisiä edellisen vuoden tietokannan kanssa. Tässä olemme hakeneet keskitietä, jotta voimme ottaa huomioon kaksi tekijää, nimittäin ”suurimman yhteisen nimittäjän” säilyttämisen optimaalisena vertailuperusteena edelliseen tutkimukseen, ja toisaalta uusien hakuvolyymiltaan kasvaneiden avainsanojen huomioon ottamisen 10 000 parhaan joukossa.
Searchmetricsin tietokanta on aina ajankohtainen. Siksi nykyisissä analyyseissä käytetään uusia, relevantteja avainsanoja, kuten ”Samsung Galaxy S5” tai ”iPhone 6”, joita ei aiemmin ollut olemassa.
Binääriset ja numeeriset tekijät – määrittely vs. olemassaolo
Tarkastellut tekijät jaetaan binäärisiin ja numeerisiin ominaisuuksiin. Tämä tarkoittaa, että tässä analyysissä käytettyjen tekijöiden luonteessa on luontainen ero. Tätä eroa ei pidä jättää huomiotta arvojen tulkinnassa.
Elementit, joita kuvataan binäärisillä tekijöillä – kuten sivun metakuvaus – ovat joko olemassa tai niitä ei ole. Porrastuksia ei ole. On myös elementtejä, joiden ominaisuudet muuttuvat eriasteisesti. Esimerkiksi URL-osoitteella voi olla nolla tai kuusituhatta takalinkkiä – mutta jokainen arvo siltä väliltä on myös mahdollinen.
Nämä numeeriset tekijät ovat jossakin mielessä ”parempia” tutkimuksissa, joissa käytetään korrelaatiolaskentaa, kuten Spearmania, ja joissa käytetään rivejä ja/tai ranking-periaatteita, jotka perustuvat porrastuksiin. Kun kyse on pelkkään korrelaatioarvoon perustuvista tulkinnoista, numeerisia tekijöitä koskevat lausumat ovat usein merkittävämpiä.
Tutkimuksessamme binääristen piirteiden korrelaatioiden pätevyyden tukemiseksi on siis säännössä määriteltävä keskiarvo. Esimerkiksi tekijän ”Kuvauksen olemassaolo” osalta voi olla, että korrelaatio sijoitusten kanssa on vain lähellä nollaa, mutta itse asiassa lähes 100 %:lla kaikista URL-osoitteista on kuvaus (ks. esimerkkikorrelaatio tekijälle A edellä).
Korrelaatioarvot vs. keskiarvot ja käyrät
Palkkeina piirretyt korrelaatioarvot on aina laskettu kaikkien käytettävissä olevien ominaisuutta kohti olevien tietojen perusteella, joten yhdelle avainsanalle tai 10 000 avainsanalle kullakin kuvaajaviivalla on 30 arvoa per avainsana.
Keskiarvot lasketaan näistä käyrän keskiarvoista, joista myös jätetään pois kunkin ominaisuuden viisi ylintä prosenttia, jotta saadaan mahdollisimman tasainen käyrä ja hallittavissa oleva mittakaava (Y-akseli), muutoin joitakin alempia keskiarvoja vastaavissa käyrissä ei näkyisi. Myös yksittäiset mediaani- ja keskiarvot lasketaan ominaisuuksille, joissa jätetään huomioimatta viisi ylintä prosenttia havainnoista.
Bränditekijä
Yksi vakioksi ranking-tekijätutkimuksissa on muodostunut mielenkiintoinen erityispiirre, jota olemme kutsuneet ”bränditekijäksi” ja joka esiintyy monissa tekijöissä ja havainnoissa.
Bränditekijällä tarkoitamme havaintoa, jonka mukaan korkean profiilin brändien tai tietyn auktoriteetin omaavat sivustot sijoittuvat yleensä rankingissa aivan kärkisijoille, vaikka ne eivät ottaisikaan huomioon tiettyjä tekijöitä, joita hieman alempana sijoittuvat URL-osoitteet noudattavat.
Brändeillä ei esimerkiksi keskimäärin ole yleensä h1-tagia sivullaan, niiden sisällön sanamäärä on alhaisempi ja avainsanaa ei löydy metatittelin kuvauksesta yhtä usein. Pähkinänkuoressa: SEO-näkökulmasta ne ovat vähemmän optimoituja. Toisaalta brändisivustoilla on tyypillisesti paljon enemmän takalinkkejä ja sosiaalisia signaaleja kuin muilla URL-osoitteilla.
Google tunnistaa jo nyt hyvin tehokkaasti tiettyjen alojen brändit ja asettaa niiden URL-osoitteet etusijalle. Arvot, kuten tunnistettavuus, käyttäjien luottamus ja tuotemerkin imago, heijastuvat myös jossain määrin SERP:ssä.
Aikomus: Miksi Ranking Factors?
Voidaan sanoa, että edes Google itse ei tiedä, miten sen oma algoritmi muodostuu, niin monimutkaisiksi arviointimittarit ovat muuttuneet.
Searchmetricsin ”Ranking Factors” -tutkimusten tavoitteena ei ole tuottaa absoluuttisen totuuden evankeliumia. Sen sijaan pidämme Searchmetrics-tutkimuksia metodologisena analyysinä tulkinnallisesta näkökulmasta. Tämä tarkoittaa sitä, että pyrimme tarjoamaan verkkoteollisuudelle helpon pääsyn datatyökalupakettiin. Käyttämällä tätä työkalupakkia ala voi tehdä tietoon perustuvia päätöksiä, jotka perustuvat intensiiviseen tutkimukseemme monenlaisten kriteerien osalta.
Tutkimukseen: Ranking Factors 2018: Targeted Analysis for more Success on Google and in your Online Market.