No gráfico, quatro exemplos de correlações e as respectivas curvas são mostradas.
- Fator A: Correlação Zero – curva linear, horizontal / média alta
- Fator B: Correlação Positiva (mais alta) – função exponencial, caindo
- Fator C: Correlação Negativa (mais baixa) – curva linear, subindo
- Fator D: Correlação positiva – curva irregular, caindo
- Explicação: Cálculo da correlação e abordagens de interpretação
- Algoritmos e fatores de classificação dos motores de busca do Google & Co.
- Black Hat SEO: Palavras-chave Stuffing, Cloaking & Co.
- Causa ≠ Correlação
- “Cum hoc ergo propter hoc” – Correlações Lógicas de Falácia e Ilusórias
- Base de dados para Fatores de Ranking de Searchmetrics
- Fatores Numéricos e Binários – Especificação versus Existência
- Valores de Correlação versus Valores Médios e Curvas
- O Fator de Marca
- Intenção: Por que Ranking Factors?
Explicação: Cálculo da correlação e abordagens de interpretação
O eixo y indica o valor médio para todas as 10.000 URLs estudadas na posição X (eixo x). Fatores com o valor “zero”, de acordo com nossa análise, não apontam para nenhuma correlação mensurável entre bons e maus resultados do Google. Quanto maior o valor de uma correlação, maiores, e mais regulares, as diferenças entre as posições. Valores em uma faixa negativa são melhor compreendidos com a afirmação oposta interpretada positivamente.
Simplesmente colocado, quanto maiores as diferenças da posição 1 a 30, maior é o valor da correlação. Para interpretar os fatores, são sempre utilizados valores médios. Por exemplo, os fatores B e C do gráfico acima têm o mesmo valor de correlação (ou seja: 1), mas são completamente diferentes em relação às suas respectivas curvas. Para o fator A, entretanto, o valor médio é 95 (eixo y) para cada posição (eixo x), mas pode até estar em 5 (eixo y). O valor da correlação permaneceria idêntico em 0, mas a interpretação do fator seria completamente diferente.
Algoritmos e fatores de classificação dos motores de busca do Google & Co.
Procurar o trabalho dos motores de busca usando algoritmos para avaliar sites por tópico e relevância. Esta avaliação é usada para estruturar páginas no índice do motor de busca, o que resulta em consultas do usuário exibindo a melhor classificação possível da exibição dos resultados. Os critérios para a avaliação de páginas web e para produzir esta classificação são geralmente referidos como factores de classificação.
As razões para isto são simples: o número exponencialmente crescente de documentos na Internet – e no índice de pesquisa – torna impossível classificar estas páginas sem um algoritmo automático, apesar da existência de “avaliadores de qualidade” humanos. Este algoritmo é tanto obrigatório (a ordem, afinal, requer um padrão), como, ao mesmo tempo, o segredo mais bem guardado no negócio da Internet, porque para os motores de busca é essencial manter os factores subjacentes que compõem o algoritmo estritamente confidenciais.
Este segredo inerente tem menos a ver com a concorrência entre motores de busca do que com razões mais básicas: Se as formas de obter boas classificações fossem amplamente conhecidas, elas tornar-se-iam irrelevantes, pois seriam constantemente manipuladas. Ninguém além do Google sabe quais são os verdadeiros Fatores de Ranking. Analisamos os dados através da análise de correlação de rankings para produzir os nossos resultados com base nas propriedades dos resultados de pesquisa orgânicos existentes. A partir destes, concluímos o que poderiam ser os Factores de Ranking, e as suas respectivas ponderações. Nossa imensa base de dados fornece uma base confiável para estas análises.
Black Hat SEO: Palavras-chave Stuffing, Cloaking & Co.
No início da era dos motores de busca, o Google considerou páginas relevantes para tópicos específicos onde os termos de pesquisa associados ao assunto (palavras-chave) eram frequentemente utilizados. Os operadores do site logo aproveitaram esse conhecimento e alcançaram posições muito boas nas SERPs ao ‘encher’ páginas com palavras-chave, permitindo que suas páginas, muitas vezes não relevantes, fossem encontradas em posições bem ordenadas para os termos de busca pretendidos.
Isso gerou não só uma competição real entre os motores de busca e os SEOs, mas produziu o mito do fator ranking. O objetivo da busca semântica criou uma rede de critérios que inicialmente eram estritamente técnicos (por exemplo, o número de backlinks), mas foram adicionados por componentes menos técnicos (por exemplo, sinais do usuário).
Este desenvolvimento, juntamente com a busca do resultado ótimo, culminou na constante evolução dos fatores de ranking. O ciclo infinito de retroalimentação dos ciclos de atualização de atualização de iteração permanente é projetado puramente para gerar resultados de busca que oferecem melhorias constantes para o pesquisador individual. A estrutura e complexidade dos fatores de ranking, somada à forte influência dos sinais do usuário, está projetada para produzir o conteúdo mais relevante para o usuário.
De uma perspectiva empresarial, o sucesso a longo prazo pode ser alcançado usando uma estratégia empresarial sustentável baseada na incorporação de fatores de qualidade relevantes para manter fortes posições de busca. Esta abordagem significa uma desconsideração das opções de influência negativa e um foco claro no conteúdo relevante, ao mesmo tempo em que combate o spam e o curto prazo.
Causa ≠ Correlação
Não somos o Google. A análise e avaliação dos fatores de ranking usando nossos dados é baseada em uma interpretação bem fundamentada – não especulação – dos fatos, ou seja, a avaliação e estruturação das propriedades do site com altas posições nos resultados da busca.
As avaliações de ranking da Searchmetrics são exatas, frescas e baseadas em muitos dados. Nós da Searchmetrics agregamos bilhões de pontos de dados numa base mensal – e aqui está a questão dos 64 milhões de dólares: Que factores distinguem sites bem colocados daqueles com posições mais baixas nos resultados de pesquisa do Google?
Comparamos as propriedades das páginas Web com a soma das suas posições no Google e obtemos uma lista estruturada de factores mais ou menos ponderados. Assim, se nas posições iniciais das SERPs investigadas, por exemplo, muitas páginas contêm a palavra-chave na etiqueta do título, então nós a reconhecemos como uma alta correlação com uma boa classificação. Estas correlações podem, portanto, oferecer conclusões sobre quais as páginas exibidas nas listas de resultados de pesquisa mais elevadas têm características semelhantes.
No entanto, é necessário salientar que as correlações não são sinônimo de relações causais, e, portanto, não há garantia de que os respectivos fatores tenham realmente qualquer impacto na classificação – ou sejam alguma vez usados pelo Google como um sinal. O que fazemos na Searchmetrics, no entanto, é interpretar estas correlações.
“Cum hoc ergo propter hoc” – Correlações Lógicas de Falácia e Ilusórias
As plantas murcham quando não recebem água: a casa fica quente quando se liga o aquecimento – e como um local tem muitos sinais sociais, sobe para #1? Stop!
Existem muitos exemplos de correlações ou avaliações ilusórias que são referidas como “falácia lógica” (Cum hoc ergo propter hoc – ver Wikipedia). Como exemplo, o co-aparecimento de fenômenos como o número de cegonhas e a maior taxa de natalidade em certas áreas, ou a relação entre as vendas de sorvete e o aumento da incidência de queimaduras solares no verão. Mas você realmente apanha queimaduras solares por causa dos sorvetes? Claro que não. Estes exemplos mostram uma correlação (ilusória), não uma relação causal. (Encontre mais exemplos aqui)
Queremos evitar a todo custo quedas lógicas e correlações ilusórias, e nossa experiência mostra que é muito fácil avaliar um fator de classificação como tendo um significado causal onde não existe nenhum. Preferimos trabalhar usando um “coeficiente de correlação de rank”, e isso requer uma interpretação avaliada e uma base de dados sólida.
Base de dados para Fatores de Ranking de Searchmetrics
Nossa análise é baseada em resultados de pesquisa para um conjunto muito grande de 10.000 termos de pesquisa para o Google U.S. O conjunto inicial é sempre o top 10.000 termos de pesquisa por volume de pesquisa, mas dos quais são extraídas palavras-chave específicas orientadas à navegação, a fim de não distorcer as avaliações. Como as pesquisas por palavras-chave orientadas à navegação são consideradas onde todos os resultados, exceto um, são irrelevantes para o pesquisador, mais ou menos (por exemplo: “Login no Facebook”).
Nossa base de dados para as análises do Fator de Ranking são sempre as três primeiras páginas de resultados orgânicos de pesquisa. Os conjuntos de palavras-chave de anos consecutivos coincidem em mais de 90 por cento com o banco de dados do ano anterior, como regra. Aqui procurámos um meio termo, para ter em conta dois factores, nomeadamente a preservação do “maior denominador comum” como base óptima de comparação com o estudo anterior, e por outro lado, tendo em conta novas palavras-chave, que cresceram em volume de pesquisa no top 10.000.
A base de dados em Searchmetrics é sempre actual. Portanto, novas palavras-chave relevantes são usadas para análises atuais, como “Samsung Galaxy S5” ou “iPhone 6”, que não existiam anteriormente.
Fatores Numéricos e Binários – Especificação versus Existência
Os fatores examinados são divididos em características numéricas e binárias. Isto significa que existe uma diferença inerente na natureza dos factores utilizados nesta análise. Esta diferença não deve ser negligenciada na interpretação dos valores.
Elementos que são descritos usando fatores binários – como uma meta descrição na página – estão presentes ou não. Não existem gradações. Há também elementos com características graduadas que mudam em diferentes graus. Por exemplo, uma URL pode ter zero ou seis mil backlinks – mas cada valor entre eles também é possível.
Esses fatores numéricos são em alguns sentidos “melhores” para estudos usando cálculos de correlação como Spearman, com linhas e/ou princípios de classificação baseados em gradações. Quando se trata de interpretações baseadas apenas no valor de correlação pura, as afirmações para fatores numéricos são frequentemente mais significativas.
Para suportar a validade das correlações de características binárias em nosso estudo, portanto, um valor médio deve ser especificado na regra. Por exemplo, em relação ao fator “Existência de Descrição”, pode ser que haja apenas uma correlação próxima a zero com rankings, mas na verdade quase 100% de todos os URLs têm uma descrição (veja o exemplo de correlação para o fator A acima).
Valores de Correlação versus Valores Médios e Curvas
Os valores de correlação traçados como uma barra são sempre calculados com base em todos os dados disponíveis por característica, portanto, para uma ou 10.000 palavras-chave, cada linha do gráfico tem 30 valores por palavra-chave.
Os valores médios são calculados a partir destes valores médios de curva, que também deixam de fora os cinco por cento superiores de cada característica para permitir a curva mais suave possível e uma escala controlável (eixo Y), caso contrário, algumas médias inferiores nas respectivas curvas não seriam vistas. Além disso, a mediana individual e os valores médios são calculados para características desconsiderando os cinco por cento superiores dos achados.
O Fator de Marca
Uma das constantes nos estudos do ranking de fatores é uma peculiaridade interessante nos dados que denominamos “fator de marca”, presente em muitos fatores e observações.
O que queremos dizer com factor de marca é a observação de que websites de marcas de alto perfil ou com uma certa autoridade geralmente ocupam os cargos mais altos no ranking, mesmo que desconsiderem factores particulares a que os URLs que ocupam cargos ligeiramente inferiores aderem.
Por exemplo, em média as marcas tendem a não ter uma etiqueta h1 na sua página, o seu conteúdo tem uma contagem de palavras mais baixa e a palavra-chave não é encontrada na descrição do meta-título com a mesma frequência. Em poucas palavras: do ponto de vista de SEO são menos otimizadas. Por outro lado, os sites de marcas normalmente apresentam muito mais backlinks e sinais sociais do que outras URLs.
Google já é muito eficiente na identificação de marcas de determinados setores e na alocação de suas URLs uma classificação preferencial. Valores como reconhecimento, confiança do usuário e imagem de marca também são refletidos nos SERPs até certo ponto.
Intenção: Por que Ranking Factors?
É justo dizer que mesmo o próprio Google não sabe como o seu próprio algoritmo é composto, tão complexo se tornaram as métricas de avaliação.
O objetivo dos estudos de Searchmetrics “Ranking Factors” não é produzir um evangelho de verdade absoluta. Ao invés disso, consideramos os estudos de Searchmetrics como uma análise metodológica a partir de uma perspectiva interpretativa. O que isto significa é que pretendemos proporcionar à indústria online um acesso fácil a uma caixa de ferramentas de dados. Ao utilizar esta caixa de ferramentas, a indústria pode tomar decisões informadas com base em nossa pesquisa intensiva através de um amplo espectro de critérios.
Para o estudo: Factores de Ranking 2018: Análise direccionada para mais sucesso no Google e no seu Mercado Online.