¿Por qué debes eliminar el tráfico spam que llega a tu Google Analytics?

Desde hace ya unos meses es muy habitual encontrarse en la sección “Adquisición / Todo el tráfico / Referencias” de Google Analytics, donde se lista el tráfico referral a tu propiedad digital (aquellos dominios que contienen un enlace a tu sitio web y que han sido, en teoría, clicados, generando tráfico a tu sitio web que contabiliza Analytics), este tipo de dominios que te enlazan:

Imagen de tráfico spamreferral en un Google Analytics

Aquí podeis ver un ejemplo de como se ve este tipo de tráfico en el informe de tráfico referral de Analytics. De los 10 dominios principales que envian tráfico a este site, 9 son spam referrals. En total, algo más del 20% del tráfico total de este sitio web no es real, es spam referral en Analytics.

En principio, todo parece correcto, ¿no? Simplemente tienes un buen montón de visitas procedentes de dominios que no habías oido nunca y que tienen en común tener nombres un tanto raros. Hasta aquí todo correcto. Lo que pasa es que un día te dices “¿Qué será el dominio este theguardlan.com?” y te da por meterlo en tu navegador, pulsar enter, y, de repente, llegas aquí.

Imagen de un sitio web destino de un dominio spam de Analytics

El sitio web al que acabas llegando al meter en el navegador el referral spamque has visto en Analytics

¿Qué significa este referral en Analytics?, ¿cómo es posible que me hayan visitado desde esta página si no hay ningún enlace a mi web ahí? Muy sencillo, nunca te han visitado realmente, es un tráfico spam que figura en tu referral de Analytics y cuenta como visita.

Pero no te ha visitado un usuario, no, te ha visitado un bot, un bicho, un cacharrete, un sistema que hace que esa visita se contabilice en Analytics a todos los efectos pero que no es una visita “real”, para que nos entendamos, es tráfico spam, así de claro, ese tráfico no existe en términos de usuario real, de persona. OK, ya lo vas asimilando, ahora la pregunta del millón de hoy, ¿cómo eliminamos ese tráfico spam de mi Analytics?

De hecho, si yo he visitado theguardlan.com, ¿cómo he acabado llegando a un ecommerce? Pues muy sencillo, a través de una cadena de 2 redirecciones 302 que acaban llevándote a una URL plagada de parametros, entiendo que para que en caso de que alguien compra bajo esa URL el creador de ese tráfico se embolse algunos eurillos en concepto de comisión, he aquí seguramente la razón de este tipo de spam tan marciano.

Cabecera HTTP Status de dominio spam de Analytics

Alguna sde las redirecciones que te acaban llevando finalmente al sitio web visto antes

Así visto, lo primero que parece que debemos hacer, tras darnos cuenta de que hablamos de visitas no reales, es eliminar dichas visitas de nuestro Analytics, para darles el valor real que tienen, cero, y, por tanto, contabilizar el tráfico lo más correctamente posible.

Sobre ese punto, como eliminar ese tráfico de Analytics, hay ya un montón de post sobre el tema. Aquí tienes un par que te ayudarán a eliminar ese tráfico de tu Analytics:

http://www.analyticsedge.com/2014/12/removing-referral-spam-google-analytics/ (en inglés, y en mi opinión el mejor post sobre el tema de los que he leido hasta la fecha)

http://www.madridgeekgirls.es/eliminar-referal-spam-google-analytics/ (traducción del post anterior que han realizado las Madrid Geek Girls, por lo tanto, la mejor referencia en castellano que he leido hasta la fecha sobre el tema)

Otros post que hablan de lo mismo:

http://moz.com/blog/how-to-stop-spam-bots-from-ruining-your-analytics-referral-data

http://ads-blocker.com/block-referral-spam/

Ya que hay muchos posts hablando de como eliminar de Analytics yo prefiero enfocar mi post a explicar porque debemos eliminar o aislar este tipo de tráfico de Analytics. Es decir, técnicamente es sencillo eliminarlo, ahora bien, ¿por qué debo hacerlo?

Eliminar lo antes posible ese referral spam de Analytics es muy necesario por varias razones. Estas son las principales:

  1.  En sites con volúmenes de tráfico pequeños (como el de la primera imagen de este post) o incluso medianos, el volumen de tráfico spam en Analytics puede ser tan grande que desvirtue cualquier otro dato si no haces un filtro muy selectivo. Hay que pensar que este tipo de tráfico genera sesiones de 100% de rebote y de 0 segundos de duración, en su mayoría. Si ese volumen de tráfico es significativo respecto al total desvirtua mucho cualquier dato general o agregado. En el ejemplo de la primera imagen, el total del tráfico spam en ese proyecto supone cerca del 20% del tráfico total. Un 20% del total del tráfico con cero segundos de permanencia y 100% de rebote… eso afecta a la casi totalidad de informes si no segregas esos datos.
  2. En Analytics conviene recordar que los datos no pueden remuestrearse en las vistas. Esto significa que cuanto más tardes en eliminar o dejar de contar ese tráfico peor para poder hacer, por ejemplo, comparaciones de datos entre periodos de tiempo. El tiempo que hayas estado contabilizando esos datos de referral spam no puede borrarse de Analytics, no puede remuestrearse, se quedará ahí para siempre, por lo tanto, cuanto más tiempo esté mucho peor para el resto de datos y para los análisis futuros que se basen en comparación de datos.
  3. Si haces informes basados exclusivamente en el sistema de reporting de Analytics, tus informes pueden estar “contaminados” por este tipo de tráfico, por lo que es importante su filtrado y la rectificación de esos informes a través de segmentos o de filtrado de esos datos nocivos, siempre que el volumen de este tráfico los haya desvirtuado.
  4. Higiene de datos. Que pasen estas cosas es bueno para hacer una revisión profunda a nuestra forma de captar datos con Analytics y verificar que todo está correctamente implementado y que hay un cierto nivel de higiene en nuestra analítica digital. Es muy importante tener bien limpito el sistema de captación de datos, que las cosas sean fiables, dentro del margen de calidad que nos ofrece Analytics. De este tipo de tráfico se libran muy pocos sitios web. Lo que sucede es que un sitio de gran volumen de tráfico este hecho no condiciona ni compromete los datos, porque no es un tráfico significativo, proporcionalmente hablando, aunque limpiarlo siempre será recomendable.

En resumen, tener en tu Analytics este tipo de datos es algo que conviene resolver lo antes posible. El mundo no se acaba ni va a llover fuego del cielo, pero si quieres que tu analítica digital tenga un cierto nivel de calidad es básico tener cosas como esta bien controladas y corregidas.

Ala, todos a verificar vuestro informe de tráfico referral a ver si encontramos tráfico de este tipo!

Be Sociable, Share!

Tags: , , , ,

  1. Roberto’s avatar

    Muy bueno el post como siempre, últimamente llega SPAM sin parar. Solo tengo una duda que por mas que leo no acabo de entender. Como puede ser que este tipo de SPAM(o por lo menos a mi) genere varias páginas vistas y tiempo de duración de entre 1 y 2 min en las páginas con porcentajes de rebote de 50% aprox. Si tienes un huequín y puedes responder se agradece ;).
    Saludos.

  2. Sergio’s avatar

    Genial el post Ricardo. Yo ya filtré los referral en mis sites y ahora el spam se ha convertido en tráfico directo. ¿Qué sentido tiene esto? También proviene de Rusia.

  3. Manoletto’s avatar

    Que problema con estos bots..

  4. Andrés’s avatar

    Hola Ricardo,

    ¿Algún consejo para eliminar el tráfico spam que aparece como tráfico directo?

    Gracias. Un saludo.

  5. Ricardo Tayar’s avatar

    Hola Andres,

    Aparte de las fuentes que cito en el artículo y que explican en detalle como hacerlo, aquí tienes una guia muy completa con diversos métodos para filtrar ese tráfico https://www.optimizesmart.com/geek-guide-removing-referrer-spam-google-analytics/ Espero que te sirva

    Un saludo,

    Ricardo