¿Google Analytics puede afectar a tu SEO? 2a parte: los pagenames

Publicado en Configuración Avanzada el 09 de junio de 2009 por .

Hace un poco más de un mes empecé una serie de artículos abriendo debate acerca de si algunas funciones o/y funcionalidades de google analytics que podían afectar tu SEO. Un tema espinoso, importante y que es muy importante tratar y hablar de forma clara.

Si en el otro artículo hablábamos de la incidencia de las etiquetas de campañas sobre seo, ahora toca hablar de los “pagenames” y los posibles afectos sobre seo.

Los Pagenames , para hablar en un lenguaje fuera de la técnica para que todos me entendáis, son una funcionalidad a través del “pagetracker call” que nos da Google analytics que nos permite cambiar el nombre de la url de nuestras páginas en los informes de Google Analytics. Se utilizan mucho para editar el informe del “embudo” o para cualquier otro tipo de análisis en los que el uso de urls con muchos parámetros hagan difícil la interpretación de datos.

¿Qué sucede si tenemos urls de las que yo llamo infumables?

Ejemplo: http://www.tuweb.com/index.php?variablecinjcomil=34$blbablablbla

O sea una url con muchos parámetros que después a la hora de analizar el contenido se hace difícil de identificar…

Y con esta función podemos conseguir que enlugar de tener esa url podamos tener como nombre de página en los archivos “home”, tal cual. No vamos a entrar en definir como se hace esto, porque no es de lo que trata el artículo…

Funciones como el “on clic” para controlar los “enlaces externos” también reproducen a través de la función “pageTracker._trackPageview” una url virtual.

Los Pagenames y la función “on clic” son funciones recomendadas y documentadas dentro de los manuales de google analytics, pero en ningún caso se habla de posibles problemas que puedan surgir y/o preocupar a los que las utilicéis.

Vamos a ponernos en perspectiva para ver el alcance de la situación. Imaginaros que soys un portal que depende de su tráfico de seo: que será muchos de los casos y por lo que sea os decidís a utilizar la función “pageTracker._trackPageview”, ya sea para analizar fúneles o bien para analizar determiandas secciones de contenidos, o bien para realizar seguimiento de los clics externos (si lo habéis hecho así hasta la fecha).

Si utilizáis Google Webmaster tools os daréis cuenta, que al poco tiempo de haber implementado los “Pagenames”, empezarán a aparecer cantidades industriales de “urls not found” que se corresponden a los pagenames que habéis creado.

Y si tu web tiene un webmaster in house o un equipo técnico o un equipo de seo ya se estarán tirando de los pelos, pensando que esta funcionalidad les puede seriamente repercutir en el posicionamiento en buscadores, ya que al ser urls que no encuentra el robot de google, podría penalizarnos.

La primera lectura es que el robot de google SI lee el java script y por lo tanto lo que hay dentro del código de GA. Por lo tanto lee los pagenames y los interpreta como urls. Los informes de google webmaster tools, que reportan estas urls y que el nombre de las urls not found se corresponden con los pagenames.

Así que mucho cuidado. Aunque los manuales de google analytics no mencionen nada de esto, y en los blogs haya un minísculo debate al respecto, la mejor solución es prevenir…

La mayoría de gente que utiliza google analytics y google webmaster tools, en su primera reacción al ver este error en google webmaster tools, suele quitar el código de analytics, por miedo. Yo no les culpo, totalmente normal, sobretodo cuando en la red hay tan pocas respuestas al respecto. Y sobretodo cuando en Google Analytics apenas se habla de todo esto y en los manuales se sigue apuntando el uso de esta función sin advertir de los posibles riesgos que comporta.

¿Afecta al SEO entonces? ¿Te puede hacer perder posiciones en los buscadores? ¿Google te va a penalizar?

Numerosas preguntas y muy pocas respuestas nos pueden calmar. Una cosa queda clarísima, el robot de google si puede leer el java script del código de analytics.

En el foro de webmasters de google se encuentra alguna respuesta al tópico: “crawl errors when renaming pagenames” en el que se explica que el robot si lee el java script e interpreta que lo que hay dentro de la funcion pagetracker, su pagename,es una carpeta o una url natural. Todo esto corroborado por google search.

En el mismo post, la persona de google search quien responde a la pregunta de una persona que se pregunta al respecto de lo que vamos a hablar a continuación, afirma que durante un periodo de tiempo google webmaster tools al acceder a estas urls virtuales e intentar buscarlas, verá que no existen y devuelven un error 404. Dice, que “con el tiempo estas urls desaparecerán” y que esto es parte del proceso de indexación y que nadie debería preocuparse. Y termina diciendo que “no debería afectar a tus rankings”. Es una lástima que no sea un “statement” mucho más claro y contundente, una frase como “NO AFECTARÁ A TUS RANKINGS” es que sabemos que nada va a pasar, que simplemente esto se genera y con el tiempo se va, y que no hay que darle importancia, pero me da a mi, que el problema existe y que la única forma de solucionarlo es a través de algunos retoques a la función.

Soluciones:

Google webmaster tools ofrece esta: incluir en la estructura de la url virtual del pagename una carpeta o directorio añadido, por ejemplo

  • pageTracker._trackPageview(“/zzz/subdirectory/pagename”); así en los reports de google webmaster tools veremos que todas las urls not found que empiezan por “zzz” son las de los pagenames y según ellos, no habrá que preocuparnos.

Esta solución más bien nos ayuda a identificar el problema más rápidamente, pero para prevenirlo mejor, sería conveniente hacer:

Añadir una carpeta al pagename tal y como indica el artículo de google de este estilo:

  • pageTracker._trackPageview(“/noindexar/subdirectory/pagename1″) para una página 1
  • pageTracker._trackPageview(“/noindexar/subdirectory/pagename2″) para una página 2
  • etc…

Y luego en el archivo robots.txt restringir la entrada del robot a la carpeta “/noindexar/”

Y evidentemente la mejor solución es que se actualice esta información en las páginas de Google Analytics para que no haya confusiones, o que podamos usar los pagenames de forma natural después que Google Search pueda afirmar sin contemplaciones que al 100% no puede penalizarte en los rankings…y todos nos quedemos tranquilos…

¿Os ha pasado alguna vez? ¿Habéis visto algún descenso en vuestros rankings después de aplicar los pagenames?

Etiquetas: ,

Sobre Ferriol Egea

Ferriol Egea es un experto analista en la optimización de negocios online. Ahora es director de marketing online de la Lavanguardia.com

Puedes encontrar a Ferriol en:



7 Comentarios en ¿Google Analytics puede afectar a tu SEO? 2a parte: los pagenames

  1. Elena Enriquez

    Gracias por este artículo tan interesante. Sin dudas GA podría dar conclusiones más claras para evitar malinterpretaciones.
    Me ha parecido genial la idea de crear un archivo bloqueado a los robots :) Elena

  2. Ferriol Egea

    Hola!
    Pero esto no debe ser exclusivo de google analytics, todos los programas de analítica web que tengan funcionalidades semejantes a esta, puede que tengan el mismo problema.

    Si, con un poco más de información o una sección de aviso, en las mismas páginas donde se anuncian estas funcionalidades, sería genial para que la gente no se lanzara a la piscina…

  3. pere rovira

    me gustaría saber si esto también puede pasar con otros programas de analítica web… sé por ejemplo que con omniture no se da el problema, pero qué hay de indextools/ywa, xiti, nedstat, weborama, webtrends,… ¿sabéis algo del tema?

    saludos

  4. Andrés Flores

    Que bueno que escribiste este post en castellano.

    Hace un tiempo escribi sobre esto:

    http://www.webanalytics.cl/09/2008/google-analytics-and-not-found-error-in-web-master-tool-reports/

    Y siempre llega tráfico organico con esta duda.

    saludos,

    Andrés

  5. Sergio

    he encontrado discrepancais en el tráfico indicado por AWstats y por GA. AWstats marca 3 veces más que GA.
    Mucho de este tráfico que AWstas contempla procede de un HTTP CODE 206, procedente de documentos PDF. He leido en la documentación de GA que éste interpreta de forma distinta la descarga o visualización de un pdf online de lo que lo hace AWstats.
    Qué de cierto tiene todo esto y dónde podría encontrar más información, así como una aclaración?

    Gracias

  6. Sergio Guerrero

    Muy interesante Ferriol.

    Desconocía esta problemática, pues nunca me he topado con algo así, pero lo tendré en cuenta cuando revise la información de mis dominios.

    Un saludo!!!

  7. Felipe Carrillo

    Una solución más concisa es utilizar una variable Javascript, que contenga el nombre lógico de la página, como argumento de trackPageview, por ejemplo trackPageview(nombre_pagina), y agregar el nombre de la variable al robots.txt. Difícilmente el Googlebot se interese en buscar el valor de la variable.

    Saludos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>