Cómo optimizar tu sitio para que no muestre contenido duplicado

Hace poco comenzamos a trabajar con un cliente nuevo para hacer optimización de SEO de su página web. Hicimos un primer análisis rápido para entender el sitio y nos dimos cuenta de muchas situaciones problemáticas que debían ser solucionadas. Por temas de confidencialidad no podemos dar el nombre del cliente, pero sí vamos a documentar qué fue lo que hicimos para tener un ejemplo concreto de cómo lo trabajamos.

La idea de este blog es que juntos aprendamos, conozcamos y mejoremos. Eso sí, aceptamos propuestas, y comentarios, ojalá sean más los buenos que los malos, aunque con las críticas también aprendemos.

El trabajo de optimización lo hemos dividido en dos grandes partes, una de SEO on page y otra de SEO off page. La de SEO on page la dividimos en dos, esto específicamente porque el cliente tiene un sitio web, pero ha decidido modificarlo y apenas será entregado en los próximos meses. Entonces, la página principal por ahora estará sin modificaciones, por lo tanto nos concentramos en el blog.

El reto

A pesar de que el sitio web se cambiará, sí debemos hacerle un trabajo de optimización On Page, y esto representa un gran reto, puesto que hay unas 450 páginas internas a modificar y mejorar. Pero te estarás preguntando: ¿si vamos a hablar de contenido duplicado en qué momento es que comenzamos con lo que me interesa?

Te entiendo perfectamente y ahora dame un momento y te aclaro el panorama.

En esas 450 páginas internas notamos que se presenta mucho contenido duplicado, y aclaro: no están repitiendo posts o artículos, pero para los buscadores, y cuando hablamos de buscadores nos refermos a Google principalmente, sí aparece como si fuera contenido duplicado o textos similares. 

Vamos explícate!

De que hablas Wllis

Como en cualquier otra área, el mundo del SEO tiene su propio lenguaje y jerga y esta es bastante amplia, pero ¡no te dejes enredar! Para los que apenas comienzan en este mundo del SEO, especialmente los que desarrollan páginas web por su cuenta, muchos de estos términos y conceptos pueden ser un poco confusos al principio. Se necesita tiempo y experiencia para tener una buena idea de la sutileza y optimización del SEO en el sitio. 

Hay conceptos técnicos básicos y mucho más avanzados de SEO, tales como la comprensión de las configuraciones del servidor, que para quienes no somos desarrolladores puede ser un poco de mandarín avanzado.

Una de las áreas más comunes de confusión para los nuevos SEOs y los webmasters sin experiencia, es el uso de la etiqueta rel=canonical, un concepto técnico de SEO de rango medio que principalmente ayuda a resolver problemas de contenido duplicado.

Las etiquetas canónicas son un aspecto importante de la optimización de sitios web y son una de las herramientas básicas que un webmaster puede utilizar para comunicarse directamente con los motores de búsqueda y sus arañas (robots). Siempre recuerdo las arañas de la película Matrix cuando pienso en las de los buscadores, pero bueno, eso ya es culpa de un profe que tuve.

Araña Matrix

Pero, ¿entonces qué son los marcadores canónicos, rel=canonical y cuándo y dónde deben usarse?

En primer lugar les recomiendo que vayan a una de las fuentes más confiables, la mismísima ayuda de Google para explicar cómo consolidar URL duplicadas y les digo que es realmente buena.

Con este artículo, espero ayudarte a entender mejor la etiqueta canonical y cómo debe ser colocada en tu sitio web con una explicación menos técnica y más fácil de digerir.

Marcadores canónicos – Conceptos básicos.

En resumen, una etiqueta rel=”canonical” es la información contenida en el encabezado HTML, que se comunica directamente con las arañas de los motores de búsqueda y explica cómo las páginas individuales de contenido se relacionan con otras páginas del sitio.

Suena confuso, pero de nuevo, no te dejes enredar, no es confuso. Sigamos.
La etiqueta se inserta en la sección <HEAD> de tus páginas para indicar a los motores de búsqueda dónde se encuentra la página original o principal y se ve así:

<link rel=”canonical” href=“http://www.tusitioweb.com/pagina-principal/” />

Y ahora te preguntas con toda razón: ¿Por qué debería ser necesario para una página normal?

Supongamos que tu sitio web es una versión sin www, la versión canónica le dice a los motores de búsqueda qué página debe indexar. Para mayor claridad, un ejemplo. Mira las siguientes páginas:

http://www.tusitioweb.com/pagina-principal/
http://tusitioweb.com/pagina-principal/
http://www.tusitioweb.com/pagina-principal/index.html
https://www.tusitioweb.com/pagina-principal/

¿Las viste bien? ¿todas son distintas cierto?

¡Pues no! Para Google son idénticas todas, y aquí es donde le decimos a Google cuál es la que debe usar para que no las vea como contenido duplicado.

En otras palabras, esta simple etiqueta explica a los motores de búsqueda que deben revisar el enlace href para determinar cuál es la página principal para ese contenido.

De esta forma, el link juice (¡ay los términos aquellos! Link Juice es la autoridad que un enlace es capaz de transmitir al sitio al que enlaza) no se diluye, y los robots de los motores de búsqueda solamente indexan y en últimas dan crédito a ese sitio en particular. Bueno al menos en teoría.

Ahora si estás usando WordPress u otro CMS que dirija a las versiones con www o sin www esto facilita las cosas.

¿Por qué vale la pena estresarse por el contenido duplicado?

Los motores de búsqueda usuarios quieren ver contenido duplicado en sus SERPs (dale con los términos…simplemente son las páginas de los resultados de búsqueda). Cuando alguien va a Google para buscar algo, el motor de búsqueda trabaja naturalmente para obtener una lista diversa de resultados relacionados pero individuales, es decir, de diferentes sitios web.
Si el motor de búsqueda encuentra más de un sitio web con el mismo contenido, los motores de búsqueda los evalúan y seleccionan la mejor versión basada en sus algoritmos.

Con una etiqueta rel=canonical, le puedes pedir al robot de búsqueda que concentre el valor del enlace en una página de inicio, de modo que tengas una mejor oportunidad de obtener una posición en un resultado de búsqueda determinado.
Las etiquetas canónicas pueden ser útiles en muchos escenarios diferentes donde la duplicación de contenido es una parte integral de un sitio web, pero puede ser problemática para los motores de búsqueda.

Reseñas de productos en sitios de comercio electrónico

Vamos a suponer que tu sitio vende bolsos para mujeres. Es muy posible tener varias URL directamente vinculadas al producto base, como un bolso negro tradicional, pero con diferencias sutiles – como color, tamaño, material, etc. – en la URL.

Mujer con muchos bolsos

Las mujeres y los bolsos, ese ya es otro tema

En este caso, quieres que la página de inicio sea la que esté indexada por los motores de búsqueda y el resto de la página de inicio sea ignorada.

Examinemos el escenario:
http://www.tudominio.com/productos/bolsos/negro/
http://www.tudominio.com/productos?type=Bolsos&amp;Color=negro

En este panorama, deberían implementarse reglas de reescritura, pero este es un tema más avanzado que abordaremos después.
¿La solución? Pués claro… utiliza la etiqueta de rel=canonical para así darle claridad y orden a Google.

Los Blogs

Si tienes un blog, tendrás contenido paginado ¿Qué demonios es esto?
La paginación es un término que se refiere a la página(s) “siguiente”; y “anterior” del contenido del blog o 1, 2, 3 y así sucesivamente.
En este caso, el uso de la etiqueta de rel=canonical generalmente no es la solución porque dejarías de mostrar páginas relevantes. Aquí lo que quieres usar son las etiquetas rel=prev y rel=next, a menos que tengas una página “ver todo”. Vamos a abordar este último posteriormente ya que es un poco más avanzado.

En Conclusión

Para los desarrolladores web y SEO sin tanta experiencia, el uso de las etiquetas de canónicas puede ser confuso al principio y les llevará algún tiempo sentirse cómodos. Sin embargo, a medida que Google y otros motores de búsqueda continúan tratando de proporcionar resultados únicos y valiosos para sus usuarios en línea, se vuelve cada vez más importante aprender a comunicarse con las arañas de los motores de búsqueda y guiarlos hacia el contenido que desea indexar y clasificar.
Este breve artículo es sólo una introducción al uso de las etiquetas canónicas, pero debería llevar a los desarrolladores web sin mucha experiencia a una mejor comprensión de su uso y valores.

¿No estás seguro sobre cómo empezar a usar la etiqueta canonical o tienes una pregunta específica? ¡Empecemos la discusión aquí abajo!