Síguenos en las Redes

Header Ad

Últimos artículos

Categories

Información interesante sobre el contenido duplicado

contenido duplicado
9 minutos de lectura

El Contenido duplicado significa que el contenido es muy similar, o es exactamente el mismo que se encuentra en varias páginas de la misma web o en otras páginas web externas. El objetivo de este artículo es ayudarte a identificar las razones que pueden generar esta situación y cómo resolverlas.

Antes de comenzar, deseamos aclarar que este artículo se refiere al contenido duplicado que se produce entre varias páginas de la misma página web (on-site) y entre tras páginas externas (off-site) en relación con un contenido idéntico publicado en otras páginas web.


¿Qué es el contenido duplicado?

  • Tomado en sentido estricto, el contenido duplicado se refiere al contenido muy similar, o exactamente igual, que se encuentra en múltiples páginas dentro de tu propia web o en otras web.
  • Tomado en sentido amplio, el contenido duplicado es el contenido que añade poco o ningún valor para tus visitantes. Por lo tanto, las páginas con poco o ningún contenido también se consideran contenido duplicado.

¿Corregir el contenido duplicado mejorará las posiciones SEO de mi página?

Sí, porque al corregir los problemas de duplicación, le estás diciendo a los motores de búsqueda qué páginas importantes necesitan realmente para rastrear, indexar y clasificar.

También evitará que los motores de búsqueda gasten su presupuesto de rastreo de tu página web o crawl budget en páginas duplicadas irrelevantes. Pueden centrarse en el contenido único de tu página web para el cual tu quiere ser visible.

¿Qué es el presupuesto de rastreo?

El presupuesto de rastreo es la cantidad de páginas que Google rastreará en tu sitio web en un día determinado. Este número varía ligeramente de un día a otro, pero en general, es relativamente estable.

Google asigna a sus rastreadores un tiempo, para rastrear cada sitio web en base a la autoridad, accesibilidad, calidad y velocidad de la web. Google asignará más o menos tiempo para que sus robots rastreen tus páginas interiores.

Google podría rastrear 6 páginas en su sitio cada día, podría rastrear 5.000 páginas, incluso podría rastrear 4.000.000 páginas todos los días.


¿Hay una cantidad permitida de contenido duplicado?

No hay una buena respuesta a esta pregunta. Sin embargo, si quieres estar bien clasificado en las SERP con una página, debe tener valor para tus visitantes y un contenido único.


¿Cómo encontrar contenido duplicado en tu propia página web?

Con Screaming Frog, puedes encontrar fácilmente contenido duplicado comprobando si tus páginas tienen un título único, una meta descripción y un encabezado H1. Puedes identificarlo fácilmente yendo a los títulos de las páginas, a la meta descripción y a las pestañas H1 y filtrando en Duplicado.


¿Cómo encontrar contenido duplicado fuera de tu página web?

Si tienes una página web pequeña, puedes intentar buscar en Google frases entre comillas.

Por ejemplo, si quiero ver si alguien ha copiado este artículo, puedo buscar una frase escrita en el contenido como: «Por ejemplo, si quiero ver si alguien ha copiado este artículo, puedo buscar una frase escrita en el contenido como«.

Alternativamente, para páginas web más grandes, puedes usar un servicio online como Copyscape. Esta herramienta rastrea la web en busca de múltiples ocurrencias del mismo contenido o de un contenido estrechamente relacionado.


¿Por qué el contenido duplicado es malo para el SEO?

El contenido duplicado es malo para tu SEO por tres razones:

  1. Cuando hay varias versiones del contenido en varias páginas, es difícil para los motores de búsqueda determinar qué página debe ser indexada, y luego mostrarla en sus resultados de búsqueda. Cuando hay varias versiones de contenido disponibles, es difícil para los motores de búsqueda determinar qué versión indexar, y posteriormente mostrar en sus resultados de búsqueda. Esto disminuye el rendimiento de todas las versiones del contenido, ya que compiten entre sí.
  2. A los motores de búsqueda les resultará difícil establecer el R-A-C (Relevancia, Autoridad, Confianza) de cada contenido duplicado, especialmente cuando las páginas web externas enlazan con los backlinks a muchas de estas páginas. Así, la autoridad se diluirá en aquellas páginas duplicadas que muestren el mismo contenido.
  3. La reiteración de contenido duplicado en tu página y por lo tanto, de páginas irrelevantes, desperdiciará el presupuesto de rastreo asignado por los motores de búsqueda para explorar e indexar las páginas de tu página.

¿Google impone una sanción por el contenido duplicado?

El comportamiento de Google con respecto a su visibilidad orgánica será diferente dependiendo de si eres culpable del contenido duplicado entre las páginas de tu sitio o entre las páginas de diferentes sitios.

 


Contenido duplicado en la propia web

En sentido estricto, el contenido duplicado es un contenido en texto muy similar, o exactamente el mismo, que puede encontrarse en varias páginas de tu propia página web o en otras páginas web.

En general, el contenido duplicado es el que proporciona poco o ningún valor añadido a tus usuarios. Por lo tanto, las páginas con contenido inexistente o muy escaso también se considerarán como contenido duplicado.

Como comprenderás rápidamente, debes evitar tener contenido duplicado porque confunde a los motores de búsqueda y puede perjudicar tu rendimiento de SEO.

Por ejemplo, tener una docena de páginas de contenido duplicado en una página web de 100 páginas es algo que se debe corregir, pero donde el contenido duplicado realmente pesará su rendimiento de SEO es cuando haya una cantidad excesiva cercano al 50%


El contenido duplicado interno

El hecho de tener contenido duplicado puede afectar a tu rendimiento de SEO, pero Google no te penalizará mientras no copies intencionadamente la página web de otra persona.

Si eres el propietario honesto de una página web, tienes dificultades técnicas y no intentas engañar a Google, no tienes que preocuparte por ser penalizado.


Contenido duplicado de otras páginas

Por otro lado, si has copiado en tu página grandes cantidades de contenido publicado por otras personas en otros sitios web, estás en la cuerda floja…

Esto es lo que dice Google:

«En los raros casos en que creemos que se puede publicar contenido duplicado para manipular nuestras clasificaciones y engañar a nuestros usuarios, también hacemos los ajustes apropiados en la indexación y clasificación de los páginas involucradas. Como resultado, el ranking del página puede verse afectado, o la página puede ser eliminada permanentemente del índice de Google, en cuyo caso dejará de aparecer en los resultados de búsqueda».

Por lo general, en el caso del contenido duplicado entre varias páginas, Google no impone sanciones a las páginas que muestran el mismo contenido, como se explica a continuación:

«El contenido duplicado no tiene ninguna consecuencia negativa particular para tu página, a menos que el propósito parezca ser engañar y manipular los resultados de los motores de búsqueda. En caso de problemas de contenido duplicado, y si no se siguen las recomendaciones anteriores, nos encargaremos de elegir la versión del contenido que se mostrará en nuestros resultados de búsqueda».

En otras palabras, Google intentará identificar la página o el sitio web que publicó el contenido primero para que sea más visible que otros que han duplicado el contenido.

Esto significa que las páginas que copiaron el contenido serán clasificadas más abajo en el SERP, pero sin penalización, que la página canónica (que publicó el contenido primero).


¿Y el contenido traducido?

Con respecto al contenido traducido de un idioma a otro, esta práctica no es considerada por Google como contenido duplicado.

De hecho, los contenidos están en diferentes idiomas y por lo tanto son únicos.


Causas que pueden conducir a la duplicación del contenido

La duplicación de contenido se debe a menudo a un servidor o página web mal configurada. Estos casos son de naturaleza técnica y probablemente nunca resultarán en una sanción de Google. Sin embargo, pueden afectar a su clasificación orgánica, por lo que es importante corregirlos como prioridad.

Además de las causas técnicas, también hay causas humanas: contenido que se copia deliberadamente y se publica en otros lugares. Como ya hemos dicho, pueden dar lugar a sanciones si son malintencionadas.


Contenido duplicado generado por errores técnicos

wwww vs www y HTTP vs HTTPS: Supongamos que usas tu subdominio www con HTTPS. En este caso, su forma preferida de difundir su contenido es a través del formato https://www.tusitioweb.com que será su dominio canónico.

Si tu servidor web está mal configurado, su contenido también puede ser accesible a través de:

  • http://www. tusitioweb.com
  • http:// tusitioweb.com
  • https:// tusitioweb.com

Elige la forma principal de mostrar tu contenido, y configura una redirección 301 en URLs no privilegiadas que conduzcan a la versión elegida: https://www. tusitioweb.com


Estructura de la URL: barras y mayúsculas

Para la indexación, el contenido duplicado y la comprensión de tu página por parte de Google, las URL desempeñan un papel importante.

Esto significa que https:// tusitioweb.com /url-a/ y https:// tusitioweb.com /url-A/ se consideran URL diferentes.

Cuando se crean los formatos de las URL, es fácil cometer un error de imprenta, lo que hace que ambas versiones de la URL sean indexadas.

Una barra (/) al final de una URL se llama barra.

A menudo, se puede acceder a los URL por ambas variantes aquí: https:// tusitioweb.com /url-a y https://tusitioweb.com/url-a/.

Así que asegúrate de elegir el formato de URL que prefieras y redirige a otros a él a través de redirecciones 301.


Páginas de índice (index.html, index.php)

Sin su conocimiento, tu página de inicio puede ser accesible a través de varias URLs porque su servidor web está configurado incorrectamente. Además de https://www.tusitioweb.com, también se puede acceder a tu página web a través de :

  • https://www.tusitioweb.com/index.html
  • https://www.tusitioweb.com/index.asp
  • https://www.tusitioweb.com/index.aspx
  • https://www.tusitioweb.com/index.php

Elige tu dirección para servir tu página de inicio, preferiblemente https://www.tusitioweb.com y configura redirecciones 301 desde otros formatos.

Si tu página web utiliza alguna de las direcciones URL anteriores para servir contenido, asegúrate de canonizarlas mediante etiquetas canónicas, ya que las redirecciones romperían esas páginas.


Taxonomías

Una taxonomía es un mecanismo de agrupación para clasificar el contenido. A menudo se utiliza en el CMS para gestionar las categorías y las etiquetas.

Supongamos que tienes una entrada en un blog que está en tres categorías. El artículo del blog puede ser accesible en las tres categorías:

  • https://www.tusitioweb.com/category-a/articulo-1/
  • https://www.tusitioweb.com/category-b/articulo-1/
  • https://www.tusitioweb.com/category-c/articulo-1/

De nuevo, tienes dos soluciones: O escoges una categoría principal y pones etiquetas canónicas en las otras dos URLs.

Pero te aconsejamos que adoptes un formato de URL optimizado en su lugar.

En este ejemplo, en lugar de una taxonomía que siga la categorización del página y del artículo, opta por una URL de un solo paso: https://www.tusitioweb.com/articulo-1/, que te permitirá colocar tu artículo en varias categorías sin que le molesten los diferentes URL relacionados con estas categorías.


La ubicación

En lo que respecta a la localización, pueden surgir problemas de duplicación de contenido cuando se utiliza exactamente el mismo contenido para dirigirse a personas de diferentes regiones que hablan el mismo idioma.

Por ejemplo, si tienes una página web con una sección dedicada al mercado español y otra para el mercado mexicano, ambas en español, es muy probable que el contenido sea redundante.

Google sabe cómo detectarlo y normalmente agrupa los resultados. En esta situación, el atributo hreflang puede decirle a Google por qué dos secciones del página están cercanas en términos de contenido.

Si se utiliza el mismo contenido para diferentes públicos como parte de una estrategia internacional de SEO, asegúrate de que el atributo hreflang se integre en las páginas para indicar que una página es para los españoles de habla española, otra para los mejicanos de habla española.

Ten cuidado, las etiquetas hreflang no te ayudarán a deshacerte del contenido duplicado a los ojos de Google. Para ello, tendrás que escribir un contenido único es español para tu público mejicano y otro para tu público español.


Páginas de resultados de búsqueda interna indexables

Muchas páginas web le permiten buscar dentro de la página a través de un motor de búsqueda interno. Las páginas en las que se muestran los resultados de la búsqueda son todas muy similares y, en la mayoría de los casos, no ofrecen ningún valor a los motores de búsqueda. Por eso no quieres que sean indexables para los motores.

Evita que los motores de búsqueda indexen las páginas internas de resultados de búsqueda utilizando la etiqueta de meta robots:

<meta name=»robots» content=»noindex, follow»>

Al mismo tiempo, es esencial no enlazar con estas páginas de resultados desde enlaces externos.

Sin embargo, esta táctica no te ahorrará ningún presupuesto de arrastre. De hecho, la etiqueta noindex le dirá a Google que no indexe estas páginas, y para entender esto, su Googlebot tendrá que explorarlas y por lo tanto usará sus recursos de rastreo…


Evita la publicación de contenidos no terminados

Cuando creas una nueva página con poco contenido, guárdala sin publicarla, ya que a menudo tendrá poco o ningún valor.

Guarda las páginas no terminadas como borradores: Si necesitas publicar páginas de contenido limitado, evita que los motores de búsqueda las indexen utilizando el atributo de meta robots de noindex.


Para terminar, el contenido en las Landing page para las campañas de SEM (Adwords)

La búsqueda pagada (anuncios de Google, anuncios de Facebook…) requiere que las Landing pages dedicadas que apunten a palabras clave específicas.

Las Landing Page son a menudo copias de las páginas originales de la página, que luego se ajustan para apuntar a estas palabras clave específicas. Como estas páginas son muy similares, producen contenido duplicado si son indexadas por los motores de búsqueda.

Evita que los motores de búsqueda indexen las páginas de destino mediante la implementación de etiquetas de noindex.

En general, es mejor no enlazar con tus Landing Page para campañas pagadas y no incluirlas en tu mapa XML de la página.

Además, te aconsejamos que utilices las páginas de destino que ya están presentes en tu página web y optimizarlas para el SEO, ya que normalmente su contenido ya estará conformado para ser visible en las palabras clave relevantes. No olvides que una buena sinergia entre SEO y SEM es esencial en tu estrategia!


 

    Deja tu comentario

    Tu correo electrónico no será publicado.*

    diecinueve − 1 =

    Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información. ACEPTAR

    Aviso de cookies