El término «contenido duplicado» a menudo tiene una connotación negativa para los nuevos propietarios de sitios web.
Tan pronto como las personas comienzan a leer sobre qué es el contenido duplicado, a veces comienzan a creer que cada pieza de contenido en su sitio web podría desencadenar penalizaciones de Google. Si bien eso no es cierto, el contenido duplicado causa problemas de SEO.
Por lo tanto, es útil aprender:
- ¿Qué es el contenido duplicado?
- Cómo se produce el contenido duplicado de SEO
- Penalizaciones de Google por contenido duplicado
- Cómo encontrar contenido duplicado de SEO
- Cómo arreglar el contenido duplicado existente
- Cómo evitar el contenido duplicado a largo plazo
¿Qué es el contenido duplicado?
También conocido como contenido idéntico, el contenido duplicado se refiere al contenido que aparece en más de una URL de sitio web. Las personas usan el término para describir una coincidencia exacta del contenido original que se encuentra en otros sitios web.
Matt Cutts, de Google, dice que se estima que entre el 25 y el 30% de todo el contenido web es duplicado, aunque la mayor parte no es engañosa.
Según Google, algunos ejemplos de contenido duplicado no intencionado son:
- Contenido en páginas regulares y simplificadas (como las de los foros en línea)
- Páginas de productos de la tienda online
- Versiones de solo impresora de páginas web
Cómo se produce el contenido duplicado de SEO
La mayoría de los propietarios de sitios web no saben qué es el contenido duplicado, y mucho menos cómo crearlo. La mayoría del contenido duplicado no es intencionado; simplemente sucede.
Estas son algunas de las formas en que se produce el contenido duplicado:
1. Variaciones de URL
Las variaciones de URL son un ejemplo de contenido duplicado no intencionado. Los parámetros de URL, como el seguimiento de clics y el código de análisis, suelen provocar estas variaciones.
Los ID de sesión y las versiones de impresora también suelen provocar variaciones de URL. El contenido duplicado se produce cuando cada usuario visita un sitio web al que se le asigna un ID de sesión diferente al que se almacena en la URL o cuando se indexan varias páginas de versiones de impresora.
2. Contenido raspado
Si te preguntáramos qué es el contenido duplicado, lo primero que probablemente te venga a la mente es el contenido copiado o raspado.
Al fin y al cabo, es el contenido el que se plagia intencionadamente y, aunque es una práctica habitual, no es la única razón detrás de la duplicación.
Por lo general, puede encontrar contenido copiado en las secciones del blog y en las páginas de información de productos de comercio electrónico.
3. Diferentes versiones del sitio web
Otra causa del contenido duplicado de SEO son los sitios web con diferentes versiones.
Si tu sitio web tiene contenido similar en diferentes versiones de una página, se considera contenido duplicado. Por ejemplo:
- Sitios web con y sin «www»: (p. ej., https://www.websitename.com/ y https://websitename.com)
- Sitios web con y sin «https»: (por ejemplo, http://www.websitename.com/ y https://www.websitename.com)
Penalizaciones de Google por contenido duplicado
Las personas que saben qué es el contenido duplicado intentan evitarlo tanto como sea posible porque creen que Google aplica una penalización por contenido duplicado. Pero eso no es cierto.
Ya en 2008, Google dijo que no imponía una penalización a las páginas web con copias duplicadas. Sin embargo, aunque Google no impone penalizaciones por el contenido duplicado, tener contenido duplicado afecta negativamente al SEO.
El contenido duplicado hace que los motores de búsqueda se confundan sobre:
- ¿Qué contenido es más relevante?
- ¿Dónde dirigir las métricas de enlaces, como la confianza, la autoridad o la equidad de enlaces: ¿deberían dirigirlos a la página original o mantenerlos entre las otras versiones?
- Qué versiones clasificar en las páginas de resultados de los motores de búsqueda (SERP).
Cuando los motores de búsqueda no saben qué versión indexar, el sitio web sufre porque la visibilidad de búsqueda y la equidad de los enlaces entrantes de cada duplicado se diluyen. Por lo tanto, las posibilidades de que el sitio web se clasifique también disminuyen.
Cómo encontrar contenido duplicado de SEO
Ahora que sabes qué es el contenido duplicado, qué lo causa y las penalizaciones por tenerlo en tu sitio web, el siguiente paso es comprobar si el contenido de tu sitio web tiene duplicados.
Nadie está a salvo. Los sitios web pequeños utilizan el raspado de contenido para parecer más autoritarios y hacer que los motores de búsqueda piensen que son la fuente original.
Estas son algunas formas de comprobar si hay contenido duplicado de SEO:
- Usa Google para buscar un fragmento de texto de tu sitio web. Usa comillas para que el motor de búsqueda busque la frase exacta.
- Utiliza herramientas como Copyscape, Grammarly o Siteliner, que comprueba el contenido único con el contenido publicado anteriormente.
- Consulta Google Search Console para encontrar variaciones de URL que puedan estar causando problemas de contenido duplicado.
- Utiliza las Herramientas para webmasters de Google para comprobar los enlaces a tu sitio web. Si nota un tráfico sustancial de un sitio web en particular, es posible que alguien haya raspado el contenido de su sitio web. También puedes crear una alerta de Google para títulos de publicaciones similares que hayan aparecido en línea después de publicar tu contenido.
Cómo arreglar el contenido duplicado existente
Si has encontrado contenido duplicado de SEO en tu sitio web o en el de otra persona, aquí tienes algunas formas de solucionarlo:
1. Crea una redirección 301.
Una redirección 301, o una redirección permanente, indica que una URL se ha movido permanentemente de la página duplicada a la página original. Es la mejor opción si no quieres que se pueda acceder a la página duplicada.
La consolidación de páginas separadas de contenido similar en la página original le dice al algoritmo del motor de búsqueda que esta es la página correcta para clasificar, lo que afecta positivamente la capacidad de la página para clasificarse bien.
2. Añade un elemento de enlace canónico.
Otra forma de evitar el contenido duplicado de SEO es agregar una etiqueta canónica (es decir, rel = canonical).
Le dice a los motores de búsqueda que la página web actual es un duplicado del sitio web al que se vinculó en la etiqueta. De esa manera, los motores de búsqueda sabrán el sitio web que desea que aparezca en los resultados de los motores de búsqueda.
Para usar una etiqueta canónica, agregue el atributo «rel= canonical» al encabezado HTML de cada página duplicada con la URL de la página original. No olvide encerrar la URL entre comillas.
Por ejemplo: <link rel = «canonical», href = «https://www.websitename.com/»>
3. Utilice la etiqueta NoIndex de Meta Robots.
La etiqueta meta robots no index es un fragmento de código que se añade al encabezado HTML de la página que permite a los motores de búsqueda rastrear los enlaces de una página mientras les dice que excluyan esos enlaces de sus índices.
La metaetiqueta es la mejor solución para los problemas de contenido duplicado relacionados con la paginación. La paginación se produce cuando aparece contenido similar en diferentes páginas, lo que da lugar a varias URL.
Para evitar que los motores de búsqueda indexen la página, utilice el valor noindex,follow:
4. Pida a los raspadores de contenido que eliminen el contenido de su sitio web.
Digamos que alguien ha raspado tu contenido y has encontrado su sitio web. Antes de recurrir a medidas extremas, hay algunas cosas que puede hacer para solucionar el problema.
Primero, envíe un correo electrónico al administrador o propietario del sitio web y dígale que ha encontrado su contenido en su sitio web. Es posible que no sepan que el contenido te pertenece, así que dales el beneficio de la duda.
A partir de ahí, puede considerar lo siguiente:
- Si se trata de un sitio web de alta calidad, pídeles que te acrediten como autor mediante un enlace a tu sitio web. Alternativamente, ofrécete a escribir una versión revisada del artículo a cambio de un backlink.
- Si el sitio web es de baja calidad, pídeles que retiren el contenido de inmediato.
Cómo evitar el contenido duplicado a largo plazo
Una vez que sepas qué es el contenido duplicado y cómo encontrarlo, puedes aplicar medidas para evitarlo.
Estos son algunos consejos para hacerlo:
1. Sé coherente con los enlaces internos.
Siga una estructura de enlaces internos coherente.
Si utilizas https://www.websitename.com/page, no enlazes a diferentes variaciones de URL, como https://www.websitename.com/page/ o https://www.websitename.com/page/index.html.
2. Utiliza dominios de nivel superior.
Si tiene contenido específico de un país, utilice dominios de nivel superior con código de país (ccTLD).
Por ejemplo, https://www.example.com/fr o https://www.fr.example.com funcionarían mejor que https://www.example.fr para el contenido centrado en el francés.
3. Minimice el contenido similar.
Si tienes muchas páginas similares, considera exponer el contenido o consolidar todas las páginas juntas.
4. Establezca el dominio preferido en Google Search Console.
Una medida preventiva para evitar la paginación es utilizar Google Search Console.
Ve a Configuración del sitio. Cambie la configuración en Dominio preferido para elegir el formato en el que se mostrará la URL de su sitio web.
Sin embargo, una cosa a tener en cuenta es que cambiar la configuración de Google Search Console solo funciona para Google; No hay garantía de que funcione para otros motores de búsqueda.
5. Añade una insignia de la DMCA.
Una insignia de DMCA es un sello de protección que evita que los raspadores de contenido copien contenido en su sitio web. La DMCA afirma que realizará una eliminación gratuita si tiene la insignia en su sitio web.
Reflexiones finales: qué es el contenido duplicado + 9 pasos para solucionarlo y evitarlo
Cuando trabajas duro para optimizar tu contenido, encontrar problemas de contenido duplicado puede ser una molestia. Aunque Google ha confirmado que no penaliza a los sitios web por contenido duplicado, sí contribuye negativamente al SEO.
Ahora que sabes qué es el contenido duplicado y cuánto de él no es intencionado, utiliza los consejos para solucionar y prevenir los problemas de contenido duplicado de SEO.
Lidiar con contenido duplicado puede ser una molestia, pero su proveedor de alojamiento web no tiene por qué serlo. Regístrese para obtener un Bluehost plan de alojamiento web hoy.
Escriba un comentario