¿Qué es el contenido duplicado?
El contenido duplicado es cuando un texto se encuentra replicado parcial o totalmente en diferentes URLs, ya sean del mismo dominio o en otros sitios web diferentes.
Es decir, esto puede producirse tanto porque 2 URLs de diferentes sitios web poseen el mismo contenido, como por el resultado de repetir o duplicar los textos dentro de tus propias páginas.
En la mayoría de los casos, las réplicas externas suelen suceder por culpa de la copia o el plagio. En cambio, el contenido duplicado interno se da cuando tengo más de una URL que conduce a la misma página o por la duplicidad de la información en nuestras páginas.
Se estima que un contenido se puede considerar como duplicado, cuando éste se encuentra literalmente ya publicado en al menos en un 30% en otra URL.
Por el contrario, el mismo es considerado original cuando aproximadamente el 70% del texto no tiene una estructura literal idéntica a otro.
Sea como fuere, debes tener claro que replicar o copiar textos no está bien visto por ningún buscador.
Los motores de búsqueda como Google persiguen esta práctica. Además, el gran avance en sus algoritmos, ha provocado que cada vez sea más sencillo para él detectar dichas copias.
¿Te pueden penalizar por estas duplicidades?
En la mayoría de los casos, el contenido duplicado, al igual que la canibalización de palabras clave, más que acarrearnos una penalización como tal, bajan la calidad de nuestras páginas y reportan una pérdida de posiciones o desindexación de las mismas por mala calidad.
Eso sí, un sitio Web que abusa constantemente de estas prácticas será castigado o penalizado, ya que los algoritmos de Google controlan estos temas.
¿Por qué el contenido duplicado afecta negativamente al SEO?
Existen varias razones por las que la duplicidad de contenido y el SEO no se llevan nada bien:
Reducirá tu tráfico web
Publicar contenido duplicado empezará por reducir las visitas que llegan a tu sitio. Esto echa por tierra todo el trabajo que hayas podido hacer en cuanto a, por ejemplo, el «Keyword Research» y búsqueda de palabras clave longtail, para posicionar adecuadamente tus artículos.
Y es que no importa cuánto te esfuerces, ya que este problema pesará mucho más que todo lo que puedas llegar a optimizar en tus páginas.
Sufrirás desindexaciones de páginas
Posteriormente, los motores de búsqueda podrían desindexar alguna de tus URL’s.
Esto supondrá un golpe importante para tu posicionamiento, que no lograrás remontar con facilidad, incluso si dejas de publicar material copiado.
Toda tu estrategia digital perderá fuerza
Si vas perdiendo la indexación de alguna de tus páginas, todo tu plan o estrategia que hayas planteado en un principio se resentirá, ya que no podrás contar con ellas para posicionarte ni lograr resultados.
De forma lenta pero segura, tu web perderá empuje, como un avión que ha perdido uno de sus motores.
Puedes cabrear al Panda
Finalmente, debes saber que, si repites esta práctica durante demasiado tiempo, no sólo no estarás mejorando ningún aspecto de tu estrategia, sino que algoritmos como el de Panda podrían penalizar tu dominio por completo, dejándolo sin visibilidad.
En la práctica, esto supone casi desaparecer de Internet, que es obviamente todo lo contrario a lo que pretendías cuando comenzaste con tu negocio online.
Si te fijas, no hay estrategia de marketing o comunicación que pueda salvarte de semejante «castigo». Del mismo modo, por mucho que publiques contenido de calidad, con un SEO muy trabajado y estudiado, si gran parte del mismo es copiada, tu sitio caerá.
¿Por qué el contenido duplicado es perjudicial para el usuario o lector?
Ahora me gustaría analizar contigo esta situación desde el punto de vista del lector, es decir, cuando publicas contenido duplicado y éste se percata de ello:
Obviamente, también el que consume tus textos puede verse afectado de forma directa o indirecta.
Poniéndome en su lugar, quizás él haya visto la misma información en otros sitios de internet, o tal vez sea tu sitio el primer lugar al que llega para descubrir textos ya compartido en otras webs.
En esta situación, el factor que más se resintió sería la experiencia del usuario. Pero, además, estarás afectando a otros factores como:
1) Información poco fiable
Si varias personas publican lo mismo, se puede entender como que, al menos una de ellas está intentando engañar al visitante.
Esto es así porque significa que no se aplican filtros ni revisiones. Se publica sin contrastar, algo que siempre es indeseable cuando buscas contenido de calidad.
2) Perderán el interés por leerte
La lectura es repetitiva, es decir, que el visitante se aburrirá, porque percibe que lo que está viendo es algo a lo que ya accedió previamente.
3) Se genera un clima de desconfianza
Tu lector podría percatarse de que, si se copia, las partes implicadas no se preocupan lo suficiente por su contenido. Debido a esto, la retención será menor, así como las probabilidades de fidelizar a ese usuario dentro de tu estrategia de captación.
En todos estos escenarios has de considerar relevante que tu usuario se sentirá, como mínimo, defraudado.
Más allá de las penalizaciones que pueda imponer un motor de búsqueda de forma automática, las del usuario serán sin duda las que más consecuencias tengan.
¿Cuáles son las mejores herramientas para detectar (y evitar) contenido duplicado?
Como has visto, no existe un único formato, sino que podrías tener interés en resolver los problemas del contenido duplicado On-site o del que se genera en todo Internet (Off-site).
Entonces, para rastrear e identificar está duplicidades, o detectarlas inclusive antes de que las publiques en una web, puedes ayudarte de estas herramientas:
Semrush
A través de la auditoría de tu propio sitio, Semrush te permite conocer esta interesante información de forma pormenorizada.
Screaming Frog
Esta potente herramienta te permite, además de analizar un dominio en busca de posibles mejoras en el SEO de sus etiquetas y de su estructura en general, rastrear la posibilidad de duplicidades de contenido.
Plagiarisma.net
Personalmente, Plagiarisma es una de las herramientas gratuitas para detectarlo que más uso, por su sencillez y efectividad a la hora de dar con duplicidades en Internet.
Su funcionamiento es muy sencillo y tiene 2 formas de usarlo:
- Buscar copiando y pegando el texto en cuestión en su buscador: aquí, si usas su versión gratuita, podrás añadir, en una misma búsqueda, un máximo de 2.000 palabras. Aun así, podrás copiar y pegar trozo a trozo todo el texto que quieras analizar.
- Sube tu archivo desde tu disco duro o desde drive: es una forma alternativa, pero, según lo mires, bastante más cómoda. Sin embargo, si Plagiarisma detecta que el texto subido tiene más de 2.000 palabras, también te lo notificará.
Google Search Console
A través de la herramienta de webmaster de Google, podrás también identificar este problema.
Tan sólo debes ir a Search Console y en la sección «Apariencia en el buscador > Mejoras de HTML» y ver si en la opción de «Etiquetas de títulos duplicados» tienes alguna anormalidad.
Plagium
A través de Plagium puedes hacer multitud de cosas en torno al problema del contenido duplicado: checkear URL’s de manera individual, comparar dos páginas para comprobar si Google los trataría como «duplicate content», etc.
Lo mejor de todo es que, si te registras gratuitamente, podrás subir directamente un fichero de texto en Word, PDF, etc. y la herramienta lo analizará y comparará con lo que ya hay publicado en la web.
El contenido duplicado, como has podido aprender hoy, podría arruinar toda tu estrategia SEO. Podría ser algo más benevolente, pero ciertamente el tema es así.
A modo de cierre, es positivo que tengas muy presente que los motores de búsqueda detectan cualquier texto previamente publicado e indexado.
Si ciertas ideas, citas o pequeños fragmentos están presentes en otras páginas web, en teoría no pasará nada, pero si la cosa aumenta en un alto “porcentaje” al texto total, las alarmas se dispararán. Y con ello, los posibles castigos por parte de los buscadores.
Para evitar males mayores, realiza auditorías con regularidad, y saca partido a las muchas herramientas de las que dispones para detectarlo On y Off-site.
Deja una respuesta