Desindexar URLS en Google ▷【Caso práctico en una de mis webs】

Pues eso chavales, que no todo es indexar en Google. A veces es necesario limpiar nuestros contenidos y desindexar urls en Google. No estoy loco, os lo prometo 🤪. Resulta que uno de mis proyectos, de esos en los que hago pruebas de SEO, había indexado bastante contenido que no era relevante (ya veremos más adelante en concreto que contenido era ese).

Desindexar URLs en Google
Desindexar URLs en Google

El caso es que me había centrado en crear bastantes post y páginas para que empezase a posicionar y al final indexó eso y más. Os voy a dar unas pinceladas sobre el proyecto en cuestión para que entendáis el contexto:

ribamontanalmonte.com, el proyecto donde desindexar urls en Google

Esta es una página sencillita sobre el municipio en el que vivo, Ribamontán al Monte. Queria crear una web que se posicionase muy rápido arriba (la competencia es baja) y ver si podía vencer a la Wikipedia y a la página del Ayuntamiento (catastrófica 🤮 pero con enlaces entrantes de mucha autoridad).

😇 Como SEOs que somos si queréis echar un cable para acelerar el proceso ya sabéis: 1) Abrir navegador (a poder ser validados en vuestra cuenta de Google). 2) Buscad «ribamontan al monte» entrar. 3) Podéis entrar en las que vayan delante mío y salir a los pocos segundos. 4) Entrad en www.ribamontanalmonte.com (que es la que mola. Fuera de bromas es la mejor en contenidos si se mira objetivamente) y estad un buen rato por mi web, dando algún click interno. Gracias 😘

Ahí ando, en la posición 3 más o menos, con un dominio EMD comprado hace 3 meses, pero que ha estado «reposando» los dos primeros (no me gusta darles mucha caña a los dominios nada más ponerlos arriba). Es decir, en un mes he adelantado a webs del Gobierno de Cantabria, noticias del Diario Montañés (periódico de referencia aquí que posiciona muy arriba cualquier cosa que publique), páginas de casas rurales, etc. El proyecto marcha según lo previsto.

Total, que es una web con dos brazos paralelos: publicación de noticias de los municipios y artículos de calidad sobre qué hacer en Ribamontán al Monte, dónde comer, etc.

Por cierto, si la cosa va bien (que irá 🚀) y posiciono top-1 para la keyword Ribamontán al Monte, escribiré un post porque he utilizado algunas técnicas interesantes en lo que respecta a SEO local.

¿Por qué desindexar URLs en Google?

Está claro: si parte del contenido que está indexado no es bueno de cara al usuario y es «thin content» mejor hacerlo desaparecer. Os voy a dar algunas razones para desindexar URLs en Google:

  • No va a posicionar bajo ninguna palabra clave o si lo hace lo hará fatal.
  • Si un usuario llegase a través de Google a un contenido con thin content (contenido vacío o muy escaso) rebotará en tu web y eso afectará negativamente a tu SEO.
  • Cabe la posibilidad (y es más que probable) que posicione por palabras clave que ya estés posicionando con contenidos de calidad. ¿El resultado? Canibalización de keywords.

Además de evitar todos estos problemas hay algo más que beneficiará a nuestro SEO: Aprovecharemos mejor nuestro Crawl Budget (el presupuesto de tiempo que dedica Google a recorrer cada sitio web). Mi sitio web al ser muy nuevo tiene asignado un Crawl Budget muy bajo por parte de Google, por ello si indexo contenido vacío obligo al robot de Google a pasar por lugares que no me interesan que pase (mejor que lo haga por páginas importantes de mi web).

Thin Content que encontré indexado en Google

Lo primero de todo, es muy obvio, pero no está de más decirlo. Para saber «qué partes de tu web» están indexadas en Google, símplemente accede al buscador y utiliza el comando «site»:

Búsqueda de contenidos indexados de un dominio en Google con el comando Site
Búsqueda de contenidos indexados de un dominio en Google con el comando Site

Al realizar esta búsqueda nos saldrán los resultados indexados de nuestro sitio. En mi caso era extraño que una web con unas 100 direcciones (entre entradas y páginas) tenga 197 resultados indexados 🤔. A continuación paso a mostraros los diferentes thin content que encontré.

¡Ojo! No digo que estos tipos de contenidos no deban estar indexados en vuestros proyectos. Habrá mil casos (ecommerce, websites corporativas, etc.) donde cada uno de estos casos tenga su lógica, pero en el caso de mi proyecto no me benefician.

Thin content por Imágenes indexadas

Había muchísimas páginas indexadas de imágenes (todavía las hay, que Google es lentito para desindexar 😖):

Thin content por Imágenes indexadas en Google
Thin content por Imágenes indexadas en Google

Claro, el usuario pinchaba en ellas y llegaba a una página autogenerada de WordPress:

Ejemplo de página autogenerada por WordPress de una imagen
Ejemplo de página autogenerada por WordPress de una imagen

Vamos, una basura en toda regla, porque encima mete debajo una pila de enlaces internos a los diferentes tamaños de la imagen. Si entra ahí el crawler de Google no sale hasta dentro de tres meses 😴.

Thin content por categorías y tags

En mi caso no eran para nada importantes. Os pongo un ejemplo: Anero es un pueblo de Ribamontán al Monte. Yo tengo una url creada con contenidos de calidad sobre Anero. Si etiqueto las noticias de ese pueblo con el Tag de «Anero«, WordPress generará una url para ese tag, con lo que tendré dos direcciones muy parecidas (/Anero y /Tags/Anero) y que competirán por posicionar. No sólo eso: estamos incurriendo en contenido duplicado ya que estas páginas autogeneradas sirven para agrupar los tags y categorías, con lo que muestran los textos de los post originales. ¡Mejor sacarlas del mapa de Google!

Thin Content por categorías y tags
Thin Content por categorías y tags

Thin content por indexación de documentos

En este caso eran documentos PDF pero podrían ser otros como archivos Excel por ejemplo. En mi caso no valen para nada, ya que tienen sentido dentro del ámbito del post que incluya ese archivo en cuestión pero no por separado.

Thin content por indexación de archivos
Thin content por indexación de archivos

Thin content por paginación

WordPress puede paginar nuestros recursos y Google indexarlos. ¿Tienen alguna importancia en mi caso? Ninguna. En este caso te muestro el ejemplo de una página autogenerada de la sección Blog.

Thin content por paginación
Thin content por paginación

¿Cómo desindexar URLS en Google?

Es más que sencillo. Símplemente accede a tu cuenta de Google Search Console y dirígete al menú Índice de Google > Eliminar URLs:

Menú de Google Search Console para eliminar urls
Menú de Google Search Console para eliminar urls

Al pulsarlo nos aparecerá la página para eliminar URLs del índice de Google:

Eliminación de URLs de Google Search Console
Eliminación de URLs de Google Search Console

💥 ¡Atentos! Acabad de leer el artículo, ya que está «muy bonito» el eliminar las urls de Google, pero si su robot vuelve a visitarnos estaremos indexados de nuevo. Así que hay que hacer algo más en nuestro propio WordPress para evitar esto.

En esta pantalla simplemente iremos introduciendo las urls que queramos desindexar. Al introducir una y pulsar sobre «Continuar» nos aparecerá esta página:

Ocultar página y eliminarla del índice de Google
Ocultar página y eliminarla del índice de Google

Debemos dar sobre «Enviar solicitud» y veremos que nuestra url aparece una lista con el texto «Pendiente». Google tarda lo suyo en hacer esto, en mi caso rara vez tarda menos de 12 horas. Pero algo es algo. Finalmente veremos que su estado cambia a «Eliminada»

URL eliminada del índice de Google
URL eliminada del índice de Google

¿Qué nos falta por hacer en WordPress para desindexar las URLs en Google?

Pues algo muy sencillo: decirle a WordPress lo que no debe indexar de nuestra página (podía haberlo hecho antes, pero estaba a otras cosas). Se puede hacer modificando directamente el archivo robots.txt, pero como tengo el plugin Yoast SEO instalado en mi web y es tremendamente popular en los blogs WordPress os mostraré donde se indica en este plugin (iremos a títulos y metas):

Menú de Yoast Seo
Menú de Yoast Seo

En cada una de las pestañas podremos marcar diferentes aspectos para que sean no-index de cara a los robots de los buscadores. En la pestaña taxonomías (por ejemplo, en el resto del caso es igual), podremos evitar que las categorías y los tags se indexen:

Marcar como no indexable los contenidos de tags y categorías con Yoast SEO
Marcar como no indexable los contenidos de tags y categorías con Yoast SEO

Y poco más, pensaba escribir 500 palabras, pero me han salido casi el triple. ¡No tengo remedio! 😭 Espero que este artículo titulado «Desindexar URLS en Google – Un caso práctico» te haya gustado 🤞. Y si así ha sido ya sabes: comenta y suscríbete al blog justo debajo 😬.

Deja un comentario