Pues eso chavales, que no todo es indexar en Google. A veces es necesario limpiar nuestros contenidos y desindexar urls en Google. No estoy loco, os lo prometo 🤪. Resulta que uno de mis proyectos, de esos en los que hago pruebas de SEO, había indexado bastante contenido que no era relevante (ya veremos más adelante en concreto que contenido era ese).

El caso es que me había centrado en crear bastantes post y páginas para que empezase a posicionar y al final indexó eso y más. Os voy a dar unas pinceladas sobre el proyecto en cuestión para que entendáis el contexto:
En este artículo podrás leer...
ribamontanalmonte.com, el proyecto donde desindexar urls en Google
Esta es una página sencillita sobre el municipio en el que vivo, Ribamontán al Monte. Queria crear una web que se posicionase muy rápido arriba (la competencia es baja) y ver si podía vencer a la Wikipedia y a la página del Ayuntamiento (catastrófica 🤮 pero con enlaces entrantes de mucha autoridad).
😇 Como SEOs que somos si queréis echar un cable para acelerar el proceso ya sabéis: 1) Abrir navegador (a poder ser validados en vuestra cuenta de Google). 2) Buscad «ribamontan al monte» entrar. 3) Podéis entrar en las que vayan delante mío y salir a los pocos segundos. 4) Entrad en www.ribamontanalmonte.com (que es la que mola. Fuera de bromas es la mejor en contenidos si se mira objetivamente) y estad un buen rato por mi web, dando algún click interno. Gracias 😘
Ahí ando, en la posición 3 más o menos, con un dominio EMD comprado hace 3 meses, pero que ha estado «reposando» los dos primeros (no me gusta darles mucha caña a los dominios nada más ponerlos arriba). Es decir, en un mes he adelantado a webs del Gobierno de Cantabria, noticias del Diario Montañés (periódico de referencia aquí que posiciona muy arriba cualquier cosa que publique), páginas de casas rurales, etc. El proyecto marcha según lo previsto.
Total, que es una web con dos brazos paralelos: publicación de noticias de los municipios y artículos de calidad sobre qué hacer en Ribamontán al Monte, dónde comer, etc.
Por cierto, si la cosa va bien (que irá 🚀) y posiciono top-1 para la keyword Ribamontán al Monte, escribiré un post porque he utilizado algunas técnicas interesantes en lo que respecta a SEO local.
¿Por qué desindexar URLs en Google?
Está claro: si parte del contenido que está indexado no es bueno de cara al usuario y es «thin content» mejor hacerlo desaparecer. Os voy a dar algunas razones para desindexar URLs en Google:
- No va a posicionar bajo ninguna palabra clave o si lo hace lo hará fatal.
- Si un usuario llegase a través de Google a un contenido con thin content (contenido vacío o muy escaso) rebotará en tu web y eso afectará negativamente a tu SEO.
- Cabe la posibilidad (y es más que probable) que posicione por palabras clave que ya estés posicionando con contenidos de calidad. ¿El resultado? Canibalización de keywords.
Además de evitar todos estos problemas hay algo más que beneficiará a nuestro SEO: Aprovecharemos mejor nuestro Crawl Budget (el presupuesto de tiempo que dedica Google a recorrer cada sitio web). Mi sitio web al ser muy nuevo tiene asignado un Crawl Budget muy bajo por parte de Google, por ello si indexo contenido vacío obligo al robot de Google a pasar por lugares que no me interesan que pase (mejor que lo haga por páginas importantes de mi web).
Thin Content que encontré indexado en Google
Lo primero de todo, es muy obvio, pero no está de más decirlo. Para saber «qué partes de tu web» están indexadas en Google, símplemente accede al buscador y utiliza el comando «site»:

Al realizar esta búsqueda nos saldrán los resultados indexados de nuestro sitio. En mi caso era extraño que una web con unas 100 direcciones (entre entradas y páginas) tenga 197 resultados indexados 🤔. A continuación paso a mostraros los diferentes thin content que encontré.
¡Ojo! No digo que estos tipos de contenidos no deban estar indexados en vuestros proyectos. Habrá mil casos (ecommerce, websites corporativas, etc.) donde cada uno de estos casos tenga su lógica, pero en el caso de mi proyecto no me benefician.
Thin content por Imágenes indexadas
Había muchísimas páginas indexadas de imágenes (todavía las hay, que Google es lentito para desindexar 😖):

Claro, el usuario pinchaba en ellas y llegaba a una página autogenerada de WordPress:

Vamos, una basura en toda regla, porque encima mete debajo una pila de enlaces internos a los diferentes tamaños de la imagen. Si entra ahí el crawler de Google no sale hasta dentro de tres meses 😴.
En mi caso no eran para nada importantes. Os pongo un ejemplo: Anero es un pueblo de Ribamontán al Monte. Yo tengo una url creada con contenidos de calidad sobre Anero. Si etiqueto las noticias de ese pueblo con el Tag de «Anero«, WordPress generará una url para ese tag, con lo que tendré dos direcciones muy parecidas (/Anero y /Tags/Anero) y que competirán por posicionar. No sólo eso: estamos incurriendo en contenido duplicado ya que estas páginas autogeneradas sirven para agrupar los tags y categorías, con lo que muestran los textos de los post originales. ¡Mejor sacarlas del mapa de Google!

Thin content por indexación de documentos
En este caso eran documentos PDF pero podrían ser otros como archivos Excel por ejemplo. En mi caso no valen para nada, ya que tienen sentido dentro del ámbito del post que incluya ese archivo en cuestión pero no por separado.

Thin content por paginación
WordPress puede paginar nuestros recursos y Google indexarlos. ¿Tienen alguna importancia en mi caso? Ninguna. En este caso te muestro el ejemplo de una página autogenerada de la sección Blog.

¿Cómo desindexar URLS en Google?
Es más que sencillo. Símplemente accede a tu cuenta de Google Search Console y dirígete al menú Índice de Google > Eliminar URLs:

Al pulsarlo nos aparecerá la página para eliminar URLs del índice de Google:

💥 ¡Atentos! Acabad de leer el artículo, ya que está «muy bonito» el eliminar las urls de Google, pero si su robot vuelve a visitarnos estaremos indexados de nuevo. Así que hay que hacer algo más en nuestro propio WordPress para evitar esto.
En esta pantalla simplemente iremos introduciendo las urls que queramos desindexar. Al introducir una y pulsar sobre «Continuar» nos aparecerá esta página:

Debemos dar sobre «Enviar solicitud» y veremos que nuestra url aparece una lista con el texto «Pendiente». Google tarda lo suyo en hacer esto, en mi caso rara vez tarda menos de 12 horas. Pero algo es algo. Finalmente veremos que su estado cambia a «Eliminada»

¿Qué nos falta por hacer en WordPress para desindexar las URLs en Google?
Pues algo muy sencillo: decirle a WordPress lo que no debe indexar de nuestra página (podía haberlo hecho antes, pero estaba a otras cosas). Se puede hacer modificando directamente el archivo robots.txt, pero como tengo el plugin Yoast SEO instalado en mi web y es tremendamente popular en los blogs WordPress os mostraré donde se indica en este plugin (iremos a títulos y metas):

En cada una de las pestañas podremos marcar diferentes aspectos para que sean no-index de cara a los robots de los buscadores. En la pestaña taxonomías (por ejemplo, en el resto del caso es igual), podremos evitar que las categorías y los tags se indexen:

Y poco más, pensaba escribir 500 palabras, pero me han salido casi el triple. ¡No tengo remedio! 😭 Espero que este artículo titulado «Desindexar URLS en Google – Un caso práctico» te haya gustado 🤞. Y si así ha sido ya sabes: comenta y suscríbete al blog justo debajo 😬.