Noindex es un valor que se utiliza en la metaetiqueta robots del código HTML de una URL para prevenir la indexación de una página por parte de los motores de búsqueda como Google, Bing o Yahoo.
Google entiende la etiqueta noindex como una directiva. Por lo tanto, si la encuentra no mostrará dicha página a los usuarios en sus páginas de resultados.
La contrapartida de noindex es «index», que permite explícitamente la indexación aunque no es necesario su uso dado que los buscadores interpretan la ausencia de etiqueta como una luz verde para indexar el contenido.
La etiqueta noindex te permite decidir si una URL concreta debe incluirse en el índice de los motores de búsqueda o no.
Por lo tanto,
Noindex es un gran recurso que nos permite controlar la indexación de cada página individual con muy poco esfuerzo.
Por eso mismo, esta directiva es uno de los instrumentos de optimización favoritos de todos los SEOs.
Hay dos maneras de implementar la etiqueta noindex: mediante una etiqueta meta en el código HTML de la página o mediante un encabezado de respuesta HTTP.
Ambas opciones tienen el mismo resultado, así que elige la que mejor se ajuste a tu sitio web y al tipo de contenido que tienes.
Para evitar que la mayoría de los motores de búsqueda indexen una página de tu sitio, puedes incluir la siguiente etiqueta meta en la sección <head> de la página:
A continuación, te mostramos un ejemplo de la sintaxis de la etiqueta noindex:
Además, también podemos prevenir la indexación de una página para un bot específico.
Aquí te mostramos varios ejemplos:
En lugar de utilizar una etiqueta meta, también puedes incluir un encabezado X-Robots-Tag en la respuesta HTTP de tu página con los valores noindex o none. Este encabezado de respuesta es útil para recursos que no son HTML, como archivos PDF, imágenes y vídeos.
A continuación, se proporciona un ejemplo de cómo se vería una respuesta HTTP con un encabezado X-Robots-Tag
HTTP/1.1 200 OK Content-Type: text/html X-Robots-Tag: noindex Página no indexable Esta página no debería ser indexada por los motores de búsqueda.
La recomendación general a la hora de aplicar esta directiva es muy sencilla:
Esto puede resultar muy subjetivo por eso aquí te listamos algunos ejemplos de contenido o paginas que no deberias indexar:
Esto le indicará a los motores de búsqueda que no deben indexar la página. También puedes utilizar la etiqueta canonical para señalar a los motores de búsqueda cuál es la versión principal de una página con contenido duplicado.
Según la tipología de web o de página que gestiones deberás aplicar un criterio u otro, pero siempre, para salir de dudas, pregúntate si la página en cuestión tiene valor para el usuario.
Es muy importante recalcar que la etiqueta noindex de una página no impide a los crawlers de un motor de búsqueda rastrear por completo dicha URL.
Lo único que evita es mostrarla a los usuarios en sus resultados de búsqueda.
Por lo tanto,
Si lo que buscamos es impedir que una página en cuestión no sea rastreada ni indexada por un motor de búsqueda debemos acudir al uso de robots.txt.
En concreto, a la directiva “Disallow”
De esta forma prevenimos el rastreo de la página y su posterior indexación (aunque no siempre se consigue).
En cualquier caso, si queremos asegurarnos de que se cumplen ambas directivas, se puede combinar un disallow con un noindex en el robots.txt añadiendo ambas directivas al archivo robots.txt:
Disallow: /ejemplo-página-1/
Noindex: /ejemplo-página-1/
ATENCIÓN: Noindex (página) + Disallow: no puede combinarse con noindex en la página, porque la página está bloqueada y por lo tanto los motores de búsqueda no la rastrearán para saber que no deben dejar la página fuera del índice.
La metaetiqueta “noindex” es un recurso súper útil para controlar el contenido duplicado, similares o el thin content. Es decir todo el contenido de escaso valor para el usuario y que por tanto nos puede crear problemas de posicionamiento.
El uso correcto de esta directiva, junto a otras metaetiquetas nofollow, follow y el robots.txt, es vital para optimizar la indexación y rastreabilidad de nuestro sitio web. Saber cómo y cuándo emplear esta etiqueta noindex es esencial para facilitar el trabajo de los motores de búsqueda.
Importante: Google siempre se adhiere a una directiva noindex, mientras que la etiqueta index sólo se considera una recomendación.
Enlaces y lecturas recomendadas:
La meta robots noindex de una página web es una de los atributos imprescindibles para controlar el aparecer en los resultados de búsqueda de los buscadores. Si quieres aprender cómo utilizarla en tu sitio web, evitar errores y facilitar el trabajo a Google, es necesario dominar a fondo este concepto.
Una etiqueta ‘noindex’ indica a los motores de búsqueda que no incluyan la página en los resultados de búsqueda. El método más común para no indexar una página es añadir una etiqueta en la sección del encabezado del HTML, o en las cabeceras de respuesta HTTP. Para que los motores de búsqueda puedan ver esta información, la página no debe estar ya bloqueada (disallow) en un robots.txt