Noindex

Qué es, importancia y ejemplos

Qué es noindex en una Página Web

Noindex es un valor que se utiliza en la metaetiqueta robots del código HTML de una URL para prevenir la indexación de una página por parte de los motores de búsqueda como Google, Bing o Yahoo.

Google entiende la etiqueta noindex como una directiva. Por lo tanto, si la encuentra no mostrará dicha página a los usuarios en sus páginas de resultados.

La contrapartida de noindex es «index», que permite explícitamente la indexación aunque no es necesario su uso dado que los buscadores interpretan la ausencia de etiqueta como una luz verde para indexar el contenido.

Por qué es importante 

La etiqueta noindex te permite decidir si una URL concreta debe incluirse en el índice de los motores de búsqueda o no. 

Por lo tanto,

Noindex es un gran recurso que nos permite controlar la indexación de cada página individual con muy poco esfuerzo. 

Por eso mismo, esta directiva es uno de los instrumentos de optimización favoritos de todos los SEOs.

Ejemplo de Etiqueta Noindex y Sintaxis

A continuación, te mostramos un ejemplo de la sintaxis de la etiqueta noindex:

  • <meta name=»robots» content=»noindex»>

Otra variación de esta es la directiva noindex nofollow:

  • <meta name=»robots» content=»noindex,nofollow»>

Además, también podemos prevenir la indexación de una página para un bot específico. Aquí te mostramos varios ejemplos:

  • <meta name=»googlebot» content=»noindex» />
  • <meta name=»googlebot-news» content=»noindex» />
  • <meta name=»bingbot» content=»noindex» />

Cuándo Utilizar la Etiqueta meta noindex

La recomendación general a la hora de aplicar esta directiva es muy sencilla:

  • Emplear la etiqueta meta robots noindex para el contenido de escaso valor para el usuario.

Esto puede resultar muy subjetivo por eso aquí te listamos algunos ejemplos de contenido o paginas que no deberias indexar:

  • Páginas de autor
  • Resultados de búsqueda interna
  • Páginas de acceso restringido
  • Algunos tipos de entradas (personalizadas) generadas por plugins
  • Determinadas páginas de categorías o etiquetas

Según la tipología de web o de página que gestiones deberás aplicar un criterio u otro, pero siempre, para salir de dudas, pregúntate si la página en cuestión tiene valor para el usuario.

Noindex vs Disallow

Es muy importante recalcar que la etiqueta noindex de una página no impide a los crawlers de un motor de búsqueda rastrear por completo dicha URL.

Lo único que evita es mostrarla a los usuarios en sus resultados de búsqueda.

Por lo tanto,

Si lo que buscamos es impedir que una página en cuestión no sea rastreada ni indexada por un motor de búsqueda debemos acudir al uso de robots.txt.

En concreto, a la directiva “Disallow”

De esta forma prevenimos el rastreo de la página y su posterior indexación (aunque no siempre se consigue).

En cualquier caso, si queremos asegurarnos de que se cumplen ambas directivas, se puede combinar un disallow con un noindex en el robots.txt añadiendo ambas directivas al archivo robots.txt:

Disallow: /ejemplo-página-1/

Noindex: /ejemplo-página-1/

ATENCIÓN: Noindex (página) + Disallow: no puede combinarse con noindex en la página, porque la página está bloqueada y por lo tanto los motores de búsqueda no la rastrearán para saber que no deben dejar la página fuera del índice.

En conclusión:

La metaetiqueta “noindex” es un recurso súper útil para controlar el contenido duplicado, similares o el thin content. Es decir todo el contenido de escaso valor para el usuario y que por tanto nos puede crear problemas de posicionamiento.

El uso correcto de esta directiva, junto a otras metaetiquetas nofollow, follow y el robots.txt,  es vital para optimizar la indexación y rastreabilidad de nuestro sitio web. Saber cómo y cuándo emplear esta etiqueta noindex es esencial para facilitar el trabajo de los motores de búsqueda. 

Importante: Google siempre se adhiere a una directiva noindex, mientras que la etiqueta index sólo se considera una recomendación.

Enlaces y lecturas recomendadas:

Preguntas Frecuentes

La meta robots noindex de una página web es una de los atributos imprescindibles para controlar el aparecer en los resultados de búsqueda de los buscadores. Si quieres aprender cómo utilizarla en tu sitio web, evitar errores y facilitar el trabajo a Google, es necesario dominar a fondo este concepto.

Una etiqueta ‘noindex’ indica a los motores de búsqueda que no incluyan la página en los resultados de búsqueda. El método más común para no indexar una página es añadir una etiqueta en la sección del encabezado del HTML, o en las cabeceras de respuesta HTTP. Para que los motores de búsqueda puedan ver esta información, la página no debe estar ya bloqueada (disallow) en un robots.txt