Corrección del informe de cobertura de Google Search Console ‘Páginas excluidas’


Google Search Console le permite ver su sitio web a través de los ojos de Google.

Obtiene información sobre el rendimiento de su sitio web y detalles sobre la experiencia de la página, problemas de seguridad, rastreo o indexación.

La parte Excluida del informe de cobertura de índice de Google Search Console proporciona información sobre el estado de indexación de las páginas de su sitio web.

Descubra por qué algunas de las páginas de su sitio web aparecen en el informe Excluido en Google Search Console y cómo solucionarlo.

¿Qué es el informe de cobertura del índice?

los Informe de cobertura de Google Search Console muestra información detallada sobre el estado del índice de las páginas web de su sitio web.

Sus páginas web pueden ingresar en uno de los siguientes cuatro cubos:

  • Error: Las páginas que Google no puede indexar. Debe revisar este informe porque Google cree que es posible que desee indexar estas páginas.
  • Válido con advertencias: las páginas que indexa Google, pero hay algunos problemas que debe dar con.
  • Válido: Las páginas que indexa Google.
  • Excluido: Las páginas que están excluidas del índice.

Informe de cobertura de Google Search Console

¿Qué son las páginas excluidas?

Google no indexa páginas en los depósitos Error y Excluidos.

La principal diferencia entre los dos es:

  • Google cree que las páginas con error deben indexarse, pero no puede debido a un error que debe revisar. Por ejemplo, las páginas no indexables enviadas a través de un mapa del sitio XML se clasifican como Error.
  • Google cree que las páginas en el grupo Excluido deberían ser excluidas, y esta es su intención. Por ejemplo, las páginas no indexables que no se envían a Google aparecerán en el informe Excluido.
    Páginas excluidas en GSCCaptura de pantalla de Google Search Console, mayo de 2022

Sin embargo, Google no siempre lo hace bien y las páginas que deberían indexarse ​​a veces van a Excluidas.

Afortunadamente, Consola de búsqueda de Google proporciona la razón para colocar páginas en un depósito específico.

Es por eso que es una buena práctica revisar cuidadosamente las páginas en los cuatro cubos.

Ahora profundicemos en el cubo Excluido.

Posibles motivos de las páginas excluidas

Hay 15 posibles razones por las que sus páginas web están en el grupo Excluido. Echemos un vistazo más de cerca a cada uno.

Excluido por la etiqueta «noindex»

Estas son las URL que tienen una etiqueta «noindex».

Google cree que en realidad desea excluir estas páginas de la indexación porque no las incluye en la mapa del sitio XML.

Estas pueden ser, por ejemplo, páginas de inicio de sesión, páginas de usuario o páginas de resultados de búsqueda.

Google Search Console Excluido por una etiqueta noindex

Acciones sugeridas:

  • Revisa estas URL para estar seguro de ti desea excluirlos del índice de Google.
  • Compruebe si una etiqueta «noindex» todavía está/realmente presente en esas URL.

Rastreado: actualmente no indexado

Google ha rastreado estas páginas y todavía no las ha indexado.

Como dice Google en su documentación, la URL en este depósito “puede o no ser indexada en el futuro; no es necesario volver a enviar esta URL para rastrearla”.

Muchos profesionales de SEO notaron que un sitio podría tener serios problemas de calidad si muchas páginas normales e indexables pasan a ser Rastreadas, actualmente no indexadas.

Esto podría significar que Google ha rastreado estas páginas y no cree que brinden suficiente valor para indexar.

Consola de búsqueda de Google rastreada actualmente no indexadaCaptura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • Revise su sitio web en términos de calidad y COMER.

Descubierto: actualmente no indexado

Como dice la documentación de Google, la página en Descubierto, actualmente no indexada, «fue encontrada por Google, pero aún no rastreada».

Google no rastreó la página para no sobrecargar el servidor. Una gran cantidad de páginas en este depósito puede significar que su sitio tiene presupuesto de rastreo problemas.

Google Search Console descubierto actualmente no indexadoCaptura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • Verifique la salud de su servidor.

No encontrado (404)

Estas son las páginas que devolvieron el código de estado 404 (No encontrado) cuando Google lo solicitó.

Estas no son URL enviadas a Google (es decir, en un mapa del sitio XML), pero en cambio, Google descubrió estas páginas (es decir, a través de otro sitio web que enlazaba con una página antigua eliminada hace mucho tiempo).

Páginas excluidas en GSC - 404Captura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • Revise estas páginas y decidir si implementar una redirección 301 a una página de trabajo.

suave 404

suave 404en la mayoría de los casos, es una página de error que devuelve el código de estado OK (200).

Alternativamente, también puede ser una página delgada que contiene poco o ningún contenido y usa palabras como «lo siento», «error», «no encontrado», etc.

Soft 404 en Google Search ConsoleCaptura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • En el caso de una página de error, asegúrese de devolver el código de estado 404.
  • Para páginas de poco contenido, agregar contenido único para ayudar a Google a reconocer esta URL como una página independiente.

Página con redirección

Todas las páginas redirigidas en su sitio web irán al depósito Excluido, donde puede ver todas las páginas redirigidas que Google detectó en su sitio web.

Página con redirección en Google Search ConsoleCaptura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • Revisa las páginas redirigidas para asegurarse de que los redireccionamientos se implementaron intencionalmente.
  • Algunos complementos de WordPress crean automáticamente redireccionamientos cuando cambia la URL, por lo que es posible que desee revisarlos de vez en cuando.

Duplicar sin canonical seleccionado por el usuario

Google cree que estas URL son duplicados de otras URL en su sitio web y, por lo tanto, no deben indexarse.

No configuró una etiqueta canónica para estas URL y Google seleccionó la canónica en función de otras señales.

Acciones sugeridas:

  • Inspeccione estas URL para verificar qué URL canónicas Google ha seleccionado para estas páginas.

Duplicado, Google eligió un canónico diferente al del usuario

Página excluida en GSCCaptura de pantalla de Google Search Console, mayo de 2022

En este caso, usted declaró un URL canónica para la página, pero aun así, Google seleccionó una URL diferente como la canónica. Como resultado, la canónica seleccionada por Google está indexada y la seleccionada por el usuario no.

Posibles acciones:

  • Inspeccione la URL para verificar qué canonical Google seleccionado.
  • Analiza las posibles señales que hicieron que Google eligiera un canónico diferente (es decir, enlaces externos).

URL enviada duplicada no seleccionada como canónica

La diferencia entre el estado anterior y este estado es que, en el caso de este último, envió una URL a Google para su indexación sin declarar su dirección canónica, y Google cree que una URL diferente sería una mejor canónica.

Como resultado, el canónico seleccionado por Google se indexa en lugar de la URL enviada.

Acciones sugeridas:

  • Inspeccione la URL para verificar qué canonical Google ha seleccionado.

Página alternativa con la etiqueta canónica adecuada

Estos son simplemente los duplicados de las páginas que Google reconoce como URL canónicas.

Estas páginas tienen las direcciones canónicas que apuntan a la URL canónica correcta.

Acciones sugeridas:

  • En la mayoría de los casos, no se requiere ninguna acción.

Bloqueado por robots.txt

Estas son las páginas que robots.txt han bloqueado.

Al analizar este cubo, tenga en cuenta que Google aún puede indexar estas páginas (y mostrarlas de una manera «deteriorada») si Google encuentra una referencia a ellas en, por ejemplo, otros sitios web.

Acciones sugeridas:

  • Verificar si estas páginas están bloqueadas usando el probador de robots.txt.
  • Agregue una etiqueta «noindex» y elimine las páginas de robots.txt si desea eliminarlos del índice.

Bloqueado por la herramienta de eliminación de página

Este informe enumera las páginas cuya eliminación ha sido solicitada por el Herramienta de eliminación.

Tenga en cuenta que esta herramienta elimina las páginas de los resultados de búsqueda solo temporalmente (90 días) y no las elimina del índice.

Acciones sugeridas:

  • Verifique si las páginas enviadas a través de la herramienta Eliminaciones debe eliminarse temporalmente o tener una etiqueta ‘noindex’.

Bloqueado debido a solicitud no autorizada (401)

En el caso de estas URL, Googlebot no pudo aceptar a las páginas debido a una solicitud de autorización (código de estado 401).

A menos que estas páginas estén disponibles sin autorización, no necesita hacer nada.

Google simplemente le informa sobre lo que encontró.

página 401 en GoogleCaptura de pantalla de Google Search Console, mayo de 2022

Acciones sugeridas:

  • Verificar si estas páginas realmente deberían requerir autorización.

Bloqueado debido a entrada prohibido (403)

Este código de estado suele ser el resultado de algún error del servidor.

403 se devuelve cuando las credenciales proporcionadas no son correctas y no se puede otorgar entrada a la página.

Como Documentación de Google estados:

“Googlebot nunca proporciona credenciales, por lo que su servidor devuelve este error de forma incorrecta. Este error debe corregirse o la página debe ser bloqueada por robots.txt o noindex”.

¿Qué puedes aprender de las páginas excluidas?

Los picos repentinos y enormes en un grupo específico de páginas excluidas pueden indicar problemas graves en el sitio.

Aquí hay tres ejemplos de picos que pueden indicar problemas graves con su sitio web:

  • Un gran aumento en las páginas No encontradas (404) puede indicar que no se ha realizado correctamente. migración donde se han cambiado las URL, pero no se han implementado redireccionamientos a nuevas direcciones. Esto también puede suceder después de, por ejemplo, que una persona sin experiencia cambie el slug de las publicaciones del blog y, como resultado, cambie las URL de todos los blogs.
  • Un gran pico en el Descubierto: actualmente no indexado o Rastreado – actualmente no indexado puede indicar que su sitio ha sido pirateado. Asegúrese de revisar las páginas de ejemplo para verificar si realmente son sus páginas o si fueron creadas como resultado de un hackeo (es decir, páginas con caracteres chinos).
  • Un gran aumento en la etiqueta Excluido por ‘noindex’ también puede indicar un lanzamiento y una migración fallidos. Esto sucede a menudo cuando un nuevo sitio entra en producción junto con etiquetas «noindex» del sitio de prueba.

el resumen

Puede aprender mucho sobre su sitio web y cómo Googlebot interactúa con él, gracias a la sección Excluidos del informe Cobertura de GSC.

Tanto si eres un nuevo SEO o ya tiene algunos años de experiencia, acostúmbrese a revisar Google Search Console como su hábito diario.

Esto puede ayudarte a detectar varios problemas técnicos de SEO antes de que se conviertan en verdaderos desastres.

Más recursos:


Imagen destacada: Milan1983/Shutterstock





Consultar el artículo en la publicación original

Corrección del informe de cobertura de Google Search Console ‘Páginas excluidas’
A %d blogueros les gusta esto: