Cómo un SEO solucionó un problema extraño rastreado que actualmente no está indexado


Un técnico SEO publicó un caso de estudio de cómo resolvió un curioso Rastreado actualmente no indexado problema en su sitio. Si bien la solución que encontró puede no ser universal para otras personas que experimentan este problema, su método para identificar el problema y resolverlo presenta un tutorial útil para dar con problemas técnicos de SEO.

Lo que sucedió con la indexación de su sitio fue realmente extraño. Pero su solución fue sencilla y tiene sentido.

Descubrí una descripción de este problema en un tweet de Adam Gent (@Adoubleagent)

Anuncio publicitario

Continuar leyendo a continuación

Rastreado: actualmente no indexado

Hay muchos informes anecdóticos de rastreados actualmente no indexados en Facebook, Twitter e incluso en los lugares de reunión de John Mueller en horario de oficina.

En un hangout reciente en horas de oficina, alguien preguntó por qué Google Search Console (GSC) mostraba Crawled Not Indexed, pero cuando haces clic, resulta que están indexados. John Mueller respondió que es solo un desfase entre los informes.

Y en otro lugar de reunión en horario de oficina John Mueller señaló que es completamente normal que un sitio no tenga muchas páginas indexadas.

El lo notó:

«… si tiene un sitio más pequeño y observa que una parte importante de sus páginas no se indexa, entonces daría un paso atrás y trataría de reconsiderar la calidad general del sitio web y no centrarme tanto en los problemas técnicos de esas páginas.

La otra cosa a tener en cuenta con respecto a la indexación es que es completamente normal que no indexemos todo fuera del sitio web.

Y con el tiempo, cuando le dan me gusta a 200 páginas en su sitio web e indexamos 180 de ellas, ese porcentaje se reduce un poco «.

Anuncio publicitario

Continuar leyendo a continuación

Si bien ambas son buenas razones para explicar por qué el problema Crawled Not Indexed les está sucediendo a algunas personas, esa no es la razón por la que Adam Gent lo descubrió.

Adam Gent descubrió un problema completamente diferente que parecía ser un problema de algoritmo en la propia Google. No había nada de malo en el sitio en sí, el problema estaba en la indexación de Google.

Por qué se rastreó: actualmente no indexado

Adam revisó el informe de cobertura del índice GSC y descubrió que Google rastreaba e indexaba sus feeds como si fueran páginas HTML.

Tomó palabras al suerte de esas páginas e hizo un sitio: buscó con esas palabras y descubrió que el contenido de la página de alimentación estaba indexado.

Para empeorar las cosas, aparentemente Google había canonizado el contenido de la fuente RSS sobre la página web real, explicando por qué las páginas web reales fueron rastreadas pero no indexadas.

La fuente RSS fue generada por WordPress

Algo extraño de este caso es que cuando miras la página de la fuente, se muestra como una página web y no como se muestra normalmente un archivo XML.

Captura de pantalla de la caché de la fuente RSS

Captura de pantalla de una página RSS almacenada en caché

Puede que me equivoque, pero eso no parece un canal RSS normal. Parece una página HTML.

Anuncio publicitario

Continuar leyendo a continuación

Aunque el código subyacente en realidad es XML, no es así como se ven normalmente la mayoría de los feeds.

¿Podría eso haber influido en la razón por la que Google eligió canonicalizar el feed?

Es arduo entender cómo podría suceder eso porque hay tantas señales como enlaces internos que, en circunstancias habituales, harían que Google favoreciera las páginas HTML como canónicas.

Cómo Adam solucionó el problema

Después de que Adam descubrió lo que sucedió, eliminó esas páginas de feeds generadas por WordPress, envió las URL de feeds para un rastreo y luego 404 las páginas.

Después de que esas páginas se eliminaron del índice, envió las URL correctas a Google y, en unos días, se solucionó el problema.

Anuncio publicitario

Continuar leyendo a continuación

¿Qué causó el problema?

Adam escribió que el problema parece estar del lado de Google.

Pregunté y alguien me dijo que aparentemente hace unos años Google comenzó a indexar feeds, pero que pensaba que este problema se había solucionado.

No soy un experto en XML, pero parece inusual que el feed se parezca a una página HTML en lugar del diseño XML normal que aparece sin estilo HTML.

El feed no parece normal, por lo que parece que lo que sea que lo haga parecer podría ser una causa subyacente.

Independientemente, si tiene problemas de rastreo actualmente no indexado, esto es una cosa más que debe verificar en caso de que también le esté sucediendo a usted.

Anuncio publicitario

Continuar leyendo a continuación

Citación

Lea la publicación original que explica cómo dar con el problema:

Un curioso caso de canonicalización





Consultar el artículo en la publicación original

Cómo un SEO solucionó un problema extraño rastreado que actualmente no está indexado