Cómo se ve la indexación de Google desde el descubrimiento hasta la clasificación


La forma en que se representa un sitio web es parte de la cola de indexación y, al igual que las otras partes, tiene un impacto en el SEO y la clasificación. Martin Splitt de Google explicó en un seminario web organizado por Duda cómo la renderización afecta al SEO y cómo se ve el proceso de rastreo desde el descubrimiento inicial hasta la clasificación.

El seminario web comenzó con Bartosz Goralewicz relatando sus observaciones de que el renderizado y el diseño comenzaron a surgir como una tendencia en Google alrededor de 2011.

Su teoría personal es que jugó un papel en las actualizaciones de calidad.

Quizás más hoy que en el pasado, la representación y el diseño de la página juegan un papel importante debido al mayor interés en Core Web Vitals.

Se podría decir que gran parte de la comunidad de búsqueda es más consciente de aspectos como los aspectos técnicos del diseño y el renderizado que en el pasado.

La representación influye en la rapidez con la que se carga una página web y, en consecuencia, afecta las ventas y, en algunos casos, las clasificaciones.

¿El renderizado SEO ayuda a las clasificaciones?

Bartosz comenzó haciéndole a Martin Splitt una pregunta provocativa:

Anuncio publicitario

Continuar leyendo a continuación

«¿El renderizado SEO puede ayudarme a clasificar mejor?»

Martin se detuvo un momento para pensar y luego respondió:

“Por lo general, no respondo preguntas de clasificación. Haré una excepción aquí.

En general, no.

Pero hablando específicamente, si hay un problema en el que algo rompe su renderizado y el contenido no aparece, entonces si el contenido no aparece y Google no ve el contenido correctamente, entonces, eso podría lastimarlo en el sentido de, no vemos el contenido.

Por lo tanto, es posible que no indexemos la página o que indexemos la página, pero no clasifiquemos el contenido que le interesa.

Entonces sí, al final puede marcar la diferencia y puede tener un impacto. Sí, por supuesto.»

Dónde se adapta la renderización del rastreo a la indexación

Bartosz siguió con una pregunta sobre dónde encaja el renderizado en el proceso de rastreo e indexación.

Preguntó:

“¿Dónde se ubica el renderizado en todo el escenario? … Mi comprensión de eso siempre fue que Google crea una cola, luego rastrea, renderiza y, obviamente, opcional, indexa la página. ¿Sería una simplificación excesiva? «

Anuncio publicitario

Continuar leyendo a continuación

Martin respondió:

«Eso es un poco simplista, pero es fundamentalmente cierto».

El ancho de banda afecta el rastreo del sitio web

Esto es algo que tal vez no se discute lo suficiente y esa es la capacidad del servidor para manipular no solo a Google, sino a todos los demás bots y visitantes del sitio que ingresan al sitio web.

Google ajustará el rastreo si parece que el servidor no puede manejarlo.

Esto se denomina Límite de capacidad de rastreo. Lee mas: Por qué GoogleBot no rastrea suficientes páginas en algunos sitios

Martin Splitt discutió el tema del ancho de banda y cómo afecta el rastreo.

Martin continuó:

“Obtenemos muchas de sus URL y obtenemos tantas URL que no podemos rastrearlas todas al mismo tiempo por razones obvias.

No podemos rastrear todas las URL todo el tiempo al mismo tiempo por razones de ancho de banda. Por lo tanto, solo puede usar un ancho de banda de Internet limitado.

Si tiene una tienda en línea y se conecta mañana con el nuevo sitio web de la tienda en línea y tiene un millón de URL de productos, su servidor podría fallar si rastreamos todos estos millones de URL al mismo tiempo.

Así que tenemos que distribuir esto a lo largo del tiempo, por lo que hay una cola entre nosotros para descifrar una URL y la URL que realmente se está rastreando «.

Del rastreo al renderizado

A continuación, Martin explica los próximos pasos en el camino hacia la indexación de contenido.

Martín:

“Lo que sucede entonces es que una vez que hemos rastreado, ya podemos mirar en el HTML … podemos ver … en el estado de HTTP.

Si es un estado HTTP 404, entonces prácticamente el procesamiento termina aquí. Si hay una metaetiqueta de robots que dice no indexar, nuestro trabajo también termina aquí.

Pero si obtenemos un montón de contenido HTML y podemos seguir procesándolo en el resto de la canalización, también colocamos la página en cola para la ejecución de JavaScript, que es lo que llamaría «renderizado».

La segunda cola es muy opaca en el sentido de que realmente no ves cuánto tiempo nos lleva renderizar.

Entonces, como en la admisión, está la URL que descubrimos y la salida de eso es un documento indexado o un documento no indexado.

Eso es más o menos lo que puede suceder aquí «.

Anuncio publicitario

Continuar leyendo a continuación

Cómo se ve la cola de indexación

A continuación, Martin proporcionó un esquema simplificado de cómo se ve el rastreo y la indexación.

Martín:

«Por lo tanto, hay una cola adicional que omitió, y hay algunas complicaciones más en las que el modelo simplificado podría no aplicarse necesariamente, pero puede suponer que el flujo normalmente está descubriendo, rastreando, poniendo en cola, renderizando, indexando y luego potencialmente clasificación más tarde «.

Del descubrimiento al ranking

Martin Splitt proporcionó una descripción general útil de cómo Google pasa de descifrar una página web a clasificar esa página (potencialmente). Martin parece saber bastante sobre cómo funciona Google internamente, por lo que siempre es esclarecedor cuando comparte algo de lo que sabe.

Citación

Mire a Martin Splitt hablar sobre el renderizado y la cola de indexación en la marca del minuto 19:35:





Consultar el artículo en la publicación original

Cómo se ve la indexación de Google desde el descubrimiento hasta la clasificación