Googlebot rastrea e indexa los primeros 15 MB de contenido HTML


En una actualización del documento de ayuda de Googlebot, Google anunció discretamente que rastreará los primeros 15 MB de una página web. Cualquier cosa después de este límite no se incluirá en los cálculos de clasificación.

Google especifica en el documento de ayuda:

“Todos los recursos a los que se hace referencia en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado. Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB del archivo para la indexación. El límite de tamaño de archivo se aplica a los datos sin comprimir”.

esta izquierda algunos en la comunidad SEO se preguntan si esto significara que Googlebot ignoraría por completo el texto que se encontraba debajo de las imágenes en el corte de los archivos HTML.

“Es específico del archivo HTML en sí, tal como está escrito”, aclaró John Mueller, defensor de la búsqueda de Google, a través de Twitter. «Los recursos/contenidos incrustados extraídos con etiquetas IMG no forman parte del archivo HTML».

Lo que esto significa para el SEO

Para asegurarse de que Googlebot lo pondere, el contenido importante ahora debe incluirse cerca de la parte superior de las páginas web. Esto significa que el código debe estar estructurado de manera que coloque la información relevante para SEO con los primeros 15 MB en un archivo HTML o basado en texto compatible.

También significa que las imágenes y los videos deben comprimirse y no codificarse sin rodeos en HTML, siempre que sea posible.

Las mejores prácticas de SEO actualmente recomiendan mantener las páginas HTML a 100 KB o menos, muchos sitios no se verán afectados por este cambio. El tamaño de la página se puede verificar con una variedad de herramientas, incluido Google Page Speed ​​Insights.

En teoría, puede sonar preocupante que potencialmente podría tener contenido en una página que no se utiliza para la indexación. Sin embargo, en la práctica, 15 MB es una cantidad considerablemente grande de HTML.

Como dice Google, los recursos como imágenes y videos se obtienen por separado. Según la redacción de Google, parece que este límite de 15 MB se aplica solo a HTML.

Sería complicado superar ese límite con HTML a menos que estuviera publicando el texto de un libro completo en una sola página.

Si tiene páginas que superan los 15 MB de HTML, es probable que tenga problemas subyacentes que deben solucionarse de todos modos.


Fuente: Centro de búsqueda de Google
Imagen destacada: SNEHIT PHOTO/Shutterstock





Consultar el artículo en la publicación original

Googlebot rastrea e indexa los primeros 15 MB de contenido HTML
Salir de la versión móvil