Qué puede hacer la ciencia de datos por las arquitecturas de sitios


La última década ha marcado el cambio del SEO de las mejores prácticas anecdóticas basadas en hojas de cálculo a un enfoque más basado en datos, como lo demuestra el mayor número de profesionales de SEO que aprenden Python.

A medida que aumenta el número de actualizaciones de Google (11 en 2023), los profesionales de SEO reconocen la necesidad de adoptar un enfoque de SEO más basado en datos y estructuras de enlaces internos para arquitecturas del sitio no son una excepción.

en un Artículo anteriordescribí cómo los enlaces internos podrían basarse más en datos, proporcionando código Python sobre cómo evaluar estadísticamente la arquitectura del sitio.

Más allá de Python, la ciencia de datos puede ayudar a los profesionales de SEO a descifrar de manera más efectiva patrones ocultos e información clave para ayudar a señalar a los motores de búsqueda la prioridad del contenido dentro de un sitio web.

La ciencia de datos es la intersección de la codificación, las matemáticas y el conocimiento del dominio, donde el dominio, en nuestro caso, es SEO.

Entonces, si bien las matemáticas y la codificación (invariablemente en Python) son importantes, el SEO no pierde importancia, ya que hacer las preguntas correctas sobre los datos y tener la sensación instintiva de si los números «se ven bien» son increíblemente importantes.

Alinear la arquitectura del sitio para admitir contenido vinculado

Muchos sitios están construidos como un árbol de Navidad, con la página de inicio en la parte superior (siendo la más importante) y otras páginas en orden descendente de importancia en los niveles posteriores.

Los científicos de SEO entre ustedes querrán saber cuál es la distribución de enlaces desde diferentes puntos de vista. Esto se puede visualizar usando el código Python del artículo anterior de varias maneras, incluyendo:

  • Profundidad del sitio.
  • Tipo de contenido.
  • Clasificación de página interna.
  • Valor de conversión/ingresos.
Enlaces internos a URLImagen del autor, diciembre de 2023.

El diagrama de caja muestra efectivamente cuántos enlaces son «normales» para un sitio web determinado en diferentes niveles del sitio. Los cuadros azules representan el rango intercuartil (es decir, los cuantiles 25 y 75), que es donde se encuentra la mayor parte (67% para ser precisos) del número de enlaces internos entrantes.

Piensa en la curva de campana, pero en lugar de verla desde un lado (como lo harías con una desnivel), la estás viendo como un pájaro volando sobre ti.

Por ejemplo, el gráfico muestra que para las páginas que están dos niveles por debajo de la página de inicio, el cuadro azul indica que el 67% de las URL tienen entre cinco y nueve enlaces internos entrantes. También podemos ver que esto es considerablemente (y tal vez como era de esperar) mucho más bajo que las páginas que están a un salto de la página de inicio.

La línea gruesa que corta el cuadro azul es la mediana (cuantil 50), que representa el valor medio. Siguiendo con el ejemplo anterior, la mediana de enlaces internos entrantes es 7 para las páginas del nivel 2 del sitio, lo que es aproximadamente 5000 veces menos que los del nivel 1 del sitio.

Como nota al margen, es posible que observe que la línea mediana no es visible en todos los cuadros azules, debido a que los datos están sesgados (es decir, no están distribuidos normalmente como una curva en forma de campana).

¿Es esto bueno? ¿Es esto malo? ¿Deberían preocuparse los profesionales de SEO?

Un científico de datos sin conocimientos de SEO podría decidir que sería mejor restablecer el equilibrio calculando la distribución de enlaces internos a páginas por nivel de sitio.

A partir de ahí, cualquier página que esté, digamos, por debajo de la mediana o del percentil 20 (cuantil en ciencia de datos) para su nivel de sitio determinado, un científico de datos podría concluir que estas páginas requieren más enlaces internos.

Como tal, esto a menudo significa que las páginas que comparten el mismo número de saltos desde la página de inicio (es decir, el mismo nivel de profundidad del sitio) tienen la misma importancia.

Sin embargo, desde la perspectiva del valor de búsqueda, es poco probable que esto sea cierto, especialmente si se considera que algunas páginas en el mismo nivel simplemente tienen más demanda de búsqueda que otras.

Por lo tanto, la arquitectura del sitio debe priorizar aquellas páginas con más demanda de búsqueda que aquellas con menos demanda, independientemente de su lugar predeterminado en la jerarquía, ¡cualquiera que sea su nivel!

Revisión del verdadero rango de página interno (TIPR)

Ranking de página interno verdadero (TIPR), popularizado por Kevin Indig, ha adoptado un enfoque bastante más prudente al articular el PageRank externo, es decir, el obtenido a partir de vínculos de retroceso. En términos matemáticos simples:

TIPR = Clasificación de página interna x Autoridad de vínculos de retroceso a nivel de página

Aunque lo anterior es la versión no científica de su métrica, es una forma mucho más útil y empírica de modelar cuál es el valor normal de una página dentro de la arquitectura de un sitio web. Si desea que el código calcule esto, consulte aquí.

Además, en lugar de aplicar esta métrica a niveles de sitio, es mucho más instructivo aplicarla por tipo de contenido. Para un cliente de comercio electrónico, vemos la distribución de TIPR por tipo de contenido a continuación:

Imagen del autor, diciembre de 2023.

La trama en el caso de esta tienda en línea es que el TIPR medio para el contenido de categorías o páginas de listado de productos (PLP) es de aproximadamente dos puntos TIPR.

Es cierto que TIPR es un poco impreciso, pero ¿cómo se traduce eso en la cantidad de enlaces internos necesarios? No es así, al menos no sin rodeos.

A pesar de la conceptualización, esta sigue siendo una construcción más eficaz para dar forma a la arquitectura del sitio.

Si quisiera ver qué categorías tenían un rendimiento inferior en cuanto a su potencial de posición en el ranking, simplemente vería que las URL de PLP estaban por debajo del cuantil 25 y tal vez buscaría enlaces internos de páginas con un valor TIPR más alto.

¿Cuántos enlaces y qué TIPR? Con algo de modelado, esa es una respuesta para otra publicación.

Presentamos el Page Rank interno de ingresos (RIPR)

La otra pregunta importante que vale la pena responder es: ¿qué contenido merece posiciones más altas?

Kevin también abogó por un enfoque más inteligente para alinear las estructuras de enlaces internos con los valores de conversión, que muchos de ustedes, con suerte, ya están aplicando a sus clientes; Debo estar totalmente de acuerdo.

Una solución simple y no científica es tomar la relación entre los ingresos del comercio electrónico y el TIPR, es decir

DEPRE = Ingresos / TIPR

La métrica anterior nos ayuda a ver cómo se ven los ingresos normales por autoridad de página, como se visualiza a continuación:

Imagen del autor, diciembre de 2023.

Como podemos ver, el panorama cambia un poco; De repente, no vemos ningún cuadro (es decir, distribución) para el contenido del blog porque no se registran ingresos por ese contenido.

¿Aplicaciones prácticas? Si usamos esto como modelo por tipo de contenido, a cualquier página que esté por encima del cuantil 75 (es decir, al norte de su cuadro azul) para su respectivo tipo de contenido se le deberían agregar más enlaces internos.

¿Por qué? Porque tienen altos ingresos pero tienen muy baja autoridad de página, lo que significa que tienen un RIPR muy alto y, por lo tanto, deberían recibir más enlaces internos para acercarlo a la mediana.

Por el contrario, aquellos con menores ingresos pero demasiados enlaces internos importantes tendrán un RIPR más bajo y, por lo tanto, se les deberían quitar enlaces para permitir que los motores de búsqueda asignen más importancia al contenido con mayores ingresos.

Una advertencia

RIPR tiene algunas suposiciones incorporadas, como que el seguimiento de los ingresos analíticos se configure correctamente para que su modelo forme la base para recomendaciones efectivas de enlaces internos.

Por supuesto, al igual que en TIPR, se debe modelar el valor de un enlace interno en términos de cuánto RIPR vale un enlace interno desde una página determinada.

Eso es incluso antes de llegar a la ubicación de la ubicación del enlace interno.

Más recursos:


Imagen de portada: NicoElNino/Shutterstock



Consultar el artículo en la publicación original

Qué puede hacer la ciencia de datos por las arquitecturas de sitios
Salir de la versión móvil