Generación de contenido automatizada para SEO: Posibilidades y trampas de GPT-3


Desde la llegada de GPT-3, los generadores de contenido han multiplicado los casos de uso de SEO. Parece oportuno realizar una actualización bimensual para revisar los nuevos avances en el campo de los modelos lingüísticos.

En primer lugar, a fines de 2021, el club de modelos lingüísticos muy grande creció significativamente.

Cada país ha intentado mostrar sus tecnologías y hacerlas accesibles a través de trabajos de investigación y demostraciones públicas o privadas.

Aquí están los principales competidores en la carrera:

  • EE.UU .: OpenAI – Turing NLG.
  • China: Wu Dao 2.0 – PanGu-Alpha.
  • Corea del Sur: HyperCLOVA.
  • Israel: A121 (Jurásico-1).
  • Europa: Aleph Alpha.
  • Código abierto: EleutherAI.

Cada modelo tiene sus puntos fuertes y débiles.

Para probarlos, muchos editores de software de SEO o agencias de SEO están probando estos modelos.

¿Cómo elegir un modelo GPT-3?

Puede pensar que cuantos más parámetros tenga el modelo, mejor será (Nota del editor: un parámetro corresponde a un concepto aprendido por la IA).

Anuncio publicitario

Continuar leyendo a continuación

Pero estarías equivocado.

El criterio número uno no es en total el número de parámetros, porque se pueden obtener grandes resultados con modelos más ligeros.

Más bien, son los datos sobre los que se entrenó el modelo.

De hecho, para ser eficaz, un modelo debe poder comprender una gran cantidad de dominios dispares.

Lo primero que debe hacer es averiguar cómo se entrenó el modelo. Para GPT-3, el siguiente diagrama ayuda:

Diagrama GPT-3.Captura de pantalla de GPT-3, octubre de 2021

Podemos ver que GPT-3 se entrenó principalmente con datos de:

Anuncio publicitario

Continuar leyendo a continuación

  • Archivo web entre 2016 y 2019.
  • WebText, que corresponde a la recuperación de datos en la web.
  • Wikipedia.
  • Libros en inglés (Books1)
  • Libros en otros idiomas (Books2).

Ahora, si miramos cómo se entrenan los modelos de código abierto, vemos que las fuentes son bastante diferentes.

Fuentes basadas en el proyecto The Pile.Captura de pantalla de Gpt-3, octubre de 2021

Todo se basa en el proyecto The Pile, que es un conjunto de datos de 825 GB de textos en inglés diversificados que son gratuitos y accesibles al público.

Con The Pile, encontramos datos muy variados como libros, repositorios de GitHub, páginas web, revistas de discusión, artículos de medicina, física, matemáticas, informática y filosofía.

En general, será importante probar el modelo de lenguaje en su idioma y especialmente en el vocabulario específico de su sitio web.

Antes de analizar casos de uso específicos de SEO, veamos las trampas.

Escollos de la generación de contenido GPT-3 para SEO

Para generar textos cualitativos que interesen a sus usuarios, es importante conocer los escollos a evitar.

En primer lugar, sea cual sea el modelo que elijas, debes proporcionarle ejemplos de calidad como entrada para que pueda imitarlos y, sobre todo, respetar un tipo de texto concreto.

Si le pide a un modelo de lenguaje que genere contenido sobre «Plomeros de Nueva York», el modelo se dirigirá por varios caminos, a menudo inadecuados:

  • ¿Debería crear un directorio inventado?
  • ¿Debería crear contenido sobre un plomero de Nueva York?
  • ¿Debería crear un diálogo entre fontaneros en París?
  • ¿Quizás un poema sobre fontanería en Nueva York?

En resumen, el modelo se perderá.

En segundo lugar, los modelos de lenguaje no manejan contenido duplicado en total.

Anuncio publicitario

Continuar leyendo a continuación

Por lo tanto, sea cual sea el texto que genere, tendrá que utilizar una herramienta de terceros para comprobar que el modelo no ha duplicado algo que ha aprendido y, más concretamente, que el texto no existe ya y que es único.

Hay muchas herramientas disponibles para confirmar si su contenido es único. Si no es así, simplemente regenere el contenido.

Además, las plantillas de generación de contenido no optimizan el texto para la búsqueda en total.

Nuevamente, están capacitados en una amplia variedad de fuentes, por lo que tendrás que guiarlos con todas las herramientas semánticas que existen en el mercado.

También puede pedirles que enfaticen palabras clavey para explicar sus conceptos con más detalle.

Finalmente, el modelo puede inventar datos. De hecho, los modelos tienen un entorno de creatividad.

Si el modelo está configurado para permitir una alta creatividad, a veces puede inventar características para un objeto, por ejemplo, que pueden generar inconsistencias en sus textos.

Casos de uso de generación de contenido para SEO

Durante los últimos ocho meses, he estado probando muchos casos de uso de generación de contenido diferentes.

Anuncio publicitario

Continuar leyendo a continuación

Con plantillas gratuitas como GPT-Neo y GPT-J, hemos tenido muy buenos resultados en los siguientes casos de uso:

  • Extracción de conceptos (extracción de lugares, personas, etc.).
  • Extracción de preguntas de un texto.
  • Respuestas a preguntas basadas en un texto.
  • Generación de textos breves en inglés únicamente con el fin de crear títulos o meta descripciones.

Por otro lado, con un modelo pago como GPT-3 con precios accesibles, no solo hemos logrado generar textos largos y específicos sino también crear sofisticados resúmenes textuales.

Resúmenes textuales sofisticados en OpenAI.Captura de pantalla de GPT-3, octubre de 2021

La imagen no es fácil de leer pero muestra los ejemplos de entrada que se dan en negrita, luego el texto generado por el modelo que está en cursiva.

Anuncio publicitario

Continuar leyendo a continuación

Aquí, el objetivo es crear un texto de incentivo para que la gente quiera comprar un producto.

GPT-3 comprende perfectamente el tono y la longitud requeridos del texto e incluye las palabras que se utilizarán. ¡El texto se genera en menos de 10 segundos!

Aquí está el texto generado:

Ríndete a tus sueños de la infancia. ¿Aún recuerdas tu primer videojuego? Gracias al progreso tecnológico, puedes volver a vivirlos. ¡Puedes jugar con otro jugador en la carretera a través de las consolas Nintendo DS, PlayStation o Xbox!

Con Nintendo Switch, prueba juegos divertidos como Mario Kart 8 Deluxe: enfréntate a tus rivales y disfruta de aventuras mágicas con Mario, Zelda y otros personajes. Disfrute de una increíble variedad de juegos AAA; ya sea que prefieras juegos de lucha, juegos de aventuras o juegos multijugador, ¡PS4 ofrece membresías de PS Plus para satisfacer tus necesidades!

Xbox también ofrece entrada ilimitado a aplicaciones de entretenimiento como Netflix y Youtube por poco dinero. Ya sea que elija PS4, xbox o el nuevo Nintendo Switch, será fácil conectarse con familiares o amigos a través de aplicaciones como Skype para pasar un buen rato con sus amigos.

Anuncio publicitario

Continuar leyendo a continuación

¡Asegúrate de no perder esta oportunidad!

Por supuesto, todavía se requiere la corrección de pruebas para mejorar el texto, pero esta tecnología ahorra mucho tiempo y permite a los humanos enfocarse en problemas de alto valor agregado.

Pasemos a dos revoluciones en la generación de contenido.

Dos revoluciones para SEO

Antes, GPT-3 podría no haber podido generar contenido específico porque no estaba capacitado para hacerlo, como vimos anteriormente.

Ahora tiene la posibilidad de volver a entrenar el modelo.

Simplemente proporcione entre 20 y 100 ejemplos con sus instrucciones como entrada y la finalización espiritual que desea que produzca como salida:

{"prompt":"CTA:nnsubject: smartphonenn words: smartphone, Samsung, mobile phones, Xiaomi, Samsung, Apple, Huawei, Sony, iPhone, intelligent mobile phones, Androidnn ","completion":"Looking for a new smartphone? You've shortlisted a Samsung Galaxy or a Huawei model, but you haven't made a decision yet? Choose a smartphone in our product range and enjoy the best of the new mobile phones at an unbeatable price! You're guaranteed to find a smartphone at the best price, so don't miss out! It's never easy to find the best option among a multitude of smartphones: Xiaomi, Samsung, Apple, Huawei, Sony, or even Honor. Smartphones - intelligent mobile phones - aren't just synonymous with Apple's iPhone, but include many models. Smartphones using the Android operating system are the most common."}

La operación lleva mucho tiempo, pero luego tiene una plantilla optimizada que se adapta a su caso de uso, especialmente si necesita usar un vocabulario específico para un nicho, industria o tema en particular al optimizar su SEO.

Esto toma solo dos líneas de código Python. La parte que lleva más tiempo es, por supuesto, la creación de este archivo de ejemplo.

Archivo de ejemplo en OpenAI.Captura de pantalla de GPT-3, octubre de 2021

Finalmente, pasemos al último tema que me entusiasmó particularmente este mes: ¡la generación de código!

Anuncio publicitario

Continuar leyendo a continuación

De hecho, se ha lanzado una nueva tecnología donde damos instrucciones y el nuevo motor OpenAI Codex es capaz de generar código Python para solucionar nuestros problemas.

Comencemos señalando que estos son problemas simples: no puede reemplazar a los desarrolladores porque tendríamos que proporcionarle a la IA todo el código configurado, así como todas las limitaciones técnicas.

Por otro lado, desde un punto de vista pedagógico y especialmente en un enfoque sin código, es genial poder pedirle que se conecte a una fuente de datos (Mysql, Excel, CSV, API, etc.) y genere el vistas correctas en unos segundos.

Obteniendo el archivo de registro de la NASA para un día.Captura de pantalla de GPT-3, octubre de 2021

Aquí hay un mini-ejemplo en el que busco el archivo de registro de la NASA para el día 1 de agosto de 1995 y solicito un gráfico de barras con el número total de URL visitadas en la hora.

Anuncio publicitario

Continuar leyendo a continuación

Luego, con un editor de texto simple, puede ver el resultado copiando y pegando el código.

Para llevar el concepto sin código aún más lejos, estoy preparando una aplicación web en la que todo será impulsado por texto.

El único límite en el uso de modelos de lenguaje en SEO es tu imaginación. Ciertamente, puede crear un panel de SEO completo de esta manera desglosando cada una de las vistas que desee, camino a camino.

Los modelos de lenguaje todavía tienen muchas sorpresas en la tienda y hay muchos usos nuevos para el marketing.

Más recursos:


Imagen destacada: Vector Juice / Shutterstock





Consultar el artículo en la publicación original

Generación de contenido automatizada para SEO: Posibilidades y trampas de GPT-3