¿Está bien Google con ajustes menores a las traducciones automáticas?

[ad_1]

El horario de oficina de SEO de octubre de Google respondió si estaba bien usar contenido traducido automáticamente que haya sido revisado por un humano y sujeto a cambios de edición menores.

Episodio de horas de oficina de SEO de Google

Este episodio del hangout en horario de oficina sigue un nuevo formato en el que se envían preguntas y se dan respuestas.

Los Googlers que responden a las preguntas son Lizzi Sassman y John Mueller.

Lizzi Sasman (@oklizzi) es un escritor técnico que «se preocupa» por la documentación de Google Site Central.

A diferencia del formato en vivo anterior, donde la audiencia hace preguntas en tiempo real, no hay oportunidad de hacer preguntas de seguimiento.

Esto da como resultado respuestas que se asemejan mucho a la documentación de Google, y nadie puede hacer las preguntas restantes.

La persona que hizo la pregunta estaba preocupada por su contenido que estaba traducido automáticamente de otro idioma.

Emplearon editores humanos para revisar el contenido que se consideró aceptable excepto por cambios menores.

Naturalmente, a la persona que hace la pregunta le preocupa si los «ajustes menores» son suficientes para que el contenido sea aceptable para Google.

Lizzi Sassman responde a la pregunta de una manera que se adhiere estrictamente a lo que establece la documentación de Google.

Podría decirse que la respuesta podría haberse aclarado con una pregunta de seguimiento para determinar si los «ajustes menores» son lo suficientemente buenos. Después de todo, la pregunta pregunta explícitamente si los ajustes menores son lo suficientemente buenos para Google.

Posiblemente, la respuesta implícita es usar su juicio sobre la calidad del contenido traducido.

Juzga por ti mismo.

¿Es aceptable el contenido traducido por máquina moderadamente editado?

Ellos preguntaron:

“Un sitio utiliza la traducción automática para ofrecer publicaciones en otros idiomas.

El contenido es revisado por traductores humanos y, a menudo, están contentos con la calidad después de los ajustes menores.

¿Está bien para Google?”

Lizzi Sassman de Google respondió:

“Bueno, es bueno escuchar que los traductores humanos están contentos y esto está totalmente bien para Google siempre que haya un ser humano involucrado en el proceso de revisión. Esa es la clave.

Lo que debes tener en cuenta es asegurarte de que la calidad siga siendo buena y funcione bien para las personas que leen el contenido”.

La respuesta no dice específicamente si las ediciones menores están bien, solo que si los «traductores humanos» son buenos con eso, entonces debería ser bueno para Google.

¿Podría ser que Google no verifica si el contenido está traducido automáticamente, sino que se basa en señales de calidad de contenido estándar?

no lo sabemos

El nuevo formato de Horas de oficina no brinda a la persona que hace la pregunta la oportunidad de hacer una pregunta de seguimiento.

Políticas de spam de Google

La documentación para desarrolladores de Google sobre contenido spam menciona herramientas de traducción automática de texto y dice explícitamente que es spam excepto cuando hay un elemento humano involucrado.

Esto es lo que Los estados de documentación de Google:

“Ejemplos de contenido spam generado automáticamente incluyen:

Texto traducido por una herramienta automatizada sin revisión o curación humana anticipadamente a publicar”

Por lo tanto, está claro a partir de las pautas publicadas de Google que, siempre que un ser humano edite el contenido traducido por máquina, Google estará de acuerdo con eso.

Además, en un video de Google Office-Hours de abril de 2022, John Mueller mencionó cómo el contenido generado por IA se considera spam y luego mencionó el contenido traducido automáticamente.

Mueller habló sobre las herramientas de generación de contenido de IA y las comparó con las herramientas de traducción automática.

En el marca de 24:55 minutos del video Office-Hours de abril de 2022, Mueller dijo:

“Creo, no sé, con el tiempo, tal vez esto es algo que evolucionará, en el sentido de que se convertirá más en una herramienta para las personas.

Es como si usara la traducción automática como base para crear una versión traducida de un sitio web.

Pero aún así… esencialmente trabajas a través de él manualmente.

¿Por qué debería un ser humano comprobar el contenido traducido automáticamente?

Como se mencionó anteriormente, la preocupación de Google es que el contenido al que se hace referencia desde las páginas de resultados del motor de búsqueda (SERP) sea de alta calidad y que los usuarios estén contentos con él.

Algo que no se discutió es que el contenido traducido contiene firmas que un algoritmo de detección de traducción puede identificar.

La detección de contenido traducido automáticamente es algo que se ha investigado durante muchos años.

Un trabajo de investigación de 2021 (Detección de texto traducido por máquina a través de similitud de texto con traducción de ida y vueltaDescargar PDF) afirma que el contenido que se traduce de un idioma a otro puede ser complejo de detectar para los humanos.

Por ejemplo, utilizando 100 textos traducidos, los evaluadores humanos solo pudieron identificar un poco más de la mitad de los textos traducidos.

Los investigadores señalaron:

“La precisión promedio fue del 53,3 % (55,0 % para los hablantes nativos y 52,0 % para los hablantes no nativos), lo cual fue casi aleatorio”.

El enfoque, llamado Similitud de texto con traducción de ida y vuelta (TSRT), superó a los evaluadores humanos y obtuvo una puntuación más alta que los detectores de traducción de última generación cuando se publicó el artículo en 2021.

Sorprendentemente, esta técnica puede detectar el idioma original de los textos traducidos.

También es capaz de determinar qué algoritmo de traducción realizó la traducción.

Ellos informaron:

“Los resultados de la evaluación muestran que la TSRT supera a otros métodos, con una precisión de hasta el 90,2 %.

Además, TSRT también pudo identificar el traductor original y el idioma de traducción con un 93,3 % y un 85,6 % de precisión, respectivamente”.

No está claro si Google puede detectar contenido traducido y si Google está tratando de detectar contenido traducido o no.

Pero sí sabemos que existe tecnología para detectarlo. La tecnología puede detectar el contenido traducido mejor que los humanos y determinar qué algoritmo de traducción realizó la traducción.

Si el hecho de que va en contra de las Directrices para webmasters y puede tener una experiencia de usuario negativa no es suficiente para motivar la edición de contenido traducido automáticamente, entonces quizás el posibilidad el hecho de que Google esté analizando la calidad del contenido para la traducción automática puede ser una razón para realizar una revisión exhaustiva de ese tipo de contenido.


Citación

Escuche el hangout de Google Office Hours en el minuto 17:50.

Imagen destacada por Shutterstock/g_tech



[ad_2]

Consultar el artículo en la publicación original

¿Está bien Google con ajustes menores a las traducciones automáticas?