un proyecto hecho en y por el catalán

[ad_1]

A principios de este mes de junio, elAlianza por la Presencia Digital del Catalánpublicó un informe advirtiendo que un pequeño cambio en el algoritmo de cerca de Google había hecho que el buscador dejara de ofrecer páginas en catalán, incluso en los casos en que se realizaba la búsqueda en este idioma y la usuaria había especificado que quería priorizar las respuestas en esta lengua. Esta tendencia supuso una reducción de casi el 70% en el retorno de páginas en catalán respecto a su equivalente en castellano.

«Este tipo de acciones pequeñas e insidiosas» comentan las investigadoras del Centro de Supercomputación de Barcelona (BSC), Carlos Rodríguez i Carmen Armentano«movidas a veces más por el desconocimiento o por lógicas comerciales cortas de visión, hacen peligrar a medio y corto plazo la viabilidad del catalán como lengua de uso y elarrincona en entornos domésticos«.

Precisamente con el objetivo de luchar por la presencia del catalán en Internet, en los últimos años han surgido diversas iniciativas que quieren que nuestra lengua sea también la lengua de los buscadores, de los traductores e incluso de la inteligencia artificial . Uno de los proyectos que cuenta con la complicidad de Gobierno, instituciones, empresas y ciudadanía es el Proyecto AINAimpulsado por Departamento de Empresa y Trabajo de la Generalidad de Cataluña y el Centro de Supercomputación de Barcelonaen colaboración con el Gobierno de las Islas Baleares.

«Debemos pedir, exigir, no sólo esperar pasivamente, tener un futuro, un lugar, como cultura y lengua, con nuestro legado, y nuestro talante, en el espacio digital, tanto como en el analógico.»

El Proyecto AINA nació tres años con el objetivo de generar la infraestructura y los recursos necesarios para que el catalán tenga un sitio dentro del ecosistema de la inteligencia artificial. «Cuando hablamos de infraestructura», explican Rodríguez y Armentano, «hablamos deuno, recursos, datos, etc. hechas en y por el cataláncon llicencias de uso abierto y permisivo, que permitan que cualquier ciudadano o empresa las utilice gratuitamente».

Carlos Rodríguez, investigador del BSC, explica que el proyecto «surge de la preocupación por el futuro digital del catalán«, una lengua muy dinámica y con una fuerte presencia digital si miramos cifras y demografía, pero en la que todavía «se hacía difícil encontrar voces, contenidos o aplicaciones que funcionaran bien».

Una cuestión que se está procurando solucionar con la colaboración de iniciativas ya existentes, como Softcatalángrupos de investigación universitarios y asociaciones públicas y privadas de defensa de la lengua, para, según explican las investigadoras del Barcelona Supercomputing Center, «trabajar conjuntamente para aprovechar los grandes avances tecnológicos con y dentro de nuestra lengua«.

Se necesitan voces en catalán

Una de las iniciativas más conocidas dentro de AINA es el suyo banco de vocesque forma part Voz comúnun proyecto internacional para la creación de un gran corpus de voces libre. «Common Voice existe desde hace tiempo», explican las investigadoras del Barcelona Supercomputing Center, Carlos Rodríguez y Carmen Armentano, «y hasta ahora había sido impulsado en catalán por un grupo de voluntarias, sobre todo del colectivo Softcatalà, y ya habían obtenido muy buenos resultados».

En caso de querer colaborar con el banco de voces del Proyecto AINA, se puede hacer de dos formas: grabando las frases que se proponen o validando las frases que han grabado otras usuarias. «Ambas tareas son muy importantes», comenta Carlos Rodríguez, «se pueden realizar desde prácticamente cualquier sitio i dedicando cinco o diez minutos al día. Es una forma sencilla y divertida de colaborar con el desarrollo de las tecnologías en catalán», añade el investigador.

Hasta ahora, más de 34.000 personas han colaborado con el banco de voces del Proyecto AINA, grabando más deun millón de frases. De hecho, actualmente el catalán es la lengua que mayor presencia tiene en el corpus de Common Voice. Por ahora, las voces predominantes son masculino, mayores de 50 años y hablantes las variedades centrales«por lo que nos faltan sobre todo voces con otras características», recuerdan Rodríguez y Armentano.

Aunque se dio a conocer por su campaña de recogida de datos de voces, AINA tiene muchas más vertientes: modelos de lenguaje tipo ChatGPT, traductores automáticos de gran calidad, recopilaciones de datos anotadas por entrenar máquinas para interpretar y generar textos en catalán, etc. Algunas aplicaciones ya se aprovechan (o lo harán en breve) de estos esfuerzos y recursos.

Todo ello, para poder utilizar nuestra lengua en internet, lo que, según Carlos Rodríguez, requiere una constante reclamación social. «Él el pedir, exigirno sólo esperar pasivamente, tener un futuro, un lugar, como cultura y lengua, con nuestro legado, y nuestro talante, en elespacio digitaltant con en l’analógico«, reclama el investigador del Barcelona Supercomputing Center, quien añade que «tenemos el derecho y el poder como ciudadanos y como consumidores de pedirlo. Y creo que también, tenemos el deber de hacerlo. Las próximas generaciones no lo perdonarán si no lo hacemos».

[ad_2]

Publicación original

un proyecto hecho en y por el catalán