ChatGPT funciona bien en español. Sería absurdo que no lo hiciese, teniendo en cuenta que la de Cervantes es la segunda lengua más hablada en el mundo, la tercera más empleada en Internet y la segunda en el país que acoge a las empresas líderes en inteligencia artificial: OpenAI, Microsoft y Google.
Desde el principio, este LLM (language large model) ha sido entrenado en español y, como no faltan fuentes en la red para nutrirse, es competente para redactar cualquier texto sin faltas de ortografía y con una sintaxis correcta. Pero hay cosas que podría mejorar, como las referencias culturales. Hablar más de paellas y menos de hamburguesas, o más de fútbol y menos de béisbol.
El problema se agudiza cuando hablamos de lenguas cooficiales. Hay pocos textos en gallego, catalán y vasco, al menos en comparación con el castellano. Se calcula que en euskera tenemos 4.000 millones de tokens [pequeños bloques de texto que usan las máquinas para entender el lenguaje]. El catalán tendrá unos 20.000 millones, cinco veces más. El castellano 250.000, unas doce veces más.
No se trata solo de preservar referencias culturales. Cuando se trata de analizar expedientes clínicos escritos por médicos o sentencias jurídicas, es indispensable que estén entrenados y sintonizados con la lengua y contenido locales o perderían demasiados matices.
Por todo ello, desde España, noveno país del mundo en uso de IA generativa, se quiere promover un modelo de ChatGPT “made in Spain”. Lo anunció el presidente del Gobierno, Pedro Sánchez, en la pasada edición del Mobile World Congress, la feria que reúne en Barcelona a lo más granado de la tecnología a nivel mundial.
Para ello, el Gobierno pondrá en marcha una colaboración público-privada con el Barcelona Supercomputing Center, la Red Española de Supercomputación, la Academia Española de la Lengua y la Asociación de Academias de la Lengua Española. En este contexto, surge una pregunta clave: ¿qué beneficios podría tener su implementación y qué rédito sacarían las organizaciones de ello?
Los expertos de Seresco, compañía tecnológica especializada en la integración de servicios de transformación digital e infraestructura y software, apuntan los 5 principales beneficios que la creación de este LLM español tendrá para las organizaciones de nuestro país:
1. Algoritmos entrenados en español. Garantizar que los algoritmos que componen este tipo de soluciones sean entrenados con información veraz y de calidad es fundamental. Los expertos en analítica deben garantizar que los datos estén limpios para evitar sesgos y errores a la hora de generar las respuestas y, para ello, es crucial emplear el mayor contenido posible en un idioma. Al contrario de lo que pasa con Chat GPT, Bard o Gemini que, principalmente, operan con información en inglés. Al entrenar el modelo de lenguaje íntegramente en castellano, gallego, euskera, valenciano o catalán la calidad de las respuestas va a ser mucho más alta. Así, mediante esta iniciativa, el Gobierno aspira a crear una infraestructura lingüística abierta y accesible para las empresas. Esto les permitirá acceder a un modelo de lenguaje a gran escala que facilitará el desarrollo de servicios en tecnologías del lenguaje. El objetivo final es fomentar la creación de aplicaciones avanzadas que impulsen la actividad económica de manera efectiva.
2. Globalización de la economía. El desarrollo de un LLM con sello nacional y unificado bajo una misma lengua permitirá a las empresas nacionales extender las soluciones derivadas de la misma a cualquier país hispanohablante. Esto se traduce, por un lado, en un aumento de la competitividad a nivel internacional, ya que se ofrecerían soluciones tecnológicas avanzadas y adaptadas a las necesidades lingüísticas de la región. Mientras que, por el otro, las compañías podrían crear sinergias supranacionales y fomentar la exportación e importación de servicios gracias a la implementación de asistentes virtuales, análisis de sentimiento, experiencia de cliente o la automatización de tareas rutinarias que ralentizan los procesos mercantiles, como la burocracia.
3. Líderes a nivel europeo en la regulación de la IA. Tras impulsar durante la presidencia española del Consejo de la Unión Europea la Ley para la Regulación de la Inteligencia Artificial y la creación de la AESIA, España se ha posicionado como uno de los referentes a nivel mundial en lo que concierne a construir un marco jurídico que delimite cómo operar con las soluciones basadas en IA. Así pues, al desarrollar un LLM propio, al estilo de los modelos GPT que todos conocemos, nuestro país se posicionará como uno de los territorios más atractivos para invertir en este tipo de tecnología. España es considerado uno de los puertos tecnológicos más importantes del mundo y ciudades como Madrid, Barcelona o Málaga cuentan con la presidencia de las principales multinacionales tecnológicas del globo. De este modo, atraer a estas empresas y conseguir que se asienten aquí repercutirá beneficiosamente en el desarrollo de la economía local y fomentará la expansión del sector TIC nacional.
4. Cooficialidad y agilidad. Tal y como anunció Pedro Sánchez, este modelo será entrenado también en gallego, catalán, euskera y valenciano. Esto permitirá a las compañías obtener traducciones simultáneas y contar con materiales de calidad y veraces sobre casi cualquier tema en la lengua deseada. Así, por ejemplo, la relación con las administraciones públicas regionales dejará de ser un problema para las compañías que no manejan estas lenguas. Elaborar escritos, documentos y cualquier tipo de necesidad que surja en alguno de los idiomas recogidos estará cubierta mediante este modelo basado en IA. Esto permitirá a las organizaciones reducir los trámites burocráticos y contar con asistentes virtuales que atiendan a los clientes o usuarios en la lengua que ellos demanden a través de traducciones simultáneas.
5. Democratización de la Inteligencia Artificial. La apuesta de España por naturalizar y democratizar la Inteligencia Artificial es un hecho muy beneficioso para las compañías. Cuanto antes se expanda su uso y más medios se destinen desde las administraciones públicas a la investigación, más avanzarán las compañías en sus procesos de transformación digital. Se ha de tener en cuenta que el sector TIC aporta al PIB del país un 22,6% según el barómetro de AMETIC, cifra que se verá ampliamente ampliada si se apuesta de forma decidida por la IA y el desarrollo de este tipo de soluciones, bien sean modelos de lenguaje o cualquier otro avance tecnológico.
En resumen, el desarrollo de un LLM íntegro en español y las diversas lenguas cooficiales supone un paso hacia adelante para nuestro país, no solo por el avance tecnológico, si no por la ingente cantidad de oportunidades económicas que esta implementación puede generar para las compañías nacionales. Además, situarnos a la cabeza de este tipo de proyectos a nivel europeo reforzará la posición de España como hub tecnológico, lo que, previsiblemente, seguirá atrayendo a multinacionales del sector a nuestro territorio, favoreciendo así el desarrollo del empleo tecnológico cualificado y las oportunidades de negocio para las empresas locales.