El Gobierno destina 7,5 millones a que ALIA 'entrene' en catalán, gallego y euskera

El Gobierno ha dedicado 7,5 millones de euros para que ALIA, la IA impulsada por el Ejecutivo de Pedro Sánchez se entrene en catalán, gallego, euskera y valenciano. Esta herramienta aún se encuentra en una fase preliminar, pero el objetivo es "garantizar su operatividad en castellano y en el resto de las lenguas oficiales del Estado" y que todas ellas funcionen "en igualdad de condiciones", así lo ha detallado el Ministerio para la Trasformación Digital y la Función Pública. En el escrito dirigido al Partido Popular se desglosan las cantidades de dinero destinadas a las distintas entidades implicadas en el proyecto. Para el desarrollo del "corpus funcional" se han concedido tres millones de euros en ayudas al Barcelona Supercomputing Center (BSC-CNS), dos millones a la Universidad del País Vasco, otros dos a la de Santiago de Compostela y medio millón a la Universidad de Alicante. Estas instituciones cuentan con experiencia en tecnologías del lenguaje, dado que se han creado proyectos propios en estas comunidades. Es el caso de AINA en Cataluña, de GAITU en el País Vasco, de NÓS en Galicia y de VIVES en la Comunidad Valenciana. El Barcelona Supercomputing Center (BSC) será el encargado de coordinar el desarrollo de estos modelos en colaboración con las universidades, que han aportado "conjuntos de datos". También participan empresas en la optimización y alineamiento de modelos para las diferentes aplicaciones. Estas partidas se enmarcan en el Plan de Recuperación, Transformación y Resiliencia (PRTR). Este plan ha sido elaborado por los 27 miembros de la Unión Europea para fomentar la digitalización, el paso hacia una España más concienciada con el medio ambiente, la inclusión y la productividad. El plan también apuesta por la cohesión social y territorial así como por el fomento de un país sin brechas de género. El diputado del Bloque Nacionalista Galego (BNG), Néstor Rego proguntó por escrito al Gobierno sobre el uso de las lenguas cooficiales por parte de ALIA. A esta pregunta el ejecutiva ha contestado que el programa de IA anunciado por Pedro Sánchez el pasado mes de enero es una primera versión y por tanto cuenta con funcionalidades básicas. Entre ellas están las de generación de texto pero sin capacidad conversacional ni de respuestas a preguntas. Desde el Ejecutivo han señalado que las próximas versiones de esta IA incluirán la capacidad de mantener conversaciones, la alineación del modelo para garantizar respuestas "adecuadas y respetuosas" y la mejora del rendimiento en "todas las lenguas oficiales". El departamento de Óscar López ha destacado que ahora la dificultad radica en entrenar a la IA en las diferentes lenguas pues la cantidad de información que se puede encontrar en castellano es superior a la existentes en gallego, catalán, euskera y valenciano. Para mitigar esta diferencia se está trabajando con diferentes entidades colaboradores para la recopilación de contenidos de alta calidad en las diferentes lenguas cooficiales. ALIA está disponible en abierto, pero su nivel de desempeño varía en función de la cantidad y calidad de los datos de entrenamiento en cada...

Mar 23, 2025 - 18:10
 0
El Gobierno destina 7,5 millones a que ALIA 'entrene' en catalán, gallego y euskera
El Gobierno ha dedicado 7,5 millones de euros para que ALIA, la IA impulsada por el Ejecutivo de Pedro Sánchez se entrene en catalán, gallego, euskera y valenciano. Esta herramienta aún se encuentra en una fase preliminar, pero el objetivo es "garantizar su operatividad en castellano y en el resto de las lenguas oficiales del Estado" y que todas ellas funcionen "en igualdad de condiciones", así lo ha detallado el Ministerio para la Trasformación Digital y la Función Pública. En el escrito dirigido al Partido Popular se desglosan las cantidades de dinero destinadas a las distintas entidades implicadas en el proyecto. Para el desarrollo del "corpus funcional" se han concedido tres millones de euros en ayudas al Barcelona Supercomputing Center (BSC-CNS), dos millones a la Universidad del País Vasco, otros dos a la de Santiago de Compostela y medio millón a la Universidad de Alicante. Estas instituciones cuentan con experiencia en tecnologías del lenguaje, dado que se han creado proyectos propios en estas comunidades. Es el caso de AINA en Cataluña, de GAITU en el País Vasco, de NÓS en Galicia y de VIVES en la Comunidad Valenciana. El Barcelona Supercomputing Center (BSC) será el encargado de coordinar el desarrollo de estos modelos en colaboración con las universidades, que han aportado "conjuntos de datos". También participan empresas en la optimización y alineamiento de modelos para las diferentes aplicaciones. Estas partidas se enmarcan en el Plan de Recuperación, Transformación y Resiliencia (PRTR). Este plan ha sido elaborado por los 27 miembros de la Unión Europea para fomentar la digitalización, el paso hacia una España más concienciada con el medio ambiente, la inclusión y la productividad. El plan también apuesta por la cohesión social y territorial así como por el fomento de un país sin brechas de género. El diputado del Bloque Nacionalista Galego (BNG), Néstor Rego proguntó por escrito al Gobierno sobre el uso de las lenguas cooficiales por parte de ALIA. A esta pregunta el ejecutiva ha contestado que el programa de IA anunciado por Pedro Sánchez el pasado mes de enero es una primera versión y por tanto cuenta con funcionalidades básicas. Entre ellas están las de generación de texto pero sin capacidad conversacional ni de respuestas a preguntas. Desde el Ejecutivo han señalado que las próximas versiones de esta IA incluirán la capacidad de mantener conversaciones, la alineación del modelo para garantizar respuestas "adecuadas y respetuosas" y la mejora del rendimiento en "todas las lenguas oficiales". El departamento de Óscar López ha destacado que ahora la dificultad radica en entrenar a la IA en las diferentes lenguas pues la cantidad de información que se puede encontrar en castellano es superior a la existentes en gallego, catalán, euskera y valenciano. Para mitigar esta diferencia se está trabajando con diferentes entidades colaboradores para la recopilación de contenidos de alta calidad en las diferentes lenguas cooficiales. ALIA está disponible en abierto, pero su nivel de desempeño varía en función de la cantidad y calidad de los datos de entrenamiento en cada...