El proyecto que busca poner a América Latina en el mapa de la IA: "Los modelos del norte no nos reflejan"

Latam-GPT es el primer modelo de inteligencia artificial abierto que se propone ser una representación de la cultura, lenguaje e historia de América Latina y el Caribe.

Mar 31, 2025 - 19:11
 0
El proyecto que busca poner a América Latina en el mapa de la IA: "Los modelos del norte no nos reflejan"

La Inteligencia Artificial (IA) ha experimentado un crecimiento explosivo en los últimos años, con modelos como ChatGPT y Gemini liderando el sector. No es casualidad que la cultura, los valores y los sesgos de estas herramientas reflejen en gran medida a sus desarrolladores, pues la mayoría de estos modelos han sido creados y entrenados en los Estados Unidos, lo que implica limitaciones a la hora de representar con precisión otras regiones, especialmente la de América latina, donde la historia y la idiosincrasia local suelen quedar en un segundo plano.

Para reducir esta brecha, surge Latam-GPT, el primer modelo de IA diseñado para reflejar la riqueza cultural y lingüística de la región. Con un fuerte respaldo de Argentina, a través de la Universidad Nacional de Córdoba (UNC) y la Fundación Vía Libre, este proyecto busca no solo una representación más fiel de la identidad latinoamericana, sino también sentar las bases de una soberanía tecnológica.

Latam-GPT es el primer modelo de inteligencia artificial abierto que se propone ser una representación de la cultura, lenguaje e historia de América Latina y el Caribe. (Imagen: achivo)

Steam regala el juego más ansiado por todos: ¿hasta cuándo está la promoción?

El creador de ChatGPT reveló su secreto para alcanzar cualquier objetivo: "Funciona sorprendentemente bien"

Por ello, el Centro Nacional de Inteligencia Artificial (CENIA) de Chile se prepara para lanzar en junio de 2025 Latam-GPT. Más de 30 instituciones y 60 expertos regionales han trabajado en su desarrollo para garantizar que el modelo represente la riqueza y diversidad de la región.

Latam-GPT no sólo integrará expresiones y modismos propios de cada país, sino que también abordará contextos históricos y realidades actuales.

Rodrigo Durán, gerente y director ejecutivo del CENIA explica que este proyecto no busca competir con los gigantes tecnológicos del hemisferio norte, sino desarrollar capacidades locales, centradas en una profunda comprensión del contexto regional.

Además, será un "modelo fundacional", no una app ni un chatbot, sino la base sobre la que podrán desarrollarse futuras aplicaciones. Al estar construidas sobre esta inteligencia, estas aplicaciones tendrán una mayor comprensión sobre Latinoamérica y el Caribe.

El nuevo modelo de IA que busca reflejar a Latinoamérica

"Hay un tema que es cultural e idiosincrático. La mayoría de los modelos del norte global presentan una subrepresentación de los datos y por lo tanto de la cultura y de la idiosincrasia local. Eso es lo que estamos cambiando con Latam-GPT", señala Durán a El Cronista.

El proyecto que busca poner a América Latina en el mapa de la IA: "Los modelos del norte no nos reflejan". (Imagen: archivo)

En la misma línea, Joan Cwaik, autor y divulgador tecnológico, advierte que "hablar de soberanía en IA es meterse en un terreno más político que tecnológico", pero subraya que desarrollar modelos propios no es un capricho de independencia, sino una necesidad: "Los modelos entrenados con datos ajenos siempre nos van a leer con ruido. El español de la Argentina no es el de México, y mucho menos el de España, y eso es solo el idioma".

En este sentido, Alexander Diztzend, presidente de la Sociedad Argentina de Inteligencia Artificial (SAIA), sostiene que cada nación debería contar con al menos "un desarrollo de LLM propio ya que estos modelos llevan consigo la cultura de quienes los desarrollaron". Y cita un ejemplo: "Los modelos chinos no hablan de los eventos ocurridos en la plaza de Tiananmen en 1989. Los modelos no son imparciales. Siempre están sesgados en una dirección".

 Los Large Language Models (LLMs) se están integrando rápidamente en nuestras vidas. Pero, ¿qué ocurre cuando preguntamos algo atingente a Latinoamérica? (Imagen: latamgpt.org)

La universidad de los creadores de Google lanzó 5 cursos gratuitos con salida laboral: cómo inscribirse

Las 3 razones por las que hay que desactivar el Wi-Fi del celular al salir de casa

Un modelo "abierto, público e inclusivo"

Una de las características fundamentales del Latam-GPT será su naturaleza pública, abierta e inclusiva. Esto significa que el código del modelo será accesible para cualquier persona interesada: "El producto del modelo del entrenamiento se sube a una plataforma y cualquier persona puede acceder, estudiarlo, utilizarlo, replicarlo y cambiarlo".

El proceso de recolección de datos ha sido diseñado para incluir textos históricos, sentencias judiciales y documentos institucionales aún no digitalizados. Este esfuerzo permitirá integrar a comunidades marginadas cuyos datos no están disponibles en formato digital. Para ello, se ha incorporado un corpus de texto inédito que incluye documentos sobre violaciones de derechos humanos en Uruguay y transcripciones taquigráficas de congresos nacionales.

En cuanto a la base de datos de Latam-GPT, Durán menciona que el modelo "será entrenado con 55Bn de parámetros, que son 300 billones de tokens, equivalentes a 12 terabytes de datos". Sin embargo, uno de los desafíos que enfrenta es la actualización constante de los datos, algo que se logra a través de convenios con archivos nacionales y el uso de técnicas avanzadas de recolección de datos, como el OCR para textos digitalizados.

En lo que respecta a la gran inversión en hardware para entrenar el modelo, la Universidad de Tarapacá ha aportado una suma de u$s 10 millones en infraestructura.

El tan esperado lanzamiento de Latam-GPT promete ser un hito en el campo de la inteligencia artificial, no solo por su capacidad técnica, sino por su enfoque inclusivo, culturalmente adaptado para los países de América Latina.