La soberanía tecnológica frente al oligopolio de la IA
En la actualidad, el desarrollo de la Inteligencia Artificial (IA) se encuentra en una encrucijada marcada por una creciente concentración de poder en manos de un pequeño grupo de empresas tecnológicas dominantes principalmente de Estados Unidos (seguido aún de lejos por China). Estas firmas controlan no solo los modelos de IA más avanzados, sino también la mayor parte de la infraestructura fundacional, como la capacidad de cómputo, los recursos de datos y las plataformas en la nube. Esta situación ha generado un “oligopolio de la IA” que refuerza el dominio de los gigantes de las plataformas, donde los beneficios son capturados por unos pocos mientras los riesgos son asumidos por todos. Además, el avance tecnológico es tan rápido que las decisiones de las juntas corporativas preceden a la ley, estableciendo realidades de uso que terminan siendo más determinantes que las normativas de los gobiernos.
El panorama actual de la IA presenta desafíos significativos para la soberanía de las naciones. Varios países han reaccionado desplegando políticas que intentan revertir la escalada de concentración de poder sobre el desarrollo de la IA. Las herramientas utilizadas son diversas, desde inversiones directas y créditos fiscales hasta iniciativas híbridas de IA público-privadas, pasando por la plataformización de activos gubernamentales para el desarrollo de la IA junto con estrategias para compartir datos a nivel nacional y regional y también estrategias regulatorias como las de competencia y las políticas antimonopolio. Por ejemplo, la Unión Europea ha desplegado programas y estrategias como la Data Union Strategy, Invest AI, Apply AI y las AI Factories, invirtiendo miles de millones de euros en la simplificación de procesos para compartir datos, infraestructura y una red de supercomputadores públicos para apoyar a startups e instituciones de investigación. La UE también ha aprobado normativa de avanzada que regula el uso y desarrollo de IA, las relaciones de consumo digitales y la competencia en plataformas digitales. A su vez, algunos países europeos han impulsado la creación de “campeones nacionales” (como Mistral en Francia o Aleph Alpha en Alemania) mediante inversiones públicas masivas. Francia ha destinado más de mil millones de euros a supercomputadores públicos. Por su parte, India ha desarrollado una estrategia basada en la infraestructura pública digital a través de las iniciativas IndiaStack y AIRAWAT, creando plataformas de datos que facilitan el surgimiento de un mercado doméstico subsidiado por el gasto público e infraestructura de cómputo en la nube específica para IA para evitar la dependencia de proveedores comerciales como AWS o Azure. Japón, al igual que India, ha lanzado infraestructuras de cómputo en la nube gestionadas públicamente para no depender totalmente de los hiper-escaladores estadounidenses.
Los riesgos: “Nacionalismo Tecnológico” sin rumbo
El informe del AI Now Institute sobre políticas de IA advierte sobre una tendencia que denomina como “el Estado de reducción del riesgo” (de-risking State), donde los gobiernos encabezan la creación de nuevos ecosistemas lucrativos para actores privados, pero el Estado asume la mayor parte del riesgo real. Además, señala que muchas de estas estrategias de IA soberana son a menudo una “fantasía de independencia”, ya que la mayoría siguen dependiendo profundamente de las infraestructuras de semiconductores y la financiación proveniente de Silicon Valley.
Esto sucede porque se subestiman los efectos de la dependencia estructural que predomina en el desarrollo de la IA. El White Paper sobre IA Pública de Open Future describe muy bien el funcionamiento de la dependencia estructural a través de la metáfora del “AI Stack” o pila tecnológica, donde cada capa (cómputo, datos, modelos y aplicaciones) depende de la anterior. Encontramos por ejemplo:
- La capa de cómputo: en esta capa existe un “cuello de botella” físico que está en la base de la pila y es el que presenta la mayor dependencia. El hardware está dominado por Nvidia (con un 92% del mercado de chips lógicos avanzados), mientras que la infraestructura de nube es controlada por tres hiperescaladores (Amazon, Microsoft y Google), quienes poseen el 67% del mercado global. El costo de construir centros de datos para entrenar modelos de vanguardia es tan alto (miles de millones de dólares) que incluso las startups exitosas terminan pagando entre el 80% y 90% de su capital a estos mismos proveedores de nube para poder operar. Actualmente existe una enorme brecha de cómputo: se habla de unas pocas naciones “ricas en GPUs” frente a otras relativamente “pobres en GPUs”, aunque la gran mayoría de los países del mundo son grandes “desiertos de cómputo”.
- La capa de datos: en esta capa también existe un problema de asimetría crítica, donde las grandes plataformas extraen valor de los bienes comunes digitales sin reciprocidad. Mientras que las empresas dominantes tienen acceso a datos propietarios masivos de sus propios usuarios y cuentan con leyes de propiedad intelectual flexibles, los investigadores y los actores del Sur Global enfrentan un gran problema de fragmentación y de acceso a los datos. A esto se suman leyes de derecho de autor mucho más restrictivas que las del Norte Global.
- La capa de modelos: aquí encontramos que los sistemas más avanzados son mayoritariamente propietarios y están bajo el control de un puñado de empresas. Muchos modelos se promocionan como “abiertos”, pero en realidad solo liberan algunos parámetros (modelos open-weights), manteniendo ocultos los datos de entrenamiento y el código. Esto crea una dependencia donde los investigadores pueden usar el modelo, pero no pueden auditarlo, modificarlo profundamente ni entender sus sesgos. A su vez, la falta de alternativas públicas viables obliga a las instituciones a depender de modelos propietarios cuyas decisiones y sesgos reflejan los valores de sus creadores comerciales, no los del público local.
Muchos gobiernos no abordan adecuadamente los desafíos que representa esta dependencia estructural diferenciada por capas y confunden la idea de IA soberana con un nacionalismo tecnológico que simplemente replica el modelo comercial dentro de sus fronteras, realizando inversiones masivas en una o varias de las capas de la IA con la esperanza de que los beneficios sociales surjan solos, lo cual a menudo termina reforzando la dependencia de los proveedores extranjeros de chips, de nube o de software propietario. Por ejemplo, cuando los gobiernos (como en los países de la UE o el Reino Unido) invierten en “campeones nacionales” o en supercomputadores públicos, a menudo terminan reforzando esta dependencia al comprar chips de Nvidia o contratar servicios de nube de Google o Microsoft para que sus modelos funcionen.
La infraestructura digital abierta como pilar soberano
Frente a este panorama, surge el concepto de IA Pública o IA para el bien común. La IA Pública se basa en un marco de gobernanza democrática que incluye la priorización del valor social sobre el beneficio económico, la existencia de procesos de codiseño deliberativos, la construcción de infraestructura digital pública, el fomento de la transparencia y la apertura de las capas del sistema para la validación externa y la inclusión de principios de responsabilidad medioambiental. Dentro de este concepto también se incluye la IA desarrollada por empresas privadas y la IA comunitaria, siempre y cuando se garantice transparencia, rendición de cuentas y acceso equitativo a sus componentes.
En cuanto a la apertura y transparencia, se entiende que aplica a todas las capas, por lo que no basta con el impulso de modelos abiertos si no existe algún grado de apertura en las otras capas (cómputo y datos). No obstante, un aspecto relevante para el desarrollo de políticas de IA Pública es reconocer la existencia de un “gradiente de lo público”. Se trata de un marco —propuesto por Open Future en su White Paper— que sitúa las iniciativas de IA en un continuo que va desde lo totalmente privado hasta totalmente público en función de su accesibilidad, apertura, alineación con los objetivos públicos y mecanismos de gobernanza. De esta forma, en vez de concebir a la IA Pública como una tipología cerrada o pura, se acepta que, en la práctica, hoy casi ningún sistema de IA puede ser completamente independiente de algún componente comercial.
El gradiente funciona como una herramienta estratégica para los responsables de políticas públicas. Este marco permite identificar acciones concretas para aumentar el valor público de una iniciativa en cada capa, moviéndose gradualmente hacia niveles superiores de apertura, gobernanza democrática y rendición de cuentas.
Otro aspecto relevante a tomar en cuenta en el diseño de políticas públicas de IA son las leyes de la escala, que sostienen que el rendimiento mejora con más parámetros y más cómputo (cuanto “más grande es mejor”). Estas leyes son financieramente insostenibles para el sector público y para la mayor parte de las empresas, por lo que los gobiernos deberían apostar a nuevas aproximaciones. Entre las recomendaciones del White Paper sobre IA Pública de Open Future encontramos algunas propuestas interesantes en ese sentido, por ejemplo:
- Evitar la carrera por la superinteligencia: Los gobiernos deben tratar la IA no como una búsqueda de “superinteligencia” especulativa, sino como una “tecnología normal” orientada a resolver problemas sociales concretos y reales.
- Enfoque impulsado por la demanda: Las inversiones no deben seguir ciegamente los intereses de la industria, sino basarse en un análisis cuidadoso de las necesidades públicas y las capacidades técnicas necesarias para cubrirlas.
- Políticas de cómputo condicionado: La inversión pública en hardware e infraestructura de cómputo debe estar vinculada a reglas que exijan que su uso sirva para la concreción de objetivos de interés público y que los resultados sean de código abierto.
- Nuevos marcos de gobernanza para compartir datos: Los gobiernos deben fomentar la creación de conjuntos de datos de alta calidad como bienes públicos digitales. Se trata de nuevos esquemas de datos abiertos protegidos por marcos de gobernanza que eviten la extracción de valor sin reciprocidad por parte de ciertos actores.
- Impulso de “Modelos Base”: El Estado debe asegurar la existencia de al menos un modelo de vanguardia que sea permanentemente abierto, transparente y gobernado democráticamente, para que sirva como ancla del ecosistema de investigación y para que las startups puedan construir encima sin restricciones comerciales.
- Fomentar Modelos Pequeños: Se recomienda invertir en modelos más compactos y eficientes que requieran menos capacidad de cómputo, facilitando su uso en dispositivos con recursos limitados o para aplicaciones y tareas específicas ignoradas por el mercado.
En definitiva, no se trata de competir o de unirse a la carrera por el desarrollo de los sistemas de IA a gran escala, sino de concebir a la IA como una herramienta orientada a la supervivencia a largo plazo mediante el impulso de ecosistemas de código abierto, cuyo valor debe medirse en función de su capacidad para satisfacer necesidades públicas o colectivas documentadas y no como un fin en sí mismo.
IA Pública en el Sur Global
Para los países del Sur Global, especialmente los de América Latina y África, la IA Pública representa una vía estratégica para la innovación local. Dado que estas regiones a menudo carecen de la infraestructura necesaria para entrenar modelos de vanguardia desde cero, la IA Pública permite aprovechar modelos abiertos para construir aplicaciones adaptadas a sus necesidades específicas. Para dejar de ser meros consumidores de tecnología diseñada en otros contextos, nuestros países necesitan contar con vigorosos ecosistemas de IA locales de código abierto que puedan ser reutilizados por actores comerciales que actúen como arquitectos de soluciones para retos sociales específicos.
Fuera del campo de la IA, existen varios casos de éxito de infraestructura pública digital de código abierto. Por ejemplo, PIX (Brasil) y UPI (India), sistemas de pagos diseñados por el Banco Central de Brasil y la Corporación Nacional de Pagos de la India (NPCI) respectivamente. Estos sistemas han transformado las transacciones financieras en un servicio de interés común, eficiente e interoperable. A diferencia de los protocolos privados, que suelen imponer tarifas elevadas y procesos lentos, estos sistemas permiten transacciones instantáneas con unos costes casi nulos para los usuarios, lo que fomenta la inclusión financiera y desafía el dominio de los sistemas financieros tradicionales.
Lamentablemente no existen indicios de que los hacedores de política pública tanto en África como en América Latina apunten hacia estrategias claras de IA Pública como infraestructura pública digital abierta. Luego de una búsqueda (no exhaustiva) de sistemas de IA creados en América Latina y África, encontramos que la mayoría de los sistemas de IA que se encuentran en fase productiva son propietarios y dependen principalmente de startups privadas. El código abierto aparece principalmente en capas de investigación, no en productos desplegados. En cuanto a los esquemas de financiación, predominan los esquemas mixtos (cooperación internacional / gobierno / filantropía). Muchas de estos sistemas de IA financiados total o parcialmente con fondos públicos se han desarrollado como código privativo, sin repositorios públicos (en GitHub o HuggingFace, por ejemplo) ni licencias open source asociadas. Inclusive llama la atención la existencia devarios proyectos enteramente financiados con fondos públicos que no prevén la publicación en código abierto, por ejemplo:
- El algoritmo de IA DART financiado por el Ministerio de Salud de Chile para detección temprana de retinopatía diabética a partir de imágenes del ojo, permitiendo diagnósticos más rápidos y accesibles.
- El Sistema JulIA (México), buscador jurídico basado en IA para ayudar a jueces y abogados a encontrar jurisprudencia relevante y automatizar tareas legales financiado con recursos del presupuesto público del Poder Judicial Federal como parte de iniciativas de justicia digital y e-justicia.
- El sistema AI4CropHealth (Tanzania) que utiliza IA para detección, predicción y gestión de enfermedades de cultivos mediante modelos de visión computarizada e integración de datos climáticos, financiado por el gobierno de Tanzania a través de la Comisión de Ciencia y Tecnología (COSTECH).
Sin embargo, sí existen algunas iniciativas alineadas con los principios de IA Pública tanto en América Latina como en África. Se trata de grupos de investigación y desarrollo que se encuentran trabajando en el área del procesamiento de lenguaje natural (NLP por sus siglas en inglés) desde una mirada de soberanía linguística. Encontramos por ejemplo, al colectivo Masakhane, que trabaja en procesamiento de lenguaje natural y ha producido más de 50 modelos de traducción automática de código abierto para lenguas africanas. Otra iniciativa africana es Lanfrica, se trata de una plataforma de acceso abierto para descubrir y utilizar los recursos africanos, que incluye un sistema de recolección de datos desde la lógica del “data farming” a través de la recolección colaborativa y por convenio, en oposición al concepto de “data mining” o recolección predatoria.
Por otro lado, en América Latina, el CENIA (Centro Nacional de Inteligencia Artificial de Chile) se encuentra desarrollando un gran modelo de lenguaje (LLM por sus siglas en inglés). Se trata de Latam GPT que, a diferencia de sus homólogos de código cerrado Amazonia IA (de Brasil) y PatagonIA (de Chile), publicará todos los elementos relacionados con la construcción del modelo: código, benchmarks, documentación asociada y el catálogo de datasets de entrenamiento, apuntando hacia la máxima transparencia. Vale la pena resaltar que la importancia del proyecto Latam GPT no radica solo en el modelo sino que su principal fortaleza reside en la visión estratégica de desarrollo regional a largo plazo. El proyecto involucra a cientos de investigadores y desarrolladores de más de 15 países de la región y utiliza una lógica de puertas abiertas para la participación comunitaria, fomentando la construcción de capacidades entre los socios y compartiendo recursos y conocimientos.
De cualquier forma, debemos evaluar estas iniciativas desde la lógica del “gradiente de la IA Pública”, ya que se trata de productos que no son fácilmente reutilizables o que aún dependen de componentes comerciales. Por ejemplo, el colectivo Masakhane reconoce que los conjuntos de datos en lenguas africanas que ha disponibilizado probablemente no serán suficientes para entrenar perfectamente una herramienta de traducción multilingüe y que quienes pretendan utilizarlos aún necesitarán obtener una importante financiación para desarrollar las herramientas basadas en ellos. Por su parte, Latam GPT utiliza la infraestructura de nube de Amazon para las actividades de reentrenamiento de un modelo pre-existente. Este modelo pre-existente (que sirve de arquitectura base de Latam GPT) es el modelo libre de Meta (Llama 3.1). En definitiva, se trata de iniciativas de IA Pública con una dependencia estructural aún muy grande, algo totalmente esperable dada la situación de África y América Latina en el gradiente de la IA Pública.
Igwebuike. El futuro de la IA Pública en África y América Latina
“Igwebuike” es una palabra proviene de la cultura igbo-africana (principalmente de Nigeria) que significa “la fuerza reside en la comunidad”. Así titulamos el panel de del Mozilla Fest 2025 en el que participamos varios colectivos dedicados al impulso de la IA Pública en África y América Latina. En nuestros continentes estos debates aún están en una fase inicial, de hecho, resulta curioso cómo muchos investigadores y desarrolladores que trabajan en proyectos con claros componentes de IA Pública nunca han oído hablar de este concepto. De esta forma, proponemos crear espacios para la participación y el debate Sur-Sur, para ello será necesario:
- Mapear líderes y proyectos afines a la lógica de la IA Pública en ambos continentes para detectar problemas en común y fortalecer los vínculos entre proyectos e instituciones
- Impulsar marcos de gobernanza de datos e infraestructura que fomenten la posibilidad de compartir recursos y capacidades Sur-Sur pero que incluyan mecanismos de protección contra el uso predatorio de las grandes tecnológicas. En la Política de Gobernanza de Datos de Latam GPT encontramos un buen ejemplo de este tipo de marco de protección que habilita la colaboración. Este proyecto planea publicar sus datos en abierto pero incluye una cláusula de “apertura diferenciada” restringiendo el uso de su catálogo de datos “por parte de grandes empresas tecnológicas, definidas como cualquier entidad con ingresos anuales superiores a US$1 billón”.
Organizar instancias de alfabetización dirigidas a los tomadores de decisiones y líderes tecnológicos para que sean capaces de comprender las discusiones y participar activamente en foros internacionales en los que se están discutiendo actualmente las reglas que marcarán el rumbo de la gobernanza digital global.
