El debate «código abierto frente a propietario» en torno a la IA suele plantearse como una cuestión ideológica. Ese no es el enfoque adecuado. Se trata de una cuestión estratégica: ¿qué es lo que controlas y qué es lo que no controlas?

Empecemos por aclarar el vocabulario.

La confusión terminológica

Código abierto en sentido estricto (Open Source Initiative): el código, los datos de entrenamiento y los pesos son públicos y se pueden reutilizar libremente, incluso con fines comerciales. Hoy en día, casi ningún modelo de IA a gran escala alcanza este nivel.

Peso abierto: se publican los pesos del modelo, pero no necesariamente el código de entrenamiento ni los datos. Puedes descargar el modelo, ejecutarlo, modificarlo y, en su caso, comercializarlo (según la licencia). Este es el caso de Llama 3, Mistral, Mixtral, DeepSeek y Qwen.

Propietario: el modelo se ejecuta en los servidores del proveedor, y se accede a él a través de una API. No tienes control sobre los pesos, la inferencia ni las futuras versiones. GPT-4o, Claude 3.5 y Gemini 1.5 Pro se incluyen en esta categoría.

Lo que realmente controlas con los pesos libres

Con un modelo de pesos abiertos implementado a nivel local:

  • Tú controlas la versión (no te ves afectado por actualizaciones no deseadas)
  • Tus datos no salen de tu infraestructura
  • El coste marginal de inferencia es el de tu infraestructura, no una tarifa por token
  • Puedes ajustar el modelo con tus datos propios
  • Puedes auditar el comportamiento del modelo en tus casos de prueba

Lo que no puedes controlar: la calidad del modelo base (dependes de Meta, Mistral o quienquiera que haya publicado los pesos). Si Meta decide dejar de publicar los pesos, conservarás la versión actual, pero ya no tendrás acceso a las siguientes.

Lo que realmente controlas con una API propietaria

En esencia: la interfaz. Tú eliges qué mensaje de solicitud enviar y cómo procesar la respuesta. Todo lo demás queda bajo el control del proveedor.

Lo que esto implica en la práctica:

  • OpenAI dejó de dar soporte a GPT-3.5 a finales de 2024, lo que obligó a los desarrolladores a migrar
  • El comportamiento de los modelos cambia con las actualizaciones (una indicación que funcionaba bien puede dejar de hacerlo)
  • Los precios pueden cambiar (en general han bajado, pero no hay garantía de que la tendencia se mantenga)
  • El proveedor puede decidir restringir ciertos usos (los filtros de contenido evolucionan)

El verdadero compromiso

No se trata de que «código abierto = bueno, propietario = malo». Se trata de:

Para un uso crítico, con datos confidenciales y a largo plazo: las soluciones de peso abierto instaladas en las propias instalaciones ofrecen mayor control y previsibilidad, a cambio de recursos internos y un rendimiento ligeramente inferior en las tareas generales.

Para la creación rápida de prototipos, datos no confidenciales y recursos técnicos limitados: una API propia resulta más accesible, más rápida de implementar y, a menudo, más eficaz en tareas generales.

La estrategia híbrida (la más habitual en la práctica): API propia para usos no confidenciales y desarrollo, y Open Weights on-premise para usos confidenciales o de gran volumen.

DeepSeek y la competencia mundial

En diciembre de 2024, DeepSeek lanzó V3, un modelo chino de peso abierto que alcanza un rendimiento comparable al de GPT-4o en varias pruebas de rendimiento, con un coste de entrenamiento declarado de 6 millones de dólares, es decir, entre 10 y 30 veces menos que un modelo de vanguardia estadounidense equivalente.

Esta publicación pone de manifiesto que la competencia en torno a los modelos de base es global. Las pretensiones de liderazgo tecnológico sostenible de los actores estadounidenses son frágiles. Y el ecosistema de código abierto puede avanzar rápidamente, lo que mejora las alternativas disponibles.

La otra cara de la moneda: las cuestiones relacionadas con la confianza y la gobernanza en un modelo de empresa china son legítimas en determinados contextos (defensa, instituciones públicas, datos sensibles). Esto no es motivo para descartarlo en todos los contextos, pero sí es un factor que debe evaluarse de forma explícita.