Die Debatte „Open Source vs. proprietär“ im Bereich der KI wird oft als ideologische Frage geführt. Das ist der falsche Ansatz. Es handelt sich um eine strategische Frage: Was haben Sie unter Kontrolle, und was nicht?

Beginnen wir damit, den Wortschatz zu klären.

Terminologische Verwirrung

Open Source im engeren Sinne (Open Source Initiative): Der Code, die Trainingsdaten und die Gewichte sind öffentlich zugänglich und frei wiederverwendbar, auch für kommerzielle Zwecke. Kaum ein großes KI-Modell erreicht heute dieses Niveau.

Open Weights: Die Gewichte des Modells werden veröffentlicht, nicht jedoch zwangsläufig der Trainingscode oder die Daten. Sie können das Modell herunterladen, ausführen, ändern und gegebenenfalls kommerziell nutzen (je nach Lizenz). Dies gilt für Llama 3, Mistral, Mixtral, DeepSeek und Qwen.

Eigentümer: Das Modell läuft auf den Servern des Anbieters, auf die Sie über eine API zugreifen. Sie haben weder Einfluss auf die Gewichtung noch auf die Inferenz oder zukünftige Versionen. GPT-4o, Claude 3.5 und Gemini 1.5 Pro fallen in diese Kategorie.

Was Sie mit den Open Weights tatsächlich steuern

Bei einem lokal bereitgestellten Open-Weights-Modell:

  • Sie haben die Kontrolle über die Version (Sie sind nicht von ungewollten Updates betroffen)
  • Ihre Daten verlassen Ihre Infrastruktur nicht
  • Die Grenzkosten für die Inferenz entsprechen Ihren Infrastrukturkosten, nicht einer Gebühr pro Token
  • Sie können das Modell anhand Ihrer proprietären Daten feinabstimmen
  • Sie können das Verhalten des Modells anhand Ihrer Testfälle überprüfen

Was Sie nicht kontrollieren können: die Qualität des Basismodells (Sie sind von Meta, Mistral oder demjenigen abhängig, der die Gewichte veröffentlicht hat). Sollte Meta beschließen, keine Gewichte mehr zu veröffentlichen, behalten Sie zwar die aktuelle Version, haben aber keinen Zugriff mehr auf nachfolgende Versionen.

Was Sie mit einer proprietären API tatsächlich kontrollieren

Im Wesentlichen: die Benutzeroberfläche. Sie legen fest, welche Eingabeaufforderung gesendet und wie die Antwort verarbeitet werden soll. Alles andere liegt in der Hand des Anbieters.

Was das in der Praxis bedeutet:

  • OpenAI hat GPT-3.5 Ende 2024 ausgemustert, wodurch Entwickler zur Migration gezwungen wurden
  • Das Verhalten der Modelle ändert sich mit den Updates (eine Prompt, die zuvor gut funktionierte, kann an Leistung einbüßen)
  • Die Preise können sich ändern (sie sind insgesamt gesunken, aber es gibt keine Garantie für diesen Trend)
  • Der Anbieter kann beschließen, bestimmte Nutzungsarten einzuschränken (sich weiterentwickelnde Inhaltsfilter)

Der wahre Kompromiss

Es gilt nicht: „Open Source = gut, proprietär = schlecht“. Es gilt vielmehr:

Für den kritischen Einsatz mit sensiblen Daten über einen längeren Zeitraum: On-Premise-Open-Weights bieten mehr Kontrolle und Planbarkeit, allerdings auf Kosten interner Ressourcen und einer leicht geringeren Leistung bei allgemeinen Aufgaben.

Für Rapid Prototyping, nicht sensible Daten und begrenzte technische Ressourcen: Eine proprietäre API ist leichter zugänglich, schneller zu implementieren und bei allgemeinen Aufgaben oft leistungsfähiger.

Die Hybrid-Strategie (die in der Praxis am häufigsten anzutreffen ist): Proprietäre API für unkritische Anwendungen und die Entwicklung, Open Weights vor Ort für kritische Anwendungen oder solche mit hohem Datenaufkommen.

DeepSeek und der globale Wettbewerb

Im Dezember 2024 veröffentlicht DeepSeek V3, ein chinesisches Open-Weights-Modell, das bei mehreren Benchmarks eine mit GPT-4o vergleichbare Leistung erzielt, wobei die angegebenen Trainingskosten bei 6 Millionen Dollar liegen – also 10- bis 30-mal weniger als bei einem vergleichbaren US-amerikanischen State-of-the-Art-Modell.

Diese Veröffentlichung verdeutlicht, dass der Wettbewerb um Fundamentmodelle global ist. Die Behauptungen der US-amerikanischen Akteure, über einen nachhaltigen technologischen Vorsprung zu verfügen, sind fragil. Und das Open-Weights-Ökosystem kann sich rasch weiterentwickeln, was die verfügbaren Alternativen verbessert.

Die Kehrseite: Bedenken hinsichtlich Vertrauen und Unternehmensführung bei einem chinesischen Unternehmensmodell sind in bestimmten Bereichen (Verteidigung, öffentliche Einrichtungen, sensible Daten) berechtigt. Das ist kein Grund, es in allen Bereichen auszuschließen, aber es ist ein Faktor, der ausdrücklich geprüft werden muss.