Allgemeine FAQ
Alle Anbieter von KI-Modellen mit allgemeinem Verwendungszweck müssen auf der Grundlage einer von der Kommission bereitgestellten Vorlage eine Zusammenfassung der Inhalte veröffentlichen, die für die Schulung ihrer Modelle verwendet werden. Diese öffentliche Zusammenfassung soll die Transparenz in Bezug auf die Schulungsdaten des Modells erhöhen und Parteien mit berechtigten Interessen, wie z. B. Urheberrechtsinhabern, bei der Ausübung ihrer Rechte nach dem Unionsrecht unterstützen. Die Vorlage umreißt den erforderlichen Inhalt für die öffentliche Zusammenfassung zusammen mit begleitenden Erläuterungen, um die Anbieter bei der Erfüllung ihrer Verpflichtungen zu unterstützen.
Die Vorlage wurde mit Beiträgen aus einer Konsultation mehrerer Interessenträger zu KI-Modellen mit allgemeinem Verwendungszweck erstellt, die vom Amt für künstliche Intelligenz vom 30. Juli bis 18. September 2024 organisiert wurde. In diesem Zeitraum gingen mehr als 430 Antworten von einem breiten Spektrum von Interessenträgern ein. Auf der Grundlage dieses Beitrags entwarf das Amt für künstliche Intelligenz seinen vorläufigen Ansatz für das Muster und ermöglichte den Teilnehmern, die an der Entwicklung des Verhaltenskodex für KI mit allgemeinem Verwendungszweck beteiligt waren, zusätzliche schriftliche Rückmeldungen zu geben. Die aktuelle Fassung des Musters spiegelt auch die Kommentare von 111 Interessenträgern wider, darunter Anbieter von KI-Modellen mit allgemeinem Verwendungszweck, Unternehmensverbände, Organisationen von Rechteinhabern, Hochschulen, die Zivilgesellschaft und Behörden. Der Entwurf des Musters wurde auch mit der Lenkungsuntergruppe des KI-Ausschusses für KI mit allgemeinem Verwendungszweck und mit der Arbeitsgruppe KI des Europäischen Parlaments (IMCO-LIBE-Ausschüsse) vorgestellt und erörtert.
Gemäß Artikel 53 Absatz 1 Buchstabe d des KI-Gesetzes ist die Verwendung des Musters obligatorisch. Sie ermöglicht es den Anbietern, ihre Transparenzanforderungen auf einfache, kohärente und wirksame Weise zu erfüllen und gleichzeitig den Verwaltungsaufwand auf das zu minimieren, was zur Erreichung des Ziels der Zusammenfassung erforderlich ist.
Anbieter von KI-Modellen mit allgemeinem Verwendungszweck, einschließlich solcher mit Systemrisiken, die solche Modelle auf dem Unionsmarkt in Verkehr bringen, müssen entsprechende Zusammenfassungen veröffentlichen. Diese Anforderung gilt auch für Anbieter von Modellen, die unter freien und Open-Source-Lizenzen veröffentlicht wurden.
Die Verpflichtung zur Veröffentlichung der Zusammenfassung gilt ab dem 2. August 2025. Bei Modellen, die vor diesem Datum in Verkehr gebracht wurden, sollten die Anbieter die erforderlichen Schritte unternehmen, um die entsprechenden Zusammenfassungen spätestens am 2. August 2027 zur Verfügung zu stellen.
Kann ein Anbieter eines Modells, das vor dem 2. August 2025 in Verkehr gebracht wurde, trotz aller Bemühungen bestimmte für die Zusammenfassung erforderliche Informationen nicht bereitstellen, weil die Informationen nicht verfügbar sind oder ihr Abruf eine unverhältnismäßige Belastung darstellen würde, sollte der Anbieter diese Informationslücken in der veröffentlichten Zusammenfassung klar angeben und begründen.
KI-Modelle mit allgemeinem Verwendungszweck werden mit großen Datenmengen trainiert, aber es gibt nur begrenzte Informationen über ihre Herkunft. Die Vorlage und die daraus resultierenden Zusammenfassungen liefern wichtige Details zu den Schulungsdaten und erhöhen die Transparenz. Diese erhöhte Transparenz ermöglicht es Parteien mit berechtigten Interessen, ihre Rechte nach dem Unionsrecht auszuüben. Diese können sich auf Urheberrechte, verwandte Schutzrechte und andere Rechte des geistigen Eigentums sowie andere durch das Unionsrecht geschützte Rechte wie Datenschutz, Verbraucherschutz, Nichtdiskriminierung und Wissenschaftsfreiheit beziehen.
Mit der Vorlage soll ein Gleichgewicht zwischen der Wahrung der Interessen von Parteien mit berechtigten Interessen und der Förderung einer sinnvollen Transparenz der Schulungsinhalte unter Wahrung der Rechte aller betroffenen Parteien hergestellt werden, insbesondere unter Berücksichtigung der Notwendigkeit, Geschäftsgeheimnisse und vertrauliche Geschäftsinformationen zu schützen. Die Entscheidung darüber, welche Einzelheiten offengelegt werden sollten, ist das Ergebnis einer sorgfältigen Abwägung durch die Kommission, und die Vorlage erfordert je nach Datenquelle unterschiedliche Detailtiefen, um die Geschäftsgeheimnisse der Anbieter zu schützen.
Das Template bietet eine einheitliche Ausgangsbasis für Informationen, die in der Zusammenfassung veröffentlicht werden sollen, und besteht aus drei Hauptabschnitten:
- Allgemeine Informationen: Dieser Abschnitt enthält Angaben zur Identifizierung des Anbieters und des Modells, Informationen zu den Arten von Schulungsinhalten (z. B. Text, Video, Audio, Größe pro Modalität in weiten Bereichen und allgemeine Merkmale der Schulungsdaten).
- Liste der Datenquellen: Dieser Abschnitt erfordert die Offenlegung von Informationen über verschiedene Datenquellen, wie öffentlich zugängliche Datensätze, private Datensätze, Daten aus Online-Quellen, Benutzerdaten und synthetische Daten. Detailliertere Anforderungen für jede Art von Quelle sind in der Vorlage beschrieben.
- Relevante Aspekte der Datenverarbeitung: Dieser Abschnitt verlangt Informationen über bestimmte Aspekte der Datenverarbeitung, die für die Ausübung der Rechte von Parteien mit berechtigten Interessen nach dem Unionsrecht wichtig sind, wie das Urheberrecht, und enthält Einzelheiten zur Entfernung illegaler Inhalte.
Jeder Abschnitt ermöglicht es Anbietern, auf freiwilliger Basis zusätzliche Informationen bereitzustellen.
Die Transparenz der Schulungsdaten wird den Rechteinhabern dabei helfen, relevante Informationen über die Inhalte zu erhalten, die bei der Schulung von KI-Modellen mit allgemeinem Verwendungszweck verwendet werden. Die in der Musterzusammenfassung bereitgestellten Informationen werden es den Rechteinhabern insbesondere ermöglichen, besser zu bewerten, welche Datenmodalitäten und Arten von Inhalten verwendet wurden und inwieweit die in der Richtlinie über das Urheberrecht im digitalen Binnenmarkt vorgesehenen Bedingungen für eine rechtmäßige Text- und Datenauswertung eingehalten wurden.
Außerdem erhalten sie detaillierte Beschreibungen sowohl öffentlicher als auch privater Datensätze, eine Liste aller großen öffentlich zugänglichen Datensätze und detaillierte Informationen über die aus Online-Quellen abgeschabten Daten. Dazu gehören die Namen der verwendeten Crawler, der Zeitraum der Sammlung, eine umfassende detaillierte Beschreibung des abgekratzten Inhalts und eine Liste der Top 10% aller Domains, die aus dem Internet abgekratzt wurden (für KMU Top 5% oder 1000, je nachdem, welcher Wert niedriger ist).
Die Vorlage verlangt auch, dass Anbieter offenlegen, ob ihr Modell auf Daten trainiert wurde, die durch Benutzerinteraktionen mit allen ihren Diensten und Produkten gesammelt wurden, einschließlich Interaktionen mit ihren KI-Modellen.
In diesem Zusammenhang verlangt die Vorlage die Offenlegung der Modalitäten der Benutzerdaten und eine Beschreibung der damit verbundenen Dienstleistungen und Produkte, ohne dass personenbezogene Daten offengelegt werden müssen.
Weitere Einzelheiten zur Verwendung personenbezogener Daten durch Anbieter für Schulungsaktivitäten finden Sie in deren jeweiligen Datenschutzerklärungen.
Die Zusammenfassung muss spätestens zum Zeitpunkt des Inverkehrbringens eines Modells auf dem Unionsmarkt öffentlich zugänglich gemacht werden. Es sollte auf der offiziellen Website des Anbieters in deutlich sichtbarer und zugänglicher Weise veröffentlicht werden, wobei klarzustellen ist, welches Modell(e) (und möglicherweise auch welche Modellversion(en)) von der Zusammenfassung erfasst wird/werden. Die Zusammenfassung sollte neben dem Modell auch über alle öffentlichen Vertriebskanäle, wie z. B. Online-Plattformen, öffentlich zugänglich gemacht werden.
Ja, die Zusammenfassung sollte aktualisiert werden, wenn ein Anbieter das Modell weiter auf zusätzliche Daten trainiert hat, die eine Aktualisierung des Inhalts der Zusammenfassung erfordern. Die Zusammenfassung sollte in Abständen von sechs Monaten oder früher aktualisiert werden, wenn die für die Weiterbildung verwendeten neuen Daten eine wesentliche Aktualisierung des Inhalts der Zusammenfassung erfordern, je nachdem, welches Ereignis früher eintritt. In solchen Fällen sollte die Zusammenfassung die zusätzlichen Schulungsdaten widerspiegeln und das Datum der Aktualisierung enthalten. Die aktualisierte Zusammenfassung sollte parallel zum geänderten Modell öffentlich zugänglich gemacht werden.
Wird ein bereits in der Union in Verkehr gebrachtes KI-Modell mit allgemeinem Verwendungszweck von einer nachgelagerten Einrichtung so geändert, dass die nachgelagerte Einrichtung zum Anbieter des daraus resultierenden KI-Modells mit allgemeinem Verwendungszweck wird [siehe Leitlinien der Kommission zum KI-Modell mit allgemeinem Verwendungszweck ], sollte das Muster nur Informationen über die für die Änderung verwendeten Schulungsinhalte enthalten. Der Name des/der geänderten Modell(e) sollte klar angegeben werden.
Verschiedene Modelle oder Modellversionen können von der gleichen Zusammenfassung abgedeckt werden, wenn der Inhalt ihrer Zusammenfassungen identisch ist. In solchen Fällen sollte klar angegeben werden, für welche Modelle und Modellversionen die Zusammenfassung gilt.
Wenn verschiedene Modelle oder Modellversionen auf einem bestehenden KI-Modell mit allgemeinem Verwendungszweck basieren, das in der Union in Verkehr gebracht wird, und die für die einzelnen Modelle verwendeten Schulungsdaten unterschiedlich sind (wofür separate Zusammenfassungen erforderlich sind), müssen in den Zusammenfassungen nur die speziell für weitere Änderungen oder Feinabstimmungen verwendeten Schulungsdaten berücksichtigt werden. Jede Zusammenfassung sollte für die geänderten Versionen einen eindeutigen Verweis auf das ursprüngliche Modell und die entsprechende Zusammenfassung enthalten.
Die Veröffentlichung einer Zusammenfassung der Schulungsinhalte ist obligatorisch. Wird diese Zusammenfassung nicht vorgelegt, kann das Amt für künstliche Intelligenz ab dem 2. August 2026 Durchsetzungsmaßnahmen ergreifen. Die Nichteinhaltung kann zu Geldbußen von bis zu 3 % des weltweiten Jahresumsatzes des Anbieters im vorangegangenen Geschäftsjahr oder 15 000 000 Euro führen, je nachdem, welcher Betrag höher ist.
Anbieter von Modellen, die bereits vor dem 2. August 2025 in Verkehr gebracht wurden, sollten die erforderlichen Schritte unternehmen, um die entsprechende Zusammenfassung spätestens am 2. August 2027 zur Verfügung zu stellen. Kann ein Anbieter trotz aller Bemühungen Teile der Informationen aufgrund der Nichtverfügbarkeit oder einer unverhältnismäßigen Belastung beim Abrufen der Daten nicht bereitstellen, sollte der Anbieter diese Informationslücken in der Zusammenfassung klar angeben und begründen.
Die Erläuterungen (in allen EU-Amtssprachen) und das Muster ergänzen den Verhaltenskodex und die Leitlinien für KI-Modelle mit allgemeinem Verwendungszweck, indem sie die Einhaltung der Verpflichtung gemäß Artikel 53 Absatz 1 Buchstabe d des KI-Gesetzes für die öffentlichen Zusammenfassungen von Schulungsinhalten erleichtern. Insbesondere ist die Verwendung der Vorlage obligatorisch und dient als alleiniger Leitfaden für die Bereitstellung dieser öffentlichen Zusammenfassungen.
Dagegen ist die Einhaltung des Verhaltenskodex freiwillig und bezieht sich auf andere Verpflichtungen wie die Urheberrechtspolitik, die Anbieter gemäß Artikel 53 Absatz 1 Buchstabe c des KI-Gesetzes einführen müssen. Das Muster und die zugehörige Begründung sind jedoch Teil desselben Pakets, das die Einhaltung der Vorschriften für KI-Modelle mit allgemeinem Verwendungszweck erleichtern soll. Daher werden Anbieter und Interessenträger aufgefordert, alle diese Ressourcen parallel zu betrachten.
Related content

Die Kommission hat Leitlinien herausgegeben, um den Umfang der Verpflichtungen für Anbieter von KI-Modellen mit allgemeinem Verwendungszweck im Rahmen des KI-Gesetzes zu präzisieren. Diese Verpflichtungen traten am 2. August 2025 in Kraft.