Ogólne pytania i odpowiedzi
Wszyscy dostawcy modeli AI ogólnego przeznaczenia są zobowiązani do publikowania podsumowania treści wykorzystywanych do trenowania swoich modeli na podstawie wzoru dostarczonego przez Komisję. Niniejsze publiczne streszczenie ma na celu zwiększenie przejrzystości danych szkoleniowych modelu i pomoc stronom mającym uzasadnione interesy, takim jak właściciele praw autorskich, w korzystaniu z praw przysługujących im na mocy prawa Unii. We wzorze przedstawiono wymaganą treść publicznego podsumowania wraz z towarzyszącymi mu wyjaśnieniami, aby pomóc dostawcom w wypełnianiu ich obowiązków.
Szablon został stworzony na podstawie wyników konsultacji z udziałem wielu zainteresowanych stron na temat modeli AI ogólnego przeznaczenia, zorganizowanych przez Urząd ds. AI w dniach 30 lipca – 18 września 2024 r. W tym okresie otrzymano ponad 430 odpowiedzi od szerokiego grona zainteresowanych stron. Korzystając z tych informacji, Urząd ds. Sztucznej Inteligencji opracował wstępne podejście do szablonu i umożliwił uczestnikom zaangażowanym w opracowywanie kodeksu postępowania w zakresie sztucznej inteligencji ogólnego przeznaczenia przekazanie dodatkowych pisemnych informacji zwrotnych. Obecna wersja wzoru odzwierciedla również uwagi otrzymane od 111 zainteresowanych stron, w tym dostawców modeli AI ogólnego przeznaczenia, stowarzyszeń przedsiębiorców, organizacji posiadaczy praw, środowisk akademickich, społeczeństwa obywatelskiego i organów publicznych. Projekt wzoru został również przedstawiony i omówiony z podgrupą sterującą Rady ds. AI ds. AI ogólnego przeznaczenia oraz z grupą roboczą Parlamentu Europejskiego (komisje IMCO-LIBE) ds. AI.
Zgodnie z art. 53 ust. 1 lit. d) aktu w sprawie sztucznej inteligencji stosowanie szablonu jest obowiązkowe. Umożliwia to dostawcom spełnienie wymogów przejrzystości w prosty, spójny i skuteczny sposób, przy jednoczesnym zminimalizowaniu obciążenia administracyjnego jedynie do tego, co jest niezbędne do osiągnięcia celu podsumowania.
Każdy dostawca modeli AI ogólnego przeznaczenia, w tym modeli wiążących się z ryzykiem systemowym, który wprowadza takie modele do obrotu w Unii, jest zobowiązany do publikowania odpowiednich streszczeń. Wymóg ten ma również zastosowanie do dostawców modeli udostępnianych na wolnych i otwartych licencjach.
Obowiązek publikacji podsumowania zacznie obowiązywać od dnia 2 sierpnia 2025 r. W przypadku modeli wprowadzonych do obrotu przed tą datą dostawcy powinni podjąć niezbędne kroki w celu udostępnienia odpowiednich streszczeń nie później niż dnia 2 sierpnia 2027 r.
Jeżeli dostawca modelu wprowadzonego do obrotu przed dniem 2 sierpnia 2025 r. nie może, pomimo dołożenia wszelkich starań, dostarczyć niektórych informacji wymaganych do sporządzenia podsumowania, ponieważ informacje te są niedostępne lub ich pobranie stanowiłoby nieproporcjonalne obciążenie, dostawca powinien wyraźnie wskazać i uzasadnić te luki informacyjne w opublikowanym podsumowaniu.
Modele AI ogólnego przeznaczenia są trenowane z dużą ilością danych, ale dostępne są tylko ograniczone informacje na temat ich pochodzenia. Wzór i wynikające z niego podsumowania zawierają kluczowe informacje na temat danych treningowych, zwiększając przejrzystość. Zwiększona przejrzystość umożliwia stronom mającym uzasadniony interes korzystanie z praw przysługujących im na mocy prawa Unii. Mogą one odnosić się do prawa autorskiego, praw pokrewnych i innych praw własności intelektualnej, a także innych praw chronionych na mocy prawa Unii, takich jak ochrona danych, ochrona konsumentów, niedyskryminacja i wolność nauki.
Wzór ma na celu znalezienie równowagi między służeniem interesom stron mających uzasadniony interes a promowaniem znaczącej przejrzystości treści szkoleniowych przy jednoczesnym poszanowaniu praw wszystkich zainteresowanych stron, w szczególności z uwzględnieniem potrzeby ochrony tajemnic przedsiębiorstwa i poufnych informacji handlowych. Decyzja o tym, które szczegóły należy ujawnić, była wynikiem starannego wyważenia przeprowadzonego przez Komisję, a wzór wymaga różnych poziomów szczegółowości w zależności od źródła danych w celu ochrony tajemnic przedsiębiorstwa dostawców.
Wzór zapewnia jednolity punkt odniesienia dla informacji, które mają być podawane do wiadomości publicznej w podsumowaniu, składający się z trzech głównych sekcji:
- Informacje ogólne: Ta sekcja zawiera szczegółowe informacje identyfikujące dostawcę i model, informacje na temat rodzajów treści szkoleniowych (np. tekst, wideo, audio, rozmiar według modalności w szerokim zakresie oraz ogólne cechy danych szkoleniowych.
- Lista źródeł danych: Ta sekcja wymaga ujawnienia informacji o różnych źródłach danych, takich jak publicznie dostępne zbiory danych, prywatne zbiory danych, dane zeskrobane ze źródeł internetowych, dane użytkowników i dane syntetyczne. Bardziej szczegółowe wymagania dla każdego rodzaju źródła przedstawiono w szablonie.
- Odpowiednie aspekty przetwarzania danych: W tej sekcji wymaga się informacji na temat niektórych aspektów przetwarzania danych istotnych dla wykonywania praw stron mających uzasadnione interesy na mocy prawa Unii, takich jak prawo autorskie, oraz zawiera szczegółowe informacje na temat usuwania nielegalnych treści.
Każda sekcja umożliwia dostawcom podanie dodatkowych informacji na zasadzie dobrowolności.
Przejrzystość danych treningowych pomoże podmiotom praw w uzyskaniu odpowiednich informacji na temat treści wykorzystywanych do szkolenia modeli AI ogólnego przeznaczenia. Informacje przekazane za pośrednictwem streszczenia wzoru umożliwią w szczególności podmiotom praw lepszą ocenę, jakie metody przetwarzania danych i rodzaj treści zostały wykorzystane oraz w jakim stopniu spełniono warunki legalnej eksploracji tekstów i danych przewidziane w dyrektywie w sprawie praw autorskich na jednolitym rynku cyfrowym.
Otrzymają również szczegółowe opisy zarówno publicznych, jak i prywatnych zbiorów danych, wykaz wszystkich dużych publicznie dostępnych zbiorów danych oraz szczegółowe informacje dotyczące danych pozyskanych ze źródeł internetowych. Obejmuje to nazwy używanych robotów gąsienicowych, okres zbierania, wyczerpujący szczegółowy opis zeskrobanych treści oraz listę 10 % wszystkich domen, które zostały zeskrobane z internetu (w przypadku MŚP 5 % lub 1000, w zależności od tego, która z tych wartości jest niższa).
W szablonie zobowiązano również dostawców do ujawniania, czy ich model został przeszkolony na podstawie danych zgromadzonych w wyniku interakcji użytkowników ze wszystkimi ich usługami i produktami, w tym interakcji z ich modelami sztucznej inteligencji.
W tym kontekście wzór wymaga ujawnienia zasad dotyczących danych użytkownika oraz opisu powiązanych usług i produktów, przy czym nie wymaga ujawnienia żadnych danych osobowych.
Dalsze szczegóły dotyczące wykorzystywania danych osobowych przez dostawców do działań szkoleniowych można znaleźć w ich odpowiednich oświadczeniach o ochronie prywatności.
Streszczenie musi zostać podane do wiadomości publicznej nie później niż w momencie wprowadzenia modelu do obrotu w Unii. Należy je opublikować na oficjalnej stronie internetowej dostawcy w sposób wyraźnie widoczny i dostępny, wyjaśniając, który(-e) model(-y) (i ewentualnie model(-y)) jest (są) objęty(-e) podsumowaniem. Streszczenie powinno być również udostępniane publicznie wraz z modelem we wszystkich publicznych kanałach dystrybucji, takich jak platformy internetowe.
Tak, podsumowanie należy zaktualizować, jeżeli dostawca dodatkowo przeszkolił model w zakresie dodatkowych danych, co wymaga aktualizacji treści podsumowania. Podsumowanie należy aktualizować co sześć miesięcy lub wcześniej, jeżeli nowe dane wykorzystane do dalszego szkolenia wymagają istotnej aktualizacji treści podsumowania, w zależności od tego, które zdarzenie nastąpi wcześniej. W takich przypadkach podsumowanie powinno odzwierciedlać dodatkowe dane szkoleniowe i zawierać datę aktualizacji. Zaktualizowane podsumowanie powinno być podawane do wiadomości publicznej równolegle ze zmienionym modelem.
W przypadku gdy model AI ogólnego przeznaczenia już wprowadzony do obrotu w Unii jest modyfikowany przez podmiot niższego szczebla w taki sposób, że podmiot niższego szczebla staje się dostawcą powstałego w ten sposób modelu AI ogólnego przeznaczenia [zob. wytyczne Komisji dotyczące modelu AI ogólnego przeznaczenia], wzór powinien zawierać wyłącznie informacje na temat treści szkoleniowych wykorzystanych do modyfikacji. Należy wyraźnie ujawnić nazwę zmodyfikowanego(-ych) modelu(-ów).
Różne modele lub wersje modeli mogą być objęte tym samym podsumowaniem, jeżeli treść ich streszczeń jest identyczna. W takich przypadkach należy jasno określić, do których modeli i wersji modeli ma zastosowanie streszczenie.
Jeżeli różne modele lub wersje modeli opierają się na istniejącym modelu sztucznej inteligencji ogólnego przeznaczenia wprowadzonym do obrotu w Unii, a dane treningowe wykorzystywane w odniesieniu do każdego z nich są różne (co wymaga oddzielnych streszczeń), w podsumowaniach należy jedynie odnieść się do danych treningowych wykorzystywanych specjalnie do dalszej modyfikacji lub dopracowania. W każdym streszczeniu zmienionych wersji należy zawrzeć wyraźne odniesienie do pierwotnego modelu i odpowiadającego mu streszczenia.
Publikacja podsumowania treści szkolenia jest obowiązkowa. Nieprzedstawienie tego streszczenia może prowadzić do podjęcia przez Urząd ds. Sztucznej Inteligencji działań w zakresie egzekwowania prawa od dnia 2 sierpnia 2026 r. Nieprzestrzeganie przepisów może skutkować grzywną w wysokości do 3 % całkowitego rocznego światowego obrotu dostawcy w poprzednim roku obrotowym lub 15 000 000 EUR, w zależności od tego, która z tych kwot jest wyższa.
Dostawcy modeli wprowadzonych już do obrotu przed dniem 2 sierpnia 2025 r. powinni podjąć niezbędne kroki w celu udostępnienia odpowiedniego podsumowania nie później niż dnia 2 sierpnia 2027 r. Jeżeli dostawca, pomimo dołożenia wszelkich starań, nie może dostarczyć części informacji ze względu na niedostępność lub nieproporcjonalne obciążenie związane z odzyskiwaniem danych, powinien wyraźnie wskazać i uzasadnić te luki w informacjach w podsumowaniu.
Zawiadomienie wyjaśniające (we wszystkich językach urzędowych UE) i wzór uzupełniają kodeks postępowania i wytyczne w sprawie modeli AI ogólnego przeznaczenia, ułatwiając wypełnienie obowiązku wynikającego z art. 53 ust. 1 lit. d) aktu w sprawie AI w odniesieniu do publicznych podsumowań treści szkoleniowych. W szczególności stosowanie tego wzoru jest obowiązkowe i służy jako jedyne wytyczne dotyczące przekazywania tych publicznych podsumowań.
Natomiast przestrzeganie kodeksu postępowania jest dobrowolne i dotyczy innych obowiązków, takich jak polityka w zakresie praw autorskich, którą dostawcy muszą wprowadzić na podstawie art. 53 ust. 1 lit. c) aktu w sprawie sztucznej inteligencji. Wzór i powiązane zawiadomienie wyjaśniające stanowią jednak część tego samego pakietu mającego na celu ułatwienie przestrzegania przepisów dotyczących modeli AI ogólnego przeznaczenia. W związku z tym zachęca się dostawców i zainteresowane strony do jednoczesnego rozważenia wszystkich tych zasobów.
Related content

Komisja wydała wytyczne w celu wyjaśnienia zakresu obowiązków spoczywających na dostawcach modeli AI ogólnego przeznaczenia na mocy aktu w sprawie AI. Zobowiązania te weszły w życie w dniu 2 sierpnia 2025 r.