Általános GYIK
Az általános célú MI-modellek valamennyi szolgáltatójának közzé kell tennie a modelljeik tanításához használt tartalom összefoglalóját a Bizottság által biztosított sablon alapján. Ennek a nyilvános összefoglalónak az a célja, hogy növelje a modell képzési adatainak átláthatóságát, és segítse a jogos érdekkel rendelkező feleket, például a szerzői jogok jogosultjait az uniós jog szerinti jogaik gyakorlásában. A sablon felvázolja a nyilvános összefoglaló szükséges tartalmát, valamint a szolgáltatókat kötelezettségeik teljesítésében segítő kísérő magyarázatokat.
A sablont azMI-hivatal által 2024. július 30. és szeptember 18. között szervezett,az általános célú MI-modellekről szóló, több érdekelt felet tömörítő konzultációalapján hozták létre. Ebben az időszakban több mint 430 válasz érkezett az érdekelt felek széles körétől. E hozzájárulás felhasználásával az MI-hivatal kidolgozta a sablonra vonatkozó előzetes megközelítését, és lehetővé tette azáltalános célú mesterséges intelligenciára vonatkozó gyakorlati kódexkidolgozásában részt vevő résztvevők számára, hogy további írásbeli visszajelzést adjanak. A sablon jelenlegi változata 111 érdekelt féltől, köztük az általános célú MI-modellek szolgáltatóitól, a vállalkozói szövetségektől, a jogtulajdonosok szervezeteitől, a tudományos köröktől, a civil társadalomtól és a hatóságoktól kapott észrevételeket is tükrözi. A sablontervezetet ismertették és megvitatták az MI-testület általános célú mesterséges intelligenciával foglalkozó irányító alcsoportjával és az Európai Parlament (IMCO-LIBE bizottságok) mesterséges intelligenciával foglalkozó munkacsoportjával is.
Amesterséges intelligenciáról szóló jogszabály53. cikke (1) bekezdésének d) pontja értelmében a sablonhasználata kötelező. Lehetővé teszi a szolgáltatók számára, hogy egyszerű, következetes és hatékony módon teljesítsék átláthatósági követelményeiket, miközben az adminisztratív terheket csak az összefoglaló céljának eléréséhez szükséges mértékre csökkenti.
Az általános célú MI-modellek – köztük a rendszerszintű kockázatot jelentő modellek – minden olyan szolgáltatójának, amely ilyen modelleket hoz forgalomba az uniós piacon, közzé kell tennie a vonatkozó összefoglalókat. Ez a követelmény a szabad és nyílt forráskódú licencek alapján kiadott modellek szolgáltatóira is vonatkozik.
Az összefoglaló közzétételére vonatkozó kötelezettség 2025. augusztus 2-tól alkalmazandó. Az ezen időpont előtt forgalomba hozott modellek esetében a szolgáltatóknak meg kell tenniük a szükséges lépéseket annak érdekében, hogy a megfelelő összefoglalókat legkésőbb 2027. augusztus 2-ig rendelkezésre bocsássák.
Ha a 2025. augusztus 2. előtt forgalomba hozott modell szolgáltatója minden erőfeszítés ellenére sem tud megadni az összefoglalóhoz szükséges bizonyos információkat, mert az információk nem állnak rendelkezésre, vagy azok lekérdezése aránytalan terhet jelentene, a szolgáltatónak a közzétett összefoglalóban egyértelműen meg kell jelölnie és indokolnia kell ezeket az információhiányokat.
Az általános célú MI-modelleket nagy mennyiségű adattal tanítják, de az eredetükre vonatkozóan csak korlátozott információk állnak rendelkezésre. A sablon és az abból származó összefoglalók kulcsfontosságú részleteket nyújtanak a képzési adatokról, növelve az átláthatóságot. Ez a fokozott átláthatóság lehetővé teszi a jogos érdekkel rendelkező felek számára, hogy gyakorolják az uniós jog szerinti jogaikat. Ezek vonatkozhatnak a szerzői jogra, a szomszédos jogokra és más szellemitulajdon-jogokra, valamint az uniós jog által védett egyéb jogokra, például az adatvédelemre, a fogyasztóvédelemre, a megkülönböztetésmentességre és a tudomány szabadságára.
A sablon célja, hogy egyensúlyt teremtsen a jogos érdekekkel rendelkező felek érdekeinek kiszolgálása és a képzési tartalom érdemi átláthatóságának előmozdítása között, tiszteletben tartva valamennyi érintett fél jogait, különös tekintettel az üzleti titkok és a bizalmas üzleti információk védelmének szükségességére. Az arra vonatkozó döntés, hogy mely részleteket kell közzétenni, a Bizottság által végzett gondos mérlegelés eredménye, és a sablon a szolgáltatók üzleti titkainak védelme érdekében az adatforrástól függően eltérő szintű részletességet ír elő.
A sablon egységes kiindulási alapot biztosít az összefoglalóban közzéteendő információkhoz, amely három fő szakaszból áll:
- Általános információk: Ez a szakasz tartalmazza a szolgáltatót és a modellt azonosító részleteket, a képzési tartalom típusaira vonatkozó információkat (pl. szöveg, videó, hang, széles tartományon belüli modalitásonkénti méret, valamint a képzési adatok általános jellemzői).
- Az adatforrások listája: Ez a szakasz a különböző adatforrásokra, például a nyilvánosan elérhető adatkészletekre, a magán adatkészletekre, az online forrásokból lekapart adatokra, a felhasználói adatokra és a szintetikus adatokra vonatkozó információk közzétételét írja elő. Az egyes forrástípusokra vonatkozó részletesebb követelményeket a sablon ismerteti.
- Releváns adatfeldolgozási szempontok: Ez a szakasz az uniós jog alapján jogos érdekkel rendelkező felek jogainak – például a szerzői jognak – a gyakorlása szempontjából fontos bizonyos adatkezelési szempontokra vonatkozó információkat ír elő, és részleteket tartalmaz a jogellenes tartalom eltávolításáról.
Az egyes szakaszok lehetővé teszik a szolgáltatók számára, hogy önkéntes alapon további információkat adjanak meg.
A betanítási adatok átláthatósága segíteni fogja a jogosultakat abban, hogy releváns információkat szerezzenek az általános célú MI-modellek betanítása során használt tartalomról. Az összefoglaló sablonon keresztül megadott információk kifejezetten lehetővé teszik a jogosultak számára annak jobb értékelését, hogy milyen adatmódokat és tartalomtípusokat használtak, és milyen mértékbentartották tiszteletben a jogszerű szöveg- és adatbányászatnak a digitális egységes piacról szóló irányelvbenelőírt feltételeit.
Emellett részletes leírást kapnak mind a nyilvános, mind a magán adatkészletekről, az összes nagy, nyilvánosan elérhető adatkészlet listájáról, valamint részletes információkat kapnak az online forrásokból lekapart adatokról. Ez magában foglalja a használt robotok nevét, a gyűjtés időtartamát, a lekapart tartalom átfogó részletes leírását, valamint az internetről lekapart összes domain felső 10 %-át (kkv-k esetében a felső 5 % vagy 1000, attól függően, hogy melyik az alacsonyabb).
A sablon azt is előírja a szolgáltatók számára, hogy tegyék közzé, hogy modelljüket kiképezték-e az összes szolgáltatásukkal és termékükkel folytatott felhasználói interakciók során gyűjtött adatokra, beleértve az MI-modelljeikkel folytatott interakciókat is.
Ebben az összefüggésben a sablon előírja a felhasználói adatok módozatainak, valamint a kapcsolódó szolgáltatások és termékek leírásának közzétételét, ugyanakkor nem írja elő személyes adatok közzétételét.
A személyes adatok szolgáltatók általi, képzési tevékenységekhez való felhasználásával kapcsolatos további részletek a vonatkozó adatvédelmi nyilatkozatokban találhatók.
Az összefoglalót legkésőbb a modell uniós piacon történő forgalomba hozatalakor nyilvánosan hozzáférhetővé kell tenni. Az összefoglalót jól látható és hozzáférhető módon közzé kell tenni a szolgáltató hivatalos honlapján, egyértelművé téve, hogy az összefoglaló mely modell(ek)re (és esetleg modellverzió(k)ra) terjed ki. Az összefoglalót a modell mellett valamennyi nyilvános terjesztési csatornáján, például az online platformokon is nyilvánosan hozzáférhetővé kell tenni.
Igen, az összefoglalót frissíteni kell, ha a szolgáltató további képzésben részesítette a modellt olyan további adatokkal kapcsolatban, amelyek szükségessé teszik az összefoglaló tartalmának frissítését. Az összefoglalót hathavonta frissíteni kell, vagy korábban, ha a továbbképzéshez használt új adatok az összefoglaló tartalmának lényeges frissítését teszik szükségessé, attól függően, hogy melyik esemény következik be hamarabb. Ilyen esetekben az összefoglalónak tükröznie kell a kiegészítő képzési adatokat, és tartalmaznia kell a frissítés dátumát. Az aktualizált összefoglalót a módosított modellel párhuzamosan nyilvánosan hozzáférhetővé kell tenni.
Amennyiben egy, az uniós piacon már forgalomba hozott általános célú MI-modellt egy downstream szervezet oly módon módosít, hogy a downstream szervezet lesz a létrejövő általános célú MI-modell szolgáltatója [lásd azáltalános célúMI-modellről szóló bizottsági iránymutatást], a sablonnak csak a módosításhoz használt képzési tartalomra vonatkozó információkat kell tartalmaznia. A módosított modell(ek) nevét egyértelműen fel kell tüntetni.
Ugyanaz az összefoglaló vonatkozhat különböző modellekre vagy modellverziókra, ha összefoglalóik tartalma azonos. Ilyen esetekben egyértelműen meg kell határoznia, hogy az összefoglaló mely modellekre és modellverziókra vonatkozik.
Ha a különböző modellek vagy modellverziók az uniós piacon forgalomba hozott, meglévő általános célú MI-modellen alapulnak, és az egyes modellekhez használt betanítási adatok eltérőek (tehát külön összefoglalókat igényelnek), az összefoglalóknak csak a kifejezetten a további módosításhoz vagy finomhangoláshoz használt betanítási adatokkal kell foglalkozniuk. A módosított változatok minden egyes összefoglalásában egyértelműen hivatkozni kell az eredeti modellre és annak összefoglalására.
A képzési tartalom összefoglalójának közzététele kötelező. Ezen összefoglaló benyújtásának elmulasztása 2026. augusztus 2-tól végrehajtási intézkedéseket vonhat maga után az MI-hivatal részéről. A meg nem felelés a szolgáltató előző pénzügyi évi teljes éves világméretű forgalmának legfeljebb 3%-át vagy 15 000 000 EUR-t (amelyik magasabb) kitevő pénzbírságot vonhat maga után.
A 2025. augusztus 2. előtt már forgalomba hozott modellek szolgáltatóinak meg kell tenniük a szükséges lépéseket annak érdekében, hogy a vonatkozó összefoglalót legkésőbb 2027. augusztus 2-ig rendelkezésre bocsássák. Ha a szolgáltató minden erőfeszítés ellenére nem tudja megadni az információk egy részét az adatok elérhetetlensége vagy az adatok lekérdezésével kapcsolatos aránytalan teher miatt, a szolgáltatónak az összefoglalóban egyértelműen meg kell jelölnie és indokolnia kell ezeket az információs hiányosságokat.
A magyarázó közlemény és a sablon kiegészíti a gyakorlati kódexet és az általános célú MI-modellekre vonatkozó iránymutatásokat azáltal,hogy megkönnyíti a mesterséges intelligenciáról szóló jogszabály 53. cikke (1) bekezdésének d) pontja szerinti kötelezettségnek való megfelelésta képzési tartalmak nyilvános összefoglalói tekintetében. Nevezetesen a sablon használata kötelező, és az egyedüli iránymutatásként szolgál e nyilvános összefoglalók elkészítéséhez.
Ezzel szemben a gyakorlati kódex betartása önkéntes, és más kötelezettségekre is kiterjed, például a szolgáltatók által a mesterséges intelligenciáról szóló törvény 53. cikke (1) bekezdésének c) pontja alapján bevezetendő szerzői jogi politikára. A sablon és a kapcsolódó magyarázó közlemény azonban ugyanannak a csomagnak a részét képezi, amelynek célja az általános célú MI-modellekre vonatkozó szabályoknak való megfelelés megkönnyítése. Ezért a szolgáltatókat és az érdekelt feleket arra ösztönzik, hogy mindezeket az erőforrásokat párhuzamosan vegyék figyelembe.
Related content
A Bizottság iránymutatásokat adott ki az általános célú MI-modellek szolgáltatóira vonatkozó, a mesterséges intelligenciáról szóló jogszabály szerinti kötelezettségek hatályának tisztázása érdekében. Ezek a kötelezettségek 2025. augusztus 2-án lépnek hatályba.