Üldised korduma kippuvad küsimused
Kõik üldotstarbeliste tehisintellektimudelite pakkujad peavad avaldama kokkuvõtte sisust, mida kasutatakse nende mudelite treenimiseks, tuginedes komisjoni esitatud vormile. Käesoleva avaliku kokkuvõtte eesmärk on suurendada mudeli koolitusandmete läbipaistvust ja aidata õigustatud huvidega isikutel, näiteks autoriõiguse omajatel, kasutada oma liidu õigusest tulenevaid õigusi. Vormis kirjeldatakse avaliku kokkuvõtte nõutavat sisu ja sellele lisatud selgitusi, et aidata teenuseosutajatel oma kohustusi täita.
Vormloodi sisendina mitme sidusrühmaga konsulteerimisestüldotstarbeliste tehisintellektimudelite kohta, mille korraldas tehisintellektiamet 30. juulist kuni 18. septembrini 2024. Selle aja jooksul saadi mitmesugustelt sidusrühmadelt üle 430 vastuse. Seda sisendit kasutades koostas tehisintellektiamet esialgse lähenemisviisi vormile ja võimaldasüldotstarbelist tehisintellekti käsitleva tegevusjuhendi väljatöötamises osalejatel anda täiendavat kirjalikku tagasisidet. Vormi praegune versioon kajastab ka 111 sidusrühmalt, sealhulgas üldotstarbeliste tehisintellektimudelite pakkujatelt, ettevõtjate ühendustelt, õiguste omajate organisatsioonidelt, akadeemilistelt ringkondadelt, kodanikuühiskonnalt ja avaliku sektori asutustelt saadud märkusi. Vormi kavandit tutvustati ja arutati ka tehisintellektinõukogu üldotstarbelise tehisintellekti juhtrühmaga ja Euroopa Parlamendi (IMCO-LIBE-komisjoni) tehisintellekti töörühmaga.
Tehisintellekti käsitleva õigusakti artikli 53 lõike 1 punkti d kohaselton vormikasutamine kohustuslik. See võimaldab teenuseosutajatel täita oma läbipaistvusnõudeid lihtsal, järjepideval ja tõhusal viisil, minimeerides samal ajal halduskoormust ainult sellega, mis on vajalik kokkuvõtte eesmärgi täitmiseks.
Kõik üldotstarbeliste tehisintellektimudelite, sealhulgas süsteemsete riskidega mudelite pakkujad, kes lasevad selliseid mudeleid liidu turule, peavad avaldama vastavad kokkuvõtted. See nõue kehtib ka tasuta ja avatud lähtekoodiga litsentside alusel välja antud mudelite pakkujate suhtes.
Kokkuvõtte avaldamise kohustust hakatakse kohaldama alates 2. augustist 2025. Enne seda kuupäeva turule lastud mudelite puhul peaksid pakkujad võtma vajalikud meetmed, et teha vastavad kokkuvõtted kättesaadavaks hiljemalt 2. augustiks 2027.
Kui enne 2. augustit 2025 turule lastud mudeli pakkuja ei saa hoolimata parimatest jõupingutustest esitada teatavat kokkuvõtte jaoks vajalikku teavet, sest teave ei ole kättesaadav või selle otsimine põhjustaks ebaproportsionaalset koormust, peaks pakkuja need teabelüngad avaldatud kokkuvõttes selgelt välja tooma ja neid põhjendama.
Üldotstarbelisi tehisintellektimudeleid treenitakse suurte andmehulkadega, kuid nende päritolu kohta on vähe teavet. Vorm ja selle kokkuvõtted sisaldavad olulisi üksikasju koolitusandmete kohta, suurendades läbipaistvust. Selline suurem läbipaistvus võimaldab õigustatud huvidega pooltel kasutada oma liidu õigusest tulenevaid õigusi. Need võivad viidata autoriõigusele, sellega kaasnevatele õigustele ja muudele intellektuaalomandi õigustele, samuti muudele liidu õigusega kaitstud õigustele, nagu andmekaitse, tarbijakaitse, mittediskrimineerimine ja teadusvabadus.
Vormiga püütakse saavutada tasakaal õigustatud huvidega isikute huvide teenimise ja koolitussisu sisulise läbipaistvuse edendamise vahel, austades samal ajal kõigi asjaomaste isikute õigusi, võttes eelkõige arvesse vajadust kaitsta ärisaladusi ja konfidentsiaalset äriteavet. Otsus selle kohta, millised üksikasjad tuleks avalikustada, on komisjoni hoolika tasakaalustamise tulemus ning vorm nõuab olenevalt andmeallikast eri üksikasjalikkust, et kaitsta teenuseosutajate ärisaladusi.
Vormis on esitatud ühtne lähtealus teabe avalikustamiseks kokkuvõttes, mis koosneb kolmest peamisest jaost:
- Üldteave: See osa sisaldab üksikasju pakkuja ja mudeli kohta, teavet koolitussisu liikide kohta (nt tekst, video, heli, suurus meetodi kohta laias vahemikus ja koolitusandmete üldised omadused).
- Andmeallikate loetelu: Selles jaos nõutakse teabe avalikustamist mitmesuguste andmeallikate kohta, nagu avalikult kättesaadavad andmestikud, eraandmestikud, veebiallikatest kraapitud andmed, kasutajaandmed ja sünteetilised andmed. Üksikasjalikumad nõuded iga allikaliigi kohta on esitatud vormil.
- Asjakohased andmetöötlusaspektid: Selles jaos nõutakse teavet teatavate andmetöötlusaspektide kohta, mis on olulised selliste isikute õiguste kasutamiseks, kellel on liidu õiguse alusel õigustatud huvid, näiteks autoriõigus, ning see sisaldab üksikasju ebaseadusliku sisu eemaldamise kohta.
Iga osa võimaldab teenuseosutajatel anda vabatahtlikkuse alusel lisateavet.
Koolitusandmete läbipaistvus aitab õiguste omajatel saada asjakohast teavet üldotstarbeliste tehisintellektimudelite treenimisel kasutatava sisu kohta. Vormi kokkuvõttes esitatud teave võimaldab õiguste omajatel konkreetselt paremini hinnata, milliseid andmeviise ja sisu liiki kasutati ning mil määralon järgitud digitaalse ühtse turu direktiivissätestatud seadusliku teksti- ja andmekaeve tingimusi.
Samuti saavad nad nii avaliku kui ka erasektori andmekogumite üksikasjaliku kirjelduse, kõigi suurte avalikult kättesaadavate andmekogumite loetelu ja üksikasjaliku teabe veebiallikatest eemaldatud andmete kohta. See hõlmab kasutatud roomikute nimesid, kogumisperioodi, kraapitud sisu põhjalikku üksikasjalikku kirjeldust ja loetelu 10 % kõigist internetist kraapitud domeenidest (VKEde puhul 5 % või 1000, olenevalt sellest, kumb on väiksem).
Vormis nõutakse ka, et pakkujad avalikustaksid, kas nende mudelit on koolitatud andmete põhjal, mis on kogutud kasutajate suhtluses kõigi nende teenuste ja toodetega, sealhulgas suhtluses nende tehisintellektimudelitega.
Sellega seoses nõutakse mallis kasutajaandmete üksikasjade ning seotud teenuste ja toodete kirjelduse avalikustamist, kuid ei nõuta isikuandmete avalikustamist.
Lisateavet selle kohta, kuidas teenuseosutajad kasutavad isikuandmeid koolitustegevuses, leiab nende vastavatest isikuandmete kaitse põhimõtetest.
Kokkuvõte tuleb teha üldsusele kättesaadavaks hiljemalt mudeli liidu turule laskmisel. See tuleks avaldada teenuseosutaja ametlikul veebisaidil selgelt nähtaval ja kättesaadaval viisil, selgitades, millist mudelit (milliseid mudeleid) (ja võib-olla ka mudeliversiooni (mudelversioone)) kokkuvõte hõlmab. Kokkuvõte tuleks koos mudeliga teha avalikult kättesaadavaks kõigis selle avalikes turustuskanalites, näiteks veebiplatvormidel.
Jah, kokkuvõtet tuleks ajakohastada, kui teenuseosutaja on täiendavalt koolitanud lisaandmete mudelit, mis nõuab kokkuvõtte sisu ajakohastamist. Kokkuvõtet tuleks ajakohastada iga kuue kuu järel või varem, kui täiendusõppeks kasutatavad uued andmed nõuavad kokkuvõtte sisu olulist ajakohastamist, olenevalt sellest, kumb sündmus toimub varem. Sellistel juhtudel peaks kokkuvõte kajastama täiendavaid koolitusandmeid ja sisaldama ajakohastamise kuupäeva. Ajakohastatud kokkuvõte tuleks teha üldsusele kättesaadavaks paralleelselt muudetud mudeliga.
Kui tootmisahela järgmise etapi üksus muudab juba liidu turule lastud üldotstarbelist tehisintellektimudelit nii, et sellest tuleneva üldotstarbelise tehisintellektimudeli pakkujaks saab tootmisahela järgmise etapi üksus [vt komisjoni suunised üldotstarbelise tehisintellektimudeli kohta],peaks vorm sisaldama üksnes teavet muutmisel kasutatud koolitussisu kohta. Muudetud mudeli(te) nimetus(ed) tuleks selgelt avalikustada.
Sama kokkuvõte võib hõlmata eri mudeleid või mudeliversioone, kui nende kokkuvõtete sisu on identne. Sellistel juhtudel tuleks selgelt täpsustada, milliste mudelite ja näidisversioonide suhtes kokkuvõtet kohaldatakse.
Kui eri mudelid või mudeliversioonid põhinevad olemasoleval üldotstarbelisel tehisintellektimudelil, mis on liidu turule lastud, ja iga mudeli puhul kasutatavad treenimisandmed on erinevad (seega on vaja eraldi kokkuvõtteid), tuleb kokkuvõtetes käsitleda ainult treenimisandmeid, mida kasutatakse konkreetselt edasiseks muutmiseks või viimistlemiseks. Muudetud versioonide igasse kokkuvõttesse tuleks lisada selge viide algsele mudelile ja selle vastavale kokkuvõttele.
Koolituse sisu kokkuvõtte avaldamine on kohustuslik. Kui seda kokkuvõtet ei esitata, võib tehisintellektiamet võtta alates 2. augustist 2026 täitemeetmeid. Mittevastavuse korral võidakse määrata trahv, mille suurus on kuni 3 % teenuseosutaja eelmise majandusaasta ülemaailmsest aastasest kogukäibest või 15 000 000 eurot, olenevalt sellest, kumb summa on suurem.
Enne 2. augustit 2025 turule lastud mudelite pakkujad peaksid võtma vajalikud meetmed, et teha vastav kokkuvõte kättesaadavaks hiljemalt 2. augustiks 2027. Kui teenuseosutaja ei saa hoolimata parimatest jõupingutustest esitada osa teabest andmete kättesaamatuse või ebaproportsionaalse koormuse tõttu andmete hankimisel, peaks teenuseosutaja need teabelüngad kokkuvõttes selgelt välja tooma ja neid põhjendama.
Selgitav märkus ja vorm täiendavadtegevusjuhendit jaüldotstarbelisi tehisintellektimudeleid käsitlevaid suuniseid, hõlbustades tehisintellektimääruse artikli 53 lõike 1 punktis d sätestatud kohustuse täitmist treenitava sisu avalike kokkuvõtete puhul. Eelkõige on vormi kasutamine kohustuslik ja see on ainus juhend nende avalike kokkuvõtete esitamiseks.
Tegevusjuhendi järgimine on seevastu vabatahtlik ja hõlmab muid kohustusi, näiteks autoriõiguse poliitikat, mille pakkujad peavad tehisintellekti käsitleva õigusakti artikli 53 lõike 1 punkti c alusel kehtestama. Vorm ja sellega seotud selgitav märkus on aga osa samast paketist, mille eesmärk on hõlbustada üldotstarbelisi tehisintellektimudeleid käsitlevate eeskirjade järgimist. Seepärast julgustatakse teenuseosutajaid ja sidusrühmi kaaluma kõiki neid ressursse paralleelselt.
Related content
Komisjon on välja andnud suunised, et selgitada tehisintellektimääruse kohaste üldotstarbeliste tehisintellektimudelite pakkujate kohustuste ulatust. Neid kohustusi hakatakse kohaldama 2. augustil 2025.