Domande frequenti generali
Tutti i fornitori di modelli di IA per finalità generali sono tenuti a pubblicare una sintesi dei contenuti utilizzati per formare i loro modelli, sulla base di un modello fornito dalla Commissione. La presente sintesi pubblica è intesa ad aumentare la trasparenza dei dati di formazione del modello e ad assistere le parti che hanno interessi legittimi, come i titolari dei diritti d'autore, nell'esercizio dei loro diritti ai sensi del diritto dell'Unione. Il modello delinea il contenuto richiesto per la sintesi pubblica, insieme alle spiegazioni di accompagnamento per aiutare i fornitori ad adempiere ai loro obblighi.
Il modello è stato creato con il contributo di una consultazione multilaterale sui modelli di IA per finalità generali, organizzata dall'Ufficio per l'IA dal 30 luglio al 18 settembre 2024. Durante questo periodo sono pervenute oltre 430 risposte da un'ampia gamma di portatori di interessi. Utilizzando questo contributo, l'Ufficio per l'IA ha elaborato il suo approccio preliminare al modello e ha consentito ai partecipanti coinvolti nello sviluppo del codice di buone pratiche sull'IA per finalità generali di fornire ulteriori riscontri scritti. L'attuale versione del modello riflette anche le osservazioni ricevute da 111 portatori di interessi, compresi i fornitori di modelli di IA per finalità generali, le associazioni di imprese, le organizzazioni dei titolari dei diritti, il mondo accademico, la società civile e le autorità pubbliche. Il progetto di modello è stato inoltre presentato e discusso con il sottogruppo direttivo del comitato per l'IA sull'IA per finalità generali e con il gruppo di lavoro sull'IA del Parlamento europeo (commissioni IMCO-LIBE).
A norma dell'articolo 53, paragrafo 1, lettera d), della legge sull'IA, l'uso del modello è obbligatorio. Consente ai fornitori di soddisfare i loro requisiti di trasparenza in modo semplice, coerente ed efficace, riducendo al minimo gli oneri amministrativi solo a quanto necessario per conseguire l'obiettivo della sintesi.
Qualsiasi fornitore di modelli di IA per finalità generali, compresi quelli con rischi sistemici, che immette tali modelli sul mercato dell'Unione è tenuto a pubblicare le rispettive sintesi. Questo requisito si applica anche ai fornitori di modelli rilasciati con licenze gratuite e open source.
L'obbligo di pubblicare la sintesi diventa applicabile a decorrere dal 2 agosto 2025. Per i modelli immessi sul mercato prima di tale data, i fornitori dovrebbero adottare le misure necessarie per rendere disponibili le sintesi corrispondenti entro il 2 agosto 2027.
Se un fornitore di un modello immesso sul mercato prima del 2 agosto 2025 non può, nonostante i migliori sforzi, fornire determinate informazioni richieste per la sintesi perché le informazioni non sono disponibili o il loro reperimento imporrebbe un onere sproporzionato, il fornitore dovrebbe indicare chiaramente e giustificare tali lacune informative nella sintesi pubblicata.
I modelli di IA per finalità generali sono formati con grandi quantità di dati, ma le informazioni disponibili sulla loro origine sono limitate. Il modello e le sintesi risultanti forniscono dettagli cruciali sui dati di formazione, aumentando la trasparenza. Questa maggiore trasparenza consente alle parti aventi interessi legittimi di esercitare i loro diritti ai sensi del diritto dell'Unione. Tali diritti possono riferirsi al diritto d'autore, ai diritti connessi e ad altri diritti di proprietà intellettuale, nonché ad altri diritti tutelati dal diritto dell'Unione, quali la protezione dei dati, la protezione dei consumatori, la non discriminazione e la libertà scientifica.
Il modello cerca di trovare un equilibrio tra il servire gli interessi delle parti con interessi legittimi e la promozione di una trasparenza significativa dei contenuti della formazione, nel rispetto dei diritti di tutte le parti interessate, in particolare tenendo conto della necessità di proteggere i segreti commerciali e le informazioni commerciali riservate. La decisione su quali dettagli debbano essere divulgati è il risultato di un attento bilanciamento effettuato dalla Commissione e il modello richiede diversi livelli di dettaglio a seconda della fonte dei dati per proteggere i segreti commerciali dei fornitori.
Il modello fornisce una base di riferimento uniforme per le informazioni da rendere pubbliche nella sintesi, costituita da tre sezioni principali:
- Informazioni generali: questa sezione include dettagli che identificano il fornitore e il modello, informazioni sui tipi di contenuti di formazione (ad esempio testo, video, audio, dimensioni per modalità all'interno di ampi intervalli e caratteristiche generali dei dati di formazione.
- Elenco delle fonti di dati: questa sezione richiede la divulgazione di informazioni su varie fonti di dati, come set di dati disponibili al pubblico, set di dati privati, dati raschiati da fonti online, dati degli utenti e dati sintetici. Requisiti più dettagliati per ogni tipo di fonte sono delineati nel Modello.
- Aspetti pertinenti del trattamento dei dati: questa sezione richiede informazioni su determinati aspetti del trattamento dei dati importanti per l'esercizio dei diritti delle parti con interessi legittimi ai sensi del diritto dell'Unione, come il diritto d'autore, e include dettagli sulla rimozione di contenuti illegali.
Ogni sezione consente ai fornitori di fornire informazioni aggiuntive su base volontaria.
La trasparenza dei dati di formazione aiuterà i titolari dei diritti a ottenere informazioni pertinenti sui contenuti utilizzati nella formazione dei modelli di IA per finalità generali. Le informazioni fornite attraverso il modello di sintesi consentiranno specificamente ai titolari dei diritti di valutare meglio quali modalità di dati e tipo di contenuto sono stati utilizzati e in che misura sono state rispettate le condizioni per l'estrazione legale di testo e dati, come previsto dalla direttiva sul diritto d'autore nella direttiva sul mercato unico digitale.
Riceveranno inoltre descrizioni dettagliate dei set di dati pubblici e privati, un elenco di tutti i grandi set di dati disponibili al pubblico e informazioni dettagliate sui dati raschiati da fonti online. Ciò include i nomi dei crawler utilizzati, il periodo di raccolta, una descrizione dettagliata completa del contenuto raschiato e un elenco del 10% di tutti i domini che sono stati raschiati da Internet (per le PMI top 5% o 1000, a seconda di quale sia il più basso).
Il modello impone inoltre ai fornitori di comunicare se il loro modello è stato addestrato sui dati raccolti attraverso le interazioni degli utenti con tutti i loro servizi e prodotti, comprese le interazioni con i loro modelli di IA.
In questo contesto, il Modello richiede la divulgazione delle modalità dei dati dell'utente e una descrizione dei relativi servizi e prodotti, senza richiedere la divulgazione di alcuna informazione personale.
Ulteriori dettagli sull'uso dei dati personali da parte dei fornitori per attività di formazione sono disponibili nelle rispettive informative sulla privacy.
La sintesi deve essere resa pubblica al più tardi al momento dell'immissione di un modello sul mercato dell'Unione. Dovrebbe essere pubblicato sul sito web ufficiale del fornitore in modo chiaramente visibile e accessibile, chiarendo quali modelli (ed eventualmente le versioni dei modelli) sono coperti dalla sintesi. La sintesi dovrebbe inoltre essere resa pubblica insieme al modello in tutti i suoi canali di distribuzione pubblici, come le piattaforme online.
Sì, la sintesi dovrebbe essere aggiornata se un fornitore ha ulteriormente addestrato il modello su dati aggiuntivi che richiedono un aggiornamento del contenuto della sintesi. La sintesi dovrebbe essere aggiornata a intervalli di sei mesi, o prima se i nuovi dati utilizzati per l'ulteriore formazione richiedono un aggiornamento significativo del contenuto della sintesi, a seconda di quale evento si verifichi prima. In tali casi, la sintesi dovrebbe riflettere i dati di formazione aggiuntivi e includere la data dell'aggiornamento. La sintesi aggiornata dovrebbe essere resa pubblica parallelamente al modello modificato.
Quando un modello di IA per finalità generali già immesso sul mercato dell'Unione è modificato da un'entità a valle in modo tale che l'entità a valle diventi il fornitore del modello di IA per finalità generali risultante [cfr. orientamenti della Commissione sul modello di IA per finalità generali], il modello dovrebbe includere solo informazioni sul contenuto di formazione utilizzato per la modifica. Il nome del modello o dei modelli modificati deve essere chiaramente indicato.
Modelli o versioni di modelli diversi possono essere coperti dallo stesso riassunto, se il contenuto dei loro riassunti è identico. In tali casi, dovrebbe specificare chiaramente a quali modelli e versioni del modello si applica la sintesi.
Se modelli o versioni di modelli diversi si basano su un modello di IA per finalità generali esistente immesso sul mercato dell'Unione e i dati di addestramento utilizzati per ciascuno variano (richiedendo quindi sintesi separate), le sintesi devono solo trattare i dati di addestramento specificamente utilizzati per ulteriori modifiche o messa a punto. Un chiaro riferimento al modello originale e alla relativa sintesi dovrebbe essere incluso in ogni sintesi per le versioni modificate.
La pubblicazione di una sintesi dei contenuti formativi è obbligatoria. La mancata presentazione di tale sintesi può comportare azioni esecutive da parte dell'Ufficio per l'IA a partire dal 2 agosto 2026. L'inadempienza può comportare multe fino al 3% del fatturato mondiale totale annuo del fornitore nell'esercizio precedente o fino a 15 000 000 EUR, se superiore.
I fornitori di modelli già immessi sul mercato prima del 2 agosto 2025 dovrebbero adottare le misure necessarie per rendere disponibile la sintesi corrispondente entro il 2 agosto 2027. Se un fornitore, nonostante i migliori sforzi, non è in grado di fornire parti delle informazioni a causa dell'indisponibilità o di un onere sproporzionato nel recupero dei dati, dovrebbe indicare chiaramente e giustificare tali lacune informative nella sintesi.
La comunicazione esplicativa (in tutte le lingue ufficiali dell'UE) e il modello integrano il codice di buone pratiche e gli orientamenti sui modelli di IA per finalità generali, agevolando il rispetto dell'obbligo di cui all'articolo 53, paragrafo 1, lettera d), della legge sull'IA per le sintesi pubbliche dei contenuti di formazione. In particolare, l'uso del modello è obbligatorio e funge da unico orientamento per fornire tali sintesi pubbliche.
Per contro, l'adesione al codice di buone pratiche è volontaria e riguarda altri obblighi, come la politica sul diritto d'autore che i fornitori devono attuare a norma dell'articolo 53, paragrafo 1, lettera c), della legge sull'IA. Tuttavia, il modello e la relativa comunicazione esplicativa fanno parte dello stesso pacchetto concepito per facilitare il rispetto delle norme sui modelli di IA per finalità generali. Pertanto, i fornitori e le parti interessate sono incoraggiati a considerare tutte queste risorse in parallelo.
Related content

La Commissione ha pubblicato orientamenti per chiarire la portata degli obblighi per i fornitori di modelli di IA per finalità generali a norma della legge sull'IA. Tali obblighi sono entrati in vigore il 2 agosto 2025.