Copyright: 3 autori denunciano OpenAI e Meta

I modelli generativi come GPT (Generative Pre-trained Transformer) vengono addestrati utilizzando grandi dataset di informazioni che permettono di migliorarne la capacità di restituire risposte accurate e le abilità linguistiche. In alcuni casi però non è possibile controllare con attenzione la natura e le fonti dei dati impiegati per il training.

In alcuni casi tali informazioni vengono raccolte direttamente su Internet tramite una procedura denominata scraping che simula la navigazione umana ma viene effettuata in modo del tutto automatico. Può così accedere che tra i dati elaborati vi siano anche contenuti protetti da copyright e che questi ultimi vengano utilizzati nella restituzione degli output.

Ecco le ragioni per cui nelle scorse ore gli avvocati degli scrittori Christopher Golden, Richard Kadrey e della comedian Sarah Silverman avrebbero presentato una denuncia contro OpenAI e Meta che, secondo le accuse, avrebbero addestrato i modelli generativi GPT e LLaMA (Large Language Model Meta AI) utilizzando anche opere tutelate da diritto d'autore.

Nello specifico si tratterebbe di contenuti che sono disponibili online per la consultazione ma non per questo possono essere utilizzati altrove, ad esempio nelle risposte di un chatbot come ChatGPT, senza la necessaria autorizzazione. Per sostenere le proprie ragioni, gli autori avrebbero presentato degli output in cui verrebbero ripresi brani delle proprie opere.

Nel caso specifico si tratterebbe di riassunti dove però non tutti i contenuti apparirebbero del tutto originali. Ritenendosi danneggiati, gli scrittori avrebbero quindi richiesto il risarcimento dei danni, il rimborso delle spese legali sostenute e l'avvio di una class action che impedisca alle aziende che implementano i modelli generativi di guadagnare da proprietà altrui.