riproduzione – Lorenzo Albertini

E’ reperibile in rete (ad es qui) la citazione in giuidizio avanti il South. Dist. di New Yoerk contro Open AI per vioalzione di copyright proposta dalla importante Autorhs Guild e altri (tra cui scrittori notissimi) .

L’allenamento della sua AI infatti pare determini riproduzione e quindi (in assenza di eccezione/controdiritto) violazione.

Nel diritto UE l’art. 4 della dir 790/2019 presuppone il diritto di accesso all’opera per invocare l’eccezione commerciale di text and data mining:

<< 1. Gli Stati membri dispongono un’eccezione o una limitazione ai diritti di cui all’articolo 5, lettera a), e all’articolo 7, paragrafo 1, della direttiva 96/9/CE, all’articolo 2 della direttiva 2001/29/CE, all’articolo 4, paragrafo 1, lettere a) e b), della direttiva 2009/24/CE e all’articolo 15, paragrafo 1, della presente direttiva per le riproduzioni e le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso ai fini dell’estrazione di testo e di dati.

2. Le riproduzioni e le estrazioni effettuate a norma del paragrafo 1 possono essere conservate per il tempo necessario ai fini dell’estrazione di testo e di dati.

3. L’eccezione o la limitazione di cui al paragrafo 1 si applica a condizione che l’utilizzo delle opere e di altri materiali di cui a tale paragrafo non sia stato espressamente riservato dai titolari dei diritti in modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online.

4. Il presente articolo non pregiudica l’applicazione dell’articolo 3 della presente direttiva>>.

Il passaggio centrale (sul se ricorra vioalzione nel diritto usa) nella predetta citazione sta nei §§ 51-64:

<<51. The terms “artificial intelligence” or “AI” refer generally to computer systems designed to imitate human cognitive functions.
52. The terms “generative artificial intelligence” or “generative AI” refer specifically to systems that are capable of generating “new” content in response to user inputs called “prompts.”
53. For example, the user of a generative AI system capable of generating images
from text prompts might input the prompt, “A lawyer working at her desk.” The system would then attempt to construct the prompted image. Similarly, the user of a generative AI system capable of generating text from text prompts might input the prompt, “Tell me a story about a lawyer working at her desk.” The system would then attempt to generate the prompted text.
54. Recent generative AI systems designed to recognize input text and generate
output text are built on “large language models” or “LLMs.”
55. LLMs use predictive algorithms that are designed to detect statistical patterns in the text datasets on which they are “trained” and, on the basis of these patterns, generate responses to user prompts. “Training” an LLM refers to the process by which the parameters that define an LLM’s behavior are adjusted through the LLM’s ingestion and analysis of large
“training” datasets.
56. Once “trained,” the LLM analyzes the relationships among words in an input
prompt and generates a response that is an approximation of similar relationships among words in the LLM’s “training” data. In this way, LLMs can be capable of generating sentences, p aragraphs, and even complete texts, from cover letters to novels.
57. “Training” an LLM requires supplying the LLM with large amounts of text for
the LLM to ingest—the more text, the better. That is, in part, the large in large language model.
58. As the U.S. Patent and Trademark Office has observed, LLM “training” “almost
by definition involve[s] the reproduction of entire works or substantial portions thereof.”4
59. “Training” in this context is therefore a technical-sounding euphemism for
“copying and ingesting.”
60. The quality of the LLM (that is, its capacity to generate human-seeming responses
to prompts) is dependent on the quality of the datasets used to “train” the LLM.
61. Professionally authored, edited, and published books—such as those authored by Plaintiffs here—are an especially important source of LLM “training” data.
62. As one group of AI researchers (not affiliated with Defendants) has observed,
“[b]ooks are a rich source of both fine-grained information, how a character, an object or a scene looks like, as well as high-level semantics, what someone is thinking, feeling and how these states evolve through a story.”5
63. In other words, books are the high-quality materials Defendants want, need, and have therefore outright pilfered to develop generative AI products that produce high-quality results: text that appears to have been written by a human writer.
64. This use is highly commercial>>

Una recente sentenza della Corte del SOUTHERN DISTRICT OF NEW YORK del 13 aprile 2020, giudice Kimba M. Wood, affronta la questione del se sia possibile riprodurre una fotografia presente nel profilo pubblico altrui in Instagram. Vedi l’articolo in hollywoodreporter.com , ove il link al testo della sentenza su Scribd.

Nel caso specifico si trattava della fotografia <<Child, bride, mother/Child marriage in Guatemala>> della fotografa Stephanie Sinclair, a cui era interessata la ditta Mashable Inc.

Mashable aveva dapprima chiesto in licenza l’uso della fotografia proponendo euro 50, per pubblicarla sul proprio sito in relazione ad un articolo sulle donne fotografo.

Sinclair aveva però rifiutato ed allora Mashable aveva pubblicato ugualmente la fotografia sul proprio sito con la tecnica dell’embedding. Quest’ultima fa sì che il navigatore veda l’immagine in un certo sito, senza accorgersi che proviene però da un altro sito: cioè l’embedding la incorpora in un certo sito, anche se però fisicamente il relativo file si trova in un sito diverso.

A questo punto Sinclair agisce nei confronti di Mashable, ma la domanda viene respinta dalla corte di New york

il motivo è presto detto. Secondo le condizioni contrattuali proposte/imposte da Instagram, chi opta per l’account in modalità <pubblica> cede svariati diritti a Instagram tra cui quello di concedere a terzi sublicenza purchè usino l’API (-Application Programming Interface) predisposta da Instagram: <<The Terms of Use state that, by posting content to Instagram, the user “grant[s] to Instagram a non-exclusive, fully paid and royalty-free, transferable, sub-licensable, worldwide license to the Content that you post on or through [Instagram], subject to [Instagram’s] Privacy Policy.” (Terms of Use, Rights § 1.) Pursuant to Instagram’s Privacy Policy (“Privacy Policy”), Instagram users designate their accounts as “private” or “public,” and can change these privacy settings whenever they wish. (Privacy Policy, Parties With Whom You May Choose to Share Your User Content § 1.). All content that users upload and designate as “public” is searchable by the public and subject to use by others via Instagram’s API. (Id § 2.) The API enables its users to embed publicly-posted content in their websites. (Platform Policy, Preamble.). Thus, because Plaintiff uploaded the Photograph to Instagram and designated it as “public,” she agreed to allow Mashable, as Instagram’s sublicensee, to embed the Photograph in its website>> , p. 4-5.

Sinclair solleva una serie di controeccezioni, tutte respinte dalla Corte (pp. 5-8).

1) visto che Mashable non aveva potuto ottenere licenza in via negoziale, non può essere che ottenga il medesimo risultato tramite Instagram. Il giudice risponde che le due modalità acquisitive sono autonome cioè operano indipendentemente l’una dall’altra.

2) poi sostiene che la Corte non può prendere come fatto notorio il significato degli accordi proposti/imposti da Instagram, poiché sono complessi e sotto sottoposti a diverse interpretazioni. La Corte risponde di non prendere affatto come fatto notorio la loro interpretazione, la quale spetta alla Corte come questione di diritto.

3) gli accordi tra Instagram e Sinclar non attribuiscono il diritto di usare la fotografia a Mashable, perché questa non è un beneficiario voluto (intended beneficiary) di questi accordi (cioè non si tratta di contratto a favore del terzo, da noi). Non è necessario, risponde la Corte, ritenere Mashable <beneficiario voluto>. Infatti è l’attore ad aver autorizzato Instagram a concedere licenza a chiunque usasse l’API predisposto da Instagram (su cui v. p. 2). Quindi non si pone il problema se Mashable sia o meno intended beneficiary.

4) l’autorizzazione ad Instagram alla sublicenza è invalida, perché creata da una serie di documenti compless edi interconnessi. La Corte ritiene però che la pattuizione de relato sia valida.

5) dal documento contrattuale non si desume una valida sublicenza, perché il significato è circolare, incomprensibile e contraddittorio. Soprattutto secondo Sinclair è contraddittorio per Instagram imporre il dovere degli uploaders di rispettare i diritti altrui e al tempo stesso attribuire loro il diritto di condividere materiale protetto altrui. La Corte però giustamente fa presente che sono due cose distinte fare il primo upload e procedere alla successiva condivisione di materiali già caricati.

6) Instagram ha violato le sue condizioni contrattuali, concedendo una sub licenza per vendere (sell) la fotografia. Anche qui la Corte ha buon gioco nel dire che Instagram non ha venduto (sold) nulla, ha solo concesso una sub-licenza.

7) infine la clausola de qua è unfair in quanto costringe un professionista della fotografia a ripiegare sulla modalità privata dell’account, per evitare di soggiacere alle sublicenze concesse via Instagram . La Corte riconosce il dilemma per il un fotografo, basato sul fatto che Instagram è una piattaforma dominante e al tempo stesso che impone o richiede un consistente trasferimento di diritti per il proprio utilizzo. Aggiunge però che l’attore ne era consapevole e ciò nonostnte ha fatto la sua scelta, per cui la Corte non può liberarla (release) dal patto.

C’è infine un ultimo punto che vale la pena di segnalare, relativo alla domanda svolta nei confronti della parent company cioè la controllante Ziff Davis LLC.

La domanda relativa è respinta perché, stante la distinta soggettività giuridica, la responsabilità della controllante esiste <<only if there is a substantial continuing involvement by the parent specifically with respect to the allegedly infringing activity of the subsidiary”>>.

E l’attrice non ha allegato fatti che, se provati, dimostrerebbero il coinvolgimento della controllante nella pretesa attività contraffattoria della controllata. Osserva infatti il giudice: <<Plaintiff alleges that Ziff Davis owns Mashable, and that legal notices on Mashable’s website, such as the “Privacy Policy,” “Terms of Use,” and “Cookie Policy,” direct users to Ziff Davis’ corresponding policies. (SAC ¶ 17–18.) Plaintiff further alleges that Mashable’s “Copyright Policy” directs individuals with copyright claims to contact Ziff Davis’ copyright agent, and that Mashable lists Ziff Davis as its copyright agent. (Id. ¶ 18–19.) None of these facts establishes that Ziff Davis had any involvement in Mashable’s allegedly infringing activities, beyond the bare fact of corporate ownership; for instance, Plaintiff does not claim that Ziff Davis had any role in contacting Plaintiff, posting the Article, or embedding the Photograph in the Article. Plaintiff therefore fails to state a claim against Ziff Davis>>.

Tag: riproduzione

La citazione in giudizio dell’associazione scrittori usa contro Open AI

Riproduzione in un sito web tramite embedding di fotografia altrui presa da Instagram: istruzioni per l’uso