Banche dati e estrazioni di dati on line

La CG si pronuncia sulla legittimità ai sensi dei diritto sui generis sulle banche dati (art. 7 dir. 96/9) dell’attività di ricerca dati (offerte di lavoro)  da parte di un motore di ricerca specializzato, effettuata su banca dati presente in internet e liberamente accessibile.

Si tratta di CG 03.06.2021, C-762/19, «CV-Online Latvia» SIA c. «Melons» SIA .

Precisamente: <<il giudice del rinvio chieda, in sostanza, se l’articolo 7, paragrafi 1 e 2, della direttiva 96/9 debba essere interpretato nel senso che un motore di ricerca in Internet specializzato nella ricerca dei contenuti delle banche di dati, che copia e indicizza la totalità o una parte sostanziale di una banca di dati liberamente accessibile in Internet, e successivamente consente ai suoi utenti di effettuare ricerche in tale banca di dati sul suo sito Internet secondo criteri pertinenti dal punto di vista del suo contenuto, procede a un’«estrazione» e a un «reimpiego» del contenuto di tale banca di dati, ai sensi di detta disposizione, e che il costitutore di una siffatta banca di dati ha il diritto di vietare tale estrazione o reimpiego di questa stessa banca di dati.>, § 20.

Le nozioni di «estrazione» e di «reimpiego» devono essere interpretate <<nel senso che si riferiscono a qualsiasi atto consistente, rispettivamente,  nell’appropriazione e nella messa a disposizione del pubblico, senza il consenso del costitutore della banca di dati, dei risultati del suo investimento, privando così quest’ultimo di redditi che dovrebbero consentirgli di ammortizzare il costo di tale investimento (sentenza del 9 novembre 2004, The British Horseracing Board e a., C‑203/02, EU:C:2004:695, punto 51)>>, § 31.

nel caso di specie il motore di ricerca specializzato sub iudice <<non utilizza i moduli di ricerca dei siti Internet nei quali consente di effettuare una ricerca e non traduce in tempo reale le richieste dei propri utenti in criteri utilizzati da tali moduli. Tuttavia, esso indicizza regolarmente tali siti e ne conserva una copia sui propri server. Inoltre, grazie al proprio modulo di ricerca, esso consente ai suoi utenti di effettuare ricerche in base ai criteri da esso proposti, ricerche che si effettuano tra i dati che sono stati indicizzati.     Se è pur vero che il funzionamento del motore di ricerca come quello di cui trattasi nel procedimento principale è diverso da quello di cui trattavasi nella causa che ha dato luogo alla sentenza del 19 dicembre 2013, Innoweb (C‑202/12, EU:C:2013:850), ciò non toglie che tale motore di ricerca consente di esplorare, seguendo un percorso diverso da quello previsto dal costitutore della banca di dati interessata, l’intero contenuto di più banche di dati simultaneamente, tra cui quella della CV-Online, mettendo tale contenuto a disposizione dei propri utenti. Tale motore di ricerca specializzato, fornendo la possibilità di effettuare ricerche simultaneamente in più banche di dati, secondo i criteri pertinenti dal punto di vista delle persone alla ricerca di lavoro, consente agli utenti l’accesso, nel proprio sito Internet, ad offerte di lavoro contenute in tali banche di dati.>>, §§ 33-34.

Pertanto, un motore di ricerca come quello di cui trattasi nel procedimento principale <<consente di esplorare tutti i dati contenuti nelle banche di dati liberamente accessibili in Internet, ivi compreso il sito Internet della CV-Online, e fornisce ai suoi utenti un accesso all’intero contenuto di tali banche di dati seguendo un percorso diverso da quello previsto dal loro costitutore. Inoltre, la messa a disposizione di tali dati si rivolge al pubblico, ai sensi dell’articolo 7, paragrafo 2, lettera b), della direttiva 96/9, dal momento che un simile motore di ricerca può essere utilizzato da chiunque (v., in tal senso, sentenza del 19 dicembre 2013, Innoweb, C‑202/12, EU:C:2013:850, punto 51)   . 36      Inoltre, tale motore di ricerca, indicizzando e copiando sul proprio server il contenuto dei siti Internet, trasferisce il contenuto delle banche di dati costituite da tali siti verso un altro supporto.   37      Ne consegue che un simile trasferimento del contenuto sostanziale delle banche di dati interessate e che una simile messa a disposizione di tali dati al pubblico, senza il consenso della persona che le ha costituite, sono, rispettivamente, misure di estrazione e di reimpiego di tali banche di dati, vietate dall’articolo 7, paragrafo 1, della direttiva 96/9, a condizione che esse abbiano l’effetto di privare tale persona di redditi che dovrebbero consentirle di ammortizzare il costo di detto investimento. Come sottolineato dall’avvocato generale al paragrafo 36 delle sue conclusioni, la fornitura dei collegamenti ipertestuali verso gli annunci che compaiono nel sito Internet della CV-Online e la riproduzione delle informazioni contenute nei meta tag di tale sito sarebbero quindi solo manifestazioni esterne, di importanza secondaria, di tale estrazione e di detto reimpiego.>>

Occorre ancora esaminare <<se gli atti descritti ai punti 35 e 36 della presente sentenza siano tali da arrecare pregiudizio all’investimento del costitutore della banca di dati che è stata trasferita su un altro supporto e che è stata messa a disposizione del pubblico>>, § 38.

L’art. 7. 1 della direttiva 96/9 riserva il beneficio della tutela conferita dal diritto sui generis alle banche di dati <<la cui creazione o il cui funzionamento richiede un investimento rilevante sotto il profilo qualitativo o quantitativo.     Ne consegue che, come rilevato in sostanza dall’avvocato generale ai paragrafi 43 e 46 delle sue conclusioni, il criterio principale di bilanciamento dei legittimi interessi in gioco deve essere il potenziale pregiudizio all’investimento rilevante del costitutore della banca di dati di cui trattasi, vale a dire il rischio che tale investimento non possa essere ammortizzato>>, §§ 43-44.

Valutazione che, immancabilmente, tocca al giudice nazionale, § 46.

Banca dati scandagliata da motore di ricerca specializzato (aggregatore di contenuti?)

Può un motore di ricerca specializzato scandagliare i siti e relative banche dati di suo interesse , proponendone i risultat agli utenti tramite link? O viola il diritto del costitutore sulla banca dati?

Questo il quesito posto alla Corte di Giustizia (CG) , proveniente dalla Lituania, cui ha offerto il proprio (interessante, come sempre) parere l’avvocato generale (AG) Szpunar il 14.01.2021, C-762/19, SIA «CV-Online Latvia» contro SIA «Melons».

La normativa rilevante è data dalla direttiva UE 96/9 dell’11.03.1996 e , da noi, dagli artt. 102 bis-102 ter l. aut. (ma potrebbe essere un’opera dell’ingegno, artt. 64 quinquies-64 sexies l. aut.)

Una società lettone (CV) gestisce un sito con banca dati contenente annunci di lavoro.  Un’ altra società (SIA Melons) gestisce un motore di ricerca specializzato negli annunci d ilavoro che opera scandagliando i siti ad hoc e dunque i loro database, generando gli esiti tramite link offerti ai suoi utenti. La ricerca avviene soprattutto sui  meta tag per ciascun annuncio di lavoro vacante, contenuti nella banca dati scandagliata, costituiti dalle seguenti parole chiave: «denominazione del posto di lavoro», «nome dell’impresa», «luogo di lavoro» e «data di pubblicazione dell’annuncio», § 10

In linea di massima l’aggregatore di notizia opera effettuando uin <reimpiego> e/o un'<estrazione>: dunque invadendo la privativa altrui:

<<36.   Orbene, come risulta dalle informazioni contenute nella domanda di pronuncia pregiudiziale e nelle osservazioni delle parti, la stessa capacità di esplorazione dell’intero contenuto di una banca dati (o, più precisamente, di più banche dati contemporaneamente) è offerta da un motore di ricerca specializzato, come quello della Melons. Tale motore di ricerca permette di effettuare ricerche in vari siti Internet di annunci di lavoro, secondo i criteri pertinenti e senza passare attraverso i moduli di ricerca propri di tali siti. Il risultato di tale ricerca fornisce all’utente l’accesso ad annunci di lavoro selezionati secondo detti criteri. Atteso che detti siti Internet sono qualificabili come banche dati protette dal diritto sui generis previsto dalla direttiva 96/9, il motore di ricerca in questione permette di esplorare l’intero contenuto di tali banche dati, procedendo al suo reimpiego, nel senso attribuito al termine «reimpiego» dalla Corte nella sentenza Innoweb. Inoltre, indicizzando e copiando sul proprio server il contenuto dei siti Internet, il motore di ricerca della Melons effettua un’estrazione del contenuto delle banche dati che costituiscono tali siti. La fornitura dei collegamenti ipertestuali verso gli annunci che compaiono nel sito Internet della CV‑Online e la riproduzione delle informazioni contenute nei meta tag di tale sito, menzionate nelle questioni pregiudiziali, sono soltanto manifestazioni esterne, d’importanza secondaria, di tale estrazione e di detto reimpiego. La situazione oggetto del procedimento principale dunque non differisce sostanzialmente da quella della causa che ha dato luogo alla sentenza Innoweb.    37.       Si deve dunque concludere che un motore di ricerca che copia e indicizza la totalità o una parte sostanziale delle banche dati liberamente accessibili in Internet e successivamente permette ai propri utenti di effettuare ricerche in tali banche dati secondo criteri pertinenti dal punto di vista del loro contenuto procede all’estrazione e al reimpiego di tale contenuto, ai sensi dell’articolo 7, paragrafo 2, della direttiva 96/9. Ciò premesso, non ritengo che l’analisi debba fermarsi qui. Infatti, il diritto di vietare una simile estrazione ed un simile reimpiego, a mio avviso, deve soddisfare condizioni aggiuntive>>.

L’AG si confronta con la decisione Innoweb 19 dicembre 2013, C‑202/12,  relativa a motori di ricerca per veicoli  usati, e coglie poi le differenze tra il motore di ricerca sub iudice e quello di Innoweb , <metamotore di ricerca>, §§ 33-35.

Il punto interessante è quello in cui l’AG introduce un limite (meglio, un presupposto) al diritto del costitutore: non basta l’estrazione o reimpiego di <parte sostanziale> della banca dati, ma bisogna pure che <<l’estrazione o il reimpiego in questione rappresenti un pregiudizio per l’investimento relativo alla costituzione o al funzionamento della banca dati che si intende proteggere, nel senso che esse costituiscono un rischio per le possibilità di ammortizzare tale investimento, in particolare minacciando i proventi derivanti dallo sfruttamento della banca dati in questione. Infatti, lo scopo perseguito limitando la protezione alle sole banche dati che hanno dato luogo ad investimenti rilevanti sarebbe raggiunto soltanto in parte se tale protezione potesse essere fatta valere contro condotte che non arrecano pregiudizio all’investimento in questione.>>, § 46.

La ragione è evidentemente quella di conciliare il diritto del costitutore con l’esigenza collettiva di non inibire iniziative concorrenziali di terzi, soprattutto consistenti nel creare prodotti innovativi a valore aggiunto, § 40.   Del resto CV è il più importante portale del settore in Lituannia, § 55. Inoltre, CV si oppone solo ai motori di ricerca specializzati , non a quelli generalisti come Google, § 56: per cui l’AG sospetta che la ragione vera sia quella di inibire pericolosi concorrenti, dato che opera nel medesimo settore dei metamotori di ricerca tramite altra società del gruppo, § 57.

Tale requisito (<pregiudizio all’investimento impedendone l’ ammortamento>) , però,  non sta nelle disposizioni di legge: pertanto l’AG arricchisce la fattispecie costitutiva del diritto, senza alcun appiglio testuale. E’ una sorta di limitazione teleologica della fattispecie o di fair use pretorio (da vedere poi se sia proprio un fatto costititutivo del diritto del costitutore -come parrebbe- oppure fatto impeditivo , il cui onere allegativo-probatorio incomba sul terzo utilizzatore della banca dati).

Si v. però le sue consisderazioni sul profilo concorrenziale ai §§ 51-58

Un interessante caso di utilizzo di banca dati altrui e quindi di applicazione del diritto sui generis sulla medesima

Il tribunale delle imprese di Roma (sez. Trib. Imprese 4-5/09/2019, RG 34006/2019;  ne dà notizia Maraffino sul Sole 24 ore di oggi 21.10.2019, p. 22, ove il testo in allegato) interviene con un interessante provvedimento cautelare in materia di diritto sui generis su banca dati (art. 102 bis-ter l. aut.)

La banca dati per cui era causa era quella relativa ad orari e prezzi ferroviari  di Trenitalia.

Era capitato che la società di diritto inglese Go Bright avesse proceduto a estrazione e reimpiego dei dati di questa bancadati di Trenitalia. Trenitalia se n’era lamentata e aveva ottenuto in via cautelare inaudita altera parte l’inibitoria di cessazione e la comminazione di penale per successive eventuali violazioni a carico di Go Bright  Instauratosi il contraddittorio, però il tribunale di Roma col provvedimetno de quo ha revocato quello anteriore  inaudita altera parte e rigettato la domanda cautelare di Trenitalia

il Tribunale ricorda che la disciplina sulle banche dati prevede che <<il costitutore di una banca di dati ha il diritto, per la durata e alle condizioni stabilite dal presente Capo, di vietare le operazioni di estrazione ovvero reimpiego della totalita’ o di una parte sostanziale della stessa.>> (art. 102 bis c. 2 l. aut.)

“Costitutore” e quindi titolare di tale diritto è colui che <<effettua investimenti rilevanti per la costituzione di una banca di dati o per la sua verifica o la sua presentazione, impegnando, a tal fine, mezzi finanziari, tempo o lavoro;>> (art. 102 bis c. 1 lett. a) lt.). Il Tribunale dà atto che sul punto non c’erano contestazioni e quindi tale qualifica viene riconosciuta a Trenitalia.

Ad integrazione del c. 3. cit., il seguente comma 9 dell’art. 102 bis prevede però che <<non sono consentiti l’estrazione o il reimpiego ripetuti e sistematici di parti non sostanziali del contenuto della banca di dati, qualora presuppongano operazioni contrarie alla normale gestione della banca di dati o arrechino un pregiudizio ingiustificato al costitutore della banca di dati.>>

La ragione di quest’ultima norma è abbastanza chiara.  E’ vero che l’estrazione o il reimpiego di una banca dati altrui è sempre ammesso, purchè limitato ad una parte non sostanziale: ma è facile eludere tale limite procedendo con accessi ripetuti nel tempo, ciascuno rispettante il limite della “non sostanzialità” della parte utilizzata.

E’ un po’ come la regola sul divieto di uso del contante che superi una certa soglia, la quale può essere elusa tramite il frazionamento ripetuto nel tempo  di prelievi che, individualmente considerati, rispettano la soglia stessa: è per questo che la legge ha provveduto ad inserire una norma relativa al caso di cumulo di prelievi in un certo periodo di tempo. Ha infatti disposto che <<Il trasferimento superiore al predetto limite, quale che ne sia la causa o il titolo, e’ vietato anche quando e’ effettuato con piu’ pagamenti, inferiori alla soglia, che appaiono artificiosamente frazionati>>, dovendosi intendere per <<operazione frazionata>>, l’<<operazione unitaria sotto il profilo del valore economico, di importo pari o superiore ai limiti stabiliti dal presente decreto, posta in essere attraverso piu’ operazioni, singolarmente inferiori ai predetti limiti, effettuate in momenti diversi ed in un circoscritto periodo di tempo fissato in sette giorni, ferma restando la sussistenza dell’operazione frazionata quando ricorrano elementi per ritenerla tale>> (art. 49 e rispett. art. 1 lett. v) del D. lgs. 231 21.11.2007; c’è una disarmonia lessicale però, dato che prima parla di operazioni e poi di trasferimenti e di pagamenti).

Ebbene anche nel nostro caso è ammesso l’utilizzo di porzioni di banca dati altrui in misura non sostanziale ma  con dei limiti, quando si ha ripeta frequentemente.

Il legislatore fiscale ha ritenuto di porre una soglia quantitativa e temporale; la legge sul Diritto d’autore ha invece stabilito il concetto di operazioni “ripetute e sistematiche” , accompagnandolo poi con un’ulteriore duplice condizione negativa: i) che non devono presupporre operazioni contrarie alla normale gestione della banca dati; e ii) che non arrechino un pregiudizio ingiustificato al costitutore. Queste ultime due ipotesi sono parzialmente coincidenti dato che l’operazione contraria alla normale gestione probabilmente sarà anche pregiudizievole, ma letteralmente una differenza c’è: per quella sub i) rileva solo la contrarietà alla normale gestione, essendo invece irrilevante la dannosità.

Il Tribunale ricorda poi che esiste un’altra norma, trascurata dal giudice cautelare di prime cure, costituita dal c. 3 dell’articolo 102 ter. Secondo questa, <<non sono soggette all’autorizzazione del costitutore della banca di dati messa per qualsiasi motivo a disposizione del pubblico le attivita’ di estrazione o reimpiego di parti non sostanziali, valutate in termini qualitativi e quantitativi, del contenuto della banca di dati per qualsivoglia fine effettuate dall’utente legittimo. Se l’utente legittimo e’ autorizzato ad effettuare l’estrazione o il reimpiego solo di una parte della banca di dati, il presente comma si applica unicamente a tale parte>>.

La complessiva disciplina dunque pare sintetizzabile così:

A)  se la banca dati non è stata messa a disposizione del pubblico, è ammesso il reimpiego/estrazione solamente se A1) non sostanziale, nonchè  A2) non ci siano utilizzi ripetuti e sistematici contrari alla normale gestione -oppure, in alternativa ad A2- ; A3) non ci siano utilizzi ripetuti e sistematici arrecanti pregiudizievole ingiustificata al titolare.

B) quando invece la banca dati è stata messa a disposizione del pubblico, i paletti sono quelli B1) del reimpiego/estrazione “non sostanziali” (valutate in termini qualitativi e quantitativi), B2) da parte dell’utente legittimo.  Altri limiti non ci sono ed anzi è esporessamente detto che è ammesso per qualsiasi fine effettuato dall’utente legittimo (c. 3 art. 102 ter)

Semmai c’è da chiedersi chi sia l'<<utente legittimo>>, dato che per ipotesi si tratta di banca dati messa a disposizione del pubblico e quindi per chiunque. Tale concetto allora andrà probabilmente inteso con riferimento ad eventuali limitazioni che il costitutore apponga all’utilizzo pubblico: sarebbe logico,  perché in tali casi è utente legittimo solo chi rispetta i limiti entro cui il costitutore ha messo a disposizione del pubblico la banca dati. Se supera quei limiti, l’utente non è più legittimo.

Tornando al caso sub iudice l’estrazione consistette nell’estrazione da parte di Go Bright con picchi fino a 800.000 accessi al giorno, che rappresentavano il 30% di tutti gli accessi sui siti Trentilaia e rallentamenti della funzionalità dei server. Il giudice romano ha ritenuto che tali dati, forniti da Trenitalia, <<non appaiono sufficientemente convincenti per poter dare una risposta alla questione precedentemente sottolineata, in quanto il numero, per la verità non impressionante (30% degli accessi sulla totalità degli accessi giornalieri di TRENITALIA peraltro suddivisi nelle ventiquattr’ore) dello scraping effettuato sulla piattaforma della società ricorrente potrebbe essere interpretato come una periodica e selettiva acquisizione di dati da parte del server di GoBright. Non vi è quindi evidenza di una manifesta e di inequivoca sottrazione della banca dati da parte della società resistente>>( p. 8).

Inoltre ha precisato che l’apertura della banca dati al pubblico <<comporta la possibilità per qualsiasi utente di estrarre legittimamente tali dati in misura non sostanziale e di utilizzarli nelle forme che ritiene più opportune, anche in forma commerciale.>> (p. 6),  precisando subito dopo così: <<in  sintesi, una volta che la banca dati sia stata resa pubblica nel suo complesso, sono consentite ad avviso di questo giudice tutte le attività di estrazione, riproduzione e rielaborazione dei dati contenuti nella banca da parte di tutti gli utenti legittimi, siano essi soggetti fisici o soggetti imprenditoriali a condizione che la riutilizzazione e reimpiego dei dati non avvenga in maniera massiccia origuardi “ la totalità della banca dati, una parte sostanziale della stessa” (art. 102 bis) ovvero “il reimpiego di parti sostanziali valutati in termini qualitativi e quantitativi (art. 102 ter LDA)”.>> (p. 6/7)

Un elemento fattuale importante è che -secondo Go Bright- l’acquisizione dei dati non avveniva una volta per tutte e in via definitiva, bensì <<volta per volta sui propri server mediante il sistema dello “scraping” e che vi è un’acquisizione continuativa nel tempo e selettiva da parte del proprio applicativo dei dati utili al singolo utente che ne fa contestuale richiesta. In termini semplificati i server della società resistente acquisiscono i soli dati utili alla configurazione della richiesta del singolo utente.>> (p. 7).  In altre parole <<l’acquisizione parcellizzata e non massiva dei dati, considerate anche le prestazioni svolte dalla società, è piuttosto sintomatica di un uso contingente (ogniqualvolta l’utente ne faccia richiesta), circostanza questa che affievolisce significativamente il fumus cautelare evidenziato dal giudice della tutela interinale>> (p. 8)

La decisione esaminata non appare però particolarmente coerente, in quanto sembra mescolare i requisiti per fruire della banca dati altrui non resa pubblica con quelli necessari per fruire della banca dati altrui resa pubblica. Si tratta invece di due fattispecie normativamente distinte e quindi bisogna scegliere in base a quale  di esse si giudica la fattispecie concreta. Se la fattispecie astratta è quella dell’utilizzo di parti non sostanziali di banca dati non resa pubblica, allora ci si deve riferire all’articolo 102.  Se invece la fattispecie astratta è quella dell’utilizzo di banca dati resa pubblica, allora la norma di riferimento è solamente il comma 3 dell’articolo 102. I due gruppi di norme quindi non paiono potersi reciprocamente cumulare o in qualche modo integrare .

Se  sì esamina dunque il requisito del pregiudizio ex c. 9 art. 102 bis (banca dati non resa pubblica) , non si può poi anche ragionare sulla “non sostanzialità in termini qualitativi e quantitativi” di cui al c. dell’art. 102 ter (banca dati resa pubblica)

E interessante anche il riferimento finale alla recente direttiva (UE) 2019/1024 del Parlamento europeo e del Consiglio, del 20 giugno 2019, relativa all’apertura dei dati e al riutilizzo dell’informazione del settore pubblico, volta a facilitare l’utilizzo (commerciale e non) dei dati in possesso delle pubbliche amministraizoni.

Alla luce di tale novità , il  giudice ritiene che ciò porti ad un’interpretazione restrittiva del concetto di “parte sostanziale”, al punto da farla quasi coincidere col concetto di “totalità”, sì da facilitare reimpiego/estrazione dei dati propri presenti nelle banche dati. Dice infatti <<quando si parla quindi di estrazione, reimpiego ovvero rielaborazione di un quantitativo di dati provenienti da soggetto a cui la disciplina comunitaria impone la massima divulgazione dei dati in proprio possesso, il concetto di “parte sostanziale” del prelievo deve essere interpretato ed applicato in conformità alla volontà del legislatore comunitario in un’ottica di sostanziale sovrapposizione fra il concetto di “totalità” e quello di “parte sostanziale”. Quindi solo la prova stringente di una sottrazione di una banca dati complessiva può fondare il rilascio di un provvedimento interdittivo>> (p. 10)

Il punto è interessante anche se delicato da risolvere. Si potrebbe dire che la normativa sulla proprietà intellettuale vada interpretata a prescindere da questa direttiva, essendo norma speciale rispetto ad essa.

Tuttavia potrebbe far inclinare per la conclusione opposta (e quindi nel senso del Tribunale romano) il  fatto che la direttiva non si applica <<ai documenti su cui terzi detengono diritti di proprietà intellettuale;>> (art. 1 § 2 lett. c, dir.). Si badi che per <<documento>> si intende <<qualsiasi contenuto, a prescindere dal suo supporto>> (art. 2 n. 6 dir.; curioso uso sinonimico di documento e contenuto).

Con la conseguenza allora che, quando invece il diritto di IP spetti all’Ente stesso, la normativa di trasparenza e accessibilità va pienamente applicata.