Scraping di dati pubblici per non perdere il treno della concorrenza

Questa estate era circolata la notizia di una diatriba giudiziaria tra Trenitalia Spa e GoBright Media Ltd, startup ‒ inglese, ma fondata e gestita da italiani ‒ nota per aver realizzato e diffuso l’applicazione mobile “Trenit!” che permette di monitorare gli orari e i movimenti (compresi ritardi e disguidi) dei treni in Italia. Successe infatti a fine luglio che il sito e i profili social di Trenit! diffusero un comunicato in cui si spiegava:

Purtroppo dobbiamo sospendere temporaneamente il servizio, perché Trenitalia non vuole che pubblichiamo i dati (pubblici) relativi ai suoi treni e quindi ci ha fatto causa, ritenendo che l’uso che facciamo dei suoi dati sia illegittimo in quanto non autorizzato. Noi, invece, siamo convinti che il nostro operato sia pienamente lecito e non arrechi alcun danno agli operatori ferroviari. Al contrario, pensiamo che il nostro uso dei dati pubblici relativi al trasporto ferroviario arrechi un vantaggio agli operatori (visto che promuove i loro servizi).

Trenitalia si era infatti rivolta al Tribunale di Roma con procedimento d’urgenza per ottenere un’inibitoria cautelare nei confronti di GoBright Media. Il giudice la concesse, salvo poi, dopo la pausa agostana, tornare sui suoi passi con l’ordinanza del 5 settembre, nella quale ha invece stabilito la legittimità dell’operato di GoBright Media e dunque permettendo di riattivare completamente l’app Trenit!, salvo ulteriori ripensamenti possibili anche in sede di reclamo.

L’ordinanza, che pure offre numerosi spunti interessanti e meritevoli di approfondimento, tuttavia, presenta secondo il nostro punto di vista almeno tre profili discutibili che necessitano una più accurata riflessione.

Innanzitutto il Tribunale di Roma non ha tenuto conto che, nella valutazione della protezione della banca dati, la Direttiva menziona espressamente che il diritto non può essere utilizzato per creare o rafforzare una posizione dominante. A tal proposito si veda il caso Lastminute.com vs. Ryanair (Trib. Milano Sez. Proprietà Industriale n. 7808/2013; vedi sentenza), in cui si ricorda che “la protezione del diritto sui generis non deve essere esercitata in modo da favorire gli abusi di posizione dominante, con particolare riguardo alla creazione e diffusione di nuovi prodotti e servizi a valore aggiunto di ordine intellettuale, documentale, tecnico, economico e commerciale” e più in generale adotta una soluzione molto sovrapponibile all’ordinanza in commento.

In secondo luogo il giudice ha dato per scontato, come quello milanese, che la banca dati in giudizio sia una banca dati proteggibile tramite il diritto sui generis, senza però apparentemente valutare che, affinché scatti tale tutela, occorra che l’investimento rilevante, richiesto ai fini della concessione della tutela in oggetto, sia effettuato sulla raccolta, sistemazione, verifica o presentazione della banca dati, non sulla creazione dei dati poi raccolti nella banca dati. Come il Tribunale di Milano, Roma ha ritenuto che gli investimenti in tecnologia finalizzati a realizzare un sito di presentazione agli utenti e prenotazione consentisse la tutela sui generis, e non ‒ come pure potrebbe essere possibile ‒ gli investimenti in tal senso siano diretti all’esercizio del servizio di prenotazione e assistenza alla clientela, che appunto sfrutta tali dati. In senso generale si dubita di tale ricostruzione, in quanto il servizio prenotazione è appunto una componente produttiva di un servizio di trasporto e la presentazione dei dati potrebbe ben essere considerato funzionale alla conduzione di tale servizio in sé, non alla semplice presentazione dei dati agli utenti slegata da tale servizio. Pertanto, il giudice dovrebbe approfondire la sua valutazione e motivare sul punto specifico, analisi che sembra del tutto assente anche nell’ordinanza commentata ‒ dove, però, il giudice afferma che la sussistenza dei presupposti di tutelabilità non fosse messa in discussione, e dunque è possibile che tale considerazione assorba anche ai sensi probatori l’onere di allegazione. In futuro, anche alla luce dei principi della sentenza della Corte di Giustizia C-203/02 (British Horseracing Board/William Hill Organization), la valutazione se sia una banca dati proteggibile o un sottoprodotto della conduzione del servizio meriterebbe sempre un’analisi più approfondita, possibilmente a seguito di una contestazione specifica (laddove essa venisse ritenuta strategicamente conveniente, ovviamente).

Infine, l’ordinanza si concentra sulle attività di estrazione, escludendo che sussiste l’estrazione sistematica di dati per ricostituire una parte sostanziale della banca dati, che è appunto attività vietata. In realtà, l’attività di “scraping” come realizzata in questo caso deve o comunque può essere valutata come un’attività di reimpiego. Qui il Tribunale non sembra avere compiutamente valutato se si possa trattare di reimpiego. Anche qui ci soccorre la sentenza Lastminute/Ryanair già citata, la quale correttamente individua nel reimpiego la messa a disposizione dell’intero contenuto della banca dati, per finalità di sfruttamento commerciale in un altro servizio, anche senza una copia materiale di una parte sostanziale. Ad esempio, un servizio che consenta il recupero di una qualsiasi sentenza di una banca dati di sentenze, attraverso la messa a disposizione di un singolo “account” a più clienti, costituirebbe una forma di condivisione della banca data.

L’argomentazione secondo cui il servizio concorrente comporterebbe un aggravio di carico sui sistemi di Trenitalia (“stanno causando [i gestori dell’app Trenit] il 30% degli accessi”) lascia aperto il fianco a molte perplessità, mentre sembra avere un forte appeal per il Giudice romano. Non è tanto il fatto di avere un numero elevato di accessi a rilevare; occorre piuttosto verificare se questi accessi siano eccessivi rispetto al numero di utenti interessati a quei dati ‒ cosa non impossibile, ma da motivare più in profondità. Per capire meglio, ipotizziamo che Trenitalia sia monopolista nel fornire i dati sulla circolazione dei treni. Supponendo che le esigenze degli utenti rimangano immutate quale che sia il soggetto che fornisce tali dati, chi non vi accede a partire dalla piattaforma di Trenit non potrebbe fare altro che accedervi direttamente attraverso il servizio di Trenitalia. Pertanto, ogni utente che accede al servizio del concorrente è un utente in meno del servizio di Trenitalia, e viceversa, per cui l’esistenza di un servizio concorrente non aggraverebbe di per sé la situazione di Trenitalia. Ipotizzare un danno comporta dunque che chi lo allega dimostri una di queste due allegazioni: che un utente che passa da Trenit non sarebbe un utente del servizio corrispondente di Trenitalia, se Trenit non esistesse; oppure che tale utente, passando da Trenit per soddisfare la propria esigenza, consuma più risorse rispetto al caso in cui vi acceda attraverso Trenitalia. La teoria del danno dovrebbe allora estendersi non al carico dei server attribuito al servizio concorrente, ma, ad esempio, all’efficienza di tale carico (esempio: effettuano accessi troppo frequenti per cattivo design dell’applicazione), e tale argomento dovrebbe dunque trasparire dalla motivazione.

Dove invece il Tribunale coglie pienamente e lodevolmente nel segno ‒ valutando chiaramente in base alle informazioni in nostro possesso ‒ è laddove afferma che vi è un’inefficienza autoindotta (sibi imputet) in capo a Trenitalia, in quanto ha lasciato al concorrente come unica tecnica di acquisizione di dati quella di scraping concorrente, senza offrire, come fanno molti altri servizi, un più efficiente e tecnicamente sicuro accesso via “API” (Application Programming Interface, sistemi di interrogazione e interoperabilità tramite interfacce definite e rese pubbliche). Infatti, se il concorrente avesse la possibilità di scaricare i dati necessari attraverso una molto più “leggera” interrogazione API, e non costringesse i server a caricare ogni volta una complessa pagina web, il servizio risulterebbe di molto alleggerito, in quanto il compito di fornire la pagina “leggibile” graverebbe sul servizio concorrente. Trenitalia ha (non importa se legittimamente, salvo che non sia un’essential facility) scelto di non offrire tale possibilità, dunque non può a nostro parere dolersene per impedire la concorrenza.

Si noti peraltro che il tema dell’efficienza o inefficienza del riuso dei dati è un argomento seriamente connesso agli obiettivi di crescita sostenibile dell’Agenda 2030 dell’ONU. La società dell’informazione è avida di dati, servire tali dati costa in termini energetici. Soprattutto nel campo della scelta dei mezzi di trasporto (Obiettivi 11 e 12), costringere un concorrente, dunque un cittadino, a perseguire strategie inefficienti per ottenere dati, o a “reinventare la ruota” per dati di servizio che già esistono, comporta costi in termini di sostenibilità che paga l’intera società. Invece, una strategia efficiente di riuso dei dati, di condivisione degli stessi, diminuisce gli impatti e facilita la crescita economica (Obiettivo 8).

A chi scrive è capitato dover intervenire per costringere i fornitori di servizi a fare il contrario, dunque a non usare lo scraping per reimpiegare i dati, ma a usare appunto API che fornivano esattamente gli stessi dati, ma con molto minore carico dei server del cliente e addirittura una maggiore velocità nel recupero di tali dati, oltre ad evitare congestioni e interruzioni del servizio nei momenti di picco. In ultima analisi, a rendere più efficiente il servizio per tutte le parti coinvolte.

Interessante anche il punto in cui si evidenzia come Trenitalia sia incentivata a rifiutare di rendere disponibili le  informazioni sul costo del biglietto ai concorrenti per impedire il confronto tariffario con i concorrenti sulle linee pluri-carrier (tipo Milano-Roma) e dunque più soggette a pressione concorrenziale. Qui la lesione alla concorrenza e il rischio che ciò si traduca in una barriera effettiva alla concorrenza sono molto alti e dunque fa bene il Tribunale ad evidenziare la questione. Si tratta di una buona applicazione dell’analisi economica del diritto, essenziale in un caso di concorrenza come quello in esame, che personalmente vorremmo molto più comune anche nelle nostre aule, non solo nei giudizi antitrust.

Questo articolo è rilasciato nei termini della licenza Creative Commons Attribution-ShareAlike 4.0 International.

Facebook Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here