Da Pisa a Ferrara: storie di hashtag e di analisi delle reti

Massimiliano Spaziani

La scorsa settimana non è stata semplicemente quella del rientro dall’ esperienza dell’Internet Festival svoltosi a Pisa dal 4 al 7 ottobre, ma anche quella in cui – prima su TechEconomy News e poi in un post dedicato all’importanza del fattore umano – ho parlato di interpretazione di dati.

E’ nata così l’idea di approfondire e analizzare i tweets legati all’evento pisano e di metterlo a confronto con un’altra manifestazione importante che si è svolta dal 5 al 7 ottobre a Ferrara: l’Internazionale Festival.

 La scelta del canale di analisi e dei temi è stata dettata anche da una constatazione di carattere puramente pratico: molti utenti hanno trovato difficoltoso capire quali fossero gli hashtag corretti da usare in relazione ai due eventi ed in alcuni casi hanno finito con l’utilizzare l’hashtag sbagliato.

Quella che segue, come ormai avrete intuito, è dunque anche una riflessione sulle pratiche d’uso degli utenti.

Il co-autore di questa analisi a quattro mani e due cervelli è Massimiliano Spaziani, ingegnere, Data Scientist ed ex fellow del Santa Fe Institute, nonché – nell’ultimo anno e mezzo  – altra metà di questo tandem di ricerche e sperimentazioni sui modelli di analisi ed il Social Monitoring di cui io rappresento l’altro pezzo.

Dai dati all’analisi degli hashtag

Siamo partiti da un corpus di 10.149 tweet inviati tra il 4 e il 7 ottobre e contenenti almeno uno dei seguenti hashtag:

  • #if2012: hashtag ufficiale dell’Internet Festival di Pisa
  • #inf2012: hashtag ufficiale dell’Internazionale Festival di Ferrara
  • #if12: hashtag scelto dagli utenti per riferirsi all’veneto pisano o, in misura minore, a quello ferrarese

La scelta degli hashtag da analizzare ha preso le mosse proprio da alcuni tweet che menzionavano l’hashtag #if12, un esempio per tutti quello di Luca Sofri:

Da qui l’ispirazione per un’indagine più approfondita sul tema. La prima evidenza che ne abbiamo tratto è stata la distribuzione degli hashtag rispetto al corpus totale:

A ben vedere, il grosso dei tweets fa riferimento all’Internet Festival, valore che decresce notevolmente per l’Internazionale Festival ma che in entrambi i casi paga la “dispersione” di una serie di tweets in cui è stato usato l’hashtag #if12. In alcuni i casi – ma in misura comunque inferiore all’1% vengono citati anche gli hashtag ufficiali, in altri casi, invece, solo #if12.

Quali sono allora i contenuti di questa piccola percentuale di tweets dispersi?

I temi delle fonti di questo gruppo rientrano in tre macro-aree:

  • Tweets che fanno riferimento alla confusione generatasi tra i vari hashtag
  • Tweets che – pur usando l’hashtag #if12 – fanno riferimento all’evento ferrarese (17% del totale tweets con questo hashtag)
  • Tweets che – pur usando l’hashtag #if12 – fanno riferimento alla manifestazione pisana.

Questi ultimi, in particolare, rappresentano un caso interessante, dal momento che – nel globale – costituiscono il 70% dei tweets con hashtag #if12, ma di questo 70% il 41% non è direttamente riconducibile all’evento.

In altre parole, se un utente Twitter avesse letto lo stream in quel momento non avrebbe avuto alcun elemento (es. citazione del nome della città in cui si svolge la manifestazione, mention all’account dell’evento @InternetFest) per capire che si stava parlando proprio dell’Internet Festival.

In sintesi (almeno apparentemente, per i motivi che vedremo più avanti): una perdita tanto di visibilità per l’evento quanto di informazione per gli utenti. Perdita, peraltro quantificabile.

La reach* stimata generata dai tweets con hashtag #if2012 ammonta a circa 979.252 utenti raggiunti, grazie ai tweets realizzati da 1.413 autori unici. Sono stati invece 998 i twitterers unici che hanno scritto dell’Internazionale Festival generando una reach stimata di 644.434 utenti. Nel globale, la reach dei tweets dei 102 autori unici che hanno usato l’hashtag #if12 è stata di circa 136.627 utenti raggiunti.

“Depurando” quest’ultimo dato grazie al fatto che – per i motivi visti sopra – il 59% dei tweets era chiaramente riconducibile ai due eventi, ne deriva che la “reach dispersa” corrisponde a circa 21.180 utenti raggiunti da tweets. A conti fatti, insomma, una “perdita” non da poco.

D’altra parte la somiglianza tra hashtag – anche quando vengono usati quelli corretti – sembra generare confusione negli utenti e non giovare alla percezione degli eventi stessi. Per contro però l’intelligenza collettiva ha cercato di porre rimedio con la diffusione delle “istruzioni d’uso” corrette.
Fatta eccezione per alcuni casi in cui i diversi hashtag sono stati usati contemporaneamente ma con consapevolezza e senza confusione, le reazioni degli utenti hanno determinato tre principali posizioni:

  1. Critiche nei confronti degli organizzatori degli eventi. In questo caso l’errore viene imputato ai community managers e ad una sorta quindi di mancato “accordo tra le parti”
  2. Critiche nei confronti degli utenti che non sanno correttamente distinguere tra gli hashtag
  3. Diffusione delle versioni corrette degli hashtag

L’analisi delle reti sociali

I tweets analizzati ed i relativi hashtag utilizzati hanno generato numerose interazioni non solo intorno agli eventi in sé ma anche intorno a specifici temi di discussione che, in alcuni casi. hanno avuto la funzione di ponte di collegamento tra i due macrocluster di riferimento.

1. Rete degli hashtag (rete implicita)
Nel grafo rappresentato sotto due hashtag sono da considerarsi in relazione se compaiono nello stesso tweet. Secondo quanto osservato, sono emersi tre cluster principali:

  • quello degli hashtag ricollegabili all’Internet Festival
  • quello degli hashtag relativi all’Internazionale Festival
  • quello degli hashtag menzionati dai tweet di entrambe le manifestazioni.

Come detto sopra, alcuni hashtag  – in particolare #if12 rappresentato con un triangolo rosso- sono stati utilizzati impropriamente dagli autori dei tweet.

Clicca per ingrandire

In totale sono emersi dunque 1.252 hashtag che hanno dato origine a 3.184 relazioni uniche.

2. Rete esplicita delle mention
In questo caso l’autore di un tweet è in relazione con tutti gli account menzionati. Il grafo è dunque orientato, con l’arco che va dall’autore della mention all’account menzionato.

In evidenza i principali nodi, non a caso corrispondenti ad utenti particolarmente attivi all’interno della conversazione sugli eventi e dunque tali da fungere anche da ponti tra i due cluster.

Clicca per ingrandire

Dall’analisi sono emersi 916 autori (tutti gli autori unici che hanno ricevuto almeno una mention) e 3.662 relazioni uniche.

3. Rete implicita delle mention
Nel grafo due account sono in relazione se compaiono come mention nello stesso tweet.

Clicca per ingrandire

Qui sono emersi 729 autori e 1.471 relazioni uniche.

In generale, per l’intervallo temporale preso in esame, è emerso che il 6 ottobre è stata la giornata con il più alto numero di relazioni tra hashtag.

Clicca per ingrandire

Non a caso, ha coinciso con il secondo giorno del festival ferrarese e con il penultimo della manifestazione pisana, oltre al fatto che – trattandosi di un sabato – la quantità di utenti connessi o partecipanti alle iniziative è stata certamente più significativa. Al centro l’hashtag #if12 – che, come visto all’inizio, costituisce una sorta di ponte tra gli eventi – e le due città ospitanti.

Conclusioni
Alcune evidenze sono emerse da subito in questo post, altre le abbiamo costruite procedendo nella nostra analisi.
L’aspetto forse più rilevante resta però quello legato al “potere conoscitivo” delle relazioni: come emerso dalla nostra Social Network Analysis, la densità di relazioni – intese come mention ed uso di molteplici hashtag – ha comunque consentito di “limitare i danni” derivanti da uno scorretto uso degli hashtag ufficiali.
Senza dubbio, l’intelligenza collettiva e la co-correzione hanno contribuito ampiamente, magari anche l’uso comune di indicare l’anno solo con le ultime due cifre e la carenza di spazi di Twitter avranno avuto il loro peso.
Quello insomma che alcuni twitterers hanno visto come un mancato “accordo tra le parti” nell’uso degli hashtag è stata in realtà un’occasione per mostrare come gli utenti determinino usi concreti e linguaggio dei Social.
Temi emersi anche a Pisa e discussi su Twitter. Con hashtag molteplici ma, tutti, significativi.

* Da intendersi come il 15% – fattore che tiene conto della percentuale media di account Twitter che si connettono giornalmente – della somma dei followers di ciascun account partecipante alla conversazione.

Facebook Comments

4 COMMENTS

LEAVE A REPLY

Please enter your comment!
Please enter your name here