Covid19 e streaming online: i dati Twitter, Reddit e Google Trends22/04/2020

L’analisi realizzata dal Lab R&D di Alkemy su Twitter, Reddit e Google Trends, ha preso in esame lo streaming, legale e illegale, e la pirateria online. Ciò che emerge è un fenomeno trasversale, con insight interessanti.

Tra le conseguenze prodotte dalle misure di lockdown, necessarie a prevenire e contrastare la diffusione dell’epidemia del Covid19, si è registrato un aumento nelle visione e nella fruizione di contenuti media, online e offline. Il traffico streaming ha registrato un aumento considerevole, così come riportato da un articolo dell’Economist, secondo il quale potrebbe aumentare del 61% (basandosi su dati Nielsen).

L’analisi di Data Intelligence si è quindi focalizzata sul tema dello streaming, sia legale sia illegale, a partire dalle discussioni Twitter, Reddit e Google Trends. Gli obiettivi sono stati molteplici: individuare correlazioni tra le discussioni a tema #covid19 e #streaming, studiare i modi di diffusione dei link illegali, analizzare la comunicazione delle principali piattaforme online sui social network, capire quali sono e come reagiscono le community.

I risultati in sintesi

  • Il cluster di discussione relativo allo “streaming”, all’interno del corpus di analisi “Covid19”, presenta dei network tematici relativi al gaming e allo streaming video;

  • Emergono cluster di discussioni sulla visione di film di Bollywood o film di Hollywood con traduzioni in Hindi.

  • Si registra una forte presenza di comunicazione spam e automatizzata.

  • La comunicazione delle piattaforme di streaming a livello internazionale è alta e suscita un forte coinvolgimento degli utenti

  • Disney+ è l’account più coinvolgente su Twitter;

  • Google Trends, evidenzia una crescita nella ricerca delle parole Free Streaming e Streaming online.

  • Contagion, film del 2011, registra un altissimo interesse online su Google Trends.

  • Su Reddit le persone tendono a trovare dei modi alternativi alla tv via cavo per lo più ricercando siti di streaming-

Piattaforme online di Streaming: il confronto

Le conversazioni su Twitter evidenziano il coinvolgimento tra le piattaforme di streaming e i servizi offerti. Lo studio ha analizzato oltre 3.300 tweet pubblicati a partire dal 1 febbraio 2020, prima che in numerosi paesi nel mondo si applicassero le misure di lockdown, fino al 07 aprile. Netflix è l’account più attivo (con il 40,6% dei tweet pubblicati per il corpus analizzato), seguito da Prime Video (34,3%), Disney Plus (10,3%), Mixer (10%) e Twitch (4,8 %).

L’account più coinvolgente è Disney Plus con il 36,4% delle reactions complessive (ovvero il totale di like e commenti ricevuti per post pubblicati), seguito da Netflix con il 30,7%, Twitch con il 20,4%, Prime Video con il 8,3% e Mixer con il 4,1 %.

#Covid19 e #Streaming: l’analisi Twitter

Periodo analizzato 10 marzo 2020 - 07 aprile 2020 - Fonte Twitter API

L’analisi degli hashtag correlati al cluster Streaming evidenzia come, a livello quantitativo, gli hashtag più utilizzati siano #stayathome, #china, #gaming. L’attività non è alta, rispetto ai tweet raccolti a livello complessivo. Al contrario, l’analisi degli hashtag più coinvolgenti presenta alcuni interessanti risultati. L’hashtag più coinvolgente è #stayathome, con oltre 2500 reactions e condivisioni. Seguono alcuni hashtag legati al mondo del gaming #t1fighting (videogioco) e al korean pop #gidle e #monstax (gruppi musicali coreani). Emerge anche un hashtag legato a una serie tv Netflix #housearrest, in questo caso l’espressione potrebbe sovrapporsi alla critica nel rimanere confinati a casa.

Periodo analizzato 10 marzo 2020 - 07 aprile 2020 - Fonte Twitter API

L’analisi della rete rivela gli hub, nodi principali, legati alle tematiche selezionate. L’ecosistema interattivo racconta le connessioni esistenti tra i temi, emersi nell’analisi complessiva. La rete è orientata verso i punti stella. Viene generato un link tra due hashtag se gli stessi sono presenti all’interno dello stesso post/commento/tweet/reply/retweet. Il focus sul #Coronavirus è collegato a numerosi hashtag dell’ecosistema dello streaming #livestreaming #livestream #music #radio. Interessanti collegamenti con #netflix e #twitch. Il cluster Streaming invece non è un punto stella delle discussioni. Si notano le connessioni con #gaming, #viral, #health, #conference, #twitch. Il cluster Gaming è legato agli hashtag #quarantinelife #covid19 #youtube #supportsmallstreamers #thanksforwatching

Streaming illegale: l’analisi delle conversazioni Twitter in lingua inglese e delle conversazioni internazionali

Periodo 31 marzo marzo - 07 aprile 2020 Fonte: Twitter API

La Complex Network Analysis, con chiavi di ricerca “free movies”, “free online movies” e “movies free” in lingua inglese, ha evidenziato due cluster di conversazioni polarizzati. Il punto di connessione è #freefullmovies che collega i cluster #tophindimovies e #hollywoodmoviesinhindi. Entrambi contengono hashtag con una parte comune - movies - ma con variazioni semantiche, possibili attività riconducibili a componenti automatizzate e spam.

Periodo 31 marzo marzo - 09 aprile 2020 - Fonte: Twitter API 5.503 tweet analizzati

Nelle discussioni a livello internazionale la Complex Network Analysis, presenta due importanti centri stella #freemovies e #leaked (trapelare) che potrebbero riferirsi a link illegali per la diffusione di contenuti video. Emerge inoltre il cluster #fullmoviesfree con riferimenti alle piattaforme di streaming verystream, putlocker..

Google Trends: Free Streaming e Streaming Online

Periodo 09 marzo 2020 - 06 aprile 2020 - Fonte: Google Trends - elaborazione dati

Il confronto tra le ricerche “Free Streaming” e “Streaming online” evidenzia un aumento di attività degli utenti negli ultimi trenta giorni. La distribuzione geografica delle due ricerche a livello internazionale mostra un forte interesse in Europa, nel Nord e Sud America, nel sub-continente Indiano. Da notare l’interesse anche in Indonesia e Australia.

“Streaming online” per il periodo 09 marzo 2020 - 06 aprile 2020 - Fonte: Google Trends - elaborazione dati

“Free streaming” per il periodo 09 marzo 2020 - 06 aprile 2020 - Fonte: Google Trends - elaborazione dati

Contagion, film del 2011 che narra l’evolversi di un'epidemia simile a quella del Covid19 a livello globale, è stata la parola più cercata associata a free streaming.

Query associate in crescita a Free streaming Valore (superiore al 5000%)
contagion streaming Impennata
contagion Impennata
contagion free streaming Impennata
met opera streaming Impennata

Periodo 09 marzo 2020 - 06 aprile 2020 - Fonte: Google Trends - elaborazione dati

Analisi Reddit: i subreddit (community di Reddit)

Subreddit Descrizione Numero di commenti
r/CordCutters I moderatori promuovono discussioni incentrate su piattaforme di streaming sostitutive alla TV via cavo 31.195
r/IllegalLifeProTips Spazio in cui si condividono processi ed esperienze illegali 86.159
r/Piracy Spazio incentrato sulla digital piracy 77.980

Periodo compreso tra il 1° Gennaio e l’8 Aprile 2020

Le discussioni riguardano soprattutto servizi di streaming online legali e illegali in lingua inglese. Le analisi del testo dei post di Reddit hanno evidenziato che le ricerche provengono principalmente dal mercato statunitense. In particolare: nei primi 4 mesi del 2020 quasi il 50% degli ingressi Reddit da desktop proviene dagli USA, a seguire Regno Unito (7.91%) e Canada (7,41%) secondo quanto riportato dal portale Statista.

Classifica delle piattaforme di streaming online e di acquisto dei dispositivi di accesso allo streaming

Numero di account discussi all’interno dei subreddit r/CordCutters, r/IllegalLideProTips e r/Piracy

In questa classifica sono considerati non solo le piattaforme di streaming online, ma anche i siti di ecommerce perché riferiti all’acquisto di prodotti come il Chromecast e chiavette HDMI per smartTV. Amazon è il più discusso nei tre subreddit, due volte rispetto a Google (con l’app di streaming Bravo) e Apple.

La rete televisiva HBO, che si trova al quarto posto, è attiva nella produzione di serie tv, così come Netflix, che si trova al decimo posto, dopo ESPN (ottavo), Fox (nono) e Comcast il più grande operatore di TV via cavo degli Stati Uniti (sesto posto). Dalle frequenze nel diagramma a barre, sono stati selezionati i siti di streaming che offrono direttamente il servizio di intrattenimento, ottenendo così i risultati nel grafico a torta in basso. In questa classifica HBO (15,8%) e Disney (12,9%) sono le piattaforme più discusse, mentre con un valore inferiore all’1% si posiziona Bravo.

Percentuale degli account discussi all’interno dei subreddit r/CordCutters, r/IllegalLideProTips e r/Piracy

Topic Analysis dei subreddit

Topic Analysis del subreddit r/CordCutters utilizzando l’algoritmo Latent Dirichlet Allocation.

L’applicazione di moderne tecniche di Natural Language Processing hanno permesso di pulire il testo dei commenti in lingua inglese e di processarlo grazie all’utilizzo delle principali librerie per la Data Science. Il topic principale all’interno del subreddit riguarda lo streaming free su Roku, un’azienda che produce decoder e pennette HDMI per lo streaming. Questi prodotti vengono utilizzati anche per servizi di streaming pirata, che da sempre l’azienda contrasta con diversi provvedimenti.

Il secondo topic che è emerso è incentrato su canali TV specifici Fox e NBC, nonché servizi di streaming come HULU per le serie TV e ESPN per lo sport.

Topic Analysis del subreddit r/Piracy utilizzando l’algoritmo Latent Dirichlet Allocation.

Nel subreddit r/Piracy invece le discussioni attorno allo streaming sono maggiormente orientate verso soluzioni illegali. I topic sono individuati tramite grafico a bolla.

  • il Topic “1” è incentrato su discussioni più tecniche, come scaricare e installare altri file specifici: in questo caso compaiono parole come “VPN”, “software”, “Windows”, “Netflix”, “money”.

  • il Topic 2 è incentrato su come scaricare file torrent, per usufruire in modo gratuito di contenuti video.

  • il Topic “3” è relativo al download di giochi per pc e musica.

I topic etichettati come “1” e “2” sono sovrapposti e le parole chiave sono molto simili tra loro.

elaborazione algoritmica e grafica a cura del Team R&D di Alkemy SpA

Alice Andreuzzi, Digital Project Manager

Alessandra Spada, Chief Technology & Research Officer

Nicola Piras, Graphic Designer

Luca Tacchetti, Project Manager & Data Analyst

Stefano Vacca, Data Scientist

Si ringrazia per il supporto Andrea Montaldo Deweave srl