Come analizzare i big data?

13 Marzo 2015 admin

Come analizzare i Big data? Metti che hai un argomento che ti interessa, un ambito di mercato che vuoi conoscere, una serie di prodotti da tenere sotto controllo in termini di “come se ne parla”: come si potrebbe procedere? In che modo organizzare – una volta prelevati – i dati che il web ci mette a disposizione? Voglio condividere alcuni step che seguo. Innanzitutto definire la profondità  temporale dei dati da prelevare: una settimana? Un mese? Un anno? Dipende. Dipende sia dall’ambito merceologico che dall’obiettivo che vi ponete: personalmente vado da un minimo di una settimana ad un massimo di un mese, questo per la freschezza delle conversazioni nelle quali eventualmente inserirsi. Colleziono, comunque i dati in excel, in modo da costruirmi uno storico più profondo qualora occorra. Definiti questi aspetti mi muovo secondo tre momenti: quantità  e qualità  delle opinioni; analisi dei differenti ambiti di riferimento; ruolo degli utenti sul tema analizzato.

Quantità  delle opinioni

Step 1: BuzzConoscere come si distribuisce la quantità  delle opinioni lungo l’arco temporale che abbiamo preso in considerazione è importante in quanto potremmo individuare alcune caratteristiche dell’argomento, una per tutte la ciclicità . Per un evento sportivo, ad esempio, capire in che modo gli eventuali picchi della giornata dell’evento, della gara, poi si distribuiscono nel tempo e vedere se esistono dei momenti di frizione.

Qualità  delle opinioni

qualità  del buzzPer qualità  delle opinioni intendo la capacità  che queste hanno di generare engagement. Nel grafico che riporto unisco due dati: quantità  delle opinioni ed engagement. Appare evidente come nella prima settimana dell’arco temporale considerato si siano generate opinioni relativamente all’argomento oggetto di analisi, ma queste non siano state capaci di ingaggiare gli utenti in rete. Andando avanti nel tempo, notiamo come ci sia una buona reattività  da parte degli utenti in rete con tre picchi sopra la media. A questo punto la domanda sorge spontanea: esiste una sorta di correlazione tra l’engagement che le opinioni in rete hanno prodotto e la qualità  dell’ingaggio? Introduciamo, a questo punto, l’elemento del sentiment

correlazione engagementOrdinando i dati avviamo l’analisi di correlazione che ci restituisce una informazione che identifico come “di carattere”: il sentiment – in tutte le sue espressioni – presenta una correlazione >0 comunque sempre all’interno di un buon grado di elasticità  e non di rigidità  che si avrebbe con un rapporto 1:1. La correlazione più debole è rappresentata dal sentiment negativo. Per una pulizia di ragionamento, fino a questo momento dell’analisi il sentiment è preso “tal quale” e non armonizzato da una analisi semantica votata a restituire il vero significato del sentiment, riconducendo l’opinione all’interno dell’ambito di riferimento nel quale si è formato.sentiment Per chiudere il quadro, unisco la quantità  del sentiment (volumi di buzz divisi per sentiment) con i volumi di engagement. A questo punto abbiamo individuato le frazioni temporali nelle quali approfondire l’analisi

Analisi dei differenti ambiti di riferimento

mediaNell’esempio riportato Blog, Twitter, Facebook e news online sono gli ambiti dove l’argomento oggetto di analisi si è sviluppato. L’analisi dei differenti ambiti di riferimento permette di capire – a seconda del medium – quale sia lo stile da tenere nel caso si voglia entrare nella conversazione, quale sia il tono di voce da utilizzare: toni e modi per dirla in breve.

E’ in questa fase che troviamo la parte più “lavorata” dell’analisi dei bigdata: quella semantica. Approccio semantico che non può essere demandato ad un tool, ad un robot, ma necessita dell’intervento umano per confermare o ridimensionare la qualità  del sentiment identificando l’ambito nel quale la conversazione si è generata. E’ in questa fase di disamina attenta delle conversazioni che è possibile identificare gli influencer, gli opinion leader che – per certi versi – guidano la conversazione. La loro individuazione ci fa traguardare l’ultimo step

Ruolo degli utenti sul tema analizzato

ruolo degli utentiAltro aspetto dell’analisi che avviene sia manualmente che “automaticamente”. Manualmente raccogliamo le informazioni sui profili delle persone maggiormente attive sull’argomento (limitatamente al periodo considerato): personalmente ne analizzo il profilo per capirne la congruità , su certi argomenti è molto probabile che non esista, per il semplice fatto che – come dico sempre – non siamo mai lo stesso target. Ma questo non è un problema. Questo primo momento mi permette di redigere delle liste che poi metto in pasto ad un tool di analisi che mi restituisce vari dati grezzi. L’utilizzo dei filtri statistici mi permette di identificare le informazioni più in linea con l’obiettivo dell’analisi.