Come analizzare i Big data? Metti che hai un argomento che ti interessa, un ambito di mercato che vuoi conoscere, una serie di prodotti da tenere sotto controllo in termini di “come se ne parla”: come si potrebbe procedere? In che modo organizzare – una volta prelevati – i dati che il web ci mette a disposizione? Voglio condividere alcuni step che seguo. Innanzitutto definire la profondità temporale dei dati da prelevare: una settimana? Un mese? Un anno? Dipende. Dipende sia dall’ambito merceologico che dall’obiettivo che vi ponete: personalmente vado da un minimo di una settimana ad un massimo di un mese, questo per la freschezza delle conversazioni nelle quali eventualmente inserirsi. Colleziono, comunque i dati in excel, in modo da costruirmi uno storico più profondo qualora occorra. Definiti questi aspetti mi muovo secondo tre momenti: quantità e qualità delle opinioni; analisi dei differenti ambiti di riferimento; ruolo degli utenti sul tema analizzato.
Quantità delle opinioni
Conoscere come si distribuisce la quantità delle opinioni lungo l’arco temporale che abbiamo preso in considerazione è importante in quanto potremmo individuare alcune caratteristiche dell’argomento, una per tutte la ciclicità . Per un evento sportivo, ad esempio, capire in che modo gli eventuali picchi della giornata dell’evento, della gara, poi si distribuiscono nel tempo e vedere se esistono dei momenti di frizione.
Qualità delle opinioni
Per qualità delle opinioni intendo la capacità che queste hanno di generare engagement. Nel grafico che riporto unisco due dati: quantità delle opinioni ed engagement. Appare evidente come nella prima settimana dell’arco temporale considerato si siano generate opinioni relativamente all’argomento oggetto di analisi, ma queste non siano state capaci di ingaggiare gli utenti in rete. Andando avanti nel tempo, notiamo come ci sia una buona reattività da parte degli utenti in rete con tre picchi sopra la media. A questo punto la domanda sorge spontanea: esiste una sorta di correlazione tra l’engagement che le opinioni in rete hanno prodotto e la qualità dell’ingaggio? Introduciamo, a questo punto, l’elemento del sentiment
Ordinando i dati avviamo l’analisi di correlazione che ci restituisce una informazione che identifico come “di carattere”: il sentiment – in tutte le sue espressioni – presenta una correlazione >0 comunque sempre all’interno di un buon grado di elasticità e non di rigidità che si avrebbe con un rapporto 1:1. La correlazione più debole è rappresentata dal sentiment negativo. Per una pulizia di ragionamento, fino a questo momento dell’analisi il sentiment è preso “tal quale” e non armonizzato da una analisi semantica votata a restituire il vero significato del sentiment, riconducendo l’opinione all’interno dell’ambito di riferimento nel quale si è formato. Per chiudere il quadro, unisco la quantità del sentiment (volumi di buzz divisi per sentiment) con i volumi di engagement. A questo punto abbiamo individuato le frazioni temporali nelle quali approfondire l’analisi
Analisi dei differenti ambiti di riferimento
Nell’esempio riportato Blog, Twitter, Facebook e news online sono gli ambiti dove l’argomento oggetto di analisi si è sviluppato. L’analisi dei differenti ambiti di riferimento permette di capire – a seconda del medium – quale sia lo stile da tenere nel caso si voglia entrare nella conversazione, quale sia il tono di voce da utilizzare: toni e modi per dirla in breve.
E’ in questa fase che troviamo la parte più “lavorata” dell’analisi dei bigdata: quella semantica. Approccio semantico che non può essere demandato ad un tool, ad un robot, ma necessita dell’intervento umano per confermare o ridimensionare la qualità del sentiment identificando l’ambito nel quale la conversazione si è generata. E’ in questa fase di disamina attenta delle conversazioni che è possibile identificare gli influencer, gli opinion leader che – per certi versi – guidano la conversazione. La loro individuazione ci fa traguardare l’ultimo step
Ruolo degli utenti sul tema analizzato
Altro aspetto dell’analisi che avviene sia manualmente che “automaticamente”. Manualmente raccogliamo le informazioni sui profili delle persone maggiormente attive sull’argomento (limitatamente al periodo considerato): personalmente ne analizzo il profilo per capirne la congruità , su certi argomenti è molto probabile che non esista, per il semplice fatto che – come dico sempre – non siamo mai lo stesso target. Ma questo non è un problema. Questo primo momento mi permette di redigere delle liste che poi metto in pasto ad un tool di analisi che mi restituisce vari dati grezzi. L’utilizzo dei filtri statistici mi permette di identificare le informazioni più in linea con l’obiettivo dell’analisi.
Come analizzare i big data?
Come analizzare i Big data? Metti che hai un argomento che ti interessa, un ambito di mercato che vuoi conoscere, una serie di prodotti da tenere sotto controllo in termini di “come se ne parla”: come si potrebbe procedere? In che modo organizzare – una volta prelevati – i dati che il web ci mette a disposizione? Voglio condividere alcuni step che seguo. Innanzitutto definire la profondità temporale dei dati da prelevare: una settimana? Un mese? Un anno? Dipende. Dipende sia dall’ambito merceologico che dall’obiettivo che vi ponete: personalmente vado da un minimo di una settimana ad un massimo di un mese, questo per la freschezza delle conversazioni nelle quali eventualmente inserirsi. Colleziono, comunque i dati in excel, in modo da costruirmi uno storico più profondo qualora occorra. Definiti questi aspetti mi muovo secondo tre momenti: quantità e qualità delle opinioni; analisi dei differenti ambiti di riferimento; ruolo degli utenti sul tema analizzato.
Quantità delle opinioni
Qualità delle opinioni
Analisi dei differenti ambiti di riferimento
E’ in questa fase che troviamo la parte più “lavorata” dell’analisi dei bigdata: quella semantica. Approccio semantico che non può essere demandato ad un tool, ad un robot, ma necessita dell’intervento umano per confermare o ridimensionare la qualità del sentiment identificando l’ambito nel quale la conversazione si è generata. E’ in questa fase di disamina attenta delle conversazioni che è possibile identificare gli influencer, gli opinion leader che – per certi versi – guidano la conversazione. La loro individuazione ci fa traguardare l’ultimo step
Ruolo degli utenti sul tema analizzato
Categorie