Come fare content curation con i dati

8 giugno 2018 admin

Content is the king: ce lo sentiamo ripetere sempre quando parliamo di content curation. Produrre un contenuto di valore è difficile, se non abbiamo nessuna idea è praticamente impossibile. Il valore di un contenuto può avere molteplici significati. Una cosa è certa: oltre alla sua originalità  deve rispecchiare la domanda di mercato; deve rispecchiare, cioè, quello che le persone cercano in rete. I dati presenti in rete possono aiutarci in questo senso e, una volta elaborati, possono fornirci diverse strade da percorrere.

Content curation data driven: quali gli step operativi

Si parte dal topic: definito l’argomento è necessario disegnare l’architettura di analisi. L’architettura di analisi non è altro che un semplice documento dove registrare gli elementi principali della nostra analisi come ad esempio: il lasso temporale da considerare, l’individuazione dei canali dove risiedono i contenuti, analisi della domanda specifica.

Questi quattro elementi di base devono essere poi ampliati a seconda delle risultanze che lo scraping dei dati fornisce. Elemento fondamentale è avere un buon crowler per avere i dati grezzi di partenza.

Il topic che porto come esempio, ed i cui dati sono stati prelevati oltre un anno fa, è quello della sanità  digitale. Il lasso temporale considerato è stato di 30 giorni. La scelta di questo timing ristretto è dovuto al fatto che è necessario evitare la dispersione della domanda: un timing stretto assicura di prelevare dati contingenti ad avvenimenti recenti.

L’interrogazione della rete ha permesso di estrarre oltre 1700 contenuti con un duopolio di canali su cui questi contenuti viaggiavano.  Twitter e articoli online si stavano dividendo, un anno fa, i contenuti sul topic sanità  digitale.

Da questa informazione è possibile allargare la struttura architettonica della nostra analisi: prelevare le informazioni dal web per fare la text mining analysis e capire l’esistenza di aspetti particolari; realizzare l’analisi delle conversazioni si twitter per capire in che modo il tema fosse dibattuto ed individuarne, qualora esistessero, influencer specifici.

 

Content curation: la SERP Analysis

La SERP Analysis ci permette di identificare sia la competizione esistente sul tema, sia i segmenti che lo compongono. L’approccio è quello dell’analisi di long tail che molti di voi conoscono. L’analisi di coda lunga, però, non è la sola tipologia di attività  che è possibile effettuare su una SERP: una volta prelevata è possibile analizzarla anche attraverso la text mining analysis, in particolare sulla dimensione della meta description. La meta description è uno degli elementi fondamentali che orientano le nostre ricerche facilitando la scelta di clikkare, o meno, su uno dei vari link che una interrogazione su google ci restituisce. Dato il timing ed il topic, un anno fa ho prelevato circa 980 siti (pari al 50% della SERP completa) con una scelta casuale stratificata. La stratificazione permette di considerare diverse fasce di aggregazioni ed avere una rappresentatività  statistica.

Per valutare l’opportunità  di realizzare la text mining analysis in modo approfondito, il primo indicatore che si guarda è quello del grafico di Zipf: un grafico fitto ci dimostra che i temi riassunti nella meta description sono argomentati; c’è del materiale su cui poter lavorare ed andare avanti con l’analisi.

Content curation: text mining analysis

Gli insight emersi un anno fa sono stati molto interessanti: la maggior parte dei contenuti online erano relativi ad articoli/post a carattere locale e questi sporcavano la capacità  dell’analisi di far emergere il mood di fondo.

 

Ripulendo questi aspetti, è stato possibile identificare due macro cluster: uno relativo all’identità  digitale , l’altro più specifico sul tema dell’innovazione digitale nel settore ospedaliero (parte destra del grafico).

La lettura dei contenuti dei due cluster ha permesso di individuare: 4 riferimenti web per il cluster identità  digitale e 10 riferimenti per il cluster innovazione digitale.

Questi 14 siti rappresentano le fonti rilevanti per una prima identificazione del mood di fondo su un determinato topic. Unendo queste istanze con la segmentazione fatta con l’analisi della coda lunga, abbiamo ottime indicazioni per identificare l’ambito tematico che con il nostro contenuto vogliamo coprire.

 

Content curation: topic assessment con la SNA

Su Twitter sono state prelevate oltre 728 conversazioni ed è stato rilevato un network di 526 opinanti che hanno generato oltre 500 relazioni

Applicando gli indicatori statistici opportuni, si sono evidenziati alcuni cluster di conversazione. In particolare:

  • Mercato della sanità  digitale (cluster verde)
  • Innovazione nella sanità  digitale (cluster rosso)
  • Fascicolo elettronico (cluster nero)
  • Osservatorio del PoLIMI (cluster arancione)
  • Convegno osservatorio digitale (cluster centrale)

Da ogni singolo cluster sono stati, poi, estratti i principali contenuti.

 

Entrambe le analisi, seppur con ovvie sfumature, confermano gli insight che possono essere utilizzati in ottica di content curation data driven assecondando sia la domanda di mercato che le conversazoni ad essa associate. Non solo: la social networking analysis ci permette anche di individuare quali tra gli attori analizzati, siano i migliori da “contattare” per la condivisione del contenuto che andremo a creare.