Come analizzare i dati di indagine

Hai raccolto i risultati della tua indagine e hai elaborato un piano di analisi dei dati. Ora è il momento di passare alla fase di approfondimento, riordino e analisi dei dati.

L'analisi dei dati di indagine non è mai stata così semplice

Le tue indagini online sono state completate. Ora che hai raccolto i risultati della tua indagine statistica e hai elaborato un piano di analisi dei dati, è il momento di passare alla fase analitica. Vediamo come i nostri esperti di indagini interpretano i dati quantitativi (rispetto ai dati qualitativi), a partire da come analizzano le risposte e si focalizzano sulle domande principali e sugli obiettivi dell'indagine, a come esaminano i numeri e infine traggono le conclusioni.

Scopri perché l'analisi dei risultati con SurveyMonkey è semplice e immediata

Vuoi cominciare?

Per iniziare a esaminare i risultati dell'indagine in modo più efficace, segui questi 4 passaggi:

  1. Analisi delle domande principali della ricerca
  2. Applicazione di tabelle incrociate e filtri ai risultati
  3. Calcolo dei numeri
  4. Trarre le conclusioni

Analisi delle domande principali della ricerca

Innanzitutto, vediamo come calcolare i risultati relativi alle domande principali della tua ricerca. Hai proposto domande di ricerca di tipo empirico? Hai previsto un campionamento probabilistico? Ricorda che avresti dovuto delineare le domande principali della ricerca quando hai impostato l'obiettivo della tua indagine.

Se, ad esempio, hai organizzato una conferenza scolastica e hai distribuito ai partecipanti un'indagine di feedback post-evento, una delle domande principali della tua ricerca potrebbe essere: come è stato valutato complessivamente l'evento? Ora, esaminiamo le risposte che hai raccolto per una domanda specifica dell'indagine destinata a fare luce su tale interrogativo:

Intendi partecipare a questa conferenza il prossimo anno?

Opzioni di risposta
71%852
No18%216
Non sono sicuro11%132
Totale1200

Come puoi notare, le risposte contengono delle percentuali (71%, 18%) e dei numeri puri (852, 216).

Le percentuali corrispondono al numero delle persone, espresso in valore percentuale, che hanno dato una determinata risposta. In altre parole, le percentuali rappresentano il numero di persone che hanno dato ogni risposta, rispetto al numero totale di persone che hanno risposto alla domanda. Quindi, il 71% dei rispondenti all'indagine (852 dei 1200 intervistati) prevede di ritornare il prossimo anno.

Questa tabella mostra anche che il 18% pensa di non ritornare e l'11% si dichiara incerto.

Applicazione di tabelle incrociate e filtri ai risultati

Ricorderai che quando hai stabilito un obiettivo per la tua indagine e sviluppato il tuo piano di analisi, hai pensato a quali sottogruppi avresti analizzato e confrontato. Questo è il momento in cui tale pianificazione entra in gioco. Ad esempio, supponiamo che tu voglia confrontare le risposte di insegnanti, studenti e amministratori alla domanda relativa alla conferenza del prossimo anno. Per farlo, vuoi approfondire i tassi di risposta mediante una tabulazione incrociata, dove mostri i risultati della domanda sulla conferenza per sottogruppo:

NoNon sono sicuroTotale
Insegnante80%
320
7%
28
13%
52
400
Amministratore46%
184
40%
160
14%
56
400
Studente86%
344
8%
32
6%
24
400
Totale rispondenti8522161321200

Da questa tabella si vede che una grande maggioranza degli studenti (86%) e degli insegnanti (80%) prevede di tornare l'anno prossimo. Tuttavia, la percentuale relativa agli amministratori che hanno partecipato alla conferenza è ben diversa e indica che meno della metà (46%) di loro intende tornare. È auspicabile che alcune delle altre domande ti aiuteranno a capire il motivo di questa percentuale più bassa e cosa fare per rendere la conferenza più interessante per gli amministratori, in modo che molti di loro tornino anno dopo anno.

L'uso di un filtro è un altro modo utile per modellare i dati. Filtrare significa restringere l'attenzione su un particolare sottogruppo escludendo gli altri. In questo modo, anziché confrontare i sottogruppi tra loro, si analizza il modo in cui un sottogruppo ha risposto alla domanda. Ad esempio, potresti focalizzarti solo sulle donne o solo sugli uomini, quindi eseguire di nuovo la tabulazione incrociata in base al tipo di partecipante per confrontare le risposte degli amministratori, insegnanti e studenti di sesso femminile. Fai attenzione perché quando analizzi i risultati, ogni volta che applichi un filtro o una tabulazione incrociata, la dimensione del campione si riduce. Per avere la certezza che i risultati siano statisticamente rilevanti, ti consigliamo di utilizzare un calcolatore della dimensione del campione.

Analisi comparativa, tendenze e dati di confronto

Supponiamo che la tua indagine di feedback sulla conferenza contenga la domanda chiave "In generale, quanto ti ha soddisfatto la conferenza?". I risultati mostrano che il 75% dei partecipanti si dichiara soddisfatto. Il risultato è piuttosto buono. Ma non vorresti avere un po' di contesto? Qualche dato di confronto? È meglio o peggio dell'anno scorso? Com'è in confronto alle altre conferenze?

Bene, supponiamo che tu abbia posto questa domanda nella tua indagine di feedback dopo la conferenza dello scorso anno. Potresti essere in grado di eseguire un confronto delle tendenze. Come dicono i sondaggisti professionali d'oltreoceano, "trend is your friend".

Se il tasso di soddisfazione dell'anno scorso era del 60%, la soddisfazione è cresciuta del 15%! Che cosa ha determinato questo aumento della soddisfazione? Le risposte ad altre domande dell'indagine potrebbero fornire qualche chiarimento.

Se non disponi dei dati delle conferenze degli anni precedenti, da quest'anno prendi l'abitudine di raccogliere dei feedback dopo ogni conferenza. È quello che si chiama benchmarking. Stabilisci un parametro di riferimento o numero di base e, da questo momento, potrai verificare se e come varia con il tempo. Puoi valutare non solo la soddisfazione dei partecipanti, ma anche altri aspetti. Sarai in grado di tracciare, anno dopo anno, cosa pensano i partecipanti della conferenza. Questa viene definita analisi dei dati longitudinale.

Puoi persino tenere traccia dei dati per diversi sottogruppi. Supponiamo, ad esempio, che i tassi di soddisfazione crescano anno dopo anno per gli studenti e gli insegnanti, ma non per gli amministratori. Potresti voler esaminare le risposte degli amministratori a diverse domande per cercare di capire perché sono meno soddisfatti degli altri partecipanti.

Calcolo dei numeri

Sei a conoscenza di quante persone hanno affermato di voler ritornare, ma come fai a sapere se le risposte all'indagine sono attendibili e se puoi utilizzarle con sicurezza per prendere decisioni informate in futuro? È importante fare attenzione alla qualità dei dati e capire i fattori della rilevanza statistica.

Nell'uso comune, il termine "rilevante" indica qualcosa di importante o significativo. Nell'ambito dell'analisi e delle statistiche d'indagine, per rilevante si intende "una valutazione dell'accuratezza". È qui che entra in gioco l'inevitabile "più o meno" per un'indagine. In particolar modo, ciò significa che i risultati dell'indagine sono accurati entro un certo livello di confidenza e non per pura casualità. Trarre conclusioni in base a risultati non accurati, ovvero non statisticamente rilevanti, è rischioso. Il primo fattore da considerare in qualsiasi valutazione della rilevanza statistica è la rappresentatività del tuo campione, vale a dire fino a che punto il gruppo di persone incluse nella tua indagine presenta le caratteristiche della popolazione totale in merito alla quale vuoi trarre le conclusioni.

Hai un problema se il 90% dei partecipanti alla conferenza che hanno completato l'indagine erano uomini, ma solo il 15% di tutti i partecipanti era di sesso maschile. Più informazioni hai sulla popolazione oggetto del tuo studio, più sicurezza avrai circa i risultati ottenuti dalla tua indagine. Almeno dal punto di vista del genere, non ci sono problemi se gli uomini rappresentano il 15% dei rispondenti all'indagine in questo esempio.

Se il campione della tua indagine è scelto casualmente da una popolazione nota, la rilevanza statistica può essere calcolata in modo molto diretto. È qui che entra in gioco un fattore fondamentale, la dimensione del campione. Supponiamo che 50 delle 1000 persone che hanno partecipato alla conferenza abbiano risposto all'indagine. Cinquanta (50) è una piccola dimensione del campione che comporta un grosso margine di errore. In poche parole, i tuoi risultati saranno poco rilevanti.

Supponiamo che tu abbia chiesto ai rispondenti all'indagine a quante delle 10 sessioni disponibili del ciclo di conferenze hanno partecipato. I risultati che hai ottenuto sono i seguenti:

12345678910TotaleValutazione media
N. di sessioni frequentate10%
100
0%
0
0%
0
5%
50
10%
100
26%
280
24%
240
19%
190
5%
50
1%
10
10006,1

Potresti decidere di analizzare la media. Come forse ricorderai, ci sono tre tipi diversi di medie: media, mediana e moda.

Nella tabella riportata sopra, il numero medio di sessioni frequentate è 6,1. Questa è la media, il tipo con cui forse hai più familiarità. La media si calcola sommando i dati e dividendo il risultato per il numero dei dati stessi. In questo esempio, 10 persone dicono di aver partecipato a una sessione, 50 persone a quattro sessioni, 100 persone a cinque sessioni e così via. Quindi, si moltiplicano tra loro queste coppie di numeri, le si sommano e poi si dividono per il numero totale di persone.

La mediana è un altro tipo di media. La mediana è il valore intermedio, la soglia del 50%. Nella tabella riportata sopra dobbiamo individuare il numero di sessioni in cui 500 persone si trovano a sinistra e 500 a destra di tale valore. In questo caso, la mediana corrisponde a sei sessioni. Questo può aiutarti a eliminare eventuali anomalie che potrebbero compromettere i tuoi dati.

L'ultimo tipo di media è la moda. La moda è la risposta più frequente. In questo caso la risposta è 6. 260 partecipanti all'indagine hanno preso parte a 6 sessioni, più di quanti abbiano partecipato a qualsiasi altro numero di sessioni.

Le medie – di vari tipi – possono anche essere utilizzate se i tuoi risultati si basano sulle scale Likert.

Trarre le conclusioni

Al momento di trarre le conclusioni sui risultati delle indagini, pensa a quale storia raccontano i dati.

Supponiamo che, in generale, la tua conferenza abbia ricevuto valutazioni mediocri. Hai eseguito un'analisi approfondita per individuare le cause di questo risultato. I dati mostrano che i partecipanti hanno espresso valutazioni molto positive nei confronti di quasi tutti gli aspetti della conferenza, ad esempio le sessioni, i corsi, gli eventi sociali e l'hotel, a eccezione della location. (Forse la conferenza si è tenuta in Lombardia nel mese di gennaio, quando il tempo era davvero poco clemente!) Che storia raccontano questi dati? Ottima conferenza in generale, pessima location! Sicilia o Sardegna potrebbero essere location migliori per una conferenza invernale.

Quando analizzi i dati e trai le conclusioni devi considerare due aspetti: la causalità e la correlazione.

Analizza la tua prossima indagine con SurveyMonkey

Appendice

Che cos'è la raccolta dei dati di indagine?

La raccolta dei dati di indagine prevede l'impiego di indagini per raccogliere informazioni da rispondenti specifici. Tale processo può sostituire o integrare altri tipi di raccolta dati, come le interviste, i gruppi di discussione e altro ancora. I dati raccolti dalle indagini possono essere utilizzati per aumentare il coinvolgimento dei dipendenti, comprendere il comportamento degli acquirenti e migliorare le esperienze dei clienti.

Che cose'è l'analisi dei dati longitudinali?

L'analisi dei dati longitudinali (spesso chiamata "analisi delle tendenze") consiste sostanzialmente nel monitorare come le risposte a determinate domande cambiano nel tempo. Una volta definito un parametro di riferimento, è possibile determinare se e come cambiano i valori. Supponiamo che il tasso di soddisfazione relativo alla conferenza fosse del 50% tre anni fa, del 55% due anni fa, del 65% l'anno scorso e del 75% quest'anno. Complimenti! L'analisi dei dati longitudinali mostra una tendenza della soddisfazione in costante crescita.

Qual è la differenza tra correlazione e causalità?

Si parla di causalità quando un fattore ne causa un altro e di correlazione quando due variabili si muovono insieme, ma una non influenza o causa l'altra. Ad esempio, bere cioccolata calda e indossare guanti imbottiti sono due variabili correlate, tendono a salire e a scendere insieme. Tuttavia, una non causa l'altra. Difatti, sono entrambe causate da un terzo fattore, il freddo. Il freddo influenza sia il consumo di cioccolata calda sia la probabilità di indossare guanti imbottiti. Il freddo è la variabile indipendente, il consumo di cioccolata calda e la probabilità di indossare guanti imbottiti sono le variabili dipendenti. Tornando alla nostra indagine di feedback sulla conferenza, il freddo ha probabilmente influenzato l'insoddisfazione dei partecipanti nei confronti della location e dell'evento in generale. Infine, per approfondire ulteriormente la relazione tra le variabili della tua indagine, potresti dover eseguire un'analisi della regressione.

Che cose'è l'analisi dei dati di regressione?

L'analisi della regressione è un metodo avanzato di analisi dei dati che consente di esaminare la relazione tra due o più variabili. Esistono molti tipi di analisi della regressione e quelle scelte dagli esperti di indagini dipendono dalle variabili esaminate. Ciò che accomuna tutti i tipi di analisi della regressione è l'esame dell'influenza di una o più variabili indipendenti su una variabile dipendente. Quando analizziamo i dati della nostra indagine, potremmo essere interessati a conoscere i fattori che hanno maggiormente influenzato la soddisfazione dei partecipanti nei confronti della conferenza. Si tratta di un problema relativo al numero di sessioni? Al relatore? Agli eventi sociali? Al sito? Con l'analisi della regressione, un esperto di indagini può determinare se e in che misura la soddisfazione nei confronti di questi diversi attributi della conferenza contribuisce alla soddisfazione generale.

A sua volta, questa analisi offre ulteriori informazioni sugli aspetti della conferenza che potresti voler cambiare la prossima volta. Supponiamo, ad esempio, che tu abbia speso una grossa somma di denaro per assicurarti la partecipazione di un relatore d'eccellenza per la tua sessione di apertura. I partecipanti hanno assegnato punteggi elevati a questo relatore e alla conferenza in generale. Basandoti su questi due risultati potresti pensare che avere un relatore di spicco (e costoso) sia la chiave del successo della conferenza. L'analisi della regressione può aiutarti a verificare la fondatezza della tua supposizione. Potresti scoprire che la popolarità del relatore è stata un fattore rilevante della soddisfazione nei confronti della conferenza, nel qual caso per il prossimo anno provvederai a reclutare di nuovo un relatore di spicco. Ma supponiamo che la regressione mostri che, benché il relatore sia stato di gradimento, questo non ha contribuito molto alla soddisfazione dei partecipanti alla conferenza. Se così fosse, il denaro speso per il relatore potrebbe essere investito diversamente. Se dedichi del tempo ad analizzare attentamente la fondatezza dei dati della tua indagine, sarai in grado di utilizzare le risposte per prendere decisioni più informate.