Che cosa sono i test t? Guida all’analisi dei risultati dei sondaggi

Scopri come individuare differenze statisticamente significative nelle medie di due gruppi, nei dati dei sondaggi e nei risultati di test A/B con un semplice test t.

Donna che lavora su grafici di test t

Tutti possono vedere la differenza tra due numeri, ma stabilire se tale differenza sia statisticamente significativa può essere più complicato.

Immaginiamo che tu abbia condotto un sondaggio sulla soddisfazione dei clienti al lavoro. Il tuo responsabile ti chiede di analizzare se gli uomini attribuiscono all'azienda un punteggio Net Promoter Score® (NPS) inferiore rispetto alle donne. 

Nei dati raccolti, noti che la valutazione media data dagli uomini è 9, mentre quella delle donne è 12. Ma come si può stabilire se la differenza tra 9 e 12 è statisticamente significativa? È qui che entrano in gioco i test t.

In questo articolo, definiremo i test t e i loro ambiti di applicazione, presenteremo degli esempi pratici ed esamineremo come interpretare i risultati. 

Il test t è un metodo statistico che utilizza la distribuzione t per valutare se la differenza tra le medie di due gruppi è statisticamente significativa. Aiuta a capire se lo scarto osservato riflette una reale differenza tra i gruppi o se è probabilmente attribuibile al caso.

La verifica della significatività statistica è comunemente impiegata nei test dei concept e nei test dei prodotti. Nei test dei concept, i test A/B possono essere usati per stabilire se un'idea pubblicitaria è più efficace di un'altra. Lo stesso vale per i test dei prodotti, che servono a capire se un nuovo prodotto avrà successo una volta lanciato sul mercato. 

I test t utilizzano formule specifiche per confrontare le medie e stabilire se una differenza può essere considerata statisticamente significativa. Il test t per due campioni è il più utilizzato nelle analisi dei dati di indagine:

Formula del test t

Ecco le formule del test t a campione singolo e del test t per campioni appaiati:

Formula del test a campione singolo e del test t per campioni appaiati

Sia nel test t a un campione che in quello per campioni appaiati, il valore t calcolato viene confrontato con un valore critico della distribuzione t per valutarne la significatività.

Usa un test t quando desideri verificare se, nei risultati del tuo sondaggio, due medie si differenziano in modo significativo, e non solo dal punto di vista numerico. I test t aiutano a confrontare le medie dei gruppi, a valutare le differenze tra i campioni e a decidere se un divario è statisticamente significativo sulla base del valore p e del livello di confidenza.

Ecco alcuni tipici scenari di sondaggio:

  • Confronto tra due gruppi. Usa un test t per due campioni (indipendenti) per verificare se segmenti di pubblico, come uomini e donne, nuovi e vecchi clienti o diversi gruppi di dipendenti, rispondono in modo differente.
  • Test di un concept o di una variante rispetto al gruppo di controllo. Nei test A/B o nei test dei concept, un test t aiuta a capire se una versione ottiene risultati migliori rispetto a un'altra.
  • Valutazione delle differenze nei punteggi. Confronta metriche come Net Promoter Score (NPS), punteggio di soddisfazione del cliente (CSAT) o punteggio di impegno del cliente (CES) per stabilire se la valutazione media di un gruppo sia più alta o più bassa in modo statisticamente significativo.
  • Verifica dei cambiamenti nel tempo. Un test t per campioni appaiati permette di verificare se i punteggi dati dagli stessi rispondenti sono cambiati dopo un evento, il lancio di una funzionalità o una campagna.

Utilizza il test t quando devi valutare una differenza tra medie, confrontare un risultato con un parametro di riferimento o verificare un'ipotesi con campioni di piccole dimensioni. Si tratta infatti di una scelta affidabile per l'analisi dei risultati dei sondaggi, i test A/B e qualsiasi situazione in cui sia necessario dimostrare l'effettiva esistenza di una differenza nei dati.

Prima di eseguire un test t, assicurati che i tuoi dati rispettino alcuni presupposti di base per garantire risultati affidabili.

  • Risposte indipendenti. Ogni risposta deve provenire da una persona diversa e non deve influenzare le altre risposte. Evita risposte duplicate, l'uso condiviso dei dispositivi o i raggruppamenti nascosti.
  • Media approssimativamente normale. Il test t dà i risultati migliori quando la distribuzione di campionamento della media è approssimativamente normale, il che di solito avviene quando la dimensione del campione è di circa 30 individui o più per gruppo.
  • Varianza ragionevole. Se le varianze dei due gruppi differiscono molto oppure le dimensioni del campione sono sbilanciate, utilizza il test t di Welch invece del classico test t per due campioni.

Una rapida verifica di questi presupposti fondamentali ti aiuta a garantire che qualsiasi differenza riscontrata rifletta un segnale reale e non un "rumore nei dati".

Esistono tre tipi di test t comunemente utilizzati dai ricercatori. Ognuno di essi ha uno scopo specifico, che spieghiamo di seguito.

Il test t a un campione verifica se la media (ovvero il valore medio) dei dati di un gruppo (ad esempio, il punteggio CES complessivo) è diversa da un valore di riferimento stabilito.

Esempio: Il punteggio di impegno del cliente (CES) medio attuale della tua azienda è pari a 4,2. Un CES di 4,2 comporta per il cliente un livello di difficoltà significativamente superiore rispetto allo standard del settore, pari a 5,0?

I test t per due campioni valutano se la differenza tra le medie di due gruppi indipendenti sia statisticamente significativa. Se le varianze dei gruppi sembrano disuguali o le dimensioni dei campioni sono sbilanciate, è consigliabile passare al test t di Welch (disponibile nella maggior parte degli strumenti), poiché non presuppone l'uguaglianza delle varianze.

Esempio: La tua ipotesi è che gli uomini attribuiscano alla tua azienda un punteggio NPS più basso rispetto alle donne. La valutazione NPS media dei rispondenti uomini è 9, mentre quella delle donne è 12. La differenza tra 9 e 12 è statisticamente significativa?

Questo test viene utilizzato quando si sottopone due volte lo stesso gruppo di persone allo stesso sondaggio. Il test t per campioni appaiati permette di capire se la media è cambiata tra la prima e la seconda rilevazione.

Esempio: Hai intervistato lo stesso gruppo di clienti due volte: una volta ad aprile e una a maggio, dopo che avevano visto una pubblicità della tua azienda. L'NPS della tua azienda è cambiato dopo la visione dello spot?

Donna che osserva grafici al laptop

Per eseguire un test t occorre seguire quattro passaggi.

Questa sezione illustra i quattro passaggi utilizzando l'esempio dei punteggi NPS presentato all'inizio: 

La tua ipotesi è che gli uomini assegnino alla tua azienda un punteggio NPS più basso rispetto alle donne. L'NPS medio dato dagli uomini è 9, mentre quello delle donne è 12. La differenza tra 9 e 12 è statisticamente significativa? Questo è un esempio di test t per due campioni.

Analizziamo insieme i passaggi e l'esempio di test t.

Ogni tipo di test t ha una formula specifica per il calcolo della statistica t. In questo esempio useremo la formula per due campioni, dove: 

  • t è la statistica t
  • x₁ è il punteggio NPS medio per gli uomini → 9
  • x₂ è il punteggio NPS medio per le donne → 12
  • n₁ è il numero di uomini che hanno risposto alla domanda NPS → supponiamo che abbiano risposto 20 uomini
  • n₂ è il numero di donne che hanno risposto → 23 donne
  • s₁ è la deviazione standard dell'NPS per gli uomini → supponiamo che la deviazione standard calcolata sia 12,48
  • s₂ è la deviazione standard dell'NPS per le donne → la deviazione standard calcolata è 10,51
Formula del test t per due campioni

Probabilmente eseguirai i test utilizzando un foglio di calcolo o un software statistico (come Excel o SPSS). Tuttavia, se vuoi calcolare i valori manualmente, qui sotto trovi anche le formule per gli altri due tipi di test t.

Formula del test t a un campione e del test t per campioni appaiati

I gradi di libertà rappresentano il numero di modi in cui la media può variare. In questo caso, corrispondono al numero di valutazioni NPS che si potrebbero ottenere all'interno di un gruppo di intervistati. Come per la statistica t, anche la formula dei gradi di libertà varia in base al tipo di test t eseguito. 

Questa è la formula che deve essere utilizzata per calcolare i gradi di libertà nei test t per due campioni.

Formula dei gradi di libertà

Il valore critico è la soglia oltre la quale la differenza tra due numeri viene considerata statisticamente significativa. 

Secondo questa tabella, per un test a due code con livello alfa di 0,05 e 41 gradi di libertà, il valore critico è 2,02. Tieni presente che la maggior parte degli analisti utilizza il test a due code, perché è più conservativo. 

Per approfondire le differenze tra test a una coda e a due code, guarda questo video di Khan Academy.

Se la tua statistica t è superiore al valore critico, la differenza può dirsi statisticamente significativa. Se invece è inferiore, i due numeri sono, dal punto di vista statistico, indistinguibili.

Nel nostro esempio, il valore assoluto della statistica t è 0,86 e non supera il valore critico di 2,02. Di conseguenza, non vi sono prove statisticamente significative per affermare che gli uomini attribuiscano punteggi NPS più bassi delle donne.

Interpretare i risultati di un test t significa esaminare il valore t, il valore p e l'intervallo di confidenza per capire se la differenza tra i tuoi gruppi riflette un effetto reale o una variazione casuale. Questi indicatori, considerati nel loro insieme, consentono di valutare l'entità del divario, la solidità delle prove e il livello di affidabilità dei risultati. La sezione di domande e risposte che segue illustra in dettaglio il significato di ciascuno di essi e spiega come analizzare i risultati del test t.

Il valore t mostra quanto è grande la differenza tra le medie dei gruppi rispetto alla variabilità presente nei tuoi dati. Un valore t assoluto elevato indica che il segnale emerge dal rumore; un valore basso, invece, suggerisce che la differenza potrebbe essere dovuta al caso.

Il valore p indica la probabilità di osservare i risultati ottenuti qualora l'ipotesi nulla (assenza di una differenza reale) fosse effettivamente vera. Molti gruppi utilizzano una soglia di 0,05: un valore p ≤ 0,05 indica una differenza statisticamente significativa, mentre un valore p > 0,05 indica l'assenza di una differenza significativa nel campione.

L'intervallo di confidenza (IC) indica l'intervallo entro cui è probabile che si trovi la reale differenza tra le medie, offrendo un quadro più completo rispetto a un semplice risultato significativo/non significativo. Se il CI include lo zero, l'effetto non può essere considerato conclusivo; se invece rimane interamente al di sopra o al di sotto dello zero, il risultato è statisticamente significativo al livello di confidenza scelto.

Una differenza è davvero rilevante quando è sia statisticamente significativa sia importante da un punto di vista pratico. Analizza la dimensione dell'effetto e l'intervallo di confidenza per valutare l'entità della differenza e capire se ha un'importanza concreta ai fini della decisione da prendere.

Campioni più grandi riducono la variabilità, restringono gli intervalli di confidenza e facilitano l'individuazione di differenze reali. Campioni ridotti, invece, aumentano l'incertezza e rendono più difficile interpretare eventuali effetti ai limiti della significatività.

Una sintesi chiara dei risultati del test t illustra il motivo per cui è stato effettuato il confronto, cosa ha rivelato il test e il grado di affidabilità della differenza tra i gruppi. Il tuo compito è quello di tradurre i dati statistici in un linguaggio semplice, ricollegarli alla domanda iniziale ed evidenziare cosa suggeriscono i risultati per le decisioni successive.

Quando riassumi i risultati di un test t, includi questi elementi fondamentali:

  1. Indica lo scopo. Inizia spiegando perché hai eseguito un test t e qual era l'obiettivo. Ad esempio, spiega che hai utilizzato un test t per dimostrare l'esistenza di una differenza statisticamente significativa tra le medie dei due gruppi nei risultati del tuo sondaggio.  
  2. Fornisci statistiche descrittive. Successivamente, evidenzia la media e la deviazione standard di ciascun gruppo analizzato. Questo offre ai soggetti interessati il contesto necessario per comprendere le differenze osservate. È utile anche indicare la dimensione del campione di ogni gruppo per fornire ulteriore contesto. 
  3. Presenta i risultati del test. Successivamente, indica il valore t, i gradi di libertà (df), il valore p e, se disponibile, l'analisi dell'intervallo di confidenza.
  4. Condividi le conclusioni. Infine, comunica le tue conclusioni alle parti interessate. Spiega brevemente se la differenza riscontrata è risultata statisticamente significativa e cosa ciò implica per la tua ipotesi o domanda di ricerca.
  5. Definisci i passi successivi. Spiega alle parti interessate il significato dei risultati per l'organizzazione e indica quali azioni potrebbero derivare dalle tue conclusioni nelle future decisioni aziendali.

Evitare alcuni semplici errori può aiutarti a ottenere risultati del test t più puliti e affidabili dai dati dei sondaggi.

  • Cercare valori p bassi, senza valutare la differenza reale. Un risultato può essere "statisticamente significativo" anche quando la differenza tra i gruppi è troppo esigua per essere rilevante. Considera l'entità della differenza e l'intervallo di confidenza per determinare se è significativa.
  • Confrontare molti gruppi senza adeguare il metodo. Sottoporre a verifica molti segmenti o domande aumenta la probabilità di individuare una differenza solo per caso. Parti da un test più ampio come l'ANOVA oppure applica correzioni di base quando esegui diversi test t.
  • Interrompere troppo presto i test A/B. Controllare spesso i risultati e concludere il test appena qualcosa sembra promettente può portare a conclusioni errate. Decidi la dimensione del campione o la finestra temporale prima di iniziare.
  • Usare i test t con dati di tipo errato. Se le tue domande si basano su classifiche o scale molto sbilanciate, il test t potrebbe non essere la soluzione più adatta perché le medie possono risultare fuorvianti. Assicurati che i dati siano distribuiti in modo uniforme e non presentino asimmetrie eccessive.
  • Ignorare i presupposti di base. I test t funzionano al meglio quando le risposte sono indipendenti e i gruppi presentano una variabilità ragionevolmente simile. Se la differenza tra i gruppi risulta molto marcata, passa al test t di Welch per ottenere risultati più affidabili.
  • Test t e ANOVA: differenze e applicazioni
  • Test t e test z: differenze e applicazioni

I test t servono per determinare se la differenza tra le medie di due gruppi campione è statisticamente significativa. Puoi utilizzare i test t nell'analisi dei dati dei tuoi sondaggi per dimostrare l'affidabilità dei risultati. 

SurveyMonkey ti permette di semplificare il processo di creazione e invio di sondaggi a gruppi campione per le esigenze di ricerca della tua organizzazione. Puoi creare indagini di ricerca di mercato e questionari da zero, oppure scegliere tra oltre 400 modelli di sondaggio già pronti.

Inizia oggi stesso a distribuire questionari per raccogliere dati da analizzare, e aiutare la tua organizzazione a prendere decisioni più efficaci per la sua crescita. Crea un account gratuito ora.

NPS, Net Promoter e Net Promoter Score sono marchi registrati di Satmetrix Systems, Inc., Bain & Company e Fred Reichheld.

Donna con hijab che legge i risultati di una ricerca su un laptop

SurveyMonkey può aiutarti a lavorare meglio. Scopri come migliorare il tuo impatto con strategie, prodotti ed esperienze vincenti.

Una donna e un uomo che leggono un articolo sul laptop e prendono appunti su foglietti adesivi

Scopri come Hornblower usa SurveyMonkey e la sua IA per sfruttare al meglio i dati NPS, raccogliere info sui clienti e migliorare la loro esperienza.

Uomo sorridente con occhiali che usa un laptop

Migliora lo stato del tuo brand con la nostra indagine di monitoraggio. Con domande consigliate da esperti, potrai misurare il valore del marchio.

Donna che esamina informazioni sul suo laptop

Il settore dei prodotti e dei servizi di consumo, che include viaggi e ospitalità, si affida alle analisi di SurveyMonkey per definire il futuro.