Icona_Motore-di-ricercaMotori di Ricerca Banche dati
  Biblioteche Meteo
 
TagT:
Campionamento e attendibilità dei risultati di una indagine
Immagine tratta dal sito www.roma-citta.it

di Maurizio Vichi*

Ormai in moltissimi campi vengono utilizzati i sondaggi di opinione: politica, economia, finanza...
Ma quando un risultato può essere considerato veramente "attendibile"?

I fenomeni di diversa natura che regolano il mondo che ci circonda relativi, ad esempio, al territorio, alla climatologia, alla popolazione, alla agricoltura, alla sanità, al commercio, alla giustizia, al lavoro, ai conti economici di una nazione, ai prezzi, ai consumi delle famiglie, ai bilanci delle imprese ecc, sono delineati mediante una o, più frequentemente, molte variabili che si riferiscono ad una popolazione (o universo), costituita da un numero finito o infinito di unità sulle quali si osservano le modalità delle variabili.
Se si esaminano tutte le unità della popolazione si realizza un censimento e per sintetizzare le modalità osservate si usano le metodologie della statistica descrittiva, ovvero: distribuzioni di frequenze, percentuali, grafici e indici statistici (medie, indici di variabilità, misure di dipendenza, correlazione, ecc.). Questi sono i parametri di sintesi della popolazione "incogniti" e da conoscere mediante una indagine statistica.


Quando non si vuole, o non si può, fare un censimento si effettua un sondaggio...
Spesso, però, non è possibile intervistare tutta la popolazione; ad esempio le unità possono essere milioni e procedere ad una indagine totale sarebbe troppo oneroso in termini di tempo e costi. Questo è il caso delle indagini (sondaggi) frequentemente pubblicate sui giornali. Altre volte ci sono motivi pratici per non realizzare un censimento come quando l'indagine statistica è di natura "distruttiva", ad esempio, se si vuole conoscere la durata di una apparecchiatura (lampadine, radio, computer, ecc.).
In tal caso si devono utilizzare delle metodologie che sulla base di un campione di unità, ovvero una parte della popolazione, permettano di stimare i parametri dell'universo. Le metodologie dell'inferenza statistica realizzano questo processo induttivo. L'uso di un campione produce un vantaggio sui costi e il tempo di analisi statistica dei dati rilevati, ma anche una perdita di conoscenze che di norma si traduce in una differenza tra i risultati del campione (stima) e quelli "veri" della popolazione (parametro); questa differenza è l'errore campionario.


Errore campionario e affidabilità dei risultati dell'indagine
Compito dell'inferenza statistica è quello di controllare l'errore campionario e aumentare l'affidabilità dei risultati dell'indagine. Per misurare l'errore campionario si deve usare la probabilità e il campione estratto dalla popolazione deve essere casuale, ossia ogni unità ha una prefissata probabilità di essere estratta con o senza ripetizione, con un procedimento casuale simile a quello dei giochi d'azzardo. Il caso più studiato di campione probabilistico è il campione casuale semplice in cui le unità sono estratte con ripetizione ed uguale probabilità (Esempio 1).
Il Campionamento probabilistico include l'insieme delle tecniche necessarie per estrarre dalla popolazione un campione casuale e definire la sua dimensione. Se non si opera una scelta casuale delle unità della popolazione,  si realizza un campionamento non probabilistico.
In generale, si vuole ottenere un campione che sia in termini statistici "rappresentativo" della popolazione, ovvero un campione con identità di proporzioni rispetto alla popolazione per una serie di variabili che sono illustrative  della suastruttura e connesse con il fenomeno oggetto di studio.
 Ad esempio le variabili illustrative per indagini su individui sono quelle socio-demografiche (genere, età, condizione professionale, livello di istruzione) e geografiche (area geografica di residenza, ampiezza demografica del comune).


Esempi di campionamenti probabilistici
Sono campionamenti probabilistici, oltre a quello casuale semplice con e senza ripetizione, il campionamento stratificato, e il campionamento a grappoli, campionamento a due (o più) stadi
Nel primo si utilizzano una o più variabili illustrative per definire gli strati in cui suddividere la popolazione e successivamente si opera un campionamento casuale semplice per ogni strato. Nel secondo si effettua un campionamento casuale semplice di grappoli, che sono gruppi di unità eterogenee prese tutte insieme. In un campionamento a due stadi, da una popolazione divisa in grappoli si estrae casualmente un certo numero di grappoli e successivamente si procede all'estrazione casuale di un certo numero di unità dai grappoli estratti.


Stima dei parametri incogniti
Per la stima dei parametri incogniti della popolazione si usano nel campione le statistiche o stimatori. Ad esempio per stimare la media incognita di una variabile della popolazione si può usare la media calcolata sulle unità del campione. In generale, lo stimatore calcolato sul campione dà origine ad una stima puntuale, ovvero una valutazione del parametro incognito basata su un singolo valore. La stima puntuale non ci permette di fare valutazioni sulla sua attendibilità e di valutare l'errore campionario, ma lo studio teorico delle statistiche evidenzia le loro interessanti proprietà che in generale valgono in media o asintoticamente e sono utili per scegliere tra diversi stimatori.
Allora uno stimatore è: mediamente uguale al parametro incognito della popolazione se è corretto; sempre più vicino al parametro della popolazione al crescere della dimensione del campione se è consistente; il più preciso (ossia con valori più simili al parametro) per una fissata dimensione campionaria, se è efficiente.  


L'affidabilità del risultato statistico
Teoricamente si può procedere ad estrarre casualmente dalla popolazione tutti i possibili campioni di una stessa dimensione, definendo in tal modo l'universo dei campioni o spazio campionario (Esempio 2
). Calcolando lo stimatore su ciascun campione dell'universo si ottiene la distribuzione campionaria dello stimatore, (Esempio 3) con la quale si costruisce  una stima intervallare per il parametro incognito della popolazione, ovvero un intervallo di confidenza che con una assegnata probabilità, detta livello di confidenza, comprende il parametro incognito della popolazione (Esempio 4). Il livello di confidenza misura l'affidabilità che si può avere del risultato statistico, mentre la sua ampiezza  indica l'incertezza delle stima riguardo al parametro incognito.  Maggiore è la dimensione del campione più piccola è la dimensione dell'intervallo di confidenza e più elevata è la sua affidabilità (Esempio 5).  
 
 
*Insegna Statistica presso l'università "La Sapienza" di Roma. È Presidente della Società Italiana di Statistica, Editor della rivista "Advances in Data Analysis and Classification" (Springer).



Pubblicato il 4/2/2010
 
 
 
 
  
  
 
  

 
 


 

 

 
Immagine tratta dal sito www.roma-citta.it

di Maurizio Vichi*

Ormai in moltissimi campi vengono utilizzati i sondaggi di opinione: politica, economia, finanza...
Ma quando un risultato può essere considerato veramente "attendibile"?

I fenomeni di diversa natura che regolano il mondo che ci circonda relativi, ad esempio, al territorio, alla climatologia, alla popolazione, alla agricoltura, alla sanità, al commercio, alla giustizia, al lavoro, ai conti economici di una nazione, ai prezzi, ai consumi delle famiglie, ai bilanci delle imprese ecc, sono delineati mediante una o, più frequentemente, molte variabili che si riferiscono ad una popolazione (o universo), costituita da un numero finito o infinito di unità sulle quali si osservano le modalità delle variabili.
Se si esaminano tutte le unità della popolazione si realizza un censimento e per sintetizzare le modalità osservate si usano le metodologie della statistica descrittiva, ovvero: distribuzioni di frequenze, percentuali, grafici e indici statistici (medie, indici di variabilità, misure di dipendenza, correlazione, ecc.). Questi sono i parametri di sintesi della popolazione "incogniti" e da conoscere mediante una indagine statistica.


Quando non si vuole, o non si può, fare un censimento si effettua un sondaggio...
Spesso, però, non è possibile intervistare tutta la ...
Leggi tutto
(9493 battute)
Aggiungi un tag
Per contribuire a catalogare le risorse del sapere inserisci delle parole chiave
MyTreccani Commenta Pubblica su blog o sito
Condividi Tieni d'occhio Segnala alla redazione
COMMENTI
Nessun commento presente
 
SCELTI NEL WEB
Per saperne di più
v. anche, Insegnare la statistica
toglie tempo alla matematica?