top of page

ΕΙΝΑΙ ΤΟ 30 ΕΝΑ ΕΠΑΡΚΩΣ ΜΕΓΑΛΟ ΜΕΓΕΘΟΣ ΔΕΙΓΜΑΤΟΣ;


Σε μία έρευνα επισκόπησης (survey), δείγματα των 30 ή ακόμα και γύρω στα 50 είναι επαρκή για την εξαγωγή αριθμητικών συμπερασμάτων σχετικά με έναν πληθυσμό; Η υποστήριξη για ένα μέγεθος δείγματος 30 θεωρείται ότι προέρχεται από το Κεντρικό Οριακό Θεώρημα (Central Limit Theorem). Όμως, το Κεντρικό Οριακό Θεώρημα το μόνο που δηλώνει είναι ότι ο μέσος όρος ενός αρκετά μεγάλου αριθμού ανεξάρτητων τυχαίων μεταβλητών, καθεμία με πεπερασμένο μέσο όρο και διακύμανση, θα είναι περίπου κανονικά κατανεμημένος.


Το θεώρημα, όπως αντιλαμβανόμαστε, σκόπιμα δεν ορίζει τι σημαίνει «μεγάλο». Εάν μπορούσε να αποδειχθεί ότι είναι 30, ή οποιοσδήποτε άλλος αριθμός για αυτό το θέμα, θα το έλεγε καθαρά. Αλλά δεν το κάνει. Ακόμη πιο σημαντικό, το θεώρημα βασίζεται σε θεωρητικά τέλεια δείγματα με αντικατάσταση και όχι σε δείγματα που επιτυγχάνουμε σε έρευνες ευκολίας. Όταν η καμπύλη που δημιουργείται από επαναλαμβανόμενα δείγματα ενός δεδομένου μεγέθους συγκλίνει σε μια κανονική καμπύλη θα εξαρτηθεί από την υποκείμενη κατανομή από την οποία αντλείται το δείγμα και τη μεταβλητότητα με την οποία σχετίζεται. Εάν η υποκείμενη κατανομή είναι απολύτως κανονική και το δείγμα είναι απολύτως τυχαίο, χωρίς σφάλμα δειγματοληψίας, μπορεί να προσεγγίσει γρήγορα την κανονική καμπύλη. Εάν η υποκείμενη κατανομή δεν είναι κανονική ή είναι λοξή, χρειαζόμαστε μεγαλύτερα δείγματα. Το θεώρημα αναφέρει επίσης ότι, καθώς το δείγμα γίνεται μεγάλο, η κατανομή των μέσων του δείγματος γίνεται περίπου κανονική (όχι ακριβώς κανονική).


Εάν το Θεώρημα του Κεντρικού Ορίου δεν αναφέρει τίποτα σχετικά με την έννοια του «μεγάλου» δείγματος, από πού προέρχεται ο αριθμός 30 ως το μέγεθος του δείγματος που φέρει πανίσχυρη αξιοπιστία; Πολλοί ερευνητές ισχυρίζονται ότι προέρχεται από πειράματα προσομοίωσης υπολογιστή που παρουσιάζονται τόσο σε εισαγωγικά εγχειρίδια όσο και σε δημοσιευμένες μελέτες. Ας σταθούμε, όμως, λίγο εδώ και να δούμε τι ισχύει. Αυτά τα πειράματα προσομοίωσης λαμβάνουν επαναλαμβανόμενα εξιδανικευμένα δείγματα μέσω ηλεκτρονικού υπολογιστή (υποθέτοντας ότι δεν υπάρχει στοιχείο σφάλματος) από μία κανονική κατανομή (μερικές φορές και από λοξές κατανομές). Αλλά γνωρίζουμε ότι πολλά χαρακτηριστικά στην πραγματική ζωή δεν κατανέμονται κανονικά. Επιπλέον, υποθέτουμε τέλεια τυχαία δειγματοληψία, ποσοστό απόκρισης 100 τοις εκατό και κανένα σφάλμα κάλυψης (coverage error)! Η μη απόκριση είναι μια πραγματικότητα στις έρευνες δειγματοληψίας. Η «μη απάντηση» δεν λαμβάνεται υπόψη στην «απόδειξη» που προσφέρουν οι ασκήσεις προσομοίωσης που εμφανίζονται στα εκπαιδευτικά βιβλία για να καταδείξουν ότι ακόμη και ένα μέγεθος δείγματος 30, υπό ορισμένες συνθήκες, θα μπορούσε να οδηγήσει σε ασφαλές συμπέρασμα.


Ένα προφανές γεγονός, λοιπόν, είναι ότι οι δειγματοληπτικές έρευνες, ή σφυγμομέτρησης, διαφέρουν σημαντικά από τις ασκήσεις προσομοίωσης μέσω υπολογιστή σε δύο κρίσιμα σημεία:

  • Πρώτον, στην προσομοίωση υπολογιστή, κάθε δείγμα είναι ένα τέλειο απλό τυχαίο δείγμα. Αυτό απλά δεν είναι δυνατό στην πραγματικότητα. Είναι παράλογο να πιστεύουμε ότι οι έρευνές μας, όσο καλά κι αν γίνουν, επιτυγχάνουν οτιδήποτε κοντά στην απλή τυχαία δειγματοληψία. Το καλύτερο που μπορούμε να ελπίζουμε είναι ότι, σε καλά εκτελεσμένες έρευνες, τα αποτελέσματα θα μπορούσαν να προσεγγίσουν εκείνα που παράγονται από τυχαία δείγματα.

  • Δεύτερον, οι προσομοιώσεις υπολογιστή του Κεντρικού Οριακού Θεωρήματος δεν περιλαμβάνουν σφάλματα μη κάλυψης, μη απόκρισης ή μη δειγματοληψίας. Για παράδειγμα, το μέσο ποσοστό απόκρισης στις περισσότερες σφυγμομετρήσεις κυμαίνεται γύρω στο 10-15%, σε αντίθεση με το υποτιθέμενο ποσοστό απόκρισης 100% στις προσομοιώσεις υπολογιστή!

Επομένως, είναι αφελές να υποθέσουμε ότι, ακριβώς επειδή τα δείγματα των 30 που έχουν σχεδιαστεί από υπολογιστή και επιτυγχάνουν κατά προσέγγιση σύγκλιση στις ασκήσεις προσομοίωσης, οποιοδήποτε δείγμα των 30 θα λειτουργεί με τον ίδιο τρόπο και στην έρευνα δειγματοληψίας επί πραγματικών συνθηκών.


Το Θεώρημα του Κεντρικού Ορίου είναι, πράγματι, ένα πολύ σημαντικό θεώρημα στη στατιστική. Παρέχει τη βάση για πολλές από τις διαδικασίες δειγματοληψίας μας. Το γεγονός ότι ακόμη και μικρά δείγματα μπορούν να συγκλίνουν στην κανονικότητα είναι ενδιαφέρον και έχει βαθιές επιπτώσεις στην κοινωνική έρευνα. Ωστόσο, είναι μεθοδολογική ανωριμότητα να κάνουμε ένα επαγωγικό άλμα και να πιστεύουμε ότι ο αριθμός 30 έχει μαγικές ιδιότητες και θα λειτουργήσει ανεξάρτητα από την υποκείμενη κατανομή, ανεξάρτητα από το πού και πώς επιλέγεται το δείγμα, ανεξάρτητα από την ομαδοποίηση, ανεξάρτητα από τη μη ανταπόκριση, ανεξαρτήτως της μη τυχαιότητας και ανεξάρτητα από άλλα μη δειγματοληπτικά σφάλματα που συνοδεύουν τις μελέτες σφυγμομέτρησης. Το Θεώρημα του Κεντρικού Ορίου απλά δεν το αναφέρει (το μέγεθος δείγματος) και ούτε υπάρχει καμία εμπειρική υποστήριξη για αυτό.


Στην πραγματικότητα, δεν υπάρχει καμία «μαγεία» ούτε σε ένα δείγμα 100. Χρησιμοποιούμε το 100 επειδή γενικά θεωρείται ένα λογικό ελάχιστο μέγεθος δείγματος από τους ερευνητές, με βάση την εμπειρία τους με αρκετές χιλιάδες μελέτες για αρκετές δεκαετίες. Επίσης, σε αυτό το μέγεθος (συγκεκριμένα >80), οι τιμές του t-test αρχίζουν να πλησιάζουν πολύ πιο κοντά στις βαθμολογίες z με βάση την κανονική καμπύλη. Το μόνο, λοιπόν, που μας λέει το Κεντρικό Οριακό Θεώρημα είναι ότι «καθώς το μέγεθος του δείγματος γίνεται μεγάλο…».


Συμπερασματικά, μπορούμε είτε να εφαρμόσουμε μεθοδολογική σκέψη και να βασίσουμε την ερμηνεία μας για το τι θα μπορούσε να είναι ένας «μεγάλος αριθμός» σε ένα δεδομένο πλαίσιο, σε εμπειρικές παρατηρήσεις για παράδειγμα, ή να υποκύψουμε σε μια ρηχή ερμηνεία του θεωρήματος αποδίδοντας μαγικές ιδιότητες σε κάποιον αυθαίρετο αριθμό όπως το 30 ή το 40. Σίγουρα το 30 δεν είναι ανεπαρκές μέγεθος δείγματος σε όλα τα πλαίσια. Η σωστή μεθοδολογική ερώτηση θα πρέπει να είναι: «Είναι το μέγεθος του δείγματος επαρκές για τον επιδιωκόμενο σκοπό;». Για ορισμένα προβλήματα, σίγουρα, ένα μέγεθος αρκετά μικρότερου δείγματος (π.χ. ίσο με 10) μπορεί να είναι επαρκές σε άλλες περιπτώσεις (όπως η εξόρυξη στοιχείων από εκατομμύρια διαδικτυακά δεδομένα), ένα δείγμα 10.000 μπορεί να θεωρηθεί αρκετά μικρό. Ως εκ τούτου, δεν μπορεί κανείς να αποφασίσει για το μέγεθος του δείγματος με βάση μόνο στατιστικούς τύπους χωρίς να λαμβάνει υπόψη το ερευνητικό πλαίσιο.


Σχεδόν κανένα βιβλίο μεθοδολογίας έρευνας, που γράφτηκε από θεωρητικούς στατιστικούς, δεν αναφέρει ότι το Κεντρικό Οριακό Θεώρημα υποστηρίζει ένα μέγεθος δείγματος 30 ως επαρκώς μεγάλο μέγεθος δείγματος. Τα δείγματα που αναφέρονται στο Κεντρικό Οριακό Θεώρημα είναι καθαρά τυχαία δείγματα και όχι δείγματα που υπόκεινται σε σφάλματα κάλυψης, μη απόκρισης και μη δειγματοληψίας. Μην ξεχνάμε, λοιπόν, ότι όλα τα μαθηματικά θεωρήματα διατυπώνονται με ακρίβεια για κάποιο λόγο.

Komentáře


Ετικέτες
bottom of page