ΔΙΑΣΤΗΜΑ ΕΜΠΙΣΤΟΣΥΝΗΣ (CONFIDENCE INTERVAL)

Το διάστημα εμπιστοσύνης (confidence interval, CI) εκφράζει τον βαθμό αβεβαιότητας που σχετίζεται με ένα δείγμα (ονομάζεται επίσης εκτίμηση μελέτης). Ιστορικά, η έννοια του CI εισήχθη από τον Jerzy Neyman σε μια εργασία που δημοσιεύθηκε το 1937.
Η συλλογή πληροφοριών από ολόκληρο τον πληθυσμό, για την εύρεση απαντήσεων σε κλινικά ερωτήματα, είναι πρακτικά αδύνατη. Για παράδειγμα, δεν μπορούμε να συλλέξουμε πληροφορίες από όλους τους καρκινοπαθείς. Αντίθετα, συλλέγουμε πληροφορίες από μικρότερες ομάδες εντός του μεγαλύτερου πληθυσμού, που ονομάζονται δείγματα. Είναι λογικό να υποθέσουμε ότι τα στατιστικά του δείγματος θα είναι κοντά στις «αληθινές τιμές», δηλαδή τις παραμέτρους του πληθυσμού, αλλά πιθανότατα δεν θα είναι πανομοιότυπες με αυτές. Ακριβολογώντας, χωρίς να γίνει απογραφή, δεν είναι δυνατό να ληφθούν οι αληθινές πληθυσμιακές τιμές (π.χ. μέσος όρος συστολικής πίεσης των κατοίκων μίας χώρας κλπ).
Παρόλο που εργαζόμαστε με δείγματα, στόχος μας είναι να περιγράψουμε και να εξάγουμε συμπεράσματα σχετικά με τον συνολικό πληθυσμό. Αυτό γίνεται με τη χρήση μίας στατιστικής δειγματοληψίας (με την εκτίμηση σφάλματος) στο δείγμα, έτσι ώστε να προκύπτει μία αξιόπιστη προσέγγιση της μελετώμενης παραμέτρου στον πληθυσμό, όχι ως μεμονωμένη τιμή αλλά ως ένα εύρος τιμών. Αυτό το εύρος είναι το CI το οποίο εκτιμάται με βάση ένα επιθυμητό επίπεδο εμπιστοσύνης (π.χ. 95% ή 99% κλπ). Ο υπολογισμός του CI, ενός δείγματος, έχει τη γενική μορφή: CI = Σημειακή εκτίμηση ± Περιθώριο σφάλματος. Ο υπολογισμός του τυπικού σφάλματος ποικίλλει ανάλογα με το αν μελετάμε μέσο όρο, διάμεσο, αναλογία, λόγο πιθανοτήτων, σχετικούς λόγους και ούτω καθεξής. Οι παράγοντες που επηρεάζουν το πλάτος του CI περιλαμβάνουν το επιθυμητό επίπεδο εμπιστοσύνης, το μέγεθος του δείγματος καθώς και τη μεταβλητότητα στο δείγμα.
Προσοχή, ένα 95% CI δεν σημαίνει ότι το 95% των δεδομένων του δείγματος βρίσκεται σε αυτό το διάστημα. Το CI δεν είναι ένα εύρος εύλογων τιμών για το δείγμα, αλλά είναι μια εκτίμηση διαστήματος εύλογων τιμών για την παράμετρο πληθυσμού. Είναι φυσικό να ερμηνεύσουμε ένα 95% CI ως ένα εύρος τιμών με 95% πιθανότητα να περιέχει την παράμετρο πληθυσμού. Ωστόσο, η σωστή ερμηνεία δεν είναι τόσο απλή. Κι αυτό διότι η πραγματική τιμή της μελετώμενης παραμέτρου του πληθυσμού είναι σταθερή, ενώ το πλάτος του 95% CI που βασίζεται σε ένα τυχαίο δείγμα θα ποικίλλει επίσης τυχαία. Δηλαδή, εάν πάρουμε επαναλαμβανόμενα τυχαία δείγματα ίσου μεγέθους από τον πληθυσμό, θα λάβουμε έναν αντίστοιχο αριθμό 95% τιμών CI που δεν θα περιέχουν όλες την παράμετρο πληθυσμού (στην πραγματικότητα μόνο το 95% από αυτά αναμένεται να περιέχει την τιμή της παραμέτρου πληθυσμού). Έτσι, το CI μπορεί να μην δίνει πάντα μια ιδέα για την πραγματική τιμή της παραμέτρου στον πληθυσμό.
Η επιλογή του αποδεκτού επιπέδου εμπιστοσύνης είναι αυθαίρετη. Χρησιμοποιούμε συχνά το 95% CI στις βιολογικές επιστήμες, αλλά αυτό είναι θέμα σύμβασης. Ένα πολύ υψηλότερο επίπεδο χρησιμοποιείται συχνά στις φυσικές επιστήμες. Για παράδειγμα, τα προγράμματα βελτίωσης ποιότητας που εφαρμόζουν κατασκευαστικές εταιρείες συσκευών κινητής τηλεφωνίας, χρησιμοποιούν επίπεδο εμπιστοσύνης 99,99966%. Με αυτόν τον τρόπο οι μηχανικοί προσπαθούν να εξαλείψουν κάθε κατασκευαστικό πιθανό κίνδυνο του προϊόντος.
Η σύγκρουση μεταξύ κλινικής και στατιστικής σημασίας είναι ένα σημαντικό ζήτημα στη βιοϊατρική έρευνα. Η κλινική σημασία συνάγεται καλύτερα εξετάζοντας το μέγεθος του αποτελέσματος, δηλαδή πόση είναι η πραγματική αλλαγή ή διαφορά. Ωστόσο, η στατιστική σημασία (από την άποψη της τιμής p) υποδηλώνει μόνο εάν υπάρχει διαφορά στους όρους πιθανότητας. Η χρήση του CI συμπληρώνει την τιμή p παρέχοντας μία σαφώς καλύτερη εκτίμηση του πραγματικού κλινικού αποτελέσματος. Η έννοια του CI χρησιμοποιείται επίσης στον υπολογισμό του μεγέθους του δείγματος μίας έρευνας.
Τέλος, αξίζει να επισημάνουμε ότι η έννοια του CI εισήχθη για να δώσει μία απάντηση στο σημαντικότατο ζήτημα της στατιστικής αβεβαιότητας, το οποίο είναι εγγενές στα αποτελέσματα που προέρχονται από δεδομένα που αντιπροσωπεύουν τυχαία επιλεγμένο υποσύνολο ενός πληθυσμού. Υπάρχουν και άλλες θεωρητικές προσεγγίσεις, κυρίως αυτές που παρέχονται από την Μπεϋζιανή θεωρία. Σε αντίθεση με τις Μπεϋζιανές μεθόδους Bayes, η κλασική μέθοδος (frequentism) υπολογισμού του CI δεν χρησιμοποιεί καμία άλλη προηγούμενη πληροφορία σχετικά με τη θέση της παραμέτρου του πληθυσμού.
Comments