7 Οκτ 2010

Ανάπτυξη κλιμάκων μέτρησης στην εκπαιδευτική έρευνα: Οι έννοιες της εγκυρότητας και αξιοπιστίας

Του Ιωάννη Γκιόσου
Διδάκτωρ Φυσικής Αγωγής, Σύμβουλος ΣΕΠ στο ΕΑΠ

Εισαγωγή
Η μέτρηση είναι μία ζωτικής σημασίας διαδικασία στην εκπαιδευτική έρευνα. Πολλές
φορές αποκτάμε γνώση σχετική με φαινόμενα, γεγονότα αντικείμενα, διαδικασίες
μετρώντας τα. Ας υποθέσουμε για παράδειγμα ότι θέλουμε να εκτιμήσουμε α) την
ηλικία των φοιτητών και φοιτητριών του ΕΑΠ και β) τη στάση των ίδιων φοιτητών
απέναντι τις νέες τεχνολογίες. Και στις δύο περιπτώσεις πρέπει να αποτιμήσουμε
(μετρήσουμε) την ηλικία και την στάση. Η ηλικία είναι ένα στοιχείο που μπορούμε
εύκολα να το συλλέξουμε από τους φοιτητές και τις φοιτήτριες του ΕΑΠ
προστρέχοντας είτε στα αρχεία του Πανεπιστημίου είτε απλά ρωτώντας τους την
ημερομηνία γέννησης τους. Λέγοντας μας για παράδειγμα την ημερομηνία γέννησής
τους μπορούμε εύκολα να αποτιμήσουμε την ηλικία τους. Η στάση των φοιτητών...

απέναντι τις νέες τεχνολογίες, από την άλλη μεριά είναι ένα στοιχείο που δεν
μπορούμε εύκολα να το αποτιμήσουμε κάνοντας τους μια απλή ερώτηση. Και αυτό
γιατί, και αν ακόμη θέταμε στους φοιτητές/τριες την απλή ερώτηση «ποια είναι η
στάση σου απέναντι στις νέες τεχνολογίες;» κάθε ένας θα απαντούσε έχοντας στο
μυαλό του διαφορετικά πράγματα. Η στάση των φοιτητών απέναντι τις νέες
τεχνολογίες μοιάζει να είναι κάτι πολύ ασαφές σε σχέση με την ηλικία τους. Για να
την αποτιμήσουμε θα πρέπει να συλλέξουμε πληροφορίες (ρωτώντας ή
παρατηρώντας) για μια σειρά από συμπεριφορές που επηρεάζονται από αυτό που
ονομάζουμε στάση. Για παράδειγμα τους παρατηρούμε ή τους ρωτάμε μια σειρά από
ερωτήσεις όπως: i) χρησιμοποιείτε τον η/υ για να επικοινωνείτε μέσω e-mail, ii)
χρησιμοποιείτε τον η/υ για να αναζητήσετε πληροφορίες, iii) χρησιμοποιείτε τον η/υ
για να γράψετε τις εργασίες σας iv) κ.ά. Υποθέτουμε δηλαδή ότι η στάση επηρεάζει
την συμπεριφορά τους σε κάποια ζητήματα. Διερευνώντας την συμπεριφορά τους για
αυτά τα ζητήματα προσεγγίζουμε τη στάση.
Στις περιπτώσεις λοιπόν αυτές (όπου μελετάμε κάτι ασαφές και λανθάνον)
καλούμαστε να αναπτύξουμε κλίμακες μέτρησης. Πώς όμως θα τις αναπτύξουμε έτσι
ώστε να είναι αξιόπιστες και έγκυρες;
Ας σκεφτούμε πάνω σ ένα υποθετικό σενάριο. Ας υποθέσουμε ότι κάποιος
θέλει να μετρήσει την επικοινωνία μεταξύ συμβούλου καθηγητή και φοιτητή/τριας
στην εξ αποστάσεως εκπαίδευση (εξΑΕ) και ειδικότερα στο ΕΑΠ. Για να την
μετρήσει δε, αποφασίζει να φτιάξει μια κλίμακα μέτρησης με την μορφή
ερωτηματολογίου. Στο σημείο αυτό πρέπει να γίνει μια κρίσιμη επισήμανση. Κάθε
ερωτηματολόγιο δεν αποτελεί απαραιτήτως και μια κλίμακα μέτρησης. Παρομοίως
ούτε όλες οι κλίμακες μέτρησης αποτελούν απαραιτήτως ερωτηματολόγια.
Χ.
Η στάση απέναντι
στις νέες
τεχνολογίες
Χ2. χρησιμοποιείτε τον η/υ για να επικοινωνείτε μέσω e-mail
Χ2. χρησιμοποιείτε τον η/υ για να αναζητήσετε πληροφορίες
Χ3. χρησιμοποιείτε τον η/υ για να γράψετε τις εργασίες σας
Χ3. κ.ά.
Η εγκυρότητα (validity)
Το πρώτο πράγμα που πρέπει να σκεφτεί ο ερευνητής είναι η εγκυρότητα του. Η
εγκυρότητα μιας κλίμακας μέτρησης, με απλά λόγια αφορά τον βαθμό που όντως
μετράει αυτό για το οποίο φτιάχτηκε να μετράει. Χωρίζεται δε σε
• εγκυρότητα περιεχομένου (content validity)
• εγκυρότητα εννοιολογικής κατασκευής (construct validity)
• εγκυρότητα στη βάση κριτηρίων (criterion validity)
Η εγκυρότητα περιεχομένου αφορά τον βαθμό που μία κλίμακα μέτρησης μετρά το
σύνολο του πράγματος για το οποίο έχει φτιαχτεί. Για να την εξασφαλίσει ο
ερευνητής μας κάνει τα εξής βήματα.
1. Αρχικά καταφεύγει στην βιβλιογραφία για να δει πως ορίζεται και τι
περιλαμβάνει ως επικοινωνία μεταξύ καθηγητή συμβούλου και φοιτητή/τριας
στην εξΑΕ. Εκεί διαπιστώνει για παράδειγμα ότι αυτό που λέμε επικοινωνία
στην εξΑΕ είναι ένα πολυδιάστατο φαινόμενο που περιλαμβάνει το εύρος της
επικοινωνίας, το είδος της επικοινωνίας, την επάρκεια της και πολλά ακόμη.
Επιλέγει για το λόγο αυτό να μετρήσει μόνο την αντιληπτή, από μεριάς των
εκπαιδευομένων, επάρκεια της επικοινωνίας στην εξΑΕ. Είναι σαφές ότι η
προσφυγή στην βιβλιογραφία εξυπηρετεί και την εξειδίκευση και ο περιορισμός
της εννοίας που μετρά. Αφού λοιπόν περιόρισε την έννοιά του
2. ξαναγυρίζει στην βιβλιογραφία για να δει πως ορίζεται και τι περιλαμβάνει η
εξειδικευμένη έννοια της αντιληπτής, από μεριάς των εκπαιδευομένων,
επάρκειας της επικοινωνίας στην εξΑΕ Εκεί βρίσκει διάφορους ορισμούς και
περιγραφές του τι περιλαμβάνει αυτή. Η βιβλιογραφία όμως που κατέφυγε
πιθανώς να μην είναι από την Ελλάδα. Υπάρχει δηλαδή η πιθανότητα οι
Έλληνες ζώντας σε ένα διαφορετικό κοινωνικό-οικονομικό και πολιτιστικό
πλαίσιο να αντιλαμβάνονται διαφορετικά την επάρκεια της επικοινωνίας στην
εξΑΕ. Επιπλέον μπορεί στο πλαίσιο του ΕΑΠ οι φοιτητές τους και οι φοιτήτριές
του να το αντιλαμβάνονται με ιδιαίτερο τρόπο. Για να εξασφαλίσει λοιπόν ότι η
κλίμακα θα αφορά τον πληθυσμό στόχο
3. καταφεύγει στους ίδιους τους υπό έρευνα φοιτητές του ΕΑΠ και πραγματοποιεί
μια προκαταρκτική έρευνα με συνέντευξη. Σ αυτή με ερωτήσεις ανοικτού τύπου
καταγράφει το πώς αντιλαμβάνονται οι ίδιοι την επαρκή επικοινωνία στην εξΑΕ.
Ας υποθέσουμε ότι πήρε τις εξής απαντήσεις. Α) Για μένα επαρκής επικοινωνία
είναι να μου εξηγεί όλες τις απορίες μου στην ΟΣΣ.. Β) Για μένα επαρκής
επικοινωνία είναι να με κατανοεί όταν τον παίρνω τηλέφωνο. Δ) Για μένα
επαρκής επικοινωνία είναι να ευχαριστιέμαι την ΟΣΣ. Ε) Για μένα επαρκής
επικοινωνία είναι να μου εξηγεί τα λάθη μου στην γραπτή εργασία. ΣΤ) Για
μένα επαρκής επικοινωνία είναι να είναι διαθέσιμος οποιαδήποτε ώρα τον έχω
ανάγκη. Η) Για μένα επαρκής επικοινωνία είναι να με υποστηρίζει στις
δυσκολίες. Από αυτές προκύπτουν οι εξής διαστάσεις της αντιληπτής επάρκειας
της επικοινωνίας της εξΑΕ α) ενθάρρυνση, β) εξήγηση, γ) ευχαρίστηση δ) κ.α.
σε διάφορες περιπτώσεις (πριν τις ΟΣΣ, στην διάρκεια των ΟΣΣ, στο σχολιασμό
των εργασιών. Στο σημείο αυτό μπορεί να δημιουργήσει ένα σύνολο πιθανών
ερωτημάτων που θα απαρτίζουν την κλίμακα μέτρησης και να ζητήσει την
βοήθεια ειδικών (experts) που θα αξιολογήσουν τα ερωτήματα αυτά αν και σε
ποιο βαθμό καλύπτουν το πεδίο που μετρά.
Η εγκυρότητα εννοιολογικής κατασκευής αφορά τον βαθμό που μία κλίμακα
μέτρησης μετρά επακριβώς την έννοια που έχουμε ορίσει ότι μετράει. Η αποτίμηση
της εγκυρότητας εννοιολογικής κατασκευής είναι μια διαδικασία που εφαρμόζεται
κυρίως όταν δημιουργούμε όργανα μέτρησης αφηρημένων ψυχολογικών
χαρακτηριστικών, ή αντιλήψεων, πεποιθήσεων όπως αυτό της αντιληπτής επάρκειας
του παραδείγματός μας. Στην περίπτωση της αντιληπτής επάρκειας της επικοινωνίας
στην εξΑΕ ο ερευνητής έχει δημιουργήσει/κατασκευάσει μια έννοια. Με την
εγκυρότητα εννοιολογικής κατασκευή βλέπουμε κατά πόσο το όργανο μέτρησης
(στην περίπτωσή μας το σύνολο των ερωτήσεων) μετρά πράγματι αυτή την έννοια. Η
αποτίμηση της εγκυρότητας της εννοιολογικής κατασκευής μπορεί να συμπεριλάβει
πολλές διαδικασίες ανάλογα με την φαντασία και την ικανότητα του ερευνητή.
1. Συνήθως ψάχνει να βρει ή συσχέτιση μεταξύ της κλίμακας που φτιάχνουμε και
μίας αντίστοιχής που μετρά το ίδιο χαρακτηριστικό ή παρόμοιου (συγκλίνουσα
εγκυρότητα ή convergent validity) ή μη συνάφεια με μία κλίμακα που μετρά
διαφορετικού χαρακτηριστικό (διακρίνουσα εγκυρότητα η discriminant
validity).
2. Μπορούν επίσης να χρησιμοποιήσει πειραματικές διαδικασίες (π.χ.
χρησιμοποιεί την κλίμακα σε ένα πληθυσμό στόχο που γνωρίζουμε την
συμπεριφορά του)
Στην περίπτωση του παραδείγματος μας ο ερευνητής θα μπορούσε να ψάξει για μια
αντίστοιχη υπάρχουσα κλίμακα που μετρά την αντιληπτή επάρκεια της επικοινωνίας
στην εξΑΕ (συγκλίνουσα εγκυρότητα ή convergent validity). Αν υπάρχει τη δίνει μαζί
με τη δική του σε ένα δείγμα φοιτητών/τριων και αναζητά θετική συσχέτιση των
αποτελεσμάτων της με αυτά της δικής του. Τέλος στην περίπτωση που η έννοια του
έχει πολλές διαστάσεις όπως στην περίπτωσή μας, χρησιμοποιεί και παραγοντική
ανάλυση (factor analysis). Η εγκυρότητα στη βάση κριτηρίων αναφέρεται
ακριβώς σ’ αυτό που περιγράφει. Την αναζήτηση δηλαδή ενός κριτηρίου με βάση το
οποίο θα αποφανθεί ότι πράγματι η κλίμακα μετράει την έννοια που έχει πει ότι
μετρά. Συνήθως ψάχνει να βρει συσχέτιση μεταξύ της κλίμακας που φτιάχνει με μία
άλλη που μετρά συναφή έννοια ή (συγχρονική εγκυρότητα-concurent
validity).
2. Επίσης μπορεί να αναζητήσει ένα κριτήριο που προβλέπει την συμπεριφορά
στο μέλλον (προβλεπτική εγκυρότητα-predictive validity). Προσοχή η
προβλεπτική εγκυρότητα μοιάζει με την συγχρονική εγκυρότητα σε σχέση
με τον τρόπο αποτίμησής της με μόνη διαφορά τον χρόνο που δίνεται η
δεύτερη κλίμακα.
Στην περίπτωση του παραδείγματος μας ο ερευνητής θα μπορούσε να ψάξει για μία
κλίμακα που μετρά την ευχαρίστηση ή το άγχος στην εξΑΕ. Δίνει λοιπόν την ή τις
κλίμακες αυτές μαζί με τη δική του σε ένα δείγμα φοιτητών/τριων και αναζητά
συνάφεια ή μη συνάφεια των αποτελεσμάτων.
Η αξιοπιστία (reliability)Η αξιοπιστία μιας κλίμακας μέτρησης, με απλά λόγια
αφορά τη σταθερότητα με την οποία η κλίμακα μετράει αυτό που μετράει. Παρόλα
αυτά πρέπει να έχουμε στο μυαλό μας ότι η αξιοπιστία αναφέρεται στα αποτελέσματα
της μέτρησης μιας κλίμακας και όχι στην κλίμακα καθαυτή. Αυτό σημαίνει ότι η
αξιοπιστία επηρεάζεται από τα υποκείμενα της έρευνας (για παράδειγμα από τους
ερωτώμενους) και από το πρωτόκολλο της μέτρησης. Συνεπώς μια κλίμακα μπορεί να
είναι αξιόπιστη σε ένα χώρο εφαρμογής και αναξιόπιστη σ ένα άλλο. Με βάση αυτές
τις παρατηρήσεις έχουμε φθάσει να μιλάμε για γενίκευση της αξιοπιστίας
(reliability generalization).Υπάρχουν διάφορα είδη αξιοπιστίας. Για παράδειγμα:
1. Η αξιοπιστία εσωτερικής συνέπειας (internal consistency).
2. Η αξιοπιστία των επαναληπτικών μετρήσεων (test-retest reliability)
3. Η αξιοπιστία των εναλλακτικών τύπων (alternative-forms reliability or
parallel-forms reliability)
4. Η αξιοπιστία των ημίκλαστων ή ημίσεων (split-half reliability).
Στην αξιοπιστία εσωτερικής συνέπειας αξιολογείται η ομοιογένεια των ερωτήσεων
της κλίμακας. Εφαρμόζουμε την κλίμακα μία φορά και αν οι απαντήσεις είναι
δυαδικής επιλογής χρησιμοποιούμε τον συντελεστή Kuder-Richardson formula ενώ
αν οι επιλογές είναι περισσότερες χρησιμοποιούμε τον συντελεστή alpha του
Cronbach.
Στην αξιοπιστία των επαναληπτικών μετρήσεων αξιολογούμε την σταθερότητα
των απαντήσεων. Για το σκοπό αυτό εφαρμόζουμε την κλίμακα δύο φορές στα ίδια
άτομα κάτω από τις ίδιες συνθήκες και συσχετίζουμε τις δύο βαθμολογίες.
Την αξιοπιστία των εναλλακτικών τύπων την χρησιμοποιούμε στην περίπτωση που
έχουμε δύο παράλληλους τύπους της ίδιας κλίμακας. Τότε εφαρμόζουμε στα ίδια
άτομα τον ένα τύπο και αργότερα τον άλλο τύπο και συσχετίζουμε τις βαθμολογίες
μεταξύ τους
Την αξιοπιστία των ημίκλαστων ή ημίσεων την χρησιμοποιούμε στην περίπτωση
που δεν έχουμε δύο παράλληλους τύπους της ίδιας κλίμακας. Τότε εφαρμόζουμε την
κλίμακα μία φορά αλλά βαθμολογούμε χωριστά τις άρτιες και χωριστά τις περιττές
ερωτήσεις
Πολλοί ερευνητές προτείνουν για την αξιοπιστία:
a=0,90 για την εσωτερική συνοχή
r (Pearson coefficient)=0,90 για test-retest
a=0,90 για παραλλαγές κλίμακας
Για να αποτιμήσει λοιπόν ο ερευνητής την εγκυρότητα εννοιολογικής κατασκευής
την εγκυρότητα στη βάση κριτηρίων και την αξιοπιστία της κλίμακας μέτρησης
προχωρεί σε μια πιλοτική έρευνα. Βρίσκει λοιπόν ένα επαρκές δείγμα και χορηγεί την
κλίμακα.

Το αρχείο σε ηλεκτρονική μορφή είναι διαθέσιμο εδώ