Παραδεδομένα

Από archaeology
Πήδηση στην πλοήγησηΠήδηση στην αναζήτηση

Τα παραδεδομένα (paradata) αποτελούν ένα κρίσιμο και ολοένα σημαντικότερο εργαλείο στη σύγχρονη μεθοδολογία ερευνών ερωτηματολογίων, καθώς προσφέρουν λεπτομερείς και συστηματικές πληροφορίες για τη διαδικασία συλλογής των δεδομένων. Ως πληροφορίες που παράγονται αυτόματα κατά την υλοποίηση μιας έρευνας, χωρίς να απαιτείται κάποια συνειδητή ή ενεργή ενέργεια από τους ερωτώμενους, συμβάλλουν ουσιαστικά στην κατανόηση των συμπεριφορών συμμετεχόντων και συνεντευξιαστών, καθώς και στη βελτίωση της ποιότητας των τελικών δεδομένων[1]. Σε διεθνές επίπεδο, η χρήση τους παρουσιάζει αυξητική τάση, ιδίως στο πλαίσιο ηλεκτρονικών και διαδικτυακών ερευνών, όπου η τεχνολογική υποδομή επιτρέπει τόσο την εύκολη συλλογή τους όσο και τη διασύνδεσή τους με διοικητικά δεδομένα για μεγαλύτερη ακρίβεια και αξιοπιστία[2].

Ορισμός και τυπολογία παραδεδομένων

Ο όρος "παραδεδομένα" αναφέρεται σε πληροφορίες που αφορούν τη διαδικασία συλλογής των πρωτογενών δεδομένων μιας έρευνας, όπως τη ροή συμπλήρωσης, τις τεχνικές συνθήκες συμμετοχής και τις ενέργειες των ερωτώμενων κατά την αλληλεπίδρασή τους με το ερωτηματολόγιο. Στις ηλεκτρονικές έρευνες, τα παραδεδομένα δημιουργούνται και καταγράφονται αυτόματα από υπολογιστικά συστήματα, γεγονός που τα καθιστά ιδιαίτερα χαμηλής αντιδραστικότητας, αφού συλλέγονται χωρίς τη ρητή γνώση ή προσοχή των συμμετεχόντων[3]. Είναι σημαντικό να διαχωρίζονται από τα μεταδεδομένα, τα οποία περιγράφουν στοιχεία σε μακροεπίπεδο (π.χ. δειγματοληπτικό σχέδιο), από τα βοηθητικά δεδομένα, τα οποία προέρχονται από εξωτερικές πηγές όπως απογραφές και από τα παθητικά δεδομένα, τα οποία αφορούν δεδομένα που παράγονται μέσω ψηφιακών ιχνών, όπως δεδομένα τοποθεσίας ή κίνησης[4]

Η τυπολογία των παραδεδομένων συνήθως βασίζεται σε τεχνικές και λειτουργικές διαστάσεις. Σε τεχνικό επίπεδο, διακρίνονται σε server-side παραδεδομένα —που συλλέγονται στον διακομιστή της πλατφόρμας και περιλαμβάνουν, μεταξύ άλλων, τον χρόνο πρόσβασης και τον αριθμό φορτώσεων σελίδας— και σε client-side παραδεδομένα, τα οποία καταγράφονται στη συσκευή του ερωτώμενου και περιλαμβάνουν πιο λεπτομερείς πληροφορίες, όπως κινήσεις ποντικιού ή πληκτρολογήσεις, απαιτώντας συνήθως ειδικό προγραμματισμό[5].

Σε λειτουργικό επίπεδο, τα παραδεδομένα οργανώνονται σε τρεις βασικές κατηγορίες: (α) παραδεδομένα επαφής, τα οποία σχετίζονται με την επικοινωνία μεταξύ ερευνητών και ερωτώμενων (π.χ. χρόνος και τρόπος πρώτης επαφής), (β) παραδεδομένα συσκευής, τα οποία περιλαμβάνουν πληροφορίες για τον τύπο συσκευής, την ανάλυση οθόνης και το λειτουργικό σύστημα, και (γ) παραδεδομένα πλοήγησης ερωτηματολογίου, όπως χρονικές σφραγίδες, αλλαγές απαντήσεων και μοτίβα πλοήγησης[6].

Η ταξινόμηση αυτή συνδέεται στενά με το πλαίσιο συνολικού σφάλματος έρευνας (Total Survey Error Framework): τα παραδεδομένα επαφής σχετίζονται κυρίως με σφάλματα μη απόκρισης, ενώ τα παραδεδομένα πλοήγησης επιτρέπουν την ανίχνευση και διόρθωση ενδεχόμενων σφαλμάτων μέτρησης[7].

Εφαρμογές των παραδεδομένων

Τα παραδεδομένα αξιοποιούνται σε όλα τα στάδια μιας έρευνας —πριν, κατά και μετά τη συλλογή δεδομένων— τόσο για μεθοδολογικούς όσο και για ουσιαστικούς σκοπούς. Συμβάλλουν στην αύξηση της αποδοτικότητας της διαδικασίας συλλογής, για παράδειγμα μέσω βελτιστοποίησης του χρονισμού των email πρόσκλησης, αλλά και στη βελτίωση της ποιότητας των τελικών δεδομένων μέσω προσαρμογών στον σχεδιασμό του ερωτηματολογίου. Επιπλέον, χρησιμοποιούνται στη στατιστική επεξεργασία για την αντιμετώπιση προκαταλήψεων μη απόκρισης[8], ενισχύοντας την ακρίβεια των εκτιμήσεων[9]. Σε έρευνες πάνελ, τα παραδεδομένα προηγούμενων κυμάτων μπορούν να προβλέψουν συμπεριφορές συμμετεχόντων, όπως η προτίμηση τύπου συσκευής ή η πιθανότητα συνέχισης συμμετοχής [10].

Περαιτέρω, τα παραδεδομένα αποκτούν μεγαλύτερη ισχύ όταν συνδυάζονται με διοικητικά ή συμφραζόμενα δεδομένα, συμβάλλοντας στη μείωση σφαλμάτων και στον εμπλουτισμό των αναλυτικών προσεγγίσεων. Παρά τα πλεονεκτήματά τους, προκλήσεις όπως επιλεκτικές στρεβλώσεις και ζητήματα ακρίβειας μέτρησης απαιτούν προσεκτική αντιμετώπιση[11] Παράλληλα, σε ηθικό και νομικό επίπεδο, η συλλογή παραδεδομένων δημιουργεί ανησυχίες για την ιδιωτικότητα των συμμετεχόντων, ιδίως όταν συνδέονται με ευαίσθητα ψηφιακά ίχνη[12].

Παραδείγματα χρήσης σε διεθνείς έρευνες

Ένα χαρακτηριστικό παράδειγμα αποτελεί η μελέτη EN-INDEPTH, όπου αξιοποιήθηκαν παραδεδομένα από 3,6 εκατομμύρια εγγραφές και 65.768 συνεντεύξεις με στόχο τη διερεύνηση της καταγραφής εγκυμοσύνης σε χώρες χαμηλού και μεσαίου εισοδήματος. Τα παραδεδομένα ανέδειξαν διαφορές στον χρόνο ολοκλήρωσης των εργαλείων (11,4 λεπτά για FPH Full Pregnancy History, έναντι 10,3 για FBH+, Full Birth History + pregnancy‑loss questions)[13], καθώς και τη συχνότητα διορθώσεων (τουλάχιστον μία διόρθωση στο 83,7% των συνεντεύξεων)[14] Παράλληλα, τα χαρακτηριστικά των ερωτήσεων —όπως ο τύπος, η θεματική φύση και η δομή τους— βρέθηκε ότι επιδρούν σημαντικά τόσο στον χρόνο συμπλήρωσης όσο και στη συχνότητα διορθώσεων, οδηγώντας σε προτάσεις για βελτίωση του σχεδιασμού[15].

Αντίστοιχα, στη μελέτη του Kelley αξιοποιήθηκαν παραδεδομένα χρονικών σφραγίδων για τον εντοπισμό αποκλίσεων στον τρόπο ανάγνωσης ερωτήσεων από συνεντευξιαστές. Αναπτύχθηκε το όριο χρόνου QATT (Question Administration Time Threshold), το οποίο παρουσίασε ακρίβεια 87,1% για το εργαλείο 4WPS και επέτρεψε την ανίχνευση του 46,9% των σημαντικών αποκλίσεων[16]. Με τον τρόπο αυτό, ο ποιοτικός έλεγχος αυτοματοποιείται και μειώνονται τα ψευδώς θετικά σήματα εντοπισμού προβληματικών συμπεριφορών. [17]

Στη μελέτη SHARE εφαρμόστηκε τριεπίπεδο μοντέλο logit για την ανάλυση της συνεργασίας των συμμετεχόντων σε πάνελ ερευνών, με αξιοποίηση παραδεδομένων όπως το συνολικό μήκος συνέντευξης και η συμπεριφορά στρογγυλοποίησης απαντήσεων. Τα παραδεδομένα εξήγησαν το 72,5% της διακύμανσης στο επίπεδο του ερωτώμενου, το 25,9% στο επίπεδο του συνεντευξιαστή και το 1,6% στο επίπεδο του πρακτορείου συλλογής δεδομένων[18]. Επιπλέον, διαπιστώθηκε ότι έμπειροι συνεντευξιαστές και συχνή καθημερινή επικοινωνία αυξάνουν σημαντικά την πιθανότητα συνεργασίας[19].

Συμπέρασμα

Συνολικά, τα παραδεδομένα αποτελούν ισχυρό εργαλείο για την ενίσχυση της ακρίβειας, της ποιότητας και της αποδοτικότητας ερευνών ερωτηματολογίων, όπως καταδεικνύεται από πληθώρα διεθνών εφαρμογών. Παρά τις σημαντικές δυνατότητές τους, ζητήματα όπως η μεροληψία και οι ηθικές προκλήσεις γύρω από την προστασία της ιδιωτικότητας απαιτούν συνεχή και προσεκτική διαχείριση. Μελλοντικές εξελίξεις, ιδίως στο πλαίσιο νέων ψηφιακών τεχνολογιών και μεγάλων δεδομένων, αναμένεται να ενισχύσουν ακόμη περισσότερο τη χρησιμότητα των παραδεδομένων στη μεθοδολογία ερευνών[20].

Παραπομπές σημειώσεις

  1. Sakshaug and Struminskaya 2023, 475.
  2. Kunz and Hadler 2020, 1.
  3. Kunz and Hadler 2020, 1.
  4. Kunz and Hadler 2020, 1-2.
  5. Kunz and Hadler 2020, 2.
  6. Kunz and Hadler 2020, 2-3.
  7. Kunz and Hadler 2020, 3.
  8. Προκατάληψη μη απόκρισης (non-response bias) σημαίνει ότι τα αποτελέσματα μιας έρευνας στρεβλώνονται επειδή κάποιοι άνθρωποι δεν απάντησαν —και αυτοί που δεν απάντησαν διαφέρουν συστηματικά από αυτούς που απάντησαν.
  9. Kunz and Hadler 2020, 4.
  10. Kunz and Hadler 2020, 4.
  11. Sakshaug and Struminskaya 2023, 476.
  12. Sakshaug and Struminskaya 2023, 477.
  13. Η FPH καταγράφει όλο το αναπαραγωγικό ιστορικό — γεννήσεις και απώλειες — ανεξαρτήτως πότε συνέβησαν. Αυτό προσφέρει ευρύτερη και πιο ολοκληρωμένη εικόνα. Η FBH+ δίνει λιγότερες πληροφορίες για απώλειες (μόνο για τις τελευταίες 5 χρόνια), γεγονός που μπορεί να οδηγεί σε υποεκτίμηση π.χ. θνησιμότητας ή αποβολών.
  14. Gordeev et al. 2021, 5.
  15. Gordeev et al. 2021, 4-5.
  16. Kelley 2019, 18-19.
  17. Kelley 2019, 21.
  18. Bristle et al. 2019, 543.
  19. Bristle et al. 2019, 544-545.
  20. Sakshaug and Struminskaya 2023, 478.

Βιβλιογραφία

  • Bristle, J., M. Celidoni, C. Dal Bianco, and G. Weber. 2019. "The contributions of paradata and features of respondents, interviewers and survey agencies to panel co-operation in the Survey of Health, Ageing and Retirement in Europe." Journal of the Royal Statistical Society: Series A (Statistics in Society) 182(2):541–68. https://doi.org/10.1111/rssa.12391
  • Gordeev, V. S., J. Akuze, A. Baschieri, S. M. Thysen, F. Dzabeng, M. M. Haider, M. Smuk, et al. 2021. "Paradata analyses to inform population-based survey capture of pregnancy outcomes: EN-INDEPTH study." Population Health Metrics 19(Suppl 1):10. https://doi.org/10.1186/s12963-020-00241-0
  • Kelley, J. 2019. "The Accuracy and Utility of Using Paradata to Detect Interviewer Question-Reading Deviations." DigitalCommons@University of Nebraska - Lincoln. https://digitalcommons.unl.edu/sociw/8/
  • Kunz, T., and P. Hadler. 2020. "Web Paradata in Survey Research." GESIS Survey Guidelines. Mannheim, Germany: GESIS – Leibniz Institute for the Social Sciences. https://doi.org/10.15465/gesis-sg_en_037
  • Sakshaug, J. W., and B. Struminskaya. 2023. "Augmenting Surveys with Paradata, Administrative Data, and Contextual Data." Public Opinion Quarterly 87(Suppl 1):475–79. https://doi.org/10.1093/poq/nfad026

Βλ. επίσης