1279
|

Θα φέρει το Twitter το τέλος των δημοσκόπων;

Avatar protagon.import 2 Οκτωβρίου 2015, 11:40

Θα φέρει το Twitter το τέλος των δημοσκόπων;

Avatar protagon.import 2 Οκτωβρίου 2015, 11:40

Τα tweets είναι, τελικά, κάτι περισσότερο από επικοινωνία, αφορισμοί, αστειάκια ή ενημέρωση. Μπορεί, ακόμα, να είναι μια ένδειξη για το προφίλ των χρηστών του Twitter, ένας τρόπος να σκιαγραφήσουμε τα κοινωνικά και οικονομικά δημογραφικά χαρακτηριστικά των μελών του δικτύου, ακόμα περισσότερο και μια ζωντανή, ρέουσα εικόνα για τις διαθέσεις των πολιτών. Αυτό που ως τώρα καταλαβαίναμε κάπως διαισθητικά για το πού πάνε τα πράγματα, για το ποιοι είναι τέλος πάντων αυτοί που γράφουν στο Twitter, αρχίζει πλέον να γίνεται ανιχνεύσιμο και επιστημονικά.

Η μελέτη που δημοσίευσαν προ ημερών στην επιθεώρηση PLoS ONE πέντε ερευνητές από τη Βρετανία και τις ΗΠΑ είναι η πρώτη που προσπαθεί να προβλέψει το εισόδημα των χρηστών του Twitter από χαρακτηριστικά όπως τα θέματα συζήτησης που προτιμούν (πολιτική, για παράδειγμα), από τα συναισθήματα που εκφράζουν στα tweet (άγχος, αισιοδοξία, απογοήτευση, έκπληξη), και από τον κοινωνικό κύκλο που έχουν σχηματίσει στο δίκτυο (αριθμός φίλων, αριθμός και προέλευση των retweet). Ανάμεσα στους υπογράφοντες είναι ο Νίκος Αλετράς και ο Βασίλης Λάμπος από το University College του Λονδίνου.

Οι ερευνητές συνέλεξαν γύρω στα 10,7 εκατομμύρια tweet από 5.000 λογαριασμούς. Με πρότυπο τη λεπτομερή κατηγοριοποίηση των επαγγελμάτων από τη βρετανική στατιστική υπηρεσία, εντόπισαν και φιλτράρισαν χρήστες σε κάθε ομάδα, της οποίας το μέσο εισόδημα είναι ήδη γνωστό. Στη συνέχεια, με έναν συνδυασμό εξελιγμένων αλγορίθμων, επεξεργασίας φυσικής γλώσσας και δικής τους εργασίας στην αξιολόγηση των δεδομένων, κατέταξαν τους χρήστες ανάλογα με το φύλο, την ηλικία, την πολιτική κλίση (προοδευτική, συντηρητική και άλλες) και το μορφωτικό επίπεδο και είδαν αν και πώς αυτές οι κατηγοριοποιήσεις σχετίζονται και με το εισόδημα.

Μια ποικιλία συμπεριφορών

Οι χρήστες με διαφορετικά εισοδήματα έχουν διαφορετικό προφίλ χρήσης του μέσου, διαπίστωσαν οι ερευνητές. Όμως η εικόνα είναι πιο σύνθετη, εξηγεί στο protagon ο Βασίλης Λάμπος. «Σε μερικές περιπτώσεις οι διαφορές είναι στατιστικά εμφανείς, σε άλλες περιπτώσεις είναι πολύ μικρές και σε λιγότερες περιπτώσεις μπορεί να παρατηρήσουμε μια εξαίρεση από αυτόν τον κανόνα. Άρα υπάρχει ένα συνεχές πεδίο στο οποίο κινούνται οι χρήστες ή, καλύτερα, η στατιστική απεικόνιση των χρηστών που έχει ορίσει η μέθοδός μας».

Όσοι έχουν υψηλά εισοδήματα, διαπίστωσε η έρευνα, τείνουν να μιλούν στο Twitter για πολιτική, καθώς θεωρούνται ότι είναι πιο κοντά σε ανθρώπους με ισχύ, για θέματα που αφορούν εταιρείες, ακόμα και για ΜΚΟ. Εκφράζουν πιο έντονα αισθήματα όπως ο θυμός και ο φόβος, αντίθετα με την έκπληξη και την αηδία που εκφράζονται πιο έντονα από χαμηλότερα εισοδήματα. Σε κάποιον βαθμό, «παράγουν» tweet που ανακυκλώνονται μέσω των retweets από άλλους με μικρότερους κύκλους φίλων. (Η έρευνα δεν προχώρησε στο αν έχουν και μεγαλύτερη επιρροή, ωστόσο άλλη έρευνα έχει δείξει ότι η επιρροή ενός χρήστη του Twitter δεν εξαρτάται από τα θέματα για τα οποία μιλά περισσότερο).

Για χρήστες με χαμηλότερο κοινωνικό και οικονομικό προφίλ, το Twitter γίνεται μέσω επικοινωνίας παρά ενημέρωσης. Οι χρήστες σε αυτή την περιοχή τείνουν να χρησιμοποιούν περισσότερα λινκ και πιο αιχμηρή, λιγότερο προσεγμένη γλώσσα, όπως καταφαίνεται από τη χρήση της στα μηνύματα. Η έρευνα, πάντα μέσα από την ανάλυση των tweets, εντόπισε ακόμη τη διαπιστωμένη μισθολογική ανισότητα ανδρών-γυναικών.

Ο εντοπισμός των διαφορών είναι, πάντως το πρώτο βήμα και σειρά έχει η έρευνα για πιο λεπτούς διαχωρισμούς. «Ο αλγόριθμός μας δεν είναι τέλειος, κάνει λάθη, ίσως περισσότερα από όσα καταδεικνύονται από τη δημοσιογραφική κάλυψη της εργασίας. Αυτό μπορεί να έχει δύο ερμηνείες: πρώτον ότι η στατιστική μέθοδος μηχανικής μάθησης που χρησιμοποιήσαμε δεν είναι η καλύτερη, ή, δεύτερον, ότι οι χρήστες δε διαχωρίζονται πάντοτε απόλυτα, οι κανόνες διαχωρισμού δεν ισχύουν σε όλες τις περιπτώσεις κι άρα υπάρχουν εξαιρέσεις στα μοτίβα συμπεριφοράς των χρηστών. Προσωπικά πιστεύω ότι ισχύει το δεύτερο πολύ περισσότερο από το πρώτο».

Πέρα από τα tweets

Η συσχέτιση των tweets με το οικονομικό προφίλ μπορεί να είναι η αρχή. Παρόμοιες μέθοδοι, παρατηρεί ο κ. Λάμπος, «μπορούν να προσεγγίσουν την εικόνα της κοινής γνώμης για κοινωνικο-οικονομικά θέματα, αλλά και τις διάφορες οπτικές γωνίες πάνω σε θέματα διεθνούς ενδιαφέροντος, όπως είναι το προσφυγικό σήμερα ή οι επιθέσεις στη Λωρίδα της Γάζας κι ο ιός Ebola πέρυσι». Υπάρχουν ήδη πολλά παραδείγματα ερευνητικών εργασιών τέτοιου τύπου, αλλά ο ίδιος κρίνει ότι το μειονέκτημα των περισσότερων ερευνών είναι ότι δεν προσφέρουν γενικευμένες προσεγγίσεις.

Θα μπορούσαν πάντως, υπό προϋποθέσεις, να συμπληρώσουν τις εκλογικές δημοσκοπήσεις με δεδομένη την εμπειρία της αποτυχίας των προβλέψεων του αποτελέσματος στην Ελλάδα και σε άλλες χώρες. Το 2013 ερευνητές, μεταξύ τους και ο Λάμπος, δημοσίευσαν μια πρόταση για έναν αλγόριθμο στατιστικής επεξεργασίας φυσικής γλώσσας (δηλαδή έναν τρόπο να εκτιμάται η πρόθεση ψήφου από αυτά που γράφει το tweet) και εφάρμοσαν τη μέθοδο σε εκλογές στη Βρετανία και την Αυστρία με θετικά αποτελέσματα. Αυτές οι τεχνικές, εξηγεί, μπορούν να συμπληρώσουν χωρίς αναγκαστικά να αντικαταστήσουν τις δημοσκοπήσεις, αλλά η σχετική έρευνα πρέπει να προχωρήσει και άλλο.

Παρά ταύτα, το ζήτημα του μεγέθους του δείγματος, όπως και στις δημοσκοπήσεις, είναι κρίσιμο. Οι χρήστες των κοινωνικών δικτύων είναι βέβαια ένα υποσύνολο της κοινωνίας, όμως όχι εντελώς αντιπροσωπευτικό. Για τους ερευνητές «περισσότεροι χρήστες δε σημαίνει πάντα ακριβέστερα αποτελέσματα».

Εφαρμόζοντας, λοιπόν, ένα μοντέλο σε χρήστες του Twitter, που είναι κατά κανόνα 25-45 ετών, «η πρόβλεψή μας για το εκλογικό αποτέλεσμα θα αντιπροσωπεύει περισσότερο τις ηλικίες αυτές κι όχι ολόκληρο το εκλογικό σώμα κι άρα το στατιστικό λάθος πιθανότατα θα αυξηθεί». Ούτε το Facebook, παρότι σημαντικά δημοφιλέστερο από το Twitter, είναι ερευνητικά ασφαλής δρόμος. «Η πλειοψηφία των δεδομένων του είναι προστατευμένα (δεν είναι δημόσια) κι αφετέρου ότι δεν υπάρχει κάποιος δομημένος και νόμιμος τρόπος για να εξάγεις τα δεδομένα που δεν είναι προστατευμένα. Γι’ αυτό στη διεθνή βιβλιογραφία οι ουσιαστικές έρευνες που βασίζονται σε δεδομένα του Facebook έχουν γίνει ή ηγηθεί από την ερευνητική ομάδα της εταιρείας».

Επιστρέφοντας στη δική μας πραγματικότητα, στην Ελλάδα υπάρχουν κάποιες ερευνητικά αναξιοποίητες υποθέσεις, επισημαίνει ο κ. Λάμπος. Ο δρόμος προς το πρώτο μνημόνιο μέσα από τα δίκτυα και τις ενημερωτικές σελίδες είναι μία από αυτές: «Μια κοινωνικο-οικονομική ανάλυση των δεδομένων του Twitter, αλλά και των blogs ή των ειδησεογραφικών ιστοσελίδων με πολιτική κατεύθυνση ή μη, που να ξεκινά 1-2 χρόνια πριν την ψήφιση του πρώτου μνημονίου και την επίσημη έναρξη της κρίσης και να φτάνει μέχρι τη σημερινή εποχή, θα αποτελούσε σημείο αναφοράς για πολλές συζητήσεις που έγιναν, γίνονται και θα γίνουν στη χώρα μας, αλλά και στο εξωτερικό που παρακολουθεί από κοντά τις εξελίξεις αυτές». Σε ό,τι αφορά τα πλέον πρόσφατα, «θα μπορούσαμε επίσης να κοιτάξουμε τη στροφή του εκλογικού σώματος από την “αριστερά” του ΣΥΡΙΖΑ πριν το δημοψήφισμα σε ένα διαφορετικό πολιτικό μόρφωμα στις πρόσφατες εκλογές, εξάγοντας με στατιστικό τρόπο κάποιους παράγοντες που χαρακτηρίζουν το γνωστό “TINA” (There Is No Alternative / Δεν υπάρχει εναλλακτική)».

Θα προβλέπονται και οι εξεγέρσεις;

Ακόμα πιο μακριά από τα tweets, τις εκλογές ή τις αντιλήψεις για τα σημαντικά κοινωνικά ζητήματα, η αναζήτηση στα τεράστια σε όγκο δεδομένα των κοινωνικών δικτύων έχει προσελκύσει το ενδιαφέρον κρατικών υπηρεσιών. Μετά την Αραβική Άνοιξη που αιφνιδίασε τις δυτικές υπηρεσίες, έχουν αρχίσει οι αναζητήσεις για την πρόβλεψη εξεγέρσεων μέσα από την προσεκτική ανάλυση των big data από τα δίκτυα και του mood των πολιτών – πράγμα πιο δύσκολο από ό,τι ακούγεται.

«Δυστυχώς υπάρχουν ερευνητικές ομάδες που δουλεύουν προς αυτή την κατεύθυνση», επισημαίνει ο κ. Λάμπος. «Αρκεί, όμως, να δεις ποιος χρηματοδοτεί αυτές τις ερευνητικές εργασίες για να σταθείς κριτικά απέναντί τους. Πρακτικά η πρόβλεψη εξεγέρσεων δεν είναι ένα εύκολο πρόβλημα, γιατί είναι δύσκολο να δημιουργήσεις ένα ομοιογενές δείγμα δεδομένων για ένα μεγάλο χρονικό διάστημα πάνω στο οποίο ίσως να μπορούσες να βασίσεις τη μάθηση ενός στατιστικού μοντέλου. Αλλά στην επιστήμη ποτέ δε λέμε ποτέ, είναι όλα πιθανά και σίγουρα μπορεί να υπάρχει εναλλακτική.

» Το σημαντικότερο, όμως, εδώ είναι να κατανοήσουμε ότι οι κοινωνικές εξεγέρσεις έχουν συνήθως κάποιο έρεισμα, κάποια βάση. Η δουλειά και το καθήκον μας, ως ερευνητές κι ως άνθρωποι, δεν είναι να προβλέπουμε “εξεγέρσεις” για να τις αντιμετωπίζουμε καλύτερα όταν τελικά συμβούν, αλλά να βελτιώνουμε την κοινωνία εντοπίζοντας και λύνοντας τις αδικίες που τις γεννούν».

Ακολουθήστε το Protagon στο Google News