Επιστήμονες στις ΗΠΑ ανακάλυψαν ακόμη μία χρήση της επεξεργασίας προσωπικών δεδομένων από τα social media. Στόχος τους είναι να προβλέπουν τις εξάρσεις της πανδημίας του κορονοϊού, ακριβώς όπως συμβαίνει εδώ και χρόνια με το δελτίο καιρού.
Για να μετουσιώσουν σε τεχνολογία την ιδέα τους, δημιούργησαν έναν αλγόριθμο, ο οποίος φέρεται να μπορεί να κάνει προβλέψεις για την αύξηση περιστατικών του κορονοϊού σε συγκεκριμένες περιοχές, αρκετές ημέρες πριν αυτό καταγραφεί επίσημα. Στην πραγματικότητα επιχειρούν να προβλέψουν ένα νέο ξέσπασμα, όπως γράφουν οι New York Times.
Ενας τέτοιος αλγόριθμος θα βοηθούσε σημαντικά στην καλύτερη πρόληψη και φυσικά αντιμετώπιση της πανδημίας, καθώς θα επέτρεπε πιο ασφαλή λήψη, αλλά και άρση των περιοριστικών μέτρων.
Το μεγάλο του πλεονέκτημα είναι ότι προβλέπει τον κίνδυνο ή την ύφεση 14 ημέρες πριν, ακριβώς το ίδιο χρονικό διάστημα δηλαδή που διαρκεί η καθυστέρηση στα μαθηματικά μοντέλα που χρησιμοποιούνται σήμερα και στην Ελλάδα, βάσει των οποίων οργανώνεται η λήψη μέτρων. Αρα, μία τέτοια εφεύρεση θα μπορούσε να χτυπήσει συναγερμό σε πραγματικό χρόνο.
Σε μελέτη που προδημοσιεύτηκε προς έγκριση στην επιστημονική επιθεώρηση arXiv.org, η ομάδα των Μαουρίτσιο Σαντιλάνα και Νικόλ Κόγκαν από το Πανεπιστήμιο του Χάρβαρντ, αναφέρουν ότι το σύστημά τους λειτουργεί χρησιμοποιώντας και αναλύοντας δεδομένα πραγματικού χρόνου από το Twitter, τις αναζητήσεις στη Google και δεδομένα μετακινήσεων από smartphones και data streams.
Σύμφωνα με τους ερευνητές, ο αλγόριθμος θα μπορούσε να λειτουργεί ως «θερμοστάτης» σε ένα σύστημα θέρμανσης ή κλιματισμού, ώστε να καθοδηγεί την ενεργοποίηση ή τη χαλάρωση μέτρων περιορισμού με στόχο την προστασία της Δημόσιας Υγείας.
«Στα περισσότερα μοντέλα μολυσματικών και μεταδιδόμενων παθήσεων, προβάλλεις διαφορετικά σενάρια με βάση τις υποθέσεις που έχουν γίνει εκ των προτέρων» εξηγεί ο Σαντιλάνα, διευθυντής του Εργαστηρίου Πληροφορικής στο Νοσοκομείο Παίδων της Βοστώνης και επίκουρος καθηγητής Παιδιατρικής και Επιδημιολογίας στο Πανεπιστήμιο του Χάρβαρντ.
«Αυτό που κάνουμε εδώ είναι να παρατηρούμε, χωρίς να κάνουμε υποθέσεις. Η διαφορά είναι πώς οι μέθοδοί μας αντιδρούν σε άμεσες αλλαγές στη συμπεριφορά των χρηστών στα κοινωνικά δίκτυα και έτσι μπορούμε να τις ενσωματώσουμε αυτές».
Στο πλαίσιο της μελέτης του αλγόριθμου, η ομάδα ανέλυσε δεδομένα πραγματικού χρόνου χρησιμοποιώντας ως πηγές αναζητήσεις από τη Google, αναρτήσεις στο Twitter σχετικά με την Covid-19, αναζητήσεις γιατρών στην ψηφιακή επιστημονική πλατφόρμα UpToDate, ανώνυμα δεδομένα μετακίνησης από smartphone και στοιχεία από το Kinsa Smart Thermometer.
Αυτά τα data streams ενσωματώθηκαν σε ένα προηγμένο μοντέλο πρόγνωσης του Πανεπιστημίου Νορθγουέστερν, το οποίο με τη σειρά του τα αξιολόγησε με βάση το πώς οι άνθρωποι κινούνται και αλληλεπιδρούν σε κοινότητες.
Η ομάδα δοκίμασε την αξία που έχουν για τις προβλέψεις οι τάσεις στο data stream, εξετάζοντας τον τρόπο που η καθεμία συσχετιζόταν με τους αριθμούς κρουσμάτων και θανάτων τον Μάρτιο και τον Απρίλιο σε κάθε πολιτεία των ΗΠΑ.
Εν τέλει, συνδυάζοντας όλες τις πηγές δεδομένων, ο αλγόριθμος ήταν σε θέση να προβλέψει ξεσπάσματα σε 21 ημέρες κατά μέσο όρο, όπως διαπίστωσαν οι ερευνητές.
Παρόλα αυτά, όπως υπογραμμίζουν στα συμπεράσματα της έρευνά τους, προς το παρόν μεγάλα δεδομένα από τις αναλύσεις δεν είναι σε θέση να προβλέψουν απότομες αλλαγές στη μαζική συμπεριφορά καλύτερα από άλλα, πιο παραδοσιακά μοντέλα που υπάρχουν και χρησιμοποιούνται σήμερα.
Επίσης, τα social media και οι μηχανές αναζήτησης μπορούν να γίνουν λιγότερο ακριβή με το πέρασμα του χρόνου, καθώς όσο πιο οικείος γίνεται στους χρήστες ένας παθογόνος οργανισμός, τόσο λιγότερο συχνά θα υπάρχουν αναζητήσεις με συγκεκριμένες λέξεις- κλειδιά και τόσο λιγότερες δημοσιεύσεις θα γίνονται στα social media.
Ακολουθήστε το Protagon στο Google News