ΚΟΙΝΩΝΙΑ
Ελληνικό λογισμικό προβλέπει φύλο-ηλικία του ανώνυμου συγγραφέα στα social media
© ΑΠΕ-ΜΠΕ
ΘΕΜΑ: ΚΟΙΝΩΝΙΑ

Ελληνικό λογισμικό προβλέπει φύλο-ηλικία του ανώνυμου συγγραφέα στα social media

Ένα πρωτοποριακό για τα ελληνικά δεδομένα λογισμικό, που έχει αναπτύξει ένας Έλληνας ερευνητής και οι συνεργάτες του, μπορεί να αναλύει τα κείμενα ανώνυμων συγγραφέων στα μέσα κοινωνικής δικτύωσης και να προβλέπει σωστά το φύλο, την ηλικία τους, αλλά και ψυχολογικά χαρακτηριστικά της προσωπικότητάς τους.

Ακόμη και σε μικρά κείμενα, π.χ. στo Twitter, το λογισμικό —που «διαβάζει» ελληνικά, αγγλικά, ισπανικά και ιταλικά- κάνει αυτόματη αναγνώριση φύλου του συγγραφέα με ακρίβεια πάνω από 90%. Για μεγαλύτερες αναρτήσεις στα κοινωνικά δίκτυα ή για ακόμη μεγαλύτερα κείμενα (π.χ. των 5.000 λέξεων), η ακρίβεια μπορεί να προσεγγίσει το 100%. Για την εκτίμηση της ηλικίας και χαρακτηριστικών γνωρισμάτων της προσωπικότητας, η ακρίβεια κυμαίνεται μεταξύ 40% έως 70%.

Σε συνέντευξή του στο Αθηναϊκό και Μακεδονικό Πρακτορείο Ειδήσεων, ο δημιουργός του λογισμικού Γιώργος Μικρός, καθηγητής Υπολογιστικής & Ποσοτικής Γλωσσολογίας και πρόεδρος του Τμήματος Ιταλικής Γλώσσας & Φιλολογίας του Πανεπιστημίου Αθηνών, καθώς και αντιπρόεδρος της Διεθνούς Εταιρείας Ποσοτικής Γλωσσολογίας, τονίζει ότι υπάρχει διαφορετική βιολογική βάση στο γλωσσικό μηχανισμό των ανδρών και των γυναικών, ενώ οι γυναίκες εμφανίζουν καλύτερη επεξεργασία της γλώσσας.

Όπως λέει, οι γυναίκες χρησιμοποιούν και τα δύο ημισφαίρια για την παραγωγή του λόγου, ενώ οι άνδρες μόνο το αριστερό. Επίσης οι γυναίκες υπερτερούν έναντι των ανδρών στις γλωσσικές δοκιμασίες και ο λόγος τους είναι συνήθως πιο «επίσημος».

Ο διαφορετικός τρόπος που εκφράζονται τα δύο φύλα, είναι δυνατό να αναγνωρισθεί από τους αλγόριθμους τεχνητής νοημοσύνης του προγράμματος λογισμικού που έχει αναπτύξει ο κ. Μικρός και το οποίο μπορεί να αναλύσει ένα ανώνυμο κείμενο, συμπεραίνοντας αν έχει γραφτεί από άνδρα ή γυναίκα. Το λογισμικό μπορεί ακόμη να εξάγει συμπεράσματα για την ηλικία του συγγραφέα, αλλά και για βασικά χαρακτηριστικά της προσωπικότητάς του.

Λογισμικά αυτού του είδους ανήκουν στο πεδίο της Υφομετρίας (Stylometry), που συνδυάζει τεχνικές της Γλωσσολογίας και της Πληροφορικής. Ο κ. Μικρός ξεκίνησε να αναπτύσσει το εν λόγω πρόγραμμα το 2007 και ακόμη το τελειοποιεί, σε συνεργασία με ερευνητές στις ΗΠΑ.

«Οι πιθανές πρακτικές εφαρμογές του είναι πολλές» όπως λέει. Κατ' αρχήν στην εγκληματολογία (π.χ. για την ταυτοποίηση του συγγραφέα μιας τρομοκρατικής προκήρυξης ή μιας ανώνυμης απειλητικής επιστολής), στη φιλολογία (π.χ. για την ανίχνευση της λογοτεχνικής πατρότητας παλαιών κειμένων), στον εντοπισμό κάθε είδους λογοκλοπών (π.χ. σε μια φοιτητική ή άλλη εργασία), στη διερεύνηση της δυναμικής της κοινής γνώμης στο διαδίκτυο (π.χ. μέσω της ανάλυσης της συναισθηματικής φόρτισης που εμπεριέχουν οι αναρτήσεις των κοινωνικών δικτύων για έναν πολιτικό ή μια εταιρεία), στην εκπαίδευση κ.α.

Ο Γ.Μικρός είναι επίσης συνεργαζόμενος καθηγητής στο Τμήμα Εφαρμοσμένης Γλωσσολογίας του Πανεπιστημίου της Μασαχουσέτης στη Βοστώνη, από το 1992 επιστημονικός συνεργάτης του Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου «Αθηνά» (όπου έχει συμβάλει στην ανάπτυξη λογισμικού γλωσσικής τεχνολογίας), ενώ από φέτος είναι διευθυντής του προγράμματος για την «Ισπανική Γλώσσα και τον Πολιτισμό» του Ελληνικού Ανοιχτού Πανεπιστημίου.

Την Παρασκευή 21 Οκτωβρίου (στις 19:00), θα μιλήσει στο Μουσείο Ηρακλειδών στο Θησείο, σε εκδήλωση της Ομάδας «Θαλής+Φίλοι», με θέμα «Πόσο διαφορετικά γράφουν άνδρες και γυναίκες; Προβλέποντας το φύλο του συγγραφέα στα Μέσα κοινωνικής Δικτύωσης».

Παύλος Δρακόπουλος

Πηγή: ΑΠΕ-ΜΠΕ