Analytics · Social Media · Uncategorized

Τι ψηφίζουν τα Social Media; (Β’ Μέρος)

Η έρευνα πολιτικών τάσεων στα Social Media ξεκίνησε αρχικά ως ένα πειραματικό project που περιλάμβανε δέσμες ασκήσεων για την εκμάθηση εργαλείων συλλογής και ταξινόμησης Data και οπτικοποίησης των αποτελεσμάτων τους σε γραφήματα καθώς και της γλώσσας προγραμματισμού Python αλλά και εκμάθησης σύνθετων μεθόδων υπολογισμού και ανάλυσης στο Excel.

Κατά την έρευνα συλλέχθηκαν και αναλύθηκαν  αναφορές σε κάθε μία εκ των οποίων περιλαμβάνεται το όνομα, το handle ή το URL ενός ή περισσότερων ελληνικών Κομμάτων και πολιτικών αρχηγών είτε ως απλό mention είτε ως reply είτε ως retweet με ή άνευ σχολίου με αναζήτηση μέσω χρήσης boolean εντολών (AND, NOT, OR κτλ) και λέξεων-κλειδιών ή ανοιχτού πεδίου με μαζικό «κατέβασμα» δημοσιεύσεων συγκεκριμένης χρονικής περιόδου και φιλτράρισμά τους σε δεύτερη φάση. Η μέθοδος boolean αν και μεθοδολογικά αποδεκτή παρουσιάζει μια σειρά από λογικά/γλωσσικά προβλήματα με κυριότερο αυτό του τρόπου αναφοράς σε κόμματα ή πρόσωπα (π.χ. είναι δεδομένο ότι οι περισσότεροι χρήστες θα γράψουν «ΣΥΡΙΖΑ» ή «ΣΥΡΙΖΑ-ΑΝΕΛ» αλλά κάποιοι θα γράψουν «ΝΔ», κάποιοι άλλοι «Νέα Δημοκρατία», κάποιοι «Κυριάκος Μητσοτάκης» και κάποιοι άλλοι «Κούλης» καθώς και ένα σωρό άλλες παραλλαγές σε ονόματα κομμάτων ή προσώπων). Ο ερευνητής έχει υποχρέωση να τηρεί «λεξικά» ανάλογα με ΚΑΙ με τις τάσεις γραφής ονομάτων και τις όποιες αλλαγές σε αυτές για να κάνει αξιόπιστη ποσοτική και ποιοτική ανάλυση δεδομένου ότι ο τρόπος γραφής είναι ενδεικτικός και της αρνητικής ή θετικής άποψης του χρήστη για πρόσωπα και πράγματα.

Τα datasets τα οποία χρησιμοποιήθηκαν προέρχονταν, στο πρώτο στάδιο, από το Twitter μέσω του API (Application Programming Interface, ελλ. Διεπαφή Προγραμματισμού Εφαρμογών) το οποίο εκείνο παρέχει για developers. Ο λόγος ήταν καθαρά πρακτικός καθώς αυτά είναι τα πλέον δομημένα και πλήρη δεδομένα που μπορούσα να έχω στη διάθεσή μου σε εκείνη τη χρονική περίοδο και με βάση τις γνώσεις μου. Στο στάδιο αυτό τα χρονικά διαστήματα ήταν σχετικά μικρά (εβδομαδιαία, μηνιαία ή το πολύ 3μηνιαία) έτσι ώστε να μπορώ να τα επεξεργάζομαι πιο εύκολα αλλά και γιατί το Twitter API θέτει έναν περιορισμό στο «κατέβασμα» με 15λεπτη διακοπή ανά 5.000 αναφορές (Tweets). Προβλήματα που ξεπεράστηκαν στην πορεία…

Πολύ σύντομα, με το ξεδίπλωμα των δεδομένων στα υπολογιστικά φύλλα, άρχισαν να διαφαίνονται τα πρώτα μοτίβα τα οποία ξέφευγαν αρκετά από τα αναμενόμενα στατιστικά αποτελέσματα και αφορούσαν κυρίως συσσωματώσεις ομάδων ή κοινοτήτων με σαφή πολιτικά χαρακτηριστικά.  Ετσι λοιπόν, σχεδόν αυτόματα, μαζί με τα ποσοτικά στοιχεία (με σχετικό ενδιαφέρον) άρχισαν να σκιαγραφούνται τα πολιτικά οικοσυστήματα μέσα στον γενικό πληθυσμό χρηστών των Social Media.

Μη έχοντας ξαναδεί ανάλογα μοτίβα, αναζήτησα και ευτυχώς βρήκα πλήθος datasets από αντίστοιχες έρευνες πολιτικής γνώμης στα Social Media από το εξωτερικό, κυρίως τις ΗΠΑ, τη Γαλλία και τη Γερμανία. Στάθηκα μάλιστα ιδιαίτερα τυχερός διότι το ίδιο χρονικό διάστημα συνέπιπτε με μεγάλες προεκλογικές περιόδους στις χώρες αυτές. Η εμπειρία μου στο διεθνές ρεπορτάζ μου επέτρεπε να «ακουμπήσω» τα δεδομένα αυτά στην εκεί πραγματικότητα και τις εξελίξεις αλλά και την απόσταση που χώριζε αυτά τα δεδομένα με τα δεδομένα των παραδοσιακών δημοσκοπήσεων και βέβαια των τελικών αποτελεσμάτων των εκλογών. Παρά το ότι ήταν εξαιρετικά πρώιμο να κάνω κάτι ανάλογο για την Ελλάδα, ο σπόρος είχε μπει για τα καλά: η αναγκαιότητα μιας νέου τύπου έρευνας πολιτικής γνώμης μέσα από τα δεδομένα που παράγονται αυθόρμητα και σε συνεχή ροή από τους χρήστες.

Παρέμεινα προσηλωμένος στην ποσοτική ανάλυση των δεδομένων αποφεύγοντας κάθε είδους πολιτική κατηγοριοποίηση πριν βεβαιωθώ ότι τα εργαλεία μου λειτουργούν όπως θα ήθελα και αντιμετωπίζοντας μικρά ή μεγάλα υποκειμενικά ή όχι τεχνικά ζητήματα και προκλήσεις. Ταυτόχρονα όμως άνοιγα δύο επιπλέον παράλληλα project, το ένα για την επιρροή και διείσδυση των ελληνικών ΜΜΕ στα Social Media και το άλλο της καταγραφής και «χαρτογράφησης» των πολιτικών οικοσυστημάτων. Και οι τρεις έρευνες αποδείχτηκε ότι συνδυάζονται και γι αυτό εξακολουθούν να τρέχουν εκ παραλλήλου εμπλουτίζοντας η μία την άλλη.

Μία από τις πρώτες έρευνες πολιτικής γνώμης στα Social Media ήταν αυτή για το έτος 2016 η οποία ολοκληρώθηκε τον Ιανουάριο του 2017 με αναφορές αποκλειστικά στο Twitter (5.359.570 αναφορές από 97.837 χρήστες) και τον Δεκέμβριο του 2017 με τις αναφορές σε ολόκληρο το Web (blogs, ενημερωτικά site) και τα υπόλοιπα Social Media (Facebook, Instagram, YouTube) (10.480.250 αναφορές).  Εναντι εκτίμησης 80.000.000 αναρτήσεων συνολικά (πλην Facebook) στο έτος, οι αναφορές σε κόμματα και πολιτικούς ανέρχεται στο 13%. Το ποσοστό μοιάζει μικρό αλλά δεν είναι αν υπολογιστούν οι αναρτήσεις με έμμεσες αναφορές (με ή χωρίς hashtags) ή άλλου είδους ανταπόκριση στις αναφορές αυτές (favorites, likes κτλ). Με βάση περιοδικές δειγματοληψίες οι έμμεσες αναφορές και αναδράσεις ανέρχονται στο 39% του συνόλου (3Χ13%) ακόμη και στο 50% όταν η πολιτική επικαιρότητα κυριαρχεί και εντείνεται η πόλωση.

 

Στο σημείο αυτό πρέπει να αναφέρω ότι οι χρήστες του διαδικτύου στην Ελλάδα είναι 7.727.000 (2016) ή το 69,09% του πληθυσμού. Από αυτούς, περίπου τα 5.000.000 είναι και χρήστες του Facebook (Ιούνιος 2017) και 701.631 είναι χρήστες του Twitter (Ιανουάριος 2018)  εκ των οποίων οι 251.077 θεωρούνται ενεργοί (με τουλάχιστον ένα tweet ανά 10ήμερο).

 

Ιδού λοιπόν το διάγραμμα του συνόλου των αναφορών για τα κόμματα κατά τη διάρκεια του 2016:

2012-2017monthstimeline-statsExcel

 

Το διάγραμμα παρουσιάζει την διακύμανση του ποσοστού των αναφορών για κάθε κόμμα ανά εβδομάδα μέσα στο 2016. Στην ουσία δείχνει τη διείσδυση κάθε κόμματος στο δημόσιο διάλογο ανεξάρτητα από το αν το πρόσημο αυτών των αναφορών είναι θετικό ή αρνητικό (ή ουδέτερο). Ετσι λοιπόν, βλέπουμε ότι ΣΥΡΙΖΑ και ΝΔ (και σε απόσταση το ΚΚΕ και το ΠΑΣΟΚ) σχεδόν «μονοπωλούν» ενώ τα μικρότερα κόμματα βρίσκονται σε ακόμη πιο μεγάλη απόσταση.

 

Η προέλευση αυτών των αναφορών είναι η εξής:

 

twitter 51.42%
web 32.84%
facebook 15.03%
youtube 0.51%
instagram 0.20%

 

2012-2017type-statsExcel

Προφανώς τα στοιχεία του διαγράμματος δεν απαντούν στο «ΤΙ ψηφίζουν τα Social;”. Δείχνουν όμως «ΤΙ συζητούν τα Social» σε σχέση με την πολιτική και πιο συγκεκριμένα για τα κόμματα και τους πολιτικούς ανεξάρτητα αν έχουν θετική ή αρνητική γνώμη γι αυτούς. Επίσης δείχνουν πότε «ανάβει» και πότε «πέφτει» η ένταση της συζήτησης με βάση την επικαιρότητα της εκάστοτε χρονικής στιγμής:

 

Παρατηρώντας πιο προσεκτικά το διάγραμμα ανά εβδομάδα του 2016 και ανατρέχοντας στην επικαιρότητα της εποχής μπορεί να ερμηνεύσει τα υψηλά των κομμάτων με πρώτο εκείνο την ΝΔ το πρώτο δεκαήμερο του Ιανουαρίου όταν ο Κυριάκος Μητσοτάκης εκλέγεται πρόεδρος του κόμματος (10/1/2016). Επίσης υψηλά παρουσιάζει η ΝΔ στις αρχές Σεπτεμβρίου όπου ο νέος αρχηγός μιλάει στη ΔΕΘ. Αντίστοιχα το υψηλότερο ποσοστό αναφορών το συγκεντρώνει ο ΣΥΡΙΖΑ τον Δεκέμβριο του 2016 όταν προαναγγέλλει το πρώτο κοινωνικό μέρισμα. Ενδιαφέρον παρουσιάζει η εβδομάδα 18 με 24 Ιουλίου όπου συμβαίνουν τα εξής:

 

  • Αθωώνονται οι 17 από τους 32 κατηγορουμένους για την υπόθεση του Noor One
  • Απόπειρα πραξικοπήματος στην Τουρκία
  • Παραιτείται ο Σάλλας από την τράπεζα Πειραιώς
  • Ψηφίζεται η απλή αναλογική

 

Αυτός ακριβώς ο συνδυασμός των data με τα γεγονότα της κάθε ημέρας δίνει και τα πρώτα ποιοτικά στοιχεία στις έρευνες γνώμης στα Social. Στοιχεία τα οποία τα θεωρώ απείρως πολυτιμότερα από τα ευρήματα των παραδοσιακών δημοσκοπήσεων…

 

 

Advertisements

2 thoughts on “Τι ψηφίζουν τα Social Media; (Β’ Μέρος)

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση /  Αλλαγή )

w

Σύνδεση με %s