Είδατε που ο Κυριάκος Μητσοτάκης άρχισε τα attention grabs στην αρχή του post; Όχι δεν του τα έμαθα εγώ. Ελπίζω. Εγώ για full disclosure ένα Ask me Anything τον είχα βάλει να κάνει στο twitter τον...
Είδατε που ο Κυριάκος Μητσοτάκης άρχισε τα attention grabs στην αρχή του post; Όχι δεν του τα έμαθα εγώ. Ελπίζω.
Εγώ για full disclosure ένα Ask me Anything τον είχα βάλει να κάνει στο twitter τον Ιανουάριο του 2011 και είχαμε ρίξει τρελό γέλιο γιατί το τότε Twitter που ακόμα δεν είχε γίνει σηπτική δεξαμενή είχε εκτιμήσει το χιούμορ του.
Τι ήθελα να γράψω όμως; Α ναι για τις δημοσκοπήσεις και για το τι να κοιτάτε.
Γιατί είναι που είναι ζόρικα τα ρημάδια τα μαθηματικά για το μέσο Έλληνα (αν αμφιβάλλει κανείς ας ρίξει μια ματιά στις βαθμολογίες στις εξετάσεις του PISA) έρχονται και οι δημοσκοπήσεις που παρουσιάζουν τα αποτελέσματα αμπαλαέο και έχουμε μετά το πανηγύρι.
Θα προσπαθήσω να το κάνω όσο πιο απλό μπορώ.
Αυτό σημαίνει πως μπορεί να πάρω και κάποιες ελευθερίες στην επεξήγηση των αριθμών.
Αν από κάτω εμφανιστεί κανένας στατιστικολόγος, οικονομολόγος ή οποιοσδήποτε άλλος που στη ζωή του έχει κάνει μόνο γραμμικά συστήματα ενημερώνω εκ προοιμίου πως εγώ είμαι απόφοιτος ΕΜΠ οπότε στη ζωή μου έχω βρεθεί αντιμέτωπος με κανονικά μαθηματικά και όχι με γραμμικά συστήματα και μόνο.
Πάμε λοιπόν σε μορφή Q&A για να το κάνω πιο εύκολο. 1. Είναι οι δημοσκοπήσεις σωστές και αν ναι γιατί πέφτουν τόσες φορές έξω; Οι δημοσκοπήσεις που τρέχουν σύμφωνα με τα πρότυπα του κλάδου είναι μια χαρά και σωστές στις περισσότερες περιπτώσεις και είναι ένα εργαλείο χρήσιμο που αποτυπώνει συγκεκριμένα δεδομένα τη συγκεκριμένη χρονική συγκυρία.
Την ίδια ώρα όμως δεν μπορούν να είναι ακριβείς με την έννοια που την κατανοεί ο μέσος άνθρωπος.
Γιατί όταν ο δημοσκόπος έχει ένα δείγμα με 20% αναποφάσιστους και προσπαθεί να κάνει εκτίμηση ψήφου (και στάθμιση δείγματος και και και) προφανώς αρχίζει και κάνει παραδοχές.
Αυτές οι παραδοχές παράγουν και τα περιθώρια σφάλματος 1-2-3% που βλέπουμε.
Είναι αυτά τα περιθώρια σφάλματος αποδεκτά σε οποιοδήποτε άλλο πεδίο; Με την καμία.
Αν πας σε σύγχρονη βιομηχανική παραγωγή και τους πεις θα έχουμε και 3% σφάλμα στις προβλέψεις παραγωγής θα σε στείλουν από εκεί που ήρθες.
Όμως οι δημοσκοπήσεις δεν είναι πρόβλεψη παραγωγής.
Είναι προσπάθεια αποτύπωσης της τάσης της κοινωνίας για συγκεκριμένα ζητήματα. 2. Λένε ψέματα οι δημοσκοπήσεις; Όχι δεν λένε ψέματα οι δημοσκοπήσεις με τον τρόπο που το εννοούν όσοι της αμφισβητούν.
Απλά έχουν μέσα στοιχεία τα οποία στα χέρια των άσχετων που τα παρουσιάζουν οδηγούν συχνά σε λάθος συμπεράσματα.
Για παράδειγμα ας πάρουμε το ερώτημα για το αν θα ψήφιζε κάποιος το κόμμα Τσίπρα, Καρυστιανού ή Σαμαρά που έχουν διάφορες δημοσκοπήσεις τελευταία.
Αυτό το ερώτημα είναι φτιαγμένο για να το καταλαβαίνει λάθος κάποιος που δεν έχει το σύνολο των δεδομένων της έρευνας και οδηγεί με μαθηματική ακρίβεια σε λάθος συμπεράσματα όσους δεν κατανοούν τα βασικά από σύνολα, υποσύνολα και λοιπά μαθηματικά γυμνασίου.
Τι εννοώ.
Ρωτάς στη δημοσκόπηση τι θα ψηφίσεις.
Εκεί λοιπόν σου απαντάει ο ερωτώμενος θα ψηφίσω το τάδε κόμμα (ένα κάθε φορά) ή δεν ξέρω τι θα ψηφίσω. Έστω ΠΑΣΟΚ.
Μετά στην πορεία της έρευνας τον ρωτάς ξανά.
Αλέξη θα ψήφιζες; Ναι μπορεί; Καρυστιανού; Ναι σίγουρα. Σαμαρά; Με τίποτα.
Οπότε αυτός ο καψερός έχει συνεισφέρει στο 15% (πέντε πάνω πέντε κάτω δεν πειράζει) του ΠΑΣΟΚ.
Στο 12% τα είπαμε) του Αλέξη στο 19% της Καρυστιανού και στο 85% όχι στον Αντώνη της καρδιά σας.
Έρχεται μετά η δημοσιογραφάρα και γράφει. 20% ο Τσίπρας και 12% πιθανό. 19% η Καρυστιανού και 10% πιθανό. 9% ο Σαμαράς και 4% πιθανό.
Και 15% στην εκτίμηση ψήφου ο Ανδρουλάκης.
Δεν είναι όμως έτσι ρε αδελφέ.
Γιατί έχουμε ένα σύνολο που ρωτάμε.
Έχουμε ένα υποσύνολο που δήλωσε πως θα ψηφίσει ΠΑΣΟΚ.
Σε αυτό το υποσύνολο κάποιος εν δυνάμει θα ψήφιζε Τσίπρα ή Καρυστιανού.
Δεν μπορεί όμως ρε παπάρα να ψηφίσει και τους τρεις.
Μία ρημάδα ψήφο ρίχνεις στην κάλπη αλλιώς είναι άκυρο.
Οπότε η σωστή ανάγνωση είναι πως το 15% του παραδείγματος (το τονίζω γιατί είναι ικανοί οι μουτζαχεντίν του Νίκου από κάτω να μου γράφουν διάφορα) του ΠΑΣΟΚ κινδυνεύει να μειωθεί αν κάνουν κίνηση ο Αλέξης ή η Μαρία ή και οι δύο.
Γιατί δεν μπορεί να έχεις στον ίδιο κουβά και το «αν φτιάξει φορέα θα τον ψηφίσεις» με το «αν αύριο γίνουν εκλογές τι θα ψηφίσεις;» Το έχουμε; Ελπίζω. 3. Δηλαδή δεν θα πάρει 20% ο Αλέξης και 19% η Μαρία; Αυτά τα 51 χρόνια που ζω σε αυτόν τον πλανήτη τα ποσοστά του επι της εκατό αθροίζουν 100.
Ούτε 99 ούτε 101. 100. Στρογγυλό.
Δεν μπορεί να πάρει 30% η ΝΔ, 15% το ΠΑΣΟΚ, 7,7% ο Βελόπουλο κ.ο.κ. και μετά να μου φέρεις τις δηλώσεις πιθανότητας μιας άλλης υποθετικής ερώτησης και να μου τα βάλεις μέσα και να μου τα κάνεις μια ωραία σαλάτα και να μου πεις, δεύτερος ο Αλέξης.
Δεν γίνεται.
Πως να το κάνουμε.
Θέλεις να κάνεις τη δουλειά σωστά; Λες στους ψηφοφόρους που μας είπαν πως δεν έχουν αποφασίσει το 15% είπε πως είναι πιθανό να ρίξει Αλέξη.
Στους ψηφοφόρους της ΝΔ το 1% κ.ο.κ. Μετά εκεί κάνεις ένα ωραίο μαθηματικό μοντέλο και λες «Η εκτίμηση του μοντέλου μας λέει ΝΔ 33% ΠΑΣΟΚ 10% Αλέξης 15% κ.ο.κ. με σφάλμα +/-3%» Επειδή όμως τα ζόρικα μαθηματικά δεν πουλάνε σε μία κοινωνία που την κλέβουν στα ρέστα και θέλει κομπιουτεράκι για να μοιράσει τον λογαριασμό τα βάζουμε όλα αχταρμά, δεν εξηγούμε πουθενά τα προφανή και μετά πάνε και βρίζουν τους κανονικούς επιστήμονες που στην δημοσκόπηση τους έχουν κάνει τη δουλειά σωστά αλλά πρέπει να δείξουμε τις καρτέλες που πουλάνε. 4. Άρα να μην τις εμπιστευόμαστε τις δημοσκοπήσεις. Ο Μητσοτάκης καταρρέει.
Αν κατάλαβες αυτό ή εγώ δεν τα εξηγώ ωραία ή εσύ είσαι μπουμπούνας.
Μέση λύση δεν υπάρχει.
Οι δημοσκοπήσεις διαβάζονται στο σύνολο τους με το σύνολο της πληροφορίας.
Απευθύνονται σε επαγγελματίες που ξέρουν τι να κοιτάξουν και τι να αξιολογήσουν.
Ακόμα και αυτοί όπως λέει και ο Silver στο Signal and the noise έχουν δυσκολίες πολλές φορές γιατί επιλέγουν να τις κοιτάνε σαν σκαντζόχοιροι και όχι σαν αλεπούδες.
Προσπαθούν σαν σκαντζόχοιροι βρουν τα δεδομένα που θα επιβεβαιώσουν την θεωρία που έχουν από πριν και όχι σαν αλεπούδες να αναπτύξουν την θεωρία τους με βάση τα δεδομένα που έχουν μπροστά τους.
Λέει και άλλα ωραία για το μοντέλο του Bayes και τις προβλέψεις ο Silver αλλά είμαστε στη χώρα που κάνουμε θέμα σε όλα τα αθλητικά site τον «υπερυπολογιστή» του Football meets Data που λύνει απλά Μπαγιεσιανά μοντέλα και τα βαφτίζουν φοβερά και τρομερά δεδομένα.
Και ναι αν έχεις απορία από αυτόν τον Bayes βαφτίστηκε εκείνο το ιστιοφόρο που βούλιαξε Bayesian. 5. Ωραία μιας και το πιάσαμε το πρωτάθλημα θα το πάρει η ΑΕΚ σωστά; Έτσι όπως τα κατάφερε η διοίκηση του Ολυμπιακού συνεπικουρούμενη από τον Παράσχο της Ισπανίας ναι.
Η επιλογή των posts/links γίνεται με ένα στατιστικό μοντέλο και μπορεί να μην απεικονίζει επακριβώς τη σειρά δημοτικότητάς τους