Πρόσθεσε το Newsbeast στις προτεινόμενες πηγές σου στη Google

Στο παρελθόν, οι προβλέψεις για τον νικητή του Παγκοσμίου Κυπέλλου βασίζονταν σε «μυστικιστικές» μεθόδους: από χαρτομαντεία και οιωνούς μέχρι… χταπόδια που «προέβλεπαν» αποτελέσματα. Στη σύγχρονη εποχή, όμως, η επιστήμη των δεδομένων έχει αναλάβει αυτόν τον ρόλο, προσφέροντας μια πιο τεκμηριωμένη και συστηματική προσέγγιση.

Στο πλαίσιο ερευνητικής ομάδας στατιστικολόγων, αναπτύχθηκε ένα μοντέλο μηχανικής μάθησης με στόχο την πρόβλεψη της πιθανής εξέλιξης της διοργάνωσης. Το σύστημα συνδυάζει στατιστικά μοντέλα, δεδομένα από στοιχηματικές αγορές και αξιολογήσεις ειδικών, προκειμένου να εκτιμήσει τη δυναμικότητα κάθε εθνικής ομάδας και των ποδοσφαιριστών της.

Πιθανότητες και «σταθμισμένες» εκτιμήσεις

Η διαδικασία προβλέψεων εξελίσσεται σε δύο στάδια. Αρχικά, υπολογίζεται η αγωνιστική ισχύς των ομάδων μέσω συνδυασμού ιστορικών δεδομένων και εξωτερικών εκτιμήσεων. Στη συνέχεια, ένα μοντέλο μηχανικής μάθησης ενσωματώνει πρόσθετες μεταβλητές και παράγει πιθανότητες για κάθε πιθανό αποτέλεσμα.

Ενδεικτικά, στο υποθετικό ζευγάρι Μεξικού–Νότιας Αφρικής, το μοντέλο αποδίδει μέσο όρο 1,9 γκολ στο Μεξικό έναντι 0,7 στους αντιπάλους. Αυτό μεταφράζεται σε πιθανότητα νίκης 65% για το Μεξικό, 21% για ισοπαλία και 14% για επικράτηση της Νότιας Αφρικής. Το αποτέλεσμα δεν είναι βεβαιότητα, αλλά η πιο πιθανή έκβαση βάσει των δεδομένων.

Προσομοιώσεις και επαναλαμβανόμενα σενάρια

Με τη χρήση «σταθμισμένων» πιθανοτήτων, κάθε αγώνας της διοργάνωσης προσομοιώνεται επανειλημμένα, λαμβάνοντας υπόψη το επίσημο πρόγραμμα, τους κανονισμούς της FIFA και τις διαδικασίες παράτασης και πέναλτι. Η συνολική διαδικασία επαναλήφθηκε 100.000 φορές, ώστε να αποτυπωθεί η πιο πιθανή εξέλιξη του τουρνουά.

Σύμφωνα με τα αποτελέσματα των προσομοιώσεων, η Ισπανία εμφανίζεται ως το πρώτο φαβορί για την κατάκτηση του τροπαίου με πιθανότητα 14,5%. Ακολουθούν η Αγγλία και η Γαλλία με 12,4% έκαστη, ενώ η Γερμανία καταγράφει 11,2%.

Η εικόνα των φαβορί παραμένει ιδιαίτερα συμπαγής λόγω της διευρυμένης μορφής του Μουντιάλ των 48 ομάδων και των πέντε γύρων στη νοκ άουτ φάση. Πορτογαλία και Αργεντινή καταγράφουν επίσης ισχυρές πιθανότητες, στο 8,9% και 8,2% αντίστοιχα.

Ο ρόλος των ΗΠΑ και οι πιθανότητες «έδρας»

Οι Ηνωμένες Πολιτείες εμφανίζουν υψηλές πιθανότητες πρόκρισης στη φάση των «32», φτάνοντας το 78%, ποσοστό που αποτελεί το υψηλότερο στον όμιλό τους. Ωστόσο, από τη φάση των νοκ άουτ και έπειτα, οι πιθανότητες πρόκρισης μειώνονται σημαντικά, όπως συμβαίνει σε κάθε σύστημα «do or die» αγώνων.

Η πιθανότητα κατάκτησης του τίτλου από τη διοργανώτρια χώρα υπολογίζεται στο 1%, ακόμη και με τον τελικό να διεξάγεται στο MetLife Stadium του Νιου Τζέρσεϊ.

Πώς «εκπαιδεύεται» το μοντέλο

Το σύστημα βασίζεται σε πολλαπλές πηγές δεδομένων: αποτελέσματα εθνικών ομάδων των τελευταίων οκτώ ετών, αποδόσεις διεθνών στοιχηματικών εταιρειών, στατιστικά συνεισφοράς παικτών σε γκολ σε συλλογικό και διεθνές επίπεδο, καθώς και εκτιμήσεις αγοραίας αξίας μέσω της αγοράς μεταγραφών.

Οι παράγοντες αυτοί συνδυάζονται με πρόσθετες μεταβλητές, όπως η κατάταξη FIFA, η παρουσία παικτών σε ημιτελικές φάσεις ευρωπαϊκών διοργανώσεων και ευρύτεροι οικονομικοί δείκτες, όπως το κατά κεφαλήν ΑΕΠ.

Ένα μοντέλο τύπου «random forest» εκπαιδεύεται πάνω σε δεδομένα μεγάλων τουρνουά από το 2006 και έπειτα, συνδέοντας χαρακτηριστικά ομάδων με την παραγωγή τερμάτων και τα αποτελέσματα αγώνων. Όπως επισημαίνουν οι ερευνητές, οι προβλέψεις αυτές δεν δίνουν βεβαιότητες αλλά πιθανότητες. Η αξία τους δεν βρίσκεται στην απόλυτη ακρίβεια, αλλά στην καλύτερη κατανόηση των τάσεων και των δυναμικών του τουρνουά. Με άλλα λόγια, ακόμη και το πιο εξελιγμένο μοντέλο δεν μπορεί να προβλέψει τον νικητή με απόλυτη ακρίβεια, όμως μπορεί να αποδειχθεί σαφώς πιο αξιόπιστο από παραδοσιακές «προφητείες».