
Τριάντα μαθηματικοί συγκεντρώθηκαν αυτόν τον μήνα στο Χάρβαρντ για να αξιολογήσουν ένα ιδιαίτερα απαιτητικό και κρίσιμο τεστ σε ένα σύνολο δέκα προβλημάτων. Δεν επρόκειτο για μια συνηθισμένη εξέταση, καθώς το αποτέλεσμά της θα μπορούσε να επηρεάσει την πορεία ενός επιστημονικού κλάδου που βρίσκεται αντιμέτωπος με υπαρξιακά ερωτήματα για το μέλλον του.
Ο εξεταζόμενος ήταν η Τεχνητή Νοημοσύνη.
Οι επικεφαλής της πρωτοβουλίας First Proof ανακοίνωσαν ότι, σε τέσσερα διαφορετικά συστήματα AI, τα επτά από τα δέκα προβλήματα αξιολογήθηκαν ως επιτυχώς λυμένα, όπως σημειώνει το ρεπορτάζ της Washington Post.
Και κάπως έτσι, τα Μαθηματικά έγιναν ο πιο πρόσφατος τομέας της ανθρώπινης δραστηριότητας που βρίσκεται αντιμέτωπος με τις προκλήσεις και τις δυνατότητες των μεγάλων γλωσσικών μοντέλων.
Τον περασμένο μήνα μαθηματικοί παρουσίασαν τη Διακήρυξη του Λέιντεν (Leiden Declaration), ένα διεθνές μανιφέστο με περισσότερους από 2.300 υπογράφοντες, το οποίο εξετάζει τόσο τις ευκαιρίες όσο και τους κινδύνους της Τεχνητής Νοημοσύνης, προτείνοντας κατευθυντήριες γραμμές για την ηθική και διαφανή χρήση της.
Τα νέα αποτελέσματα του First Proof αποτελούν τον δεύτερο γύρο μιας πρωτοβουλίας υπό την καθοδήγηση μαθηματικών, με στόχο την αντικειμενική αξιολόγηση των δυνατοτήτων και των αδυναμιών της τεχνολογίας.
Οι μαθηματικοί συχνά ασχολούνται με εξαιρετικά εξειδικευμένα προβλήματα που οι περισσότεροι άνθρωποι δυσκολεύονται να κατανοήσουν. Ωστόσο, τα μαθηματικά μπορούν να εξηγήσουν πώς κινείται η κυκλοφορία στους δρόμους, πώς τα κύτταρά μας συνθέτουν πρωτεΐνες ή ακόμη και πώς μπορούν να επιταχυνθούν οι ιατρικές απεικονιστικές εξετάσεις.
Είναι λοιπόν η Τεχνητή Νοημοσύνη μια υπαρξιακή απειλή για τα μαθηματικά ή ένα εντυπωσιακό εργαλείο; Ή μήπως κάτι ενδιάμεσο; Οι ίδιοι οι μαθηματικοί βρίσκονται πλέον να συζητούν για την ουσία και το μέλλον του επαγγέλματός τους.
«Υπάρχει η παρανόηση ότι κάπου υπάρχει ένα κουτί γεμάτο εικασίες και ότι το μόνο που κάνουν οι μαθηματικοί είναι να τραβούν μία και να προσπαθούν να την αποδείξουν», δήλωσε στην Washington Post η Λόρεν Γουίλιαμς, καθηγήτρια Μαθηματικών στο Χάρβαρντ και μέλος της ομάδας του First Proof.
Οι δυνατότητες της ΤΝ είναι πραγματικές και εντυπωσιάζουν πολλούς ειδικούς. Ωστόσο, οι ίδιοι επισημαίνουν ότι τα μαθηματικά βασίζονται στην ανθρώπινη κρίση, το αισθητήριο και τη διαίσθηση: στην επιλογή των προβλημάτων που αξίζει να λυθούν, στη διατύπωσή τους και στην τοποθέτησή τους μέσα σε ένα ευρύτερο πλαίσιο. Αυτές οι δεξιότητες δεν έχουν ακόμη κατακτηθεί από τα συστήματα ΤΝ.
«Ποια είναι η ενδιαφέρουσα ερώτηση που πρέπει να τεθεί; Υπάρχουν άπειρες ανούσιες ερωτήσεις. Ενας γεωλόγος θα μπορούσε να ρωτήσει ποιο είναι το μέσο χρώμα ενός βράχου στη Γη. Είναι μια ερώτηση, αλλά μάλλον όχι μια ενδιαφέρουσα ερώτηση. Οι επιστήμονες πρέπει να ανακαλύπτουν ποιες κατευθύνσεις είναι πραγματικά γόνιμες», σημείωσε η Γουίλιαμς.
Στα μέσα Μαΐου, η OpenAI ανακοίνωσε ότι μοντέλο της κατάφερε να καταρρίψει μια εικασία που είχε διατυπώσει το 1946 ο διάσημος μαθηματικός Πολ Ερντος. Ο Ερντος υπήρξε ένας από τους πιο παραγωγικούς δημιουργούς μαθηματικών προβλημάτων και εκατοντάδες από τις προκλήσεις που άφησε πίσω του παραμένουν άλυτες, αποτελώντας σήμερα σημείο αναφοράς για τη βιομηχανία της Τεχνητής Νοημοσύνης.
Το συγκεκριμένο πρόβλημα ήταν παραπλανητικά απλό: αν τοποθετηθούν σημεία σε ένα επίπεδο, πόσα ζεύγη σημείων μπορούν να απέχουν ακριβώς την ίδια απόσταση;
Ο Ερντος πρότεινε μια πιθανή λύση και προσέφερε αμοιβή 300 δολαρίων σε όποιον αποδείκνυε ή κατέρριπτε την εικασία. Το 1995 αύξησε το έπαθλο στα 500 δολάρια. Ογδόντα χρόνια μετά τη διατύπωση του προβλήματος, δεν ήταν ένας άνθρωπος αλλά μια υπολογιστική νοημοσύνη που έδωσε αυτό που ο μαθηματικός του Πρίνστον Νόγκα Αλον χαρακτήρισε «θεαματική λύση». «Η Τεχνητή Νοημοσύνη μάς βοηθά να εξερευνήσουμε πιο ολοκληρωμένα τον καθεδρικό ναό των μαθηματικών», έγραψε ο ερευνητής μαθηματικός Τόμας Μπλουμ από το Πανεπιστήμιο του Μάντσεστερ.
Ο Σεμπαστιάν Μπουμπέκ, μαθηματικός και ερευνητής στην OpenAI, δήλωσε ότι η λύση προέκυψε από ένα γενικής χρήσης μοντέλο που δεν είχε εκπαιδευτεί ειδικά για μαθηματικά προβλήματα και χωρίς ανθρώπινη παρέμβαση. «Ορισμένες αποδείξεις στις οποίες έχω εργαστεί στο παρελθόν είναι εξαντλητικές πνευματικά. Πρέπει να κρατάς στο μυαλό σου ταυτόχρονα πολλά στοιχεία και να βεβαιώνεσαι ότι όλα συνδέονται σωστά. Η ΤΝ έχει σαφές πλεονέκτημα σε αυτό. Μπορεί να δημιουργήσει πιο σύνθετες κατασκευές», ανέφερε.
Εσπευσε όμως να διευκρινίσει ότι αυτό δεν σημαίνει το τέλος των ανθρώπινων μαθηματικών. «Η αδυναμία που βλέπω σήμερα σε αυτά τα μοντέλα είναι η κατανόηση: γιατί κάνουμε αυτό που κάνουμε; Εγώ δεν προσπαθώ απλώς να λύσω ένα πρόβλημα. Το εντάσσω σε ένα ευρύτερο ερευνητικό πρόγραμμα. Τα μοντέλα αυτά δεν έχουν τέτοιες ευρύτερες επιδιώξεις», εξήγησε στην Washington Post.
Σύμφωνα με τον Ροντρίγκο Οτσιγκάμε, ανθρωπολόγο και ιστορικό της πληροφορικής στο Πανεπιστήμιο του Λέιντεν και συντάκτη της διακήρυξης, το επάγγελμα του μαθηματικού πιθανόν να αλλάξει, αλλά δεν πρόκειται να εξαφανιστεί. Οπως σημείωσε, στο μέλλον ίσως δοθεί μεγαλύτερη έμφαση στον καθορισμό ερευνητικών κατευθύνσεων, στη δημιουργία νέων τεχνικών και ορισμών, στην καλλιέργεια βαθύτερης κατανόησης, στην αξιολόγηση της σημασίας των ιδεών και στη σύνδεση επιμέρους προβλημάτων με μεγαλύτερα ερωτήματα τόσο στα μαθηματικά όσο και στον ευρύτερο κόσμο.
Τέσσερις ομάδες AI, δέκα προβλήματα
Καθώς οι εταιρείες Τεχνητής Νοημοσύνης στρέφουν τα μοντέλα τους προς τα άλυτα προβλήματα των μαθηματικών, πολλοί ερευνητές αντιμετωπίζουν τις εξελίξεις με ενδιαφέρον αλλά και σκεπτικισμό. Θεωρούν ότι πρόκειται για εμπορικές τεχνολογίες που συχνά δεν αποδίδουν επαρκώς τα εύσημα στις πηγές των ιδεών τους. Οι εταιρείες προβάλλουν τις επιτυχίες τους, όμως στην πράξη οι επιδόσεις των μοντέλων παρουσιάζουν μεγάλες διακυμάνσεις και η επαλήθευση των αποτελεσμάτων τους δεν είναι απλή υπόθεση.
«Ολοι είναι εντυπωσιασμένοι, αυτό είναι το εύκολο κομμάτι», δήλωσε ο Μάρτιν Χάιρερ, μαθηματικός του EPFL και του Imperial College London. «Δεν τα κάνει πάντα σωστά και απαιτείται μεγάλη προσπάθεια για να πειστείς ότι έχει δίκιο. Δεν γράφει όπως γράφουμε εμείς. Με κάποιο τρόπο δεν γράφει με ειλικρίνεια».
Το πρόγραμμα First Proof δημιουργήθηκε εν μέρει για να επαναφέρει τον έλεγχο της συζήτησης στα χέρια των μαθηματικών και όχι των τεχνολογικών εταιρειών.
Για να αξιολογήσουν αντικειμενικά τις δυνατότητες της AI, οι ερευνητές χρησιμοποίησαν προβλήματα που είχαν ήδη λυθεί ιδιωτικά αλλά δεν είχαν δημοσιευθεί. Σε μια πρώτη δοκιμή στις αρχές του 2026, τα μοντέλα κατάφεραν να επιλύσουν περίπου έξι έως οκτώ από τα δέκα προβλήματα. Στον δεύτερο γύρο, η μεθοδολογία βελτιώθηκε και τα αποτελέσματα ανακοινώθηκαν πριν από μερικές ημέρες.
Τα ευρήματα ήταν αποκαλυπτικά: επτά από τα δέκα προβλήματα είχαν τουλάχιστον μία σωστή λύση από τα τέσσερα συστήματα που δοκιμάστηκαν. Ορισμένες λύσεις χαρακτηρίστηκαν άψογες, άλλες χρειάστηκαν μικρές διορθώσεις, ενώ κάποιες απέτυχαν πλήρως. Σε μία περίπτωση, μάλιστα, το μοντέλο ακολούθησε διαφορετική στρατηγική από εκείνη των ανθρώπων και εντυπωσίασε τους αξιολογητές.
«Τα αποτελέσματα αποδεικνύουν πραγματικές δυνατότητες», ανέφερε η συντακτική επιτροπή του First Proof. «Ορισμένες λύσεις ήταν σωστές, πλήρεις και πρωτότυπες, ενώ άλλες αποκάλυψαν συστηματικές αδυναμίες που είναι χρήσιμο να κατανοήσει η ερευνητική κοινότητα».
Ο Τέρι Τάο, καθηγητής στο UCLA, συμμετείχε σε ομάδα που ανέπτυξε ένα ειδικό «σύστημα υποστήριξης AI», λογισμικό που επιτρέπει στα μοντέλα να χρησιμοποιούν εργαλεία και να συνεχίζουν τη συλλογιστική τους διαδικασία.
Οπως εξήγησε, τα μοντέλα βελτιώνονται διαρκώς, όμως η διαφορά μεταξύ ανθρώπων και AI μοιάζει με τη διαφορά ανάμεσα στην αναρρίχηση και το άλμα. «Οι άνθρωποι είναι σαν ορειβάτες που εξερευνούν υπομονετικά το έδαφος, εντοπίζουν ενδιάμεσους στόχους και βοηθούν ο ένας τον άλλον να προχωρήσει. Τα συστήματα AI εξακολουθούν σε μεγάλο βαθμό να είναι “άλτες”: μπορούν να φτάσουν σε ύψη που ίσως ένας άνθρωπος δεν θα έφτανε με μία προσπάθεια, αλλά δεν αποτυγχάνουν με ομαλό τρόπο και συχνά δεν μπορείς να διασώσεις πολλά χρήσιμα στοιχεία από μια αποτυχημένη απόπειρα».
Ακολουθήστε το Protagon στο Google News



