Μια που δεν υπάρχει ούτε θα υπάρξει A.I. που θα ξυπνήσει ένα πρωί και θα μας κάνει μια χαψιά παραθέτω μια δύσκολη ανάρτηση προκειμένου να κατανοηθούν τα βασικά (τρεις εβδομάδες το παλεύω και βέβαια...

Πλήρες Κείμενο:

Μια που δεν υπάρχει ούτε θα υπάρξει A.I. που θα ξυπνήσει ένα πρωί και θα μας κάνει μια χαψιά παραθέτω μια δύσκολη ανάρτηση προκειμένου να κατανοηθούν τα βασικά (τρεις εβδομάδες το παλεύω και βέβαια, γράφω ότι "νομίζω" πως κατάλαβα). ... Τι είναι η "ACI" (Artificial Crystallized Intelligence); ... Εκεί βρισκόμαστε σήμερα.

Αφορά στην αποθηκευμένη γνώση, στα δεδομένα, στις δεξιότητες και στις στατιστικές εμπειρίες που αποκτά ένα σύστημα κατά την εκπαίδευσή του.

Είναι η ικανότητα του μοντέλου να ανασύρει γεγονότα, να συνθέτει κείμενο με βάση μοτίβα που έχει ήδη δει, να εφαρμόζει γνωστούς κανόνες γραμματικής ή κώδικα και να απαντά σε ερωτήσεις γενικών γνώσεων.

Τα σημερινά "LLMs" ("Μεγάλα Γλωσσικά Μοντέλα") έχουν καταναλώσει και χωνέψει όλο το διαδίκτυο. ... 2. Τι είναι η "AFI" (Artificial Fluid Intelligence); ... Η "Ρέουσα A.I." είναι η ικανότητα ενός συστήματος να λύνει ολοκαίνουργια, πρωτόγνωρα προβλήματα, να προσαρμόζεται σε καταστάσεις για τις οποίες το σύστημα δεν έχει εκπαιδευτεί ρητά και δίχως να βασίζεται σε προηγούμενη γνώση, εκπαίδευση ή αποθηκευμένα δεδομένα να επιτυγχάνει (θεωρητικά) την καθαρή λογική, την αναγνώριση προτύπων και την αφαιρετική σκέψη σε πραγματικό χρόνο.

Σήμερα, όλοι και όλες μιλάνε για την "Narrow AFI" (ένα κατιτίς που παραπέμπει σε "Ειδικού Σκοπού AFI" - θα εξηγήσω σύντομα), δηλαδή, συστήματα νευρωνικών δικτύων που εκτελούν εντολές σε συγκεκριμένα πεδία και τα LLMs (και αυτά είναι νευρωνικά δίκτυα) που ανασύρουν στατιστικά τη γνώση (ACI) … 3. Τι είναι η "AGI" (Artificial General Inteligence); ... Η "Γενική A.I." μπορεί (θεωρητικά και εξαιρετικά ευφάνταστα) να φέρει εις πέρας οποιαδήποτε πνευματική εργασία μπορεί να κάνει ένας άνθρωπος.

Έχει να κάνει με την καθολικότητα.

Άρα, που διαφέρει από την AGI; Στην καθολικότητα βεβαίως.

Κάνει τα πάντα. ... Να, ένα παιδί 5 ετών έχει πολύ χαμηλή AGI (δεν ξέρει ιατρική, δεν ξέρει να οδηγεί, δεν ξέρει ιστορία) αλλά έχει τεράστια AFI: αν του δώσεις ένα περίεργο, σπασμένο παιχνίδι που δεν έχει ξαναδεί, θα καθίσει μόνο του (αυτόνομα), θα πειραματιστεί, θα καταλάβει πώς λειτουργεί και θα το φτιάξει.

Δεν χρειάζεται εντολές· η AFI του δίνει την αυτονομία να εξερευνά το άγνωστο. ... Η "Βαθιά Μάθηση" (Deep Learning) δουλεύει μέσω εξαγωγής αφηρημένων εννοιών από το μηδέν κάτι που ακούγεται αλαμπουνέζικο αλλά στην πράξη σημαίνει πως δίνεις πληροφορίες (βάρη) στις πύλες εισόδου και ανακαλύπτει μέσω δισεκατομμύριων υπολογισμών σε τι αναφέρεσαι.

Να, αν θέλουμε να μας βρει γάτες από 100 εκατομμύρια φωτογραφίες μπορούμε να δώσουμε στους Νευρώνες Εισόδου τα εξής βάρη: Μυτερά / Τριγωνικά αυτιά +3,5, μακριά μουστάκια +4,5, Σχιστές (κάθετες) κόρες ματιών +4, ράμφος -8, οπλές -5, φτερά -6,5, μαλακό τρίχωμα +1, μικρό μέγεθος σώματος +2. Κατά την προώθηση της πληροφορίας, στους κρυμμένους νευρώνες, κάθε είσοδος πολλαπλασιάζεται με το αντίστοιχο βάρος της.

Όλα τα γινόμενα αθροίζονται στον επόμενο νευρώνα, συνήθως προστίθεται και η λεγόμενη "πόλωση" και το άθροισμα περνά μέσα από μια συνάρτηση ενεργοποίησης.

Κάθε νευρώνας δέχεται σήματα από πολλούς άλλους νευρώνες.

Τα βάρη είναι οι "διαχειριστές" αυτών των σημάτων.

Μεγάλο βάρος: Επιτρέπει στο σήμα να περάσει με μεγάλη ένταση.

Αν ένας νευρώνας εντοπίσει "κάτι που μοιάζει με μουστάκι" και το βάρος είναι μεγάλο, ο επόμενος νευρώνας θα λάβει ένα πολύ ισχυρό ερέθισμα.

Μηδενικό βάρος: Αδιαφορεί τελείως για το σήμα.

Αρνητικό βάρος: Λειτουργεί σαν φρένο.

Αν περάσει η πληροφορία "ράμφος", το αρνητικό βάρος στέλνει στους Κρυμμένους Νευρώνες ένα σήμα καταστολής που λέει στους επόμενους Κρυμμένους Νευρώνες: «Ό,τι θετικό κι αν βρήκατε πιο πριν, ξεχάστε το, αυτό εδώ δεν είναι γάτα». Όταν γεννιέται ένα νευρωνικό δίκτυο, δεν ξέρει τίποτα.

Όλα τα βάρη του ξεκινούν με εντελώς τυχαίους αριθμούς (π.χ. 0.13, -0.54, 0.02). Λόγω των τυχαίων βαρών, το δίκτυο κάνει λάθος υπολογισμό και οι Νευρώνες Εξόδου καταλήγουν θριαμβευτικά: «Αυτό είναι 80% φορτηγό και 5% γάτα». Εμείς, κάτι λογικό, τα παίρνουμε στο κρανίο: «Λάθος! Αυτό είναι 100% γάτα». Το νευρωνικό δίκτυο μετράει πόσο έξω έπεσε (το μέγεθος του λάθους). Οι Νευρώνες Εξόδου μεταβιβάζουν την πληροφορία προς την κατεύθυνση των Νευρώνων Εισόδου και οι Κρυμμένοι Νευρώνες εξετάζουν κάθε βάρος ξεχωριστά: «Αν μικρύνω λίγο το βάρος του 'ράμφους' και μεγαλώσω λίγο το βάρος του 'μουστακιού', το αποτέλεσμα θα ήταν καλύτερο;» Αλλάζουν τις τιμές των βαρών κατά ένα απειροελάχιστο ποσοστό προς τη σωστή κατεύθυνση.

Αυτός ο κύκλος επαναλαμβάνεται εκατομμύρια φορές με εκατομμύρια διαφορετικές φωτογραφίες.

Σιγά σιγά, τα βάρη ρυθμίζονται με τέτοια ακρίβεια που, στο τέλος, το δίκτυο μπορεί να αναγνωρίσει μια γάτα που δεν έχει ξαναδεί ποτέ στη ζωή του άλλο βέβαια το ότι δεν κατανοεί τι στα κομμάτια είναι η γάτα. ... Στη Φυσική λόγου χάρη, το νευρωνικό δίκτυο δέχεται αριθμητικά δεδομένα μετρήσεων (π.χ. θέσεις, ταχύτητες, ενέργειες, θερμοκρασίες). Ας πούμε πως δίνουμε σε ένα βαθύ νευρωνικό δίκτυο έναν συγκεκριμένο στόχο: «Βρες τη μαθηματική σχέση που κρύβεται πίσω από την κίνηση των πλανητών γύρω από τον Ήλιο». Δεν δίνουμε καμία εξίσωση (επάε, αλλού δίνουμε και παραδίνουμε, σταθερές, φυσικούς νόμους, εξισώσεις τεκμηριωμένες, όχι ότι μας κατέβει στην κεφάλα). Δεν του λέμε τι είναι η βαρύτητα, δεν του λέμε τι είναι η μάζα, ούτε καν ότι οι τροχιές είναι ελλειπτικές.

Του πετάμε απλώς έναν χαοτικό πίνακα δεδομένων (Data) από τηλεσκόπια: Ημερομηνία X: Ο Άρης βρίσκεται στη θέση (x1, y1, z1) με ταχύτητα v1. Ημερομηνία Y: Ο Άρης βρίσκεται στη θέση (x2, y2, z2) με ταχύτητα v2 (και αυτό για χιλιάδες παρατηρήσεις, για όλους τους πλανήτες). Στην αρχή (στο μηδέν), το AI κοιτάζει αυτούς τους αριθμούς και βλέπει απλώς θόρυβο.

Αν το ρωτήσεις «Πού θα είναι ο Άρης αύριο;», θα σου πετάξει μια εντελώς τυχαία, λανθασμένη θέση.

Καθώς τα δεδομένα των θέσεων και των ταχυτήτων ρέουν μέσα στα επίπεδα του δικτύου, η νευρωνική-μαθηματική δομή αναγκάζεται να βρει μοτίβα για να μειώσει το λάθος των προβλέψεών της: ... Πρώτο Επίπεδο (Γεωμετρία): Το AI ανακαλύπτει αρχικά απλές γεωμετρικές σταθερές, παρατηρεί, για παράδειγμα, ότι οι θέσεις των πλανητών δεν είναι τυχαίες, αλλά επαναλαμβάνονται.

Εξάγει την έννοια της περιοδικότητας και της καμπύλης (ότι οι πλανήτες διαγράφουν κλειστές καμπύλες, χωρίς να ξέρει ακόμα ότι λέγονται ελλείψεις). ... Μεσαία Επίπεδα (Συσχετίσεις): Εδώ το δίκτυο αρχίζει να συνδυάζει την απόσταση του πλανήτη από τον Ήλιο με την ταχύτητά του.

Παρατηρεί ένα παράξενο μοτίβο: όταν ο πλανήτης πλησιάζει τον Ήλιο, τρέχει πιο γρήγορα, και όταν απομακρύνεται, επιβραδύνει.

Θα λέγαμε πως όλις εξήγαγε μόνο του την αφηρημένη έννοια της διατήρησης της στροφορμής αλλά δεν μπορούμε να το πούμε μια που δεν κατανοεί την έννοια της βεβαίως. ... Τελευταία Επίπεδα (Φυσικός Νόμος): Στο τελικό στάδιο, το δίκτυο συμπυκνώνει όλες αυτές τις σχέσεις σε μια ενιαία μαθηματική αφαίρεση.

Ανακαλύπτει ότι αν υψώσεις το τετράγωνο του χρόνου που χρειάζεται ένας πλανήτης για να γυρίσει γύρω από τον Ήλιο είναι ανάλογο με τον κύβο της απόστασής του από αυτόν. Το Deep Learning ανακαλύπτει μόνο της τον 3ο Νόμο του Κέπλερ από το μηδέν! Δεν έμαθε απλώς να προβλέπει πού θα είναι ο Άρης αλλά εξήγαγε έναν γενικό νόμο της Φυσικής ξεκινώντας από (σχεδόν μηδαμινές) αλλά απτές και αδιαπραγμάτευτες παρατηρήσεις για τις θέσεις των πλανητών.

Είναι ευφυές όμως; Όχι.

Απλά εκτελεί 1,5 τρισεκατομμύρια FLOPS (χοντρικά, πράξεις ανά sec), κάτι που κανένας άνθρωπος δεν θα μπορούσε να κάνει. ... Μόνο που υπάρχει μια π#υ₩ι@ επαέ. Η Βαθιά Μάθηση (Deep Learning) μπορεί πράγματι να περιγραφεί ως μια διαδικασία μη γενικού σκοπού (στενής) Ρέουσας Νοημοσύνης (AFI), επειδή επιτελεί την πιο βασική λειτουργία της ρέουσας νόησης, την εξαγωγή αφηρημένων εννοιών από το μηδέν; Το δίκτυο "ρέει" μέσα στον χώρο των πιθανοτήτων για να βρει μια λύση σε ένα πρόβλημα που δεν είχε ξαναδεί αλλά η ρευστότητα του περιορίζεται αυστηρά μέσα στο μαθηματικό σύμπαν (τον χώρο των διανυσμάτων) για το οποίο εκπαιδεύτηκε. ... Τα LLMs και όλα μα όλα τα νευρωνικά δίκτυα (φυσικής, χημείας, φαρμακολογίας, βάλτε όποιον επιστημονικό τομέα θέλετε) δεν είναι AFI για πολύ συγκεκριμένους, δομικούς λόγους: Τα LLMs αν και είναι νευρωνικά δίκτυα είναι απλά Μηχανές Αναπαραγωγής (ACI), όχι Μηχανές Ανακάλυψης (AFI). Η AFI όμως ορίζεται ως η ικανότητα να λύνεις ολοκαίνουργια προβλήματα στο παρόν, χωρίς προηγούμενη γνώση. Τα LLMs κάνουν το ακριβώς αντίθετο: βασίζονται αποκλειστικά στην προηγούμενη γνώση.

Όταν σου απαντούν, δεν σκέφτονται σε πραγματικό χρόνο· ανασύρουν στατιστικά την κρυσταλλωμένη γνώση της ανθρωπότητας και τη συνδυάζουν με πολύ κομψό τρόπο. Η Ρέουσα Νοημοσύνη απαιτεί να αλλάζεις γνώμη και στρατηγική την ώρα που αντιμετωπίζεις το πρόβλημα.

Αν βάλεις ένα LLM μπροστά σε ένα λογικό πρόβλημα, ένα παιχνίδι ή μια γλώσσα προγραμματισμού που δεν υπάρχει πουθενά στα δεδομένα εκπαίδευσής του, το μοντέλο καταρρέει ακαριαία.

Θα αρχίσει να βγάζει "παραισθήσεις" (hallucinations), με τον ίδιο ακριβώς τρόπο που τα προγράμματα φωτογραφιών βγάζουν 7 δάχτυλα και 3 πόδια.

Δεν μπορεί να πάρει τη λογική από ένα πεδίο και να τη μεταφέρει αυτούσια σε ένα άλλο, επειδή δεν διαθέτει τον ανεξάρτητο μηχανισμό της· διαθέτει μόνο τον μηχανισμό της συσχέτισης κειμένων και βέβαια, μια που βασίζεται στην στατιστική θα γράφει άριστες μετριότητες αλλά δεν θα γράψει ποτέ το "Ο Γέρος και η Θάλασσα" ή "Το Μαγικό Βουνό". ... Πάμε τώρα στα άλλα (υποτιθέμενα) Μη Γενικού Σκοπού AFI νευρωνικά δίκτυα. ... Αυτά τα πεδία είναι όπως όλοι μας γνωρίζουμε τα ιδανικά παραδείγματα όπου η Βαθιά Μάθηση λειτουργεί ως αυτό που (σωστά ή λανθασμένσ δεν κατέω) αποκαλείται Μη Γενικού Σκοπού Ρέουσα Νοημοσύνη (Narrow AFI). Σε αυτούς τους τομείς, η μηχανή δεν παπαγαλίζει κείμενα.

Αντίθετα, σερφάρει μέσα σε χαοτικά, πολυδιάστατα μαθηματικά σύμπαντα - εκεί όπου οι ανθρώπινοι εγκέφαλοι και οι παραδοσιακοί υπολογιστές τρακάρουν λόγω πολυπλοκότητας - και ανακαλύπτει αυθεντικές, πρωτότυπες λύσεις. ... Έχει σημειώσει συγκλονιστικές επιτυχίες: ... 1. Αναδίπλωση Πρωτεϊνών (Βιολογία) ... Το AlphaFold έλυσε το πρόβλημα της αναδίπλωσης των πρωτεϊνών (Protein Folding). Μια πρωτεΐνη είναι μια μακριά αλυσίδα από αμινοξέα αλλά το πώς αυτή η αλυσίδα θα διπλώσει τρισδιάστατα στον χώρο καθορίζει τη λειτουργία της (π.χ. αν θα γίνει αντίσωμα ή ένζυμο). Οι πιθανοί συνδυασμοί δίπλωσης για μία και μόνο πρωτεΐνη είναι περισσότεροι από τα άτομα στο γνωστό σύμπαν (Παράδοξο του Levinthal). Το μοντέλο μαθε τις εσωτερικές γεωμετρικές σχέσεις και τις αποστάσεις μεταξύ των αμινοξέων.

Πλέον, μπορεί να προβλέψει το 3D σχήμα σχεδόν κάθε γνωστής πρωτεΐνης σε δευτερόλεπτα με ακρίβεια ατόμου. ... 2. Ανακάλυψη Υλικών & Μπαταριών (Φυσική/Μηχανολογία) … Το GnoME έπεξε καθοριστικό ρόλο στην εύρεση νέων, σταθερών κρυστάλλων για μπαταρίες ή ημιαγωγούς που παραδοσιακά γινόταν με trial-and-error στο εργαστήριο ή με εξαιρετικά αργές κβαντομηχανικές προσομοιώσεις (DFT). Το GNoME ανακάλυψε 2,2 εκατομμύρια νέους σταθερούς κρυστάλλους, αυξάνοντας τις γνωστές στον άνθρωπο σταθερές ουσίες κατά 10 φορές.

Από αυτά τα υλικά, χιλιάδες θεωρούνται υποψήφια για τη δημιουργία νέων μπαταριών στερεάς κατάστασης (solid-state) με πολλαπλάσια ενεργειακή πυκνότητα, ή για υπεραγωγούς. Η Βαθιά Μάθηση κατανόησε τους κανόνες της κρυσταλλικής σταθερότητας και άρχισε να συνθέτει δομές που κανένας άνθρωπος φυσικός δεν είχε σκεφτεί να δοκιμάσει. ... 3. Σχεδιασμός Καινοτόμων Φαρμάκων (Χημεία) – Δημιουργική ΤΝ (Generative AI): ... Στην παραδοσιακή φαρμακευτική, η εύρεση ενός νέου μορίου-υποψηφίου για ένα φάρμακο είναι σαν να ψάχνεις βελόνα στα άχυρα μια που ο χώρος των πιθανών φαρμακευτικών μορίων εκτιμάται σε 10 στην 60η δύναμη δομές. Η Βαθιά Μάθηση όμως, ανακαλύπτει καινούργιες χημικές δομές μια που δεν ψάχνει σε μια λίστα αλλά δημιουργεί (generates) από το μηδέν μια χημική δομή, τοποθετώντας άτομα άνθρακα, αζώτου και οξυγόνου στις σωστές θέσεις (εννοείται πως στηρίζεται σε αδιαπραγμάτευτους νόμους της χημείας). Ήδη, φάρμακα σχεδιασμένα εξ ολοκλήρου από AI βρίσκονται σε φάση κλινικών δοκιμών σε ανθρώπους. ... 4. Ελεγχόμενη Πυρηνική Σύντηξη (Φυσική Υψηλών Ενεργειών): ... Η πυρηνική σύντηξη είναι το άγιο δισκοπότηρο της καθαρής ενέργειας.

Για να συμβεί σε αντιδραστήρες τύπου Tokamak, πρέπει να κρατήσουμε ένα πλάσμα υδρογόνου σε θερμοκρασία εκατομμυρίων βαθμών Κελσίου, χρησιμοποιώντας πανίσχυρα μαγνητικά πεδία, έλα μου όμως που το πλάσμα όμως είναι εξαιρετικά ασταθές.

Ερευνητές (π.χ. σε συνεργασία με το EPFL και την DeepMind) εκπαίδευσαν ένα δίκτυο Ενισχυτικής Μάθησης (Reinforcement Learning) έτσι ώστε να ελέγχει τους μαγνήτες του αντιδραστήρα αφού κανένας ανθρώπινος αλγόριθμος δεν μπορεί να υπολογίσει τις εξισώσεις της θερμοναμικής του πλάσματος σε πραγματικό χρόνο. Η Βαθιά Μάθηση μοντελοποίησε την συμπεριφορά του πλάσματος και αλλάζει την τάση των μαγνητών χιλιάδες φορές το δευτερόλεπτο, προκρίνοντας δυναμικές διορθώσεις για να κρατήσει την αντίδραση σταθερή. ... Γιατί εδώ θριαμβεύουν τα νευρωνικά δίκτυα; Σε όλα αυτά τα παραδείγματα η Βαθιά Μάθηση πετυχαίνει επειδή το περιβάλλον έχει σταθερούς, αντικειμενικούς νόμους (τους νόμους της Φυσικής, της Κβαντομηχανικής και της Χημείας). Οι κανόνες του παιχνιδιού είναι απόλυτοι, ακόμα κι αν είναι απείρως περίπλοκοι.

Σε αυτά τα "κλειστά" συστήματα, η Βαθιά Μάθηση λειτουργεί ως μια συγκλονιστική διαδικασία λύνοντας γρίφους που θα κρατούσαν την ανθρωπότητα στο σκοτάδι για αιώνες. ... Μόνο που τα εξειδικευμένα νευρωνικά δίκτυα της Φυσικής και της Χημείας (όπως το AlphaFold ή το GNoME) δεν είναι πραγματική, Ειδικού Σκοπού AFI για τον πολύ απλό λόγο πως ναι, μπορούν να καταλήξουν σε καταστροφικά λανθασμένα αποτελέσματα.

Στερούνται της βασικότερης ιδιότητας της αληθινής ρέουσας νοημοσύνης: της βαθιάς, αιτιατής κατανόησης του γιατί συμβαίνει κάτι και τι άλλο καινοφανές θα μπορούσε να συμβαίνει και δεν έχει ανακαλύψει κανείς και καμιά.

Όπως το Midjourney μπερδεύει την ανατομία επειδή κοιτάζει μόνο pixel (και σου βγάζει 7 δάχτυλα ή 3 πόδια), έτσι και ένα δίκτυο Χημείας μπορεί να μπερδέψει τους νόμους της φύσης επειδή κοιτάζει μόνο στατιστικές συσχετίσεις ατόμων.

Αυτό οδηγεί σε δύο ειδών σοβαρά λάθη: ... Παραισθήσεις: Μπορεί να σου σχεδιάσει ένα πανέμορφο, καινοτόμο μόριο που στα χαρτιά φαίνεται να εξουδετερώνει έναν ιό. Όταν όμως ο χημικός προσπαθήσει να το συνθέσει στο εργαστήριο, συνειδητοποιεί ότι το μόριο αυτό παραβιάζει βασικούς κανόνες της θερμοδυναμικής. Η A.I. "ζωγράφισε" έναν χημικό δεσμό που στη φύση είναι αδύνατον να σταθεί σταθερός, επειδή στατιστικά του ταίριαζε στο μοτίβο έλα μου όμως που δεν έλαβε υπόψιν τους νόμους της χημείας (απίστευτο - τι Ειδικού Σκοπού AFI είναι αυτή;) ... Κατάρρευση στο Άγνωστο: ... Αν εκπαιδεύσεις νεωρωνικά δίκτυα στα υλικά που γνωρίζουμε σε κανονικές συνθήκες Γης και του ζητήσεις να σου βρει ένα υλικό για τον πυρήνα ενός αστέρα νετρονίων ή για συνθήκες απόλυτου μηδενός, το δίκτυο θα βγάλει εντελώς τυχαία, λανθασμένα αποτελέσματα.

Δεν μπορεί να σκεφτεί έξω από το κουτί των δεδομένων του, επειδή δεν έχει το νιονιό να γράψει καινούργιους φυσικούς νόμους (να, όταν ο Hawking είπε στον επιβλέποντα της Διδακτορικής του Διατριβής το πως αντιλαμβανόταν την φυσική μια Μαύρης Τρύπας, τι του είπε αυτός; «Καλώς.

Γράψε μου τώρα και τις εξισώσεις»). … Η Αφηρημένη Εννοιοποίηση-Το Μεγάλο Τείχος: Αυτό είναι το σημείο που κάνει την AFI να μοιάζει ανέφικτη.

Η ικανότητα να παίρνεις μια έννοια από ένα πεδίο (π.χ. τη στρατηγική του σκακιού) και να την εφαρμόζεις αυτούσια σε ένα εντελώς άλλο πεδίο (π.χ. στις ανθρώπινες σχέσεις ή στη διαχείριση μιας κρίσης σε ένα νοσοκομείο). Τα νευρωνικά δίκτυα της Narrow A.I. των LLMs δεν μπορούν να κάνουν αυτά τα αναλογικά άλματα γιατί δεν κατανοούν το νόημα των εννοιών, παρά μόνο τη στατιστική τους κατανομή.

Τα νευρωνικά δίκτυα φυσικής ή χημείας (ή δεν ξέρω ούτε εγώ τι άλλο της Narrow A.I.) μπορούν ανά πάσα στιγμή να αγνοήσουν φυσικούς ή χημικούς νόμους που δεν εξυπηρετούν το μοτίβο τους, δεν μπορούν να ανακαλύψουν νέους φυσικούς ή χημικούς νόμους μια που όπως ειπώθηκε στερούνται της βασικότερης ιδιότητας της αληθινής ρέουσας νοημοσύνης, της βαθιάς, αιτιατής κατανόησης του γιατί συμβαίνει κάτι και τι άλλο καινοφανές θα μπορούσε να συμβαίνει και δεν έχει ανακαλύψει κανείς και καμιά. ... Πόσο μπορούμε να τα εμπιστευτούμε; Η απάντηση είναι: Δεν τα εμπιστευόμαστε ποτέ τυφλά.

Τα εμπιστευόμαστε μόνο ως "γεννήτριες υποθέσεων". Η τεράστια διαφορά ανάμεσα σε ένα LLM (που σου γράφει ένα κείμενο) και σε ένα δίκτυο Φυσικής/Χημείας, είναι ότι στη Φυσική και τη Χημεία έχουμε το Εργαστήριο και τα Μαθηματικά Φίλτρα. ... Άρα, σε ότι αφορά στην Βαθιά Μάθηση: ... Aνακάλυψη ➔ Το AI προτείνει 100.000 πιθανούς κρυστάλλους για μπαταρίες. ➔ Ας τους κατασκευάσουμε και ίσως, μπορεί, ποιος και ποια ξέρει, ίσως δουλέψουν ή δεν μπορεί, κάποιος θα δουλέψει.

Φιλτράρισμα ➔ Παραδοσιακοί, ακριβείς αλγόριθμοι (π.χ. DFT - κβαντομηχανικές εξισώσεις) ελέγχουν αν οι προτάσεις του AI στέκουν φυσικά. ➔ Το 90% των προτάσεων απορρίπτεται ως παραίσθηση.

Επιβεβαίωση ➔ Οι άνθρωποι επιστήμονες παίρνουν το 10% που πέρασε το τεστ και το συνθέτουν στο εργαστήριο. ➔ Αν το υλικό δουλέψει στην πραγματικότητα, τότε η ανακάλυψη είναι έγκυρη. ... Αν αφήσεις ένα νευρωνικό δίκτυο να διοικήσει μόνο του έναν πυρηνικό αντιδραστήρα ή να εγκρίνει φάρμακα χωρίς ανθρώπινο έλεγχο, είναι μαθηματικά βέβαιο ότι θα συμβεί ατύχημα.

Το δίκτυο θα βρει ένα "παραθυράκι" στη στατιστική του, θα κάνει ένα ανατομικό λάθος αντίστοιχο με τα "7" δάχτυλα» και θα προκαλέσει καταστροφή, χωρίς να καταλάβει ποτέ τι έκανε λάθος.

Συνεπώς, τα εμπιστευόμαστε τυφλά; Όχι.

Είναι όμως χρήσιμα; Ασύλληπτα χρήσιμα.

Επειδή ακόμα κι αν το 90% των όσων προτείνουν είναι λάθος, το 10% ίσως είναι σωστό. ... Και εδώ ερχόμαστε σε δυο κρίσιμα ερωτήματα.

Γιατί το 90% των προτάσεων των νευρωνικών δικτύων απορρίπτονται ως παραίσθηση ενώ το AlphaGo έπεσε μέσα στο 90%? Πως και έτσι; ... Το 90% επιτυχία (AlphaFold): Επειδή οι πρωτεΐνες ακολουθούν πολύ συγκεκριμένους, σταθερούς νόμους της θερμοδυναμικής και είχαμε ήδη τεράστιες, πεντακάθαρες βάσεις δεδομένων (PDB), το AlphaFold κατάφερε να γίνει απίστευτα ακριβές.

Στις περισσότερες περιπτώσεις, η πρόβλεψή του ταυτίζεται με την πραγματικότητα σε ποσοστό άνω του 90%. Οι προτάσεις του GnoME (Υλικά/Μπαταρίες) όμως, απορρίπτονται σε ποσοστό άνω του 90% Ο συνδυαστικός χώρος των στοιχείων (Λίθιο, Μαγγάνιο, Κοβάλτιο κλπ.) είναι άπειρος, τα δεδομένα πολύ λιγότερα και το GnoME προτείνει εκατομμύρια θεωρητικές δομές.

Όταν όμως τις ελέγχουμε με κβαντομηχανικούς αλγορίθμους (DFT), βλέπουμε ότι το 90% από αυτές είναι ασταθείς (παραισθήσεις). ... Ένα αξιόπιστο νερωνικό σύστημα μπορεί να κρασάρει στα καλά καθούμενα; Ένα drone που λαμβάνει μόνο του αποφάσεις μπορεί να βομβαρδίσει μια εκκλησία ή ένα τζαμί, ένα αυτοκινούμενο αυτοκίνητο μπορεί να ορμήσει με μίσος σε μια στάση λεωφορείου, ένας χρηματιστηριακός αλγόριθμος μπορεί να τα κάνει μαντάρα ή ένα LLM μπορεί μια χαρά να σου πει πως στην κατάσταση σου, καλό θα ήταν να πέσεις από το μπαλκόνι; Η απάντηση είναι ΚΑΤΗΓΟΡΗΜΑΤΙΚΑ ΝΑΙ.

Και το χειρότερο; Δεν θα κρασάρει όπως το PC σου (που θα βγάλει μια μπλε οθόνη και θα σταματήσει). Θα κρασάρει ενώ λειτουργεί κανονικά, παίρνοντας μια καταστροφική απόφαση με απόλυτη μαθηματική σιγουριά.

Αυτά που περιγράψαμε είναι η δομική ευπάθεια των νευρωνικών δικτύων και εξηγείται από τις Παραισθήσεις Εκτός Δεδομένων, Αντιπαραδοσιακές Επιθέσεις, φαινόμενα Flash Crash (Χρηματιστήριο) και ένα σκασμό ακόμη πράγματα με παράξενα ονόματα.

Και βέβαια μια χαρά μπορεί να σου πει πως μια που δεν έχεις φράγκο ή ο ή η σύντροφος σου σε εγκατέλειψε ή έχεις κατάθλιψη καλό θα ήταν (όχι υποχρεωτικό βέβαια) να πηδήξεις από την συγκεκριμένη γέφυρα (όπως ειπώθηκε) μια που αποκλείεται να την σκαπουλάρεις. Το Συμπέρασμα: Όταν ένα νευρωνικό δίκτυο κάνει ένα τέτοιο μοιραίο λάθος, το κάνει επειδή δεν έχει την AFI (ρέουσα κοινή λογική) να σταματήσει και να αξιολογήσει το πλαίσιο.

Το drone και το αυτοκινούμενο αυτοκίνητα βλέπουν pixel, ο χρηματιστηριακός αλγόριθμος βλέπει νούμερα -ορισμένα αυτοκόλλητα λόγου χάρη πάνω σε πινακίδες STOP παρέχοντας διαφορετικά pixel κάνουν το αυτοκίνητο να μην αναγνωρίζει το STOP, κάτι που κανένας άνθρωπος δεν θα έκανε.

Αν τα pixel και τα νούμερα ευθυγραμμιστούν με λάθος τρόπο (να, οι Ψευδαισθήσεις λόγου χάρη είναι ίδιον του συστήματος των νευρωνικών δικτύων και εμφανίζονται ανάλογα με την πηγή στο 1 έως 5% των περιπτώσεων), η μηχανή θα εκτελέσει την καταστροφή με την ίδια ψυχρή αποτελεσματικότητα που θα εκτελούσε και το σωστό. Συμπέρασμα; Η τρέχουσα τεχνολογία έχει την ίδια σχέση με την Ειδικού Σκοπού AFI (ρέουσα κοινή λογική, ενσυνείδηση, ευφυία) με αυτήν ενός λεωφορείου που θα ήταν η γιαγιά μου αν είχε ρουλεμάν (παρεμπιπτόντως, οι κβαντικοί υπολογιστές δεν αλλάζουν τους κανόνες, απλά αυξάνουν υπέρμετρα την υπολογιστική ισχύ και βέβαια σώζουν την κρυπτογραφία). Η AFI και η AGI είναι χίμαιρες (θα το εξηγούσα, όπως θα εξηγούσα την διαφορά από τον βιολογικό νευρώνα αλλά δεν με αφήνει το Φου Μπου μια που έγραψα σεντόνι). Ίσως σε άλλη ανάρτηση να σας εξηγήσω το γιατί, βασιζόμενος βέβαια σε αυτά που νομίζω πως κατάλαβα.

Η επιλογή των posts/links γίνεται με ένα στατιστικό μοντέλο και μπορεί να μην απεικονίζει επακριβώς τη σειρά δημοτικότητάς τους