Πώς Λειτουργεί η Τεχνητή Νοημοσύνη (AI) Ένας Απλός Οδηγός

📢 Το παρακάτω άρθρο μπορείτε να το ακούσετε σε μορφή podcast, που δημιουργήθηκε με χρήση τεχνητής νοημοσύνης και φωνές AI παρουσιαστών.
🎧 Ακούστε το εδώ

Η Πρόκληση - Ξεκλειδώνοντας το AI

Η Τεχνητή Νοημοσύνη (AI) έχει αναδειχθεί σε θέμα που προκαλεί έντονο ενδιαφέρον, συζητήσεις και ενίοτε, αρκετή σύγχυση. Ως κάποιος που αγαπά να ανακαλύπτει πώς λειτουργούν τα πράγματα, θέλησα να αναλάβω την πρόκληση να αναλύσω τα θεμελιώδη στοιχεία της τεχνολογίας AI σε έναν πιο απλό και κατανοητό οδηγό για όλους.

Για να το πετύχω αυτό, συνδύασα δική μου έρευνα αλλά και τις «εκνευριστικά» επίμονες ερωτήσεις μου προς συστήματα τεχνητής νοημοσύνης όπως το ChatGPT της Open AI και το Claude AI της Anthropic. Ομολογώ πως αυτή η διαδικασία με βοήθησε να ξεκαθαρίσω πολύπλοκες έννοιες, κάτι που θα ήθελα να μοιραστώ μαζί σας.

Αυτό που διαπίστωσα είναι ότι, στην παρούσα φάση, τα συστήματα τεχνητής νοημοσύνης, μπορούν να αξιοποιηθούν από οποιονδήποτε ενδιαφέρεται να μάθει κάτι νέο, ανεξαρτήτως πεδίου. Η πραγματική πρόκληση όμως είναι να ξέρεις πώς να τα ρωτήσεις σωστά, γιατί - όπως είναι γνωστό - η σωστή ερώτηση είναι η μισή απάντηση. Αν διαθέτετε αυτή την ικανότητα ή έχετε την διάθεση να την καλλιεργήσετε, θα μπορείτε να κατανοήσετε και να εμβαθύνετε σε οποιοδήποτε θέμα σας ενδιαφέρει.

Το αποτέλεσμα της έρευνας αυτής, είναι ο οδηγός που πρόκειται να διαβάσετε. Στόχος μου ήταν να αφαιρέσω την περιττή τεχνική ορολογία-όσο ήταν αυτό δυνατόν, ώστε ακόμα κι αν δεν έχετε καμία εμπειρία με την AI τεχνολογία, αλλά και με την τεχνολογία γενικότερά, να αποκτήσετε μια σαφή κατανόηση του πώς λειτουργεί – από τα βασικά της μετατροπής των λέξεων σε αριθμούς, μέχρι τον τρόπο με τον οποίο η τεχνολογία AI μαθαίνει από δεδομένα, προσαρμόζεται και ευθυγραμμίζεται με τις ανθρώπινες αξίες.

Σε αυτήν την ανάρτηση, θα ανακαλύψετε βήμα προς βήμα τη διαδικασία πίσω από τα συστήματα AI, συμπεριλαμβανομένων βασικών εννοιών όπως τα διανύσματα (vectors), τα βάρη (weights), τα «attention scores», καθώς και τον ρόλο της ανθρώπινης ανατροφοδότησης στη βελτίωση της Τεχνητής Νοημοσύνης.

Ελπίζω ότι μέχρι το τέλος, θα νιώθετε πιο σίγουροι ή έστω θα έχετε μία λίγο καλύτερη κατανόηση, αυτής της τεχνολογίας που γίνεται αναπόσπαστο μέρος της ζωής μας.

Ας ξεκινήσουμε λοιπόν να εξερευνήσουμε μαζί τον συναρπαστικό κόσμο της Τεχνητής Νοημοσύνης!

Βήμα 1

Μετατροπή Λέξεων σε Διανύσματα (Vectors)

Για να μπορέσει ένα σύστημα τεχνητής νοημοσύνης (AI) να κατανοήσει ένα κείμενο, πρέπει πρώτα να το «μεταφράσει» σε κάτι που μπορεί να καταλάβει. Οι υπολογιστές στην πραγματικότητα δεν καταλαβαίνουν λέξεις, όπως τις αντιλαμβανόμαστε εμείς, αλλά αριθμούς. Έτσι, το πρώτο βήμα που κάνει το σύστημα είναι να μετατρέψει κάθε λέξη σε διάνυσμα (vector). Ένα διάνυσμα λειτουργεί σαν ένα σύνολο αριθμών που χρησιμεύουν ως συντεταγμένες, περιγράφοντας τη θέση και τη σημασία μιας λέξης σε έναν πολυδιάστατο χώρο. Αυτό επιτρέπει στο AI να κατανοεί τις λέξεις με έναν μαθηματικό και γεωμετρικό τρόπο, βοηθώντας το έτσι, να αναγνωρίζει, πώς συνδέονται μεταξύ τους.

Για να επιτευχθεί αυτή η μετατροπή και η κατανόηση, χρησιμοποιείται ένα ιδιαίτερο μοντέλο, το Transformer. Πρόκειται για έναν εξελιγμένο αναλυτή κειμένου που μπορεί να επεξεργάζεται λέξεις και φράσεις με πολύ έξυπνο τρόπο.

Αλλά τι είναι ακριβώς το Transformer; Μπορείτε να το φανταστείτε σαν έναν εξαιρετικά ικανό αναγνώστη, που δεν περιορίζεται μόνο στην ανάγνωση λέξεων, αλλά προσπαθεί να κατανοήσει και το βαθύτερο νόημα πίσω από αυτές.

Στην ουσία, το Transformer κάνει πολύ περισσότερα από το να μετατρέπει λέξεις σε αριθμούς. Χρησιμοποιεί έναν ιδιαίτερο μηχανισμό, που ονομάζεται «attention mechanism», για να κατανοεί τις σχέσεις μεταξύ των λέξεων μέσα σε μια πρόταση, δίνοντας έμφαση σε εκείνες που είναι πιο σημαντικές για την κατανόηση του ευρύτερου νοήματος.

Αυτός ο συνδυασμός ακριβείας και κατανόησης το καθιστά εξαιρετικά αποτελεσματικό στην επεξεργασία φυσικής γλώσσας, επιτρέποντάς του να παράγει κείμενο που βγάζει νόημα και να ανταποκρίνεται σε διαφορετικές περιστάσεις και ανάγκες.

 ➡ Επιγραμματικά:

  • Το πρώτο βήμα στην εκπαίδευση ενός AI μοντέλου είναι να μετατρέψει τις λέξεις σε διανύσματα (vectors).
  • Ένα διάνυσμα λειτουργεί σαν ένα σύνολο αριθμών που χρησιμεύουν ως συντεταγμένες, περιγράφοντας τη θέση και τη σημασία μιας λέξης σε έναν πολυδιάστατο χώρο.

Σημείωση: Ο ορισμός του διανύσματος που χρησιμοποιείται εδώ αφορά τον τρόπο που εφαρμόζεται στην τεχνητή νοημοσύνη και τη μηχανική εκμάθηση, και διαφέρει από τον παραδοσιακό ορισμό που συναντάμε στα μαθηματικά και τη φυσική.

 💡 Επεξήγηση:

Φανταστείτε το εξής,

Ξεκινάμε με μία διάσταση, όπως μια γραμμή (σαν χάρακας). Αν προσθέσουμε άλλη μία διάσταση, έχουμε μια επίπεδη επιφάνεια (όπως ένα κομμάτι χαρτί). Προσθέτοντας και το ύψος, έχουμε τρισδιάστατο χώρο (σαν ένα κουτί). Αυτά είναι τα 1D, 2D και 3D που όλοι γνωρίζουμε.

Όμως, στην περίπτωση του AI, τα πράγματα γίνονται πολύ πιο περίπλοκα. Όταν λέμε ότι οι λέξεις βρίσκονται σε χώρο πολλών διαστάσεων, εννοούμε έναν χώρο με εκατοντάδες ή και χιλιάδες κατευθύνσεις! Έναν χώρο όπου δεν υπάρχουν μόνο οι κλασικές κατευθύνσεις αριστερά/δεξιά, πάνω/κάτω, αλλά εκατοντάδες ακόμη.

Πώς σχετίζεται αυτό με τις λέξεις;

Σκεφτείτε ότι κάθε λέξη αντιπροσωπεύεται από ένα διάνυσμα (δηλαδή μια λίστα αριθμών), και αυτοί οι αριθμοί λειτουργούν σαν συντεταγμένες σε αυτόν τον πολυδιάστατο χώρο. Κάθε διάσταση μπορεί να εκφράζει κάτι διαφορετικό:

  • Μία διάσταση μπορεί να δείχνει αν μια λέξη είναι θετική ή αρνητική.
  • Μια άλλη μπορεί να δείχνει αν η λέξη σχετίζεται με ζώα, αντικείμενα ή ανθρώπους.
  • Κάποια άλλη μπορεί να δείχνει αν η λέξη είναι ουσιαστικό, ρήμα ή επίθετο.

Ας πούμε ότι θέλουμε να κατανοήσουμε τη λέξη «σκύλος». Σε αυτόν τον χώρο πολλών διαστάσεων, η λέξη «σκύλος» μπορεί να βρίσκεται κοντά σε λέξεις όπως «γάτα» ή «κατοικίδιο», επειδή έχουν παρόμοιες σημασίες. Από την άλλη, θα βρίσκεται πολύ μακριά από λέξεις όπως «αυτοκίνητο» ή «κτίριο», που δεν έχουν καμία σχέση.

Με απλά λόγια: Φανταστείτε ότι οι λέξεις είναι σαν αστέρια στον απέραντο γαλαξία. Το AI μπορεί να δει ποια αστέρια (λέξεις) είναι κοντά το ένα με τ' άλλο και ποια είναι μακριά. Οι λέξεις με παρόμοιες σημασίες συγκεντρώνονται κοντά, ενώ οι άσχετες λέξεις βρίσκονται πιο μακριά.

Γι' αυτό το AI μπορεί να καταλάβει ότι η λέξη «σκύλος» είναι πιο σχετική με τη λέξη «γάτα» παρά με τη λέξη «αυτοκίνητο» —επειδή τα διανύσματά τους βρίσκονται πιο κοντά στον πολυδιάστατο αυτόν χώρο.

Στην αρχική φάση της εκπαίδευσης, οι τιμές που αποδίδονται στα διανύσματα που αντιπροσωπεύουν τις λέξεις είναι τυχαίες, καθώς το AI δεν έχει ακόμα μάθει και δεν «κατανοεί» τις σχέσεις μεταξύ των λέξεων.

Παράδειγμα:

  • Έχουμε τρεις λέξεις: «σκύλος», «γάτα», και «μπάλα».
    • «σκύλος» → Διάνυσμα = [0,7, -1,2, 0,3] (σε αυτή τη φάση οι τιμές είναι τυχαίες)
    • «γάτα» → Διάνυσμα = [0,6, -1,1, 0,4] (σε αυτή τη φάση οι τιμές είναι τυχαίες)
    • «μπάλα» → Διάνυσμα = [-0,2, 0,9, -0,5] (σε αυτή τη φάση οι τιμές είναι τυχαίες)

Βήμα 2

Εκχώρηση Βαρών (Weights) στις Διασυνδέσεις Μεταξύ Λέξεων

Αφού το AI μετατρέψει τις λέξεις σε αριθμούς (διανύσματα), το επόμενο βήμα είναι να καταλάβει πόσο σχετικές είναι αυτές οι λέξεις μεταξύ τους. Εδώ είναι που μπαίνουν στο παιχνίδι τα βάρη (weights). Τα βάρη είναι αριθμοί που δείχνουν πόση επιρροή έχει μια λέξη πάνω σε μια άλλη, βοηθώντας το AI να αναγνωρίσει σχέσεις και μοτίβα μεταξύ των λέξεων.

Καθώς το AI μαθαίνει, τα βάρη αυτά προσαρμόζονται για να βελτιωθεί η κατανόηση των σχέσεων μεταξύ των λέξεων. Στην αρχή, αυτά τα βάρη εκχωρούνται τυχαία, αλλά όσο το μοντέλο εκπαιδεύεται, αρχίζει να καταλαβαίνει καλύτερα πώς οι λέξεις συνδέονται. Έτσι, το AI γίνεται πιο «έξυπνο» και μπορεί να αναγνωρίζει σημαντικές λέξεις και φράσεις με μεγαλύτερη ακρίβεια.

Επιγραμματικά:

  • Τα βάρη (weights) είναι αριθμοί που καθορίζουν πόση επιρροή έχει μια λέξη σε μια άλλη κατά τη διαδικασία εκμάθησης.
  • Τα βάρη προσαρμόζονται κατά τη διάρκεια της εκπαίδευσης για να βοηθήσουν το AI να μάθει ποιες λέξεις σχετίζονται μεταξύ τους και πόσο ισχυρά.
  • Τα βάρη είναι στατικά μόλις το μοντέλο εκπαιδευτεί - δεν αλλάζουν, εκτός αν γίνει περαιτέρω βελτιστοποίηση.

Παράδειγμα:

  • Αν το AI πρέπει να αναλύσει την πρόταση:

«Ο σκύλος κυνήγησε την μπάλα.»

  • Το βάρος μεταξύ της λέξης «σκύλος» και της λέξης «κυνήγησε» μπορεί αρχικά να οριστεί 0,5 (τυχαία). Κατά την εκπαίδευση, αν το AI διαπιστώσει ότι «σκύλος» και «κυνήγησε» εμφανίζονται συχνά μαζί, θα αυξήσει το βάρος σε 0,9.

Βήμα 3

Εκπαίδευση με Επιμελημένα Δεδομένα Φυσικής Γλώσσας
(Εκμάθηση από Υψηλής Ποιότητας Κείμενα)

Μόλις το AI κατανοήσει τις λέξεις και τις σχέσεις τους, χρειάζεται να μάθει πώς να χρησιμοποιεί τη γλώσσα σωστά. Για να το πετύχει αυτό, εκπαιδεύεται με μεγάλες συλλογές δεδομένων που αποτελούνται από πραγματικά κείμενα γραμμένα από ανθρώπους. Σε αυτή τη φάση, τα κείμενα που χρησιμοποιούνται στα datasets είναι επιλεγμένα ώστε να είναι υψηλής ποιότητας και προσεγμένα, για να εξασφαλιστεί ότι το AI μαθαίνει από άριστα παραδείγματα.

Στην ουσία, το AI προσπαθεί να προβλέψει τι θα ακολουθήσει σε μια πρόταση, μαθαίνοντας από τα παραδείγματα που του παρέχονται. Με αυτόν τον τρόπο, βελτιώνει συνεχώς τις προβλέψεις του, συγκρίνοντας τις με τις σωστές απαντήσεις και προσαρμόζοντας τα βάρη του για να γίνει πιο ακριβές.

 ➡ Επιγραμματικά:

  • Το AI εκπαιδεύεται χρησιμοποιώντας μεγάλες βάσεις δεδομένων που περιέχουν κείμενα γραμμένα από ανθρώπους.
  • Μαθαίνει προσπαθώντας να προβλέψει λέξεις, να συμπληρώσει κενά ή να ολοκληρώσει προτάσεις, και στη συνέχεια συγκρίνει τις προβλέψεις του με τις σωστές απαντήσεις που παρέχονται στο dataset.
  • Αυτή η διαδικασία βοηθά το AI να προσαρμόσει τα βάρη του για να βελτιώσει την ακρίβειά του.

Παράδειγμα:

  • Πρόταση από τα δεδομένα εκπαίδευσης:

«Η γάτα κάθισε στο ___.»

  • Το AI μπορεί να μαντέψει «χαλί», «πάτωμα» ή «καρέκλα». Ελέγχει την απάντησή του με τη σωστή απάντηση (π.χ., «χαλί») και προσαρμόζει τα βάρη του αν έκανε λάθος.

Βήμα 4

Κατανόηση Περιεχομένου Χρησιμοποιώντας τον Μηχανισμό «Attention»
(Attention Mechanism)

Αφού το AI έχει μάθει να μετατρέπει τις λέξεις σε αριθμούς και να αναγνωρίζει τις σχέσεις μεταξύ τους, το επόμενο βήμα είναι να κατανοεί ποιο είναι το πιο σημαντικό μέρος μιας πρότασης. Εδώ έρχεται ο μηχανισμός «attention». Σκεφτείτε το σαν το AI να προσπαθεί να αποφασίσει πού πρέπει να εστιάσει την προσοχή του κάθε φορά που διαβάζει μια πρόταση. Τα «attention scores» υπολογίζονται σε πραγματικό χρόνο (δυναμικά) και βοηθούν το AI να εντοπίζει τις λέξεις που έχουν τη μεγαλύτερη σημασία για να κατανοήσει το συνολικό νόημα. Με αυτόν τον τρόπο, μπορεί να προσαρμόζει την κατανόησή του ανάλογα με το περιεχόμενο που επεξεργάζεται κάθε φορά.

 ➡ Επιγραμματικά:

  • Τα «attention scores» είναι διαφορετικά από τα βάρη. Υπολογίζονται δυναμικά κάθε φορά που το AI επεξεργάζεται μια πρόταση.
  • Ο μηχανισμός «attention» βοηθά το AI να αποφασίσει ποιες λέξεις σε μια πρόταση είναι πιο σημαντικές.
  • Τα βάρη (weights)βοηθούν το AI να μάθει γενικά μοτίβα κατά την εκπαίδευση, ενώ τα «attention scores» του επιτρέπουν να κατανοεί το περιεχόμενο σε βάθος και να προσαρμόζει την κατανόησή του ανάλογα με κάθε συγκεκριμένη περίπτωση στην οποία καλείται να απαντήσει.

Παράδειγμα:

  • Για την πρόταση:

«Ο σκύλος κυνήγησε την μπάλα γρήγορα.»

  • Ο «μηχανισμός attention» δίνει υψηλότερο score στις λέξεις «σκύλος» και «κυνήγησε» επειδή είναι πιο σχετικές με το νόημα και το περιεχόμενο της πρότασης και συμβάλλουν στην κατανόησή της.

Βήμα 5

Υπολογισμός Ομοιοτήτων Χρησιμοποιώντας Dot Products

Αφού το AI έχει μάθει να εστιάζει σε λέξεις που είναι σημαντικές μέσα σε μια πρόταση (χρησιμοποιώντας τον μηχανισμό attention), χρειάζεται να υπολογίσει πόσο στενά συνδέονται αυτές οι λέξεις μεταξύ τους. Εδώ μπαίνει στο παιχνίδι το «dot product», που είναι στην ουσία το εργαλείο που χρησιμοποιεί το σύστημα, για να μετρήσει αυτή τη σχέση, συγκρίνοντας τα διανύσματα των λέξεων.

Το «dot product» είναι ο τρόπος με τον οποίο το AI μετρά την ομοιότητα μεταξύ των λέξεων, χρησιμοποιώντας τα διανύσματά τους. Αυτοί οι υπολογισμοί βοηθούν το AI να καθορίσει πόσο προσοχή πρέπει να δώσει σε κάθε λέξη, ανάλογα με το πόσο σχετική είναι με τις υπόλοιπες λέξεις της πρότασης. Όσο υψηλότερο το αποτέλεσμα του «dot product», τόσο πιο σημαντική θεωρείται η σχέση των λέξεων για την κατανόηση του νοήματος της πρότασης. Αντίθετα, ένα χαμηλό ή αρνητικό αποτέλεσμα δείχνει ότι οι λέξεις δεν σχετίζονται στενά με το περιεχόμενο και το νόημα της πρότασης.

Έτσι, το Βήμα 5 συνδέεται άμεσα με το Βήμα 4, καθώς το «dot product» συμβάλλει στον προσδιορισμό των «attention scores», επιτρέποντας στο AI να επιλέγει τις πιο σημαντικές λέξεις σε κάθε πρόταση.

 ➡ Επιγραμματικά:

  • Για να καταλάβει πόσο σχετικές είναι δύο λέξεις, το AI χρησιμοποιεί «dot products» μεταξύ των διανυσμάτων τους.
  • Το «dot product» μετρά την ομοιότητα μεταξύ δύο διανυσμάτων. Όσο υψηλότερο το αποτέλεσμα, τόσο πιο σχετικές είναι οι λέξεις μεταξύ τους στο συγκεκριμένο πλαίσιο.

 💡  Τι είναι ακριβώς όμως, το «Dot Product»;

Το «dot product» είναι μια μέθοδος υπολογισμού, που χρησιμοποιείται για να μετρήσουμε πόσο παρόμοια είναι δύο διανύσματα (vectors). Στο πλαίσιο του AI, χρησιμοποιείται για να υπολογιστεί πόσο σχετικές είναι δύο λέξεις σε μία πρόταση.

Γενικό Παράδειγμα Υπολογισμού «Dot Product»:

  • Ας υποθέσουμε ότι έχουμε δύο διανύσματα:
    • Διάνυσμα A = [1, 2, 3]
    • Διάνυσμα B = [4, 5, 6]

Το «dot product» υπολογίζεται πολλαπλασιάζοντας τους αντίστοιχους αριθμούς και προσθέτοντας τα αποτελέσματα:

(1×4) + (2×5) + (3×6) = 4 + 10 + 18 = 32

Γιατί ένα Υψηλότερο Dot Product Σημαίνει Μεγαλύτερη Σχέση;

Όσο μεγαλύτερο το αποτέλεσμα του «dot product», τόσο περισσότερο ευθυγραμμισμένα είναι τα διανύσματα, δηλαδή τόσο πιο σχετικές είναι οι λέξεις. Αν τα διανύσματα δείχνουν προς παρόμοια κατεύθυνση στον πολυδιάστατο χώρο, το «dot product» θα είναι μεγάλο. Αν δείχνουν προς εντελώς διαφορετική κατεύθυνση, το «dot product» θα είναι μικρό ή ακόμα και αρνητικό.

Συγκεκριμένο Παράδειγμα Υπολογισμού Dot Product:

Εφαρμογή στην Πρόταση:

«Ο σκύλος κυνήγησε την μπάλα γρήγορα.»

Ας δούμε πώς λειτουργεί αυτό στην πράξη με την παραπάνω πρόταση. Το AI θέλει να καταλάβει πόσο στενά συνδέονται οι λέξεις «σκύλος» και «κυνήγησε» σε αυτό το πλαίσιο περιεχομένου.

Βήματα Υπολογισμού:

  • Υποθέτουμε ότι τα διανύσματα για τις λέξεις είναι τα εξής:
    • Διάνυσμα για «σκύλος» = [0,71,5, -0,3]
    • Διάνυσμα για «κυνήγησε» = [0,6, 1,4, -0,2]
  • Υπολογίζουμε το «dot product»:

(0,7×0,6) + (1,5×1,4) + [−0,3×(−0,2)] = 0,42 + 2,1 + 0,06 = 2,58

Αποτέλεσμα: Σε αυτή την περίπτωση, το αποτέλεσμα του «dot product» είναι 2,58, το οποίο υποδεικνύει ότι οι λέξεις «σκύλος» και «κυνήγησε» είναι στενά συνδεδεμένες σε αυτό το συγκεκριμένο εννοιολογικό πλαίσιο. Αυτό βγάζει νόημα, καθώς οι λέξεις αυτές σχετίζονται άμεσα με τη δράση που περιγράφεται στην πρόταση.

Τι Συμβαίνει όμως όταν χρησιμοποιηθούν οι ίδιες λέξεις σε διαφορετικό περιεχόμενο;

Για παράδειγμα, ας υποθέσουμε ότι έχουμε την εξής πρόταση:

«Ο σκύλος κοιμήθηκε ήσυχα καθώς το παιδί κυνήγησε μια πεταλούδα στον κήπο.»

Σε αυτή την περίπτωση, αν και οι λέξεις «σκύλος» και «κυνήγησε» υπάρχουν στην ίδια πρόταση, δεν έχουν στενή σχέση μεταξύ τους, στη συγκεκριμένη περίσταση, καθώς η ενέργεια του κυνηγιού αφορά το παιδί και όχι τον σκύλο.

Ας δούμε πώς θα μπορούσε να μοιάζει ο υπολογισμός σε αυτή την περίπτωση:

  • Διάνυσμα για «σκύλος» = [0,7, 1,5, -0,3]
  • Διάνυσμα για «κυνήγησε» = [0,2, -0,6, 0,4]
  • Υπολογίζουμε το «dot product»:

(0,7×0,2) + [(1,5×(-0,6)] + (−0,3×0,4) = 0,14 - 0,9 - 0,12 = -0,88

Αποτέλεσμα: Το αποτέλεσμα είναι -0,88, που δείχνει ότι οι λέξεις «σκύλος» και «κυνήγησε» δεν είναι στενά συνδεδεμένες στη συγκεκριμένη πρόταση.

Συμπέρασμα: Όσο υψηλότερο είναι το «dot product» μεταξύ των διανυσμάτων των λέξεων, τόσο πιο πιθανό είναι αυτές οι λέξεις να σχετίζονται στενά με το νόημα της πρότασης. Το AI χρησιμοποιεί αυτή την πληροφορία για να αποφασίσει πού να εστιάσει την προσοχή του και ποιες λέξεις είναι οι πιο σημαντικές για την κατανόηση του συνολικού μηνύματος.

Βήμα 6

Μετατροπή Scores σε Πιθανότητες με Softmax

Αφού το AI υπολογίσει τα «attention scores» με βάση τα «dot products» μεταξύ των λέξεων, έχει πλέον μια σειρά από αριθμούς που αντιπροσωπεύουν πόσο σημαντική είναι κάθε λέξη σε μια πρόταση. Ωστόσο, αυτά τα scores από μόνα τους δεν αρκούν για να ληφθεί μια τελική απόφαση. Εδώ έρχεται η συνάρτηση softmax, η οποία μετατρέπει τα scores σε πιθανότητες. Κανονικοποιεί τα scores έτσι ώστε να αθροίζονται σε 100%, επιτρέποντας στο AI να καταλήξει με βεβαιότητα στο ποια λέξη ή ενέργεια είναι η πιο κατάλληλη στο συγκεκριμένο πλαίσιο.

 ➡ Επιγραμματικά:

  • Το AI χρησιμοποιεί τη συνάρτηση softmax για να μετατρέψει τα «attention scores» σε πιθανότητες.
  • Αυτό βοηθά το AI να αποφασίσει ποια λέξη ταιριάζει καλύτερα σε ένα συγκεκριμένο εννοιολογικό πλαίσιο.

Βήμα 7

Εκμάθηση από Λάθη με Χρήση Backpropagation

Αφού το AI κάνει μια πρόβλεψη και καθορίσει τις πιθανότητες να επιλέξει τη σωστή λέξη, χρειάζεται στη συνέχεια να αξιολογήσει πόσο κοντά ήταν η πρόβλεψή του στο επιθυμητό αποτέλεσμα. Για να το πετύχει αυτό, χρησιμοποιεί μια «συνάρτηση απώλειας» (loss function), η οποία μετρά την «απόσταση» μεταξύ της πρόβλεψης και της σωστής απάντησης. Αν η απόκλιση είναι μεγάλη, το AI προσαρμόζει τα βάρη του μέσω μιας διαδικασίας που ονομάζεται backpropagation, μαθαίνοντας από τα λάθη του και βελτιώνοντας τις μελλοντικές προβλέψεις του. Η μέθοδος αυτή δεν χρησιμοποιείται μόνο σε LLMs (Γλωσσικά μοντέλα AI όπως το ChatGPT) αλλά και σε διαφορετικού είδους συστήματα AI, όπως αυτά που χρησιμοποιούνται για αυτοματισμούς, με σκοπό να εκτελέσουν συγκεκριμένες ενέργειες - π.χ., να ανάψουν ένα φως ή να κλείσουν μια συσκευή.

 ➡ Επιγραμματικά:

  • Μετά από μια πρόβλεψη, το AI ελέγχει αν ήταν σωστή χρησιμοποιώντας μια «συνάρτηση απώλειας» (loss function). Αν έκανε λάθος, προσαρμόζει τα βάρη χρησιμοποιώντας backpropagation.
  • Το AI επαναλαμβάνει αυτή τη διαδικασία εκατομμύρια φορές, χρησιμοποιώντας εκατομμύρια παραδείγματα από διαφορετικά datasets, βελτιώνοντας συνεχώς την κατανόηση της γλώσσας και την ακρίβεια των προβλέψεών του.

Βήμα 8

Fine-Tuning με Ανθρώπινη Ανατροφοδότηση
(Reinforcement Learning from Human Feedback - RLHF)

Αφού το AI ολοκληρώσει την αρχική του εκπαίδευση και μάθει να κατανοεί τα δεδομένα, περνά από ένα επιπλέον στάδιο όπου ειδικοί παρεμβαίνουν για να το βελτιώσουν. Σε αυτή τη φάση, το AI υποβάλλεται σε διαδικασία που ονομάζεται Reinforcement Learning from Human Feedback (RLHF).

Οι ειδικοί που συμμετέχουν σε αυτή τη διαδικασία περιλαμβάνουν ερευνητές στην επεξεργασία φυσικής γλώσσας (NLP experts), γλωσσολόγους, επιμελητές κειμένων, καθώς και κοινωνιολόγους, ψυχολόγους, και άτομα με σπουδές στη φιλοσοφία και ειδίκευση στην ηθική. Αυτοί διασφαλίζουν ότι οι απαντήσεις του AI δεν είναι μόνο τεχνικά σωστές, αλλά και ευθυγραμμισμένες με ηθικές αξίες και κοινωνικά αποδεκτές προσεγγίσεις.

Ωστόσο, η διαδικασία δεν περιορίζεται μόνο σε θέματα ηθικής. Εστιάζει επίσης στη βελτιστοποίηση της ποιότητας των απαντήσεων, διασφαλίζοντας ότι είναι χρηστικές, καλογραμμένες και προσαρμοσμένες στις ανάγκες των χρηστών. Με τη συμβολή αυτών των ειδικών, το AI γίνεται όχι μόνο πιο ακριβές, αλλά και πιο αξιόπιστο και λειτουργικό στην καθημερινή του χρήση.

 ➡ Επιγραμματικά:

  • Μετά την αρχική εκπαίδευση, το AI περνά από μια διαδικασία Reinforcement Learning from Human Feedback (RLHF).
  • Ειδικοί αξιολογούν τις απαντήσεις του AI για να διασφαλίσουν ότι ευθυγραμμίζονται με ηθικές αξίες, αλλά και ότι είναι καλογραμμένες και χρηστικές.

Σύνοψη

Η διαδικασία εκπαίδευσης και βελτίωσης της Τεχνητής Νοημοσύνης περιλαμβάνει τα εξής στάδια:

  1. Μετατροπή λέξεων σε διανύσματα (vectors) ώστε το AI να μπορεί να κατανοήσει κείμενο σε μαθηματική μορφή.
  2. Εκχώρηση βαρών στις σχέσεις μεταξύ λέξεων, επιτρέποντας στο AI να αναγνωρίζει σχέσεις και μοτίβα.
  3. Εκπαίδευση με επιμελημένα κείμενα υψηλής ποιότητας για τη βελτίωση της ακρίβειας των προβλέψεων.
  4. Χρήση attention scores για την ανάδειξη των πιο σημαντικών λέξεων σε κάθε πρόταση.
  5. Υπολογισμός ομοιοτήτων με dot products για την αξιολόγηση της συνάφειας των λέξεων στο περιεχόμενο.
  6. Μετατροπή attention scores σε πιθανότητες με χρήση της συνάρτησης softmax, επιτρέποντας στο AI να λαμβάνει αποφάσεις με μεγαλύτερη ακρίβεια.
  7. Βελτίωση με backpropagation, προσαρμόζοντας τα βάρη βάσει των λαθών, ώστε να αυξάνεται συνεχώς η ακρίβεια του συστήματος.
  8. Fine-tuning με Reinforcement Learning from Human Feedback (RLHF), όπου ειδικοί αξιολογούν και βελτιώνουν τις απαντήσεις του AI για ευθυγράμμιση με ηθικές αξίες και πρακτική χρησιμότητα.

Αυτή η ολοκληρωμένη προσέγγιση επιτρέπει στην Τεχνητή Νοημοσύνη και ειδικότερα στα γλωσσικά μοντέλα LLMs (large Language Models) να κατανοούν καλύτερα την γλώσσα και να προσαρμόζονται στις ανάγκες των χρηστών, εξασφαλίζοντας πιο αξιόπιστες και καλογραμμένες απαντήσεις.

Ορίστε λοιπόν, αυτό ήταν! Τώρα έχετε μια κατανόηση που πιθανώς ξεπερνά αυτή πολλών από τους πολιτικούς μας, οι οποίοι σύντομα θα πρέπει να επινοήσουν και να προσαρμόσουν πολιτικές, για να συμβαδίσουν με τη νέα τεχνολογική πραγματικότητα ... ή τουλάχιστον να προσποιηθούν ότι το κάνουν.

Τελικά, ίσως να μην κατάφερα να αποφύγω πλήρως την εξειδικευμένη ορολογία, καθώς σε ένα τόσο τεχνικό θέμα είναι πραγματικά πολύ δύσκολο να το πετύχεις. Ωστόσο, εύχομαι ότι τα παραδείγματα και οι αναλυτικές επεξηγήσεις, έκαναν λίγο πιο προσιτό, τον σύνθετο κόσμο της Τεχνητής Νοημοσύνης. Και, ποιος ξέρει; Ίσως η νέα γνώση που αποκτήσατε να σας δώσει ιδέες για επαγγελματικές κατευθύνσεις που μέχρι τώρα δεν είχαν ιδιαίτερη ζήτηση, αλλά σύντομα μπορεί και να γίνουν περιζήτητες. Καθώς η τεχνολογία εξελίσσεται, ειδικότητες όπως γλωσσολόγοι, κοινωνιολόγοι, ειδικοί στην ηθική και ψυχολόγοι που μπορούν να συμβάλουν στην εκπαίδευση και τη βελτίωση των AI συστημάτων, ενδέχεται να γίνουν πιο πολύτιμοι από ποτέ.

Ίσως, μάλιστα, η γνώση που αποκτήσατε να σας ανοίξει δρόμους για νέες ερωτήσεις και προβληματισμούς. Τώρα που γνωρίζετε τις ανάγκες των γλωσσικών μοντέλων (LLMs), ίσως να αναρωτηθείτε: Πώς θα συνεχιστεί η εκπαίδευση αυτών των AI συστημάτων, τώρα που έχουν ήδη διαβάσει σχεδόν τα πάντα που είναι διαθέσιμα στο διαδίκτυο; Ποιοι κατέχουν τα πνευματικά δικαιώματα των πολύτιμων κειμένων που ίσως χρειαστούν για τη μελλοντική τους εκπαίδευση; Και μήπως έχουν ήδη παραβιαστεί δικαιώματα κατά τη χρήση των υφιστάμενων δεδομένων;

Επίσης, πόσο αξιόπιστα είναι τα δεδομένα με τα οποία έχουν εκπαιδευτεί τα τρέχοντα συστήματα; Υπάρχουν κρυφές προκαταλήψεις σε αυτά τα κείμενα ή αμφιλεγόμενες πηγές που επηρεάζουν την ακρίβεια των απαντήσεων; Και μήπως η υπερβολική χρήση της τεχνικής Reinforcement Learning from Human Feedback (RLHF) τελικά περιορίσει την πραγματική χρησιμότητα και αυθεντικότητα αυτών των συστημάτων;

Πέρα από τις ηθικές προκλήσεις, πρέπει να αναλογιστούμε και την τεράστια υπολογιστική δύναμη που απαιτείται για την εκπαίδευση αυτών των συστημάτων. Η δημιουργία ενός ανταγωνιστικού γλωσσικού μοντέλου προϋποθέτει επενδύσεις που ξεπερνούν τα 100 εκατομμύρια δολάρια, κάτι που περιορίζει την πρόσβαση σε τέτοιες τεχνολογίες μόνο σε μεγάλες εταιρείες με τεράστια κεφάλαια. Αυτή η συγκέντρωση δύναμης μπορεί να δημιουργήσει μονοπωλιακές τάσεις, ενώ ταυτόχρονα επιβαρύνει τους ήδη πιεσμένους φυσικούς πόρους. Οι εγκαταστάσεις που υποστηρίζουν αυτές τις υπολογιστικές ανάγκες καταναλώνουν τεράστιες ποσότητες ενέργειας και νερού για ψύξη, αυξάνοντας το αποτύπωμα της τεχνολογίας στο περιβάλλον.

Οι απορίες και τα ερωτήματά πολλά και οι βεβαιότητες λίγες. Το μέλλον θα δείξει πώς θα εξελιχθεί αυτή η τεχνολογία και ποια μονοπάτια θα ακολουθήσει. Σίγουρα, πάντως, οι εξελίξεις στην Τεχνητή Νοημοσύνη μας επιφυλάσσουν αρκετές εκπλήξεις.

Disclaimer: Δεν είμαι ειδικός στην τεχνητή νοημοσύνη (AI) και όσα παρατέθηκαν παραπάνω είναι αποτέλεσμα προσωπικής μου έρευνας. Έχω προσπαθήσει να αποδώσω τον βασικό μηχανισμό λειτουργίας της AI με όσο το δυνατόν μεγαλύτερη ακρίβεια και απλότητα, αλλά ενδέχεται να υπάρχουν λάθη ή παρανοήσεις. Παρακαλώ να λάβετε υπόψη σας ότι το περιεχόμενο αυτό έχει γραφεί με την πρόθεση να προσφέρει μια απλή εισαγωγή στο θέμα, και όχι ως ακαδημαϊκή ανάλυση.

Share this post