Έντυπη έκδοση

Τεχνητή Νοημοσύνη και Μεγάλα Γλωσσικά Μοντέλα

Η ΤΝ χρησιμοποιεί ιδέες από πολλές επιστήμες, όπως η βιολογία, τα μαθηματικά, η γλωσσολογία, οι οικονομικές επιστήμες, αλλά ως κλάδος της πληροφορικής μελετάται από τη δεκαετία του 1950.

26.02.2024

17:40

ΟΠΑ

Έντυπη έκδοση

Ιωνας Ανδρουτσόπουλος

Τεχνητή Νοημοσύνη και Μεγάλα Γλωσσικά Μοντέλα

Futuristic Autonomous Self-Driving Concept Car Moving Through City, Head-up Display HUD Showing Infographics: Speed, Distance, Navigation, Fuel. Road Scanning. Driver Seat Point of View POV FPV.

26.02.2024

17:40

ΟΠΑ

Έντυπη έκδοση

Ιωνας Ανδρουτσόπουλος

Η ΤΝ χρησιμοποιεί ιδέες από πολλές επιστήμες, όπως η βιολογία, τα μαθηματικά, η γλωσσολογία, οι οικονομικές επιστήμες, αλλά ως κλάδος της πληροφορικής μελετάται από τη δεκαετία του 1950.

Κάντε TO BHMA προτιμώμενη πηγή

Η Τεχνητή Νοημοσύνη (ΤΝ) αναπτύσσει υπολογιστικά συστήματα τα οποία επιχειρούν να λύσουν προβλήματα ή να εκτελέσουν εργασίες που συνήθως θεωρούμε πως απαιτούν νοημοσύνη. Παραδείγματα τέτοιων προβλημάτων είναι η απόδειξη μαθηματικών θεωρημάτων, η οδήγηση αυτοκινήτων, η κατανόηση φυσικής γλώσσας και εικόνων. Η ΤΝ χρησιμοποιεί ιδέες από πολλές επιστήμες, όπως η βιολογία, τα μαθηματικά, η γλωσσολογία, οι οικονομικές επιστήμες, αλλά ως κλάδος της πληροφορικής μελετάται από τη δεκαετία του 1950. Μάλιστα πολλοί από τους θεμελιωτές της σύγχρονης πληροφορικής, όπως ο Alan Turing, τον οποίον οι αναγνώστες ίσως θυμούνται από την ταινία «Το παιχνίδι της μίμησης», ήταν και πρωτοπόροι της ΤΝ. Η ΤΝ έχει περάσει περιόδους υπερ-αισιόδοξων εκτιμήσεων των δυνατοτήτων της αλλά και «χειμώνες», περιόδους στις οποίες πολύ λίγοι πίστευαν πλέον στις δυνατότητές της. Σήμερα διανύουμε περίοδο έντονης αισιοδοξίας, που οφείλεται κυρίως στη μηχανική μάθηση, ιδιαίτερα τη «βαθιά μάθηση», μια μορφή τεχνητών νευρωνικών δικτύων που έχει δανειστεί μερικές ιδέες από τα φυσικά νευρωνικά δίκτυα των εγκεφάλων ανθρώπων και ζώων.

Νευρωνικά δίκτυα και βαθιά μάθηση

Οι αλγόριθμοι μηχανικής μάθησης επιτρέπουν στους υπολογιστές να μαθαίνουν οι ίδιοι πώς να εκτελούν μια εργασία. Για παράδειγμα, ένα σύστημα αυτόματης οδήγησης εκπαιδεύεται σε δεδομένα του παρελθόντος που δείχνουν τι «έβλεπαν» οι κάμερες του αυτοκινήτου και άλλοι αισθητήρες σε πολλές διαφορετικές χρονικές στιγμές όσο οδηγούσαν άνθρωποι, μαζί με τις ενέργειες των οδηγών (π.χ. πόσο αριστερά ή δεξιά έστριβαν το τιμόνι, πόσο πατούσαν το γκάζι). Από τα δεδομένα αυτά, το σύστημα μαθαίνει να μιμείται τη συμπεριφορά των ανθρώπων-οδηγών. Στην περίπτωση ενός απλοϊκού νευρωνικού δικτύου (βλ. εικόνα), οι ενδείξεις των αισθητήρων του αυτοκινήτου θα δίνονταν ως είσοδοι στο δίκτυο. Οι έξοδοι (οι αποκρίσεις) του δικτύου θα έδειχναν τις αποφάσεις του συστήματος για το πόσο αριστερά ή δεξιά να στρίψουμε το τιμόνι, πόσο να πατήσουμε το γκάζι κ.λπ.

Ένα νευρωνικό δίκτυο αποτελείται από πάρα πολλούς νευρώνες (τα κυκλάκια της εικόνας). Κάθε νευρώνας εκτελεί έναν πολύ απλό υπολογισμό. Απλά αθροίζει τις εισόδους του πολλαπλασιάζοντας την κάθε είσοδο με ένα «βάρος» (διαφορετικό για κάθε καλώδιο της εικόνας) το οποίο μαθαίνει κατά την εκπαίδευση του νευρωνικού δικτύου. Κατόπιν ο νευρώνας δίνει το αποτέλεσμα του υπολογισμού του στους νευρώνες του επόμενου «στρώματος», αφού πρώτα εφαρμόσει πάνω στο άθροισμα που υπολόγισε έναν μετασχηματισμό («συνάρτηση ενεργοποίησης»). Για παράδειγμα, μπορεί το αποτέλεσμα που προωθεί ο νευρώνας στο επόμενο στρώμα να είναι μηδέν αν το άθροισμα που υπολόγισε είναι αρνητικός αριθμός, διαφορετικά να προωθεί απλά το ίδιο το άθροισμα.

Η βαθιά μάθηση χρησιμοποιεί πολύ περισσότερα στρώματα νευρώνων (το «βάθος» αναφέρεται στο πλήθος των στρωμάτων), με πιο περίπλοκες διατάξεις νευρώνων και συνολικά δισεκατομμύρια βάρη αλλά η βασική ιδέα παραμένει η ίδια. Στη διάρκεια της εκπαίδευσής του, το νευρωνικό δίκτυο προσαρμόζει τα βάρη του, ώστε να επιτυγχάνει την επιθυμητή συμπεριφορά σε πολλά παραδείγματα εκπαίδευσης (π.χ. να στρίβει σωστά το τιμόνι, να πατάει όσο πρέπει το γκάζι).

Στην περίπτωση μιας κάμερας κινητού τηλεφώνου, οι είσοδοι του νευρωνικού δικτύου θα αντιστοιχούσαν στα pixels (κουκκίδες) της εικόνας που βλέπει η κάμερα και οι έξοδοι μπορεί να έδειχναν πού στην εικόνα (συντεταγμένες) βρίσκονται πρόσωπα και αν η εικόνα περιλαμβάνει το πρόσωπο του ιδιοκτήτη του κινητού (π.χ. για να ξεκλειδώσει το κινητό). Σε ένα σύστημα μηχανικής μετάφρασης, οι είσοδοι θα παρίσταναν π.χ. μια γερμανική πρόταση (λέξεις και ολόκληρες προτάσεις μπορούν και αυτές να παρασταθούν ως αριθμοί) και οι έξοδοι θα παρίσταναν (προσπερνώντας πολλές λεπτομέρειες) πιθανές ελληνικές μεταφράσεις. Αντίστοιχα ένα σύστημα αναγνώρισης ομιλίας «μεταφράζει» το ηχητικό σήμα σε κείμενο.

Μεγάλα Γλωσσικά Μοντέλα

Μια από τις πιο εντυπωσιακές εξελίξεις της ΤΝ είναι τα Μεγάλα Γλωσσικά Μοντέλα (ΜΓΜ), όπως το ChatGPT. Στην περίπτωση αυτή, οι είσοδοι του νευρωνικού δικτύου παριστάνουν (σε μορφή αριθμών) ένα πιθανώς ημιτελές κείμενο (π.χ. «Η πρωτεύουσα της Ελλάδας είναι η»), ενώ οι έξοδοι δείχνουν πόσο πιθανό είναι για κάθε μία λέξη της γλώσσας (π.χ. «Αθήνα», «ομορφότερη», «πρώτη») να είναι η επόμενη. Βασιζόμενοι στις εξόδους του ΜΓΜ, μπορούμε να επιλέξουμε μια πιθανή επόμενη λέξη (π.χ. «ομορφότερη»), να την προσθέσουμε στο ημιτελές κείμενο («Η πρωτεύουσα της Ελλάδας είναι η ομορφότερη») και να ζητήσουμε από το ΜΓΜ να μας πει πάλι πόσο πιθανό είναι για κάθε μία λέξη της γλώσσας (π.χ. «πόλη», «πρωτεύουσα») να είναι η επόμενη. Κατόπιν μπορούμε πάλι να επιλέξουμε μια πιθανή επόμενη λέξη και ομοίως να συμπληρώσουμε (να συνεχίσουμε) το αρχικό κείμενο με πολλές λέξεις (ή προτάσεις).

Τα ΜΓΜ εκπαιδεύονται σε τεράστιους όγκους κειμένων να κάνουν ακριβώς αυτό, να υπολογίζουν πιθανές συνεχίσεις κειμένων. Το ενδιαφέρον είναι ότι μια πολύ πιθανή συνέχιση μιας ερώτησης (π.χ. «Ποια είναι η πρωτεύουσα της Ελλάδας;»), είναι η σωστή απάντηση («Η Αθήνα»). Γενικότερα, όσο αυξάνονται τα δισεκατομμύρια των βαρών ενός ΜΓΜ και τα κείμενα στα οποία εκπαιδεύεται, γίνεται όλο και πιο πιθανό το ΜΓΜ να συνεχίσει ένα αίτημα (π.χ. προς τον ψηφιακό βοηθό του Δημοσίου) με τη σωστή απόκριση, χρησιμοποιώντας γνώσεις (π.χ. για το συντακτικό της γλώσσας αλλά και εγκυκλοπαιδικές γνώσεις) που έχει αποθηκεύσει με μη προφανή τρόπο στα βάρη του. Η πιθανότητα σωστής απόκρισης αυξάνεται όταν το αίτημα επαυξάνεται (χωρίς να το αντιλαμβάνεται ο χρήστης) με οδηγίες (επίσης σε φυσική γλώσσα) που λένε στο ΜΓΜ να βασίσει την απάντησή του σε σχετικά τμήματα εγγράφων (π.χ. του Δημοσίου), τα οποία έχουμε πρώτα εντοπίσει με μια μηχανή αναζήτησης και τα έχουμε προσθέσει στο αίτημα (retrieval-augmented generation). Η πιθανότητα σωστής απόκρισης αυξάνεται, επίσης, αν το ΜΓΜ υποστεί πρόσθετη εκπαίδευση, ώστε να αποφεύγει να αποκρίνεται με ακατάλληλη γλώσσα (π.χ. υβριστικά) ή με τρόπο που δεν απαντά στο αίτημα του χρήστη. Χωρίς αυτή την πρόσθετη εκπαίδευση, που επέτρεψε στο ChatGPT να βελτιωθεί σημαντικά σε σχέση με προηγούμενα ΜΓΜ, μια πιθανή απόκριση του ΜΓΜ σε ένα ερώτημα χρήστη μπορεί να είναι «Και τι σε νοιάζει εσένα;» ή κάποια υβριστική απόκριση, αφού τα κείμενα εκπαίδευσης (π.χ. διάλογοι κοινωνικών δικτύων) δείχνουν ότι και τέτοιου είδους αποκρίσεις είναι πιθανές συνεχίσεις διαλόγων.

Το αφιέρωμα αυτό θα παρουσιαστεί σε δύο μέρη, στα οποία διακεκριμένοι συνάδελφοι θα φωτίσουν διαφορετικές πτυχές της ΤΝ.

Ο Ίωνας Ανδρουτσόπουλος είναι Καθηγητής Τεχνητής Νοημοσύνης στο Τμήμα Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών και ερευνητή στο Ερευνητικό Κέντρο «Αθηνά».

ΟΠΑ News

Ακολούθησε το Βήμα στο Google news και μάθε όλες τις τελευταίες ειδήσεις.

Σχόλια

Νευρωνικά δίκτυα και βαθιά μάθηση

Μεγάλα Γλωσσικά Μοντέλα

Βρέθηκε νεκρός στο γραφείο του ο γνωστός ποινικολόγος - Τι εξετάζουν οι Αρχές

Σε κόκκινο συναγερμό Αττική και τέσσερις περιοχές για καύσωνα και φωτιές

Μπαρτζώκας: Δάκρυσε μιλώντας για τον πατέρα του – Δείτε τη συγκινητική στιγμή

Νέο αποκαλυπτικό βίντεο από τη σύγκρουση των πλοίων στη Σούδα - Τα δεδομένα

Από τα τεκμήρια στη διασυνδεδεμένη γνώση

Ψηφιακές τεχνικές στην αρχαιολογική έρευνα πεδίου

Όταν οι μηχανές «διαβάζουν» τον άνθρωπο

Ψηφιοποίηση υφασμάτων: Προκλήσεις και λύσεις

Σταύρος Γεωργίου: Βρέθηκε νεκρός στο γραφείο του ο γνωστός ποινικολόγος

Αλέξης Σταμάτης: Ο τελευταίος αποχαιρετισμός από τους ανθρώπους που τον γνώρισαν

Πρίγκιπας Harry: Γιατί ποτέ δεν του άρεσε να αποκαλούν τη Diana «πριγκίπισσα» - Grace

Antonela Roccuzzo για Lionel Messi: Το τρυφερό μήνυμα αγάπης μετά τον τελικό που συγκίνησε - «Θα είσαι πάντα ο καλύτερος» - Gra

Αλέξης Σταμάτης: Οι προσωπικές εξομολογήσεις για τον αλκοολισμό - «Το αλκοόλ σβήνει τον άνθρωπο»

Όταν ο Αλέξης Σταμάτης έγραφε για την μητέρα του, Μπέτυ Αρβανίτη - «Με τη μάνα μου έχουμε σχέση ζωής» - Grace

Αλέξης Σταμάτης: Η ασθένεια στο αίμα και η τελευταία του ανάρτηση

Λεονόρ - Σοφία: Οι εγγυήτριες της ισπανικής μοναρχίας

Ο πρίγκιπας George ετοιμάζεται για το μεγαλύτερο βήμα της μέχρι τώρα ζωής του – Η προσωπική του απόφαση που εντυ

«Closing shift»: Η 30λεπτη βραδινή συνήθεια που υπόσχεται ένα τακτοποιημένο σπίτι κάθε πρωί - Grace

Κωνσταντίνος Τασούλας: «Η ενότητα και η παιδεία είναι η πραγματική μας δύναμη»

Κοσμοπολίτικη αύρα στο Αιγαίο: Μέσα στο νέο Fouquet's Mykonos

Στον πλανήτη του Μικρού Πρίγκιπα

Κονσταντίν Μπρανκούζι: Η γλυπτική της ουσίας

Έτσι θα κυβερνήσει ο Μπέρναμ - «Ξηλώνει» το Γουέστμινστερ, το ανατρεπτικό μοντέλο

Έτσι θα κυβερνήσει ο Μπέρναμ - «Ξηλώνει» το Γουέστμινστερ, το ανατρεπτικό μοντέλο

Εξοπλισμοί 5 δισ.: Κλειδώνει η «Ασπίδα του Αχιλλέα», ισραηλινή απόβαση στην Αθήνα

Αποκλειστικό: Μείωση φόρου 2% για όλες τις επιχειρήσεις - Το «κλειδωμένο» πακέτο της ΔΕΘ

Στο κατώφλι της Ντάουνινγκ Στριτ ο Αντι Μπέρναμ με οδηγό το «μοντέλο του Μάντσεστερ» - To στοίχημα

Όταν η CIA «έχασε» το πραξικόπημα κατά Μακαρίου - Η απόρρητη έκθεση που «τύφλωσε» τον Νίξον

27+1 θεατρικές παραστάσεις για το καλοκαίρι

Η Αθήνα πάνω στα «αόρατα» ρέματα: Οι περιοχές που βρίσκονται στον αέρα

Φονικός εμπρησμός: Το λάθος με την ομπρέλα και τα επόμενα χτυπήματα

Μαντόνα: Πώς το «Confessions II» ισοφάρισε το ρεκόρ των Beatles και «τρέλανε» το Spotify

Ο τελευταίος αγώνας επιβίωσης του ΣΥΡΙΖΑ: Πώς προσπαθεί να αποφύγει την ολική διάλυση

Οι αφανείς της ΕΛ.Α.Σ: Οι άνθρωποι-κλειδιά πίσω από τον ανανεωμένο Τσίπρα

«Ωρα ΔΕθ» για το πρόγραμμα του ΠαΣοΚ

Ο «ελέφαντας στο δωμάτιο» του Μαξίμου και το «ζύγι» του πολυκερματισμού

Κωνσταντίνος Τασούλας: «Η ενότητα και η παιδεία είναι η πραγματική μας δύναμη»

Ειδήσεις

Συνδρομές

International Edition

Γνώμες

Μόνο στο Βήμα

ΒΗΜΑgazino

Grace

Podcasts

Videos

Newsletters

ΤΟ ΒΗΜΑ των μαθητών

Special Editions