Έναν αλγόριθμο ικανό να μάθει να παίζει 49 απλά βιντεοπαιχνίδια του Atari 2600, παρακολουθώντας μόνο τα πίξελ στην οθόνη να αλλάζουν χρώμα και το σκορ, αναπτύχθηκε στους κόλπους της Google από την ομάδα που εξαγόρασε το 2014 η εταιρεία, επενδύοντας 400 εκατομμύρια δολάρια. Οι DeepMind χαρακτηρίζουν το επίτευγμα ως το πρώτο βήμα σε μια μακρόχρονη προσπάθεια να μάθουν στις μηχανές να… μαθαίνουν.

Videogame master

Τα παιχνίδια τα οποία κλήθηκε να μάθει ο υπολογιστής που έτρεχε το πρόγραμμα της DeepMind ήταν μεταξύ άλλων το Space Invaders, το Breakout, το Seaquest και το Pong. Στα παιχνίδια αυτά, ο παίκτης καλείται να πατήσει ένα πλήκτρο -συνήθως το spacebar- την κατάλληλη στιγμή για να πετύχει τον στόχο του -μια μπάλα που αναπηδά ή τους εξωγήινους που εισβάλλουν στο Διάστημα. Ως δύσκολο χαρακτηρίζεται το εγχείρημα να μάθει ο ίδιος o αλγόριθμος να παίξει, για παράδειγμα PacMan, στο οποίο θα πρέπει να διαβεί έναν λαβύρινθο αποφεύγοντας τα τερατάκια. Αυτό που κατορθώνει ο αλγόριθμος της εταιρείας με έδρα στο Λονδίνο είναι να συσχετίζει την αύξηση του σκορ με τις αλλαγές στο παιχνίδι και τα αλλεπάλληλα χτυπήματα του εκάστοτε πλήκτρου. Όπως ένα μωρό ανοίγει για πρώτη φορά τα μάτια του, έτσι και ο αλγόριθμος της DeepMind επιχειρεί να μάθει από όσα παρατηρεί ότι προκαλούν οι κινήσεις του (αξιολογώντας παράλληλα το αποτέλεσμα, με βάση τη βαθμολόγηση).

Εντούτοις, το πρόγραμμα τεχνητής νοημοσύνης που έχει ως μοναδικά δεδομένα τα pixel και το σκορ του παιχνιδιού κατάφερε να ξεπεράσει τις επιδόσεις όλων των προηγούμενων αλγορίθμων και μάλιστα, να παίξει επιτυγχάνοντας επιδόσεις συγκρίσιμες με αυτές ενός ανθρώπου σε ένα σύνολο 49 παιχνιδιών, με τον ίδιο αλγόριθμο, την ίδια αρχιτεκτονική και παραμέτρους. Το γεγονός ήταν αρκετό για να αποτελέσει η μελέτη της DeepMind αντικείμενο δημοσίευσης στην επιθεώρηση «Nature».