Ερευνητές στη Βρετανία καμαρώνουν για τις επιδόσεις του Sketch-a-Net, ενός προγράμματος που βασίζεται στην αρχιτεκτονική του εγκεφάλου και μπορεί να αναγνωρίζει το θέμα απλών σχεδίων «καλύτερα από ό,τι οι άνθρωποι».

Λογισμικό VS άνθρωπος: σημειώσατε 1

Το λογισμικό του Πανεπιστημίου Queen Mary του Λονδίνου μπορεί για παράδειγμα να ξεχωρίζει το σχέδιο ενός γλάρου από το σκίτσο ενός περιστεριού με πιθανότητα επιτυχίας 74,9%, συγκριτικά με το 73,1% που πετυχαίνουν κατά μέσο όρο οι άνθρωποι.

Μπορεί επίσης να ξεχωρίζει παραλλαγές του ίδιου θέματος, όπως «πουλί που πετάει» ή «πουλί που στέκεται» με ακρίβεια 42,5%, συγκριτικά με την ανθρώπινη επίδοση του 24,8%.

«Τα σκίτσα είναι ενδιαφέρον αντικείμενο μελέτης επειδή χρησιμοποιούνται από τα προϊστορικά χρόνια ως μορφή επικοινωνίας» αναφέρει ο Τίμοθι Χοσπεντάλες, μέλος της ερευνητικής ομάδας. Οι άνθρωποι αντιλαμβάνονται τα σχέδια σχεδόν διαισθητικά, οι υπολογιστές όμως δυσκολεύονται να αντλήσουν νόημα από αφηρημένες ασπρόμαυρες γραμμές.

Μίμηση του τρόπου μάθησης του εγκεφάλου

Το Sketch-a-Net ουσιαστικά μιμείται τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος μαθαίνει. Το λογισμικό αποτελείται από έναν μεγάλο αριθμό μαθηματικών «κόμβων», οι οποίοι συνδέονται μεταξύ τους όπως οι νευρώνες του νευρικού συστήματος. Όταν του δοθεί μια λίστα σκίτσων με γνωστό θέμα, το νευρωνικό δίκτυο σταδιακά μαθαίνει τι αντιπροσωπεύει το καθένα, και μπορεί στη συνέχεια να διαβάσει νέα, άγνωστα σκίτσα.

Η μελέτη βασίστηκε σε προϋπάρχουσα βάση δεδομένων που περιέχει 250 κατηγορίες σχεδίων με 80 σκίτσα η καθεμία.

Όπως επισημαίνουν οι ερευνητές, κλειδί για την επιτυχία του λογισμικού είναι η ικανότητά του να παρακολουθεί με ποια σειρά σχεδιάζονται οι γραμμές -ένα σημαντικό στοιχείο που απουσίαζε από προηγούμενες, αντίστοιχες προσπάθειες.

Πιθανή χρήση σε υπολογιστές με οθόνες αφής

Σύμφωνα με την ερευνητική ομάδα, το Sketch-a-Net θα μπορούσε να αξιοποιηθεί σε υπολογιστές με οθόνες αφής, επιτρέποντας για παράδειγμα στο χρήστη να εισάγει σκίτσα αντί για λέξεις κλειδιά.

Θα μπορούσε επίσης να χρησιμοποιηθεί από την αστυνομία σε περιπτώσεις που το σκίτσο ενός υπόπτου πρέπει να ταυτοποιηθεί σε εικόνες από κάμερες παρακολούθησης.

Η μελέτη έχει γίνει δεκτή για παρουσίαση στο Βρετανικό Συνέδριο Μηχανικής Όρασης και είναι διαθέσιμη στην υπηρεσία προδημοσίευσης arXiv.org.