Αυτό που συμβαίνει τώρα – και θα ενταθεί ως τα επόμενα Χριστούγεννα – είναι κάτι που καταναλωτικά θα χαρακτηρισθεί ως «Αλλαγή Εποχής». Δηλαδή, παρουσιάζεται μία κατηγορία προϊόντων που θα αλλάξει ριζικά τον τρόπο συμπεριφοράς των ιδιοκτητών τους. Συνάμα, όμως, τα προϊόντα αυτά έχουν μέσα τους το σπέρμα της τόσο γοργής εξέλιξής τους ώστε… σίγουρα σε λίγο θα μιλάμε απαξιωτικά για αυτή την εποχή πρωτοεμφάνισής τους – θα μιλάμε για τον «πόλεμο της ντουντούκας».

Ο λόγος είναι ότι πρόκειται για ασύρματα ηχεία που επικοινωνούν διαδικτυακά με τεχνητή νοημοσύνη. Ηχεία που διατίθενται αρχικά στις ΗΠΑ και μιλούν μαζί μας μόνο στα αγγλικά. Ηχεία που πωλούν ακριβά τον ήχο τους και φθηνά την εξυπνάδα τους. Ηχεία που μοιάζουν με βάζο κατάλληλο για το σαλόνι ή την κουζίνα, αλλά που άρχισαν ήδη να συνδυάζονται με κάμερες και οθόνες και θα τρυπώσουν σύντομα και στα αυτοκίνητά μας.

Με άλλα λόγια, θα σας μιλήσουμε τώρα για τα «έξυπνα ηχεία» που κυκλοφόρησαν ή θα κυκλοφορήσουν από το φθινόπωρο, αλλά μη γελιέστε: θα σας μιλήσουμε για τους προπομπούς της καταιγίδας εφαρμογών τεχνητής νοημοσύνης που θα μας προκύψει τα επόμενα χρόνια.

Πρόκειται για τους «κράχτες», τις ντουντούκες προσέλκυσής μας στο διαμορφούμενο πανηγύρι του Διαδικτύου των Πάντων, της πανταχού παρούσας βοήθειας στις αναζητήσεις μας και στη λήψη των αποφάσεων μας.
Ναι, δείτε μαζί μας τα νέα φετίχ του πολιτισμού μας, τα «τζίνια» που θα προστρέχουν σε κάθε προσταγή της φωνής μας. Δείτε αυτά που θα μας κάνουν παντοδύναμους με αυτά και ανίκανους χωρίς αυτά.

To 2014 η εταιρεία κλαδικών μελετών Gartner υπολόγισε ότι ως το 2020 θα έχουν συνδεθεί στο Διαδίκτυο των Πραγμάτων (ΙοΤ) περίπου 26 δισεκατομμύρια συσκευές, ενώ η ανταγωνίστριά της ABI Research ανέβασε τον αριθμό αυτόν στα 30 δισεκατομμύρια. Τώρα, τρία χρόνια μετά, δεν γνωρίζω πού κρύβονται τα στελέχη που έκαναν τις εν λόγω προβλέψεις, αλλά σίγουρα κανείς μας δεν νιώθει αυτά τα «έξυπνα δισεκατομμύρια» να τον περιβάλλουν. Το μόνο στοιχείο του Διαδικτύου των Πραγμάτων που διαδίδεται επιτυχημένα είναι οι «έξυπνοι τελάληδές του»: τα ηχεία τεχνητής νοημοσύνης και τα παράγωγά τους.

Πρώτο εμφανίστηκε στην αγορά το Echo της Amazon, τον Νοέμβριο του 2015. Εναν χρόνο μετά, τον Νοέμβριο του 2016, η Google μάς παρουσίασε το δικό της έξυπνο ηχείο, το Google Home. Τον Μάιο του 2017 η Microsoft παρουσίασε τη δική της συνεργασία με την Harman Kardon και τον Ιούνιο του 2017 η Apple προανήγγειλε το δικό της ηχείο, ονόματι HomePod –που όμως θα πωλείται στην Ευρώπη από το 2018. Τι «ενώνει και τι δονεί» όλα αυτά; Αφενός ότι είναι συσκευές ήχου (ή και εικόνας) και αφετέρου ότι ενσωματώνουν διαδικτυακά μεταδιδόμενη τεχνητή νοημοσύνη. Το πόσο πραγματικά διαφέρουν και πώς μπορούν να επηρεάσουν μελλοντικά τη ζωή μας θα το δούμε στη συνέχεια.


Υποδεχθείτε τα τζίνια
Η πρώτη εταιρεία που συνέλαβε την ανάγκη πιο άμεσου τρόπου επικοινωνίας με το Διαδίκτυο των Πραγμάτων δεν ήταν μια κατασκευάστρια λογισμικού (όπως η Microsoft) ή μια κατασκευάστρια συστημάτων (όπως η Apple), ούτε μια ειδήμων στις διαδικτυακές αναζητήσεις (όπως η Google). Ηταν η μόνη που δεν προσέβλεπε σε κέρδη από την πώληση όλων αυτών, αλλά από την πώληση «μέσω αυτών»: το ψηφιακό σουπερμάρκετ που λέγεται Amazon.
H Amazon λοιπόν ήταν η πρώτη που συνειδητοποίησε ότι για να αξιοποιήσει κανείς την πανσπερμία δεδομένων που προκύπτουν και θα προκύπτουν από τους αισθητήρες όλων των διαδικτυωμένων συσκευών χρειάζεται η ενσωμάτωση τεχνητής νοημοσύνης, όχι μόνο μέσω εντολών σε πληκτρολόγια αλλά και μέσω του αρχαιότερου τρόπου επικοινωνίας φίλων: της συνομιλίας. Υλοποίησε λοιπόν και παρουσίασε πρώτη στη διεθνή αγορά τον κύλινδρο Amazon Echo, που εμπεριείχε μικρόφωνα για να συλλαμβάνουν τη φωνή μας και δύο μεγάφωνα (ένα tweeter και ένα woofer των 2,5 ιντσών) για να ακούμε ήχους, μουσική και… τη φωνή και τις συμβουλές της δικής της τεχνητής νοημοσύνης, ονόματι Alexa. Η τιμή του; Εκατόν ογδόντα δολάρια.
Η Google την ακολούθησε πέρυσι με το Google Home και τη δική της τεχνητή νοημοσύνη που ακούει σε φωνητικές εντολές, τον Google Assistant, με τιμή 130 δολάρια αλλά χωρίς τη συνδεσιμότητα Bluetooth που έχει το Echo. Εφέτος τον Μάιο η Microsoft απάντησε στην πρόκληση… μέσω τρίτου: έδωσε τη δική της βοηθό τεχνητής νοημοσύνης, την Cortana, στη συσκευή Invoke της Harman Kardon, που θα πωλείται στις ΗΠΑ από το φθινόπωρο και μετά. Με τρία μεγάφωνα woofer, τρία tweeters και επτά μικρόφωνα, το Invoke σκοπεύει να ανταγωνιστεί το Amazon Echo κατεξοχήν ως «ηχείο ανώτερης ποιότητας». Επιπλέον, επιτρέπει τηλεφωνικές κλήσεις ανοιχτής ακρόασης μέσω Skype. Την ίδια συνταγή «ποιοτικού ηχείου» φαίνεται να ακολουθεί και η Apple, που παρουσίασε στις 5 Ιουνίου 2017 το HomePod, με επτά tweeters και ένα woofer τεσσάρων ιντσών, τον βοηθό τεχνητής νοημοσύνης Siri, συνδεσιμότητα AirPlay 2 και τιμή 350 δολάρια.
Το τρικ της Amazon
Με όλους αυτούς τους σοβαρούς διεκδικητές να έρχονται στο κατόπι της, θα νομίζετε ότι η Amazon «χάνει όπου να ‘ναι την πρωτιά». Κι όμως, η ευελιξία που δείχνει αυτή η νεόκοπη κατασκευάστρια συσκευών είναι απαράμιλλη: μετά το αρχικό μονοφωνικό ηχείο WiFi, παρουσίασε την πάμφθηνη έκδοσή του Echo Dot (Alexa χωρίς ηχείο, συνδεόμενη με όποιο στερεοφωνικό άλλου κατασκευαστή, σε τιμή 50 δολαρίων). Επειτα, προσέθεσε τη φορητή εκδοχή του Echo, το Amazon Tap (στερεοφωνικό, με επαναφορτιζόμενη μπαταρία και τιμή 130 δολάρια). Και, μόλις πρόσφατα, συμπλήρωσε την οικογένεια με την ασύρματη κάμερα Echo Look που –έναντι 200 δολαρίων – σε φωτογραφίζει, σε βιντεοσκοπεί, σε συμβουλεύει ενδυματολογικά και σου βρίσκει «τι σου πάει» από τα όσα (βέβαια) μπορείς να αγοράσεις μέσω της Amazon. Τη δε επομένη της ημέρας που η Microsoft ανακοίνωσε τo Invoke, η Amazon παρουσίασε την οθονίτσα αφής Echo Show, που κάνει ό,τι και το Echo αλλά με την προσθήκη της δυνατότητας προβολής βίντεο. Τιμή; Διακόσια τριάντα δολάρια.
Οι αναλυτές της αγοράς εκτιμούν ότι ήδη η Amazon έχει καταλάβει το 70,6% της υπάρχουσας αγοράς «έξυπνων συσκευών με φωνητικό βοηθό» –35,6 εκατομμύρια Αμερικανών. Αλλά μη νομίζετε ότι αφήνει το υπόλοιπο 30% στους τρεις μεγάλους της αντιπάλους (Apple, Google, Microsoft): αν μπείτε στον ιστότοπο της Amazon, θα βρείτε μια πανσπερμία συσκευών που μιμούνται το Amazon Echo, με τιμή 50 δολάρια και ενσωμάτωση της… Alexa! Δηλαδή, η Amazon δίνει τα όπλα της σε όποιον τα ζητήσει, αρκεί να της φέρει τελικά πελάτες στο μητρικό σουπερμάρκετ.
Τι μας προσφέρουν;
Το αν ακούτε μουσική ή βλέπετε ταινίες μέσα από αυτές τις μικροσυσκευές είναι δευτερεύον, όσο κι αν η ποιότητα ήχου/βίντεο είναι καθοριστική για την επιλογή τους. Ο πραγματικός ρόλος τους είναι εκείνος του βικτωριανού μπάτλερ: ρωτάτε, ζητάτε και παραγγέλνετε, προσβλέποντας σε άμεση ανταπόκριση. Με προϋπόθεση τη συνεχή σύνδεση στο Διαδίκτυο, ο ψηφιακός αυτός υπηρέτης απαντά σε ερωτήσεις κάθε τύπου (από εγκυκλοπαιδικών γνώσεων έως πρόβλεψη καιρού, συνταγές μαγειρικής, εύρεση καταστημάτων, παραγγελία προϊόντων και υπηρεσιών…). Επίσης, ρυθμίζει τις όποιες συσκευές του σπιτιού επικοινωνούν μαζί του (από λάμπες φωτισμού έως γκαραζόπορτες, κάμερες ασφαλείας κ.λπ.), παίζει τα τραγούδια ή τις ταινίες που του ζητάτε, ψάχνει τους ραδιοφωνικούς ή τηλεοπτικούς σταθμούς για να σας πει τις ειδήσεις που προτιμάτε και, γενικά, διεκπεραιώνει διάφορα παρεμφερή τεμπέλικα χούγια σας.
Επιπλέον, δεν είναι διόλου αμελητέα η «προσαρμοζόμενη ποιότητα απόλαυσης» που παρέχουν αυτές οι συσκευές: μέσω ειδικών φίλτρων μέτρησης της απόστασης, αντιλαμβάνονται τη θέση εμποδίων στον χώρο και κατευθύνουν έξυπνα τον ήχο ώστε να τον ακούτε καθαρό.
Η συμπεριφορά και οι επιδόσεις του ψηφιακού υπηρέτη συνδέονται άμεσα με την τεχνητή νοημοσύνη που έχουν, αλλά και τον βαθμό «εξοικείωσης» που αποκτά βαθμηδόν από τις προσωπικές επιλογές που κάνετε καθημερινά. Με άλλα λόγια, ο «μεγάλος αδελφός» καθεμιάς από αυτές τις εταιρείες διαμορφώνει ένα όλο και πληρέστερο προφίλ των προτιμήσεών σας και των ιδιαιτεροτήτων σας, ώστε να «προλαβαίνει τις επιθυμίες σας» και να σας «προτείνει το καταλληλότερο».
Τέλος, δεν θα πρέπει να μας διαφεύγει το ότι η φωνητική επικοινωνία με το τζίνι ενός πολυεθνικού κολοσσού δεν αφήνει τα περιθώρια αναζήτησης «ανέξοδων λύσεων» που είχαμε με τα πλήκτρα. Εφεξής, θα ακούμε και θα βλέπουμε μόνο τα όσα είναι παρεχόμενα δωρεάν από τους παρόχους τους ή εκείνα για τα οποία έχουμε πληρώσει συνδρομή.
Ποιος είναι καλύτερος σε τι;
Αν και η Apple είχε την πρωτοπορία στους φωνητικούς βοηθούς –παρουσίασε το Siri το 2011 -, ξεπεράστηκε γρήγορα από την τεχνητή νοημοσύνη των τριών άλλων. Σε αυτό συνέβαλαν τρία πράγματα: η μεγαλύτερη πελατειακή βάση των άλλων, ο μεγαλύτερος σεβασμός στην ιδιωτικότητα των πελατών της που έχει η Apple και… η κουλτούρα μυστικοπάθειας που έχει και απωθεί τους φτασμένους προγραμματιστές τεχνητής νοημοσύνης. Γι’ αυτό και τώρα η Apple προβάλλει ως κύριο προτέρημα την ποιότητα του ήχου του «έξυπνου ηχείου της». Βασικό όπλο της σε αυτή τη μάχη είναι ο επεξεργαστής A8 που έχει ενσωματώσει στο HomePod ώστε να προσαρμόζει τον ήχο στον χώρο. Ομοια, η Harman Kardon προτάσσει τον ήχο ως παραδοσιακό της πλεονέκτημα, αλλά σίγουρα η Cortana της Microsoft αναμένεται να της προσφέρει μελλοντικά ανταγωνιστικό πλεονέκτημα και στην «εξυπνάδα».
Το Google Home βρίσκεται αυτή τη στιγμή στη μεσαία κατηγορία, από άποψη τόσο τιμής όσο και επιδόσεων. Ο ήχος του είναι αξιοπρεπής αλλά όχι ο βέλτιστος και η τεχνητή του νοημοσύνη έχει τις καλύτερες προδιαγραφές αλλά δεν είναι ακόμη πλήρως ανεπτυγμένη –π.χ. δεν επιτρέπει τις παραγγελίες και πληρωμές προς τρίτους, διαδικτυακά. Και το Home πωλείται ακόμη μόνο στις ΗΠΑ, στον Καναδά και στη Βρετανία.
Για όλους τους άλλους, η φθηνή λύση ακούει στο όνομα Amazon Echo Dot και τα παρόμοια με αυτό. Αν συνδυαστούν με ένα πολύ καλό ηχητικό σύστημα, ίσως δώσουν και την καλύτερη ποιότητα ήχου.
Στο παιχνίδι της συμβατότητας η Amazon βρίσκεται πολύ μπροστά: η πλατφόρμα τρίτων συνεργατών περιλαμβάνει ήδη άνω των 10.000 εφαρμογών, ενώ εκείνη του Google Home περιελάμβανε ως το τέλος του 2016 μόλις 35. Με την έλευση όμως των Apple και Microsoft στο παιχνίδι, η κατάσταση αυτή ίσως αλλάξει ραγδαία. Δεδομένου όμως ότι η Amazon δίνει δωρεάν την άδεια σύνδεσης με τις συσκευές της, δεν αποκλείεται στο τέλος να δουλέψουν όλοι για αυτήν: να «τρέχουν» όλες οι εφαρμογές των αντιπάλων και στις συσκευές της!


Το αγγλόφωνο πείραμα
Αναμφίβολα, όλοι οι παίκτες αυτής της αγοράς θα μειώσουν τα μειονεκτήματα και θα αυξήσουν τα πλεονεκτήματά τους πολύ προτού διεκδικήσουν τα προϊόντα τους την παγκόσμια –και την ελληνική –αγορά. Τι εννοούμε; Οτι αυτό που συμβαίνει αυτή τη στιγμή είναι ένα πείραμα που αφορά κυρίως τους αγγλόφωνους πληθυσμούς. Ο λόγος είναι ότι οι εν λόγω φωνητικοί βοηθοί (τα τζίνια) δεν καταλαβαίνουν ακόμη παραγγελιές και προστάγματα σε άλλες γλώσσες.
Αν αυτή η δυστοκία είχε να κάνει μόνο με την καταναλωτική εξέλιξη της αγοράς των «έξυπνων συσκευών», θα μπορούσαμε και να αδιαφορήσουμε. Ωστόσο, αυτό που χτίζεται με όλη αυτή την τεχνολογία περιλαμβάνει και κάτι διαφορετικό: η επικοινωνία των ανθρώπων με τις συσκευές μέσω της φυσικής γλώσσας τους και οι απαντήσεις των συσκευών σε αυτήν την εκάστοτε γλώσσα θα προσφέρουν την ύστατη ίσως ευκαιρία διάσωσης των επί μέρους γλωσσών του πλανήτη. Διότι, αν η τεχνητή νοημοσύνη των συσκευών κατανοεί και ομιλεί αυτές τις γλώσσες, επαυξάνοντας καθημερινά τις «γνώσεις της» για το πώς ορίζονται και πώς αποδίδονται οι έννοιες σε κάθε ιδίωμα, θα έλθει η μέρα που η αυτόματη μετάφραση και η αυτοστιγμεί διερμηνεία θα γίνουν πραγματικότητα. Το «διαδικτυακό νέφος των έξυπνων βοηθών» θα συντηρεί τη σύγχρονη Στήλη της Ροζέτας για κάθε γλώσσα και η μονοκρατορία της lingua franca θα αποφευχθεί.
Εκτός κι αν επιμείνετε να απευθύνεστε στον μπάτλερ σας με Greeklish!

ΕΝΤΥΠΗ ΕΚΔΟΣΗ