Είναι φοβερά ενδιαφέρον αυτό που θα συμβεί την Κυριακή 6 Απριλίου στο Μέγαρο Μουσικής Αθηνών. Το κορυφαίο Eρευνητικό Iνστιτούτο IRCAM με έδρα το Παρίσι, σε συνεργασία με το Εργαστήριο Μουσικής Ακουστικής και Τεχνολογίας (LABMAT) του Τμήματος Μουσικών Σπουδών του Εθνικού Καποδιστριακού Πανεπιστημίου Αθηνών παρουσιάζουν στις 12 το μεσημέρι το πρωτοποριακό σύστημα Somax 2, σε μια συναυλία που ταξιδεύει το κοινό στον αναδυόμενο κόσμο της συνύπαρξης μουσικής δημιουργίας, ερμηνείας και τεχνητής νοημοσύνης (η εκδήλωση πραγματοποιείται στο πλαίσιο της σειράς Γέφυρες με επικεφαλής τον Δημήτρη Μαραγκόπουλο).
Το σύστημα Somax 2 αποτελεί πλέον διεθνές σημείο αναφοράς. Υπό την καθοδήγηση του δημιουργού του, διακεκριμένου ερευνητή και διευθυντή ερευνών του IRCAM Ζεράρ Ασσαγιάγκ, ακούει, κατανοεί και αλληλεπιδρά σε πραγματικό χρόνο με τους μουσικούς που παίζουν και δημιουργούν στη σκηνή.
Ο Τηλέμαχος Μούσας και μικρά σύνολα του μεταπτυχιακού προγράμματος «Μουσική τεχνολογία και σύγχρονες πρακτικές» του ΕΚΠΑ, παρουσιάζουν έναν μοναδικό συνδυασμό νέων συνθέσεων, όπου η εκρηκτική ενέργεια και οι πολυρρυθμίες κυριαρχούν, συνδέοντας την τζαζ, τις μουσικές του κόσμου, τη ροκ και την κλασική μουσική με τις νέες τεχνολογίες.
Ο κύριος Ασσαγιάγκ μίλησε στο Βήμα για αυτή τη συνεργασία και για το αν η τεχνητή νοημοσύνη αποτελεί απειλή για τη μουσική δημιουργία.
Πώς προέκυψε η ιδέα για το Somax 2 και τι σας παρακίνησε αρχικά να το αναπτύξετε;
Το Somax2 αποτελεί μέρος του έργου ERC REACH του European Research Council. Παρότι το REACH ξεκίνησε το 2021, βασίζεται σε προηγούμενες έρευνές μου στην Ομάδα Μουσικής Αναπαράστασης στο Ινστιτούτο IRCAM, οι οποίες ξεκίνησαν στις αρχές του 2000 με το πρώτο λογισμικό ανθρώπινου-μηχανικού αυτοσχεδιασμού, το γνωστό OMax. Θα μπορούσε κανείς να θεωρήσει το OMax μια μορφή πρώιμης τεχνητής νοημοσύνης: η κεντρική ιδέα της ΤΝ είναι η προσομοίωση ανώτερων λειτουργιών του ανθρώπινου νου, και το OMax προσομοιώνει έναν αυτοσχεδιαστή. Αν και δεν βασίζεται στη βαθιά μάθηση, το OMax προηγήθηκε κατά είκοσι χρόνια σε σχέση με την τωρινή εποχή, καθώς ο σκοπός του ήταν να μαθαίνει άμεσα το στιλιστικό αποτύπωμα της μουσικής που παίζει ζωντανά ένας μουσικός, και παράλληλα να παράγει παραλλαγές αυτής της μουσικής, έτσι ώστε να εμπλέκεται σε έναν ζωντανό διάλογο με τον άνθρωπο. Το μουσικό στιλ μοιάζει με μια περιοχή: στην κλασική μουσική, για παράδειγμα, οι διαφορετικές τονικότητες είναι σαν τοπία, ο ρυθμός σαν ιδιαιτερότητα του εδάφους και ούτω καθεξής.
«Ο μουσικός νιώθει ότι υπάρχει αμοιβαία κατανόηση, αλλά ταυτόχρονα η εμπειρία δεν γίνεται ποτέ βαρετή, επειδή εμφανίζονται διακοπές και εκπλήξεις».
Όταν ένας μουσικός παίζει ή αυτοσχεδιάζει, διασχίζει ένα μονοπάτι μέσα σε αυτό το τοπίο και αποκαλύπτει έτσι ένα – εκ των πραγμάτων περιορισμένο – τμήμα του. Βάσει των διαδρομών που ακολουθεί ο μουσικός, το OMax χαρτογραφεί το σύνολο του τοπίου. Έπειτα, επιλέγοντας τις δικές του διαδρομές μέσα στον χάρτη, το OMax αλληλεπιδρά αυτοσχεδιαστικά με τον μουσικό. Σε αυτό το σημείο, το Somax εισάγει την έννοια της αντίδρασης: κατευθύνει την πλοήγηση λαμβάνοντας υπόψη τις αλλαγές στο ηχητικό περιβάλλον, αντιδρώντας γρήγορα και φυσικά. Αυτό ανεβάζει την εμπειρία της αυτοσχεδιαστικής διάδρασης λογισμικού-ανθρώπου σε νέα επίπεδα, διότι φαίνεται πως το λογισμικό ακούει πραγματικά ό,τι κάνει ο μουσικός σε κάθε στιγμή.
Πού βρίσκεστε τώρα σε σχέση με το αρχικό σας όραμα; Αισθάνεστε πως έχετε πετύχει τους στόχους σας ή υπάρχει ακόμα αρκετός δρόμος μπροστά;
Σε γενικές γραμμές, τα συστήματα μουσικής ΤΝ προσπαθούν να δημιουργήσουν μουσικά έργα που υπακούουν σε κάποιον προκαθορισμένο σκοπό και επιδιώκουν να είναι δημιουργικά. Ωστόσο, εμείς δεν ενδιαφερόμαστε για μια μηχανή που είναι αυτόνομα δημιουργική – ό,τι κι αν σημαίνει αυτό! – αλλά για τη διάδρασή της με τους μουσικούς. Η έννοια της συνεπικουρικής δημιουργικότητας (co-creativity) πρέπει να αντιμετωπίζεται ως ένα φαινόμενο «ανάδυσης» μέσα στο σύνθετο σύστημα που σχηματίζουν ο μουσικός και η μηχανή: ένα σύστημα όπου ο καθένας ακούει, μαθαίνει διαρκώς από τον άλλο και διαμορφώνει μια προσαρμοστική πορεία. Κατ’ αυτόν τον τρόπο, προκύπτουν νέες μουσικές μορφές, οι οποίες παράγονται από κοινού, σε ένα double feedback loop. Αυτές οι μορφές δεν μπορούν να περιοριστούν στη δράση του ενός ή του άλλου, αλλά υπάρχουν μόνο στη φευγαλέα κατάσταση της αλληλεπίδρασης. Έτσι ανοίγει ένα εντελώς νέο πεδίο για τη φαντασία, και τα αποτελέσματα που επιτυγχάνουμε είναι αναμφίβολα αυθεντικές δημιουργίες – ενώ, αντιθέτως, πολλά συστήματα τεχνητής νοημοσύνης που παράγουν μουσική παράγουν κυρίως απομιμήσεις.
Υπάρχει, ωστόσο, πολύς δρόμος ακόμα, καθώς το Somax εξακολουθεί να χρειάζεται ανθρώπινη καθοδήγηση προκειμένου να λαμβάνει αποφάσεις που σχετίζονται με τη ρύθμιση των δράσεων: πρέπει να αποφασίσουμε αν θα παίξει ή θα σταματήσει, αν θα αλλάξει τη μουσική του μνήμη για να φορτώσει άλλα είδη μουσικών υλικών, αν θα κινηθεί σε συμφωνία ή σε αντίθεση με τους μουσικούς ή αν θα παραμείνει ουδέτερο. Το Somax τα πάει καλά στο να παράγει μουσικό περιεχόμενο, ωστόσο χρειάζεται καθοδήγηση σχετικά με τη στρατηγική της εκτέλεσης. Αυτό είναι το μεγάλο ερευνητικό μονοπάτι που ξετυλίγεται μπροστά μας.
Ποιες ήταν οι κύριες τεχνολογικές και ερευνητικές προκλήσεις που αντιμετωπίσατε στην ανάπτυξη του Somax 2;
Αξιοποιώντας τις τελευταίες εξελίξεις στη διαδραστική τεχνολογία μουσικής εκτέλεσης και στο generative AI, το περιβάλλον του Somax2 βασίζεται σε μηχανική μάθηση, γνωστική μοντελοποίηση και corpus-based generation. Το Somax2 έχει σχεδιαστεί ώστε να παρέχει, σε πραγματικό χρόνο, αυτοσχεδιαστικούς agents που μπορούν να αλληλεπιδρούν αυτόνομα και δημιουργικά με μουσικούς (ή μεταξύ τους), αναπτύσσοντας αδιάκοπα τις μουσικές υφές τους μέσα από μια συνεχή αλληλεπίδραση, η οποία άλλοτε έρχεται σε συμφωνία ή αντίθεση, και άλλοτε λειτουργεί εντελώς ανεξάρτητα από το εξελισσόμενο και συχνά απρόβλεπτο ακουστικό πλαίσιο.
Το Somax2 δημιουργεί μια νέα μικτή μουσική πραγματικότητα, συνδυάζοντας σε πραγματικό χρόνο τη μουσική που παράγει το σύνολο επί σκηνής με τα ηχητικά στρώματα που παράγονται από τη μηχανή, μέσα από πολλαπλά feed-back loops αμοιβαίων επιρροών. Σε αυτούς τα feed-back loops, άνθρωποι και τεχνητοί πράκτορες ακούνε ταυτόχρονα ο ένας τον άλλον, μαθαίνουν και αντιδρούν αμοιβαία. Το Somax2 είναι ένα αυτόνομο σύστημα, που μπορεί ωστόσο να χρησιμοποιηθεί και σαν όργανο, όταν η στρατηγική της δημιουργίας και της αλληλεπίδρασης καθοδηγείται από την παρέμβαση ενός ανθρώπινου μουσικού.
Πώς αλλάζει το Somax 2 την εμπειρία του αυτοσχεδιασμού για έναν μουσικό;
Η αλληλεπίδραση με έναν υπολογιστή ανοίγει νέες προοπτικές για τους νεότερους μουσικούς και τους απαλλάσσει από το βαρύ φορτίο των παραδοσιακών προτύπων. Η παρουσία του υπολογιστή είναι ήπια υπό την έννοια ότι δεν είναι ένα υποκείμενο με τη φιλοσοφική σημασία του όρου – άρα δεν ασκεί καταπιεστική ή κυριαρχική επίδραση, όπως ίσως θα έκανε ένας δάσκαλος ή ένας μαέστρος. Ωστόσο, εισάγει έναν ολόκληρο καινούργιο φαντασιακό κόσμο και απαιτεί υψηλό επίπεδο, οπότε λειτουργεί ως ένα εξαιρετικό εργαλείο εξάσκησης.
Τι κερδίζουν καλλιτεχνικά οι μουσικοί όταν έχουν ένα σύστημα ΤΝ όπως το Somax 2 ως «συμπαίκτη»;
Η μηχανή είναι συγχρόνως οικεία, καθώς αναπαράγει υλικά που έχει μάθει από ανθρώπους (και μερικές φορές από τους ίδιους τους μουσικούς που παίζει μαζί τους), αλλά και απρόβλεπτη, αφού μπορεί να ακολουθεί μια εντελώς δική της, ορθολογική μεν για την ίδια αλλά αιφνιδιαστική για τον άνθρωπο, διαδρομή επιλογών. Έτσι, αποτελεί έναν ιδανικό συνεργάτη για (συν-)αυτοσχεδιασμό: ο μουσικός νιώθει ότι υπάρχει αμοιβαία κατανόηση, αλλά ταυτόχρονα η εμπειρία δεν γίνεται ποτέ βαρετή, επειδή εμφανίζονται διακοπές και εκπλήξεις. Γενικά, οι έμπειροι αυτοσχεδιαστές το εκτιμούν ιδιαίτερα και βρίσκουν ότι ανανεώνει την εκτελεστική τους εμπειρία.
Σε αυτή τη συναυλία, συναντώνται στοιχεία από τζαζ, ροκ, έθνικ και κλασική μουσική. Πώς ανταποκρίνεται το Somax 2 σε τόσο ποικίλα μουσικά είδη;
Το Somax2 είναι ένας μη ιδιωματικός αυτοσχεδιαστής: δεν προσπαθεί δηλαδή να ακολουθήσει ένα αυστηρό πλαίσιο σύνθεσης, όπως π.χ. ένα τραγούδι ή μια τζαζ αρμονική ακολουθία ή ένα παραδοσιακό σχήμα. Αντίθετα, στοχεύει στο να είναι έτοιμο να ανταποκριθεί σε οποιαδήποτε κατάσταση προκύψει μέσα από την ελεύθερη αυτοσχεδιαστική διαδικασία. Αυτό, βέβαια, συνιστά μια πρόκληση για τους φοιτητές μουσικούς, που δεν είναι πάντοτε εξοικειωμένοι με την εξερεύνηση ελεύθερων πεδίων νέας μουσικής, η οποία απαιτεί πολλές δεξιότητες και εμπειρία. Πάντως, βρίσκουν συνήθως κοινό έδαφος, γιατί σε αυτό το πλαίσιο συνεπικουρικής δημιουργικότητας παρατηρείται μια αμοιβαία επιρροή μεταξύ ανθρώπου και μηχανής που μαθαίνουν ο ένας από τον άλλον – μια μορφή, ας το πούμε, κοινής εξέλιξης. Πρόκειται για ένα εξαιρετικό σχολείο για τους νέους αυτοσχεδιαστές, καθώς τους εκπαιδεύει να είναι έτοιμοι για οποιοδήποτε άλμα στο άγνωστο ενδέχεται ξαφνικά να προτείνει η μηχανή.
«Μπορεί να συμβεί μια μορφή κοινής εξέλιξης: η μηχανή ακούει και μαθαίνει από τον άνθρωπο, προσαρμόζεται και παράγει, το ίδιο και ο άνθρωπος».
Ποιο είναι το επόμενο βήμα μετά το Somax 2; Ετοιμάζετε ήδη την επόμενη εκδοχή (Somax 3) ή κάποιο άλλο πρότζεκτ;
Έχουμε προχωρήσει πολύ, όπως και η έρευνα στην ΤΝ γενικότερα, στο ζήτημα της μάθησης περιεχομένου μέσω της έκθεσης σε δεδομένα. Κατόπιν, ενεργοποιούμε αυτό το περιεχόμενο, δημιουργώντας συνθήκες αλληλεπίδρασης. Ωστόσο, τι συμβαίνει με όσα μαθαίνουμε από την ίδια την αλληλεπίδραση, από τις επιτελούμενες δράσεις, και όχι μόνο από το δημιουργούμενο περιεχόμενο; Αν δούμε το περιεχόμενο σαν απάντηση στο ερώτημα «τι παίζω;», τότε οι δράσεις σχετίζονται με το «πότε το παίζω;» – πότε αποφασίζω να σταματήσω, να ξαναρχίσω, να μιμηθώ τον άλλον ή αντίθετα να τον κοντράρω; Θα μπορούσε ένα σύστημα τεχνητής νοημοσύνης με μηχανική μάθηση να μάθει την πλέξη περιεχομένου και δράσης, του τι και του πότε, αναπαράγοντας αυτό το σύνθετο μείγμα που ο άνθρωπος ελέγχει με τόση μαεστρία; Τότε θα είχαμε κάνει ένα ακόμη βήμα μπροστά.
Πώς αντιμετωπίζετε τις ανησυχίες ότι η ΤΝ θα τη δημιουργική διαδικασία και θα μειώσει τον ρόλο των ανθρώπινων μουσικών;
Στη δική μας προσέγγιση για την ΤΝ, δεν υπάρχει ο φόβος ότι ο άνθρωπος θα εκλείψει, διότι ο άνθρωπος είναι στο επίκεντρο της εμπειρίας, την ορίζει μέσω της ιδέας της συνεπικουρικής δημιουργικότητας, η οποία αναδύεται μέσα από την αλληλεπίδραση. Όταν αλληλεπιδρούν σύνθετα συστήματα όπως άνθρωποι και μηχανές, παρατηρούμε κάτι περισσότερο από ένα απλό άθροισμα συμπεριφορών: παρατηρούμε μια ανάδυση συγχωνευμένων ηχητικών μορφών, που είναι απρόβλεπτες, πλούσιες και εμπνέουν. Το όλον είναι μεγαλύτερο από το άθροισμα των μερών του, και η περίπλοκη δυναμική του δεν μπορεί να ερμηνευτεί μόνο μέσω της ανάλυσης των συστατικών του, τα οποία μπορεί να παραμένουν σχετικά απλά. Μπορεί να συμβεί μια μορφή κοινής εξέλιξης: η μηχανή ακούει και μαθαίνει από τον άνθρωπο, προσαρμόζεται και παράγει, το ίδιο και ο άνθρωπος.
Έτσι δημιουργείται ένα double feedback loop που γεννά μια από κοινού δράση, προερχόμενη από ένα μοιρασμένο γνωστικό σύστημα. Η δυναμική των σύνθετων συστημάτων συνήθως δημιουργεί εναλλαγές τάξης και χάους, σταδιακές εξελίξεις και βίαιες ρήξεις, συμφωνία και διαφωνία, κάτι που ταιριάζει απόλυτα στη μουσική δημιουργία και τη διαμόρφωση μορφής. Ακριβώς αυτή τη σύνθετη δυναμική της δημιουργίας αποκαλούμε συνεπικουρική δημιουργικότητα (co-creativity) και επιδιώκουμε να την κατανοήσουμε, να τη μοντελοποιήσουμε και να την υλοποιήσουμε με τεχνολογίες όπως το Somax2.