Η τέχνη και η τεχνολογία είναι ιστορικά αλληλένδετες, καθώς κάθε τεχνολογική καινοτομία μπορεί να ανοίξει νέους τρόπους έκφρασης. Ειδικά στις πιο σύγχρονες τέχνες της φωτογραφίας και του κινηματογράφου η σχέση αυτή είναι προφανής και ισχυρή, ενώ στη μουσική η ίδια η χρήση νέων αναλογικών ή ψηφιακών μεθόδων παραγωγής μουσικής όρισε νέα μουσικά ρεύματα ειδικά στον 20ό αιώνα.
Στο ίδιο πνεύμα τεχνολογικής εξέλιξης, η σύγχρονη μετάβαση προς τη χρήση της τεχνητής νοημοσύνης (ΤΝ) ανοίγει έναν νέο χώρο δημιουργικών δυνατοτήτων και συνεργασίας ανθρώπου-μηχανής. Η χρήση της ΤΝ στην τέχνη έχει αναπτυχθεί ραγδαία τα τελευταία χρόνια με την άνοδο της παραγωγικής ΤΝ, όμως και πολύ νωρίτερα αξιοποιούσαμε αλγορίθμους κυρίως για την ανάλυση καλλιτεχνικού περιεχομένου.
Στη μουσική, για παράδειγμα, η τεχνολογία audio fingerprinting βασίζεται σε μεθόδους ανάλυσης σήματος και μηχανικής μάθησης ώστε, από ένα μικρό δείγμα ήχου λίγων δευτερολέπτων, να προσδιορίζει με ακρίβεια ποιο τραγούδι ακούγεται. Εφαρμογές όπως το Shazam, που χρησιμοποιούμε εδώ και σχεδόν είκοσι χρόνια, αποτελούν χαρακτηριστικό παράδειγμα του πώς η ΤΝ υποστηρίζει την καλλιτεχνική εμπειρία.
Πριν την εμφάνιση της παραγωγικής ΤΝ, μοντέλα μηχανικής μάθησης χρησιμοποιούνταν επίσης για σύσταση περιεχομένου, όπως στα πρώιμα συστήματα των Spotify και YouTube που μάθαιναν τις προτιμήσεις του χρήστη και πρότειναν νέα έργα. Επιπλέον, τεχνικές υπολογιστικής όρασης επέτρεψαν την αυτόματη αναγνώριση έργων τέχνης, του καλλιτέχνη, του στιλ τους ή άλλων χαρακτηριστικών, διευκολύνοντας την αρχειοθέτησή τους και –κυρίως– την εύκολη αναζήτησή τους.
Η παραγωγή βίντεο και animation πάντα ήταν συνδεδεμένη με εργαλεία λογισμικού, ωστόσο η παραγωγική ΤΝ άλλαξε τελείως το παιχνίδι: text-to-video μοντέλα όπως το Sora επιτρέπουν με πολύ εύκολο τρόπο τη δημιουργία concept videos ή μικρών ταινιών από απλή κειμενική περιγραφή. Αυτό σημαίνει ότι δημιουργοί χωρίς εξειδικευμένες τεχνικές γνώσεις μπορούν πλέον να οπτικοποιήσουν ιδέες που άλλοτε απαιτούσαν μεγάλα στούντιο και σημαντικούς πόρους.
Παράλληλα, η ταχύτητα με την οποία τα μοντέλα αυτά παράγουν υλικό επιτρέπει γρήγορο πειραματισμό και εξερεύνηση πολλών διαφορετικών κατευθύνσεων, χωρίς το κόστος του παραδοσιακού animation. Τέλος, η ΤΝ διευκολύνει τη σύγκλιση μεταξύ κινηματογράφου, γραφιστικής και ψηφιακής τέχνης, δημιουργώντας ένα νέο πεδίο υβριδικής οπτικοακουστικής έκφρασης. Στη μουσική βιομηχανία, η εμφάνιση της παραγωγικής ΤΝ σηματοδοτεί την αρχή μιας νέας εποχής δημιουργικότητας και παραγωγής. Αυτή η τεχνολογία επιτρέπει πλέον τη σύνθεση νέων μουσικών κομματιών με πρωτοφανή ταχύτητα και ευκολία.
Η διαδικασία ξεκινά από απλές κειμενικές περιγραφές, στιλιστικές οδηγίες ή από την ανάλυση παραδειγμάτων ήχου που παρέχει ο χρήστης ως «έμπνευση». Πολλά μοντέλα έχουν αναδειχθεί ως πρωτοπόρα. Εμπορικές λύσεις όπως το MusicLM της Google και το Suno προσφέρουν τη δυνατότητα παραγωγής ολοκληρωμένων, υψηλής ποιότητας τραγουδιών. Παράλληλα, υπάρχουν και ανοικτές πρωτοβουλίες, που επιτρέπουν στους δημιουργούς να πειραματιστούν χωρίς περιορισμούς σε επίπεδο αδειών ή κόστους, απαιτώντας ωστόσο έναν βαθμό τεχνικής εξοικείωσης. Ετσι, η ουσιαστική αλλαγή που επιφέρει η ΤΝ είναι ότι η διαδικασία παραγωγής δεν περιορίζεται πλέον αποκλειστικά στον παραδοσιακό εξοπλισμό (κονσόλες και synthesizers) ή στις απαιτητικές τεχνικές δεξιότητες.
Αντιθέτως, η δημιουργία μετατρέπεται σε ένα διαδραστικό περιβάλλον συνεργασίας με την ΤΝ. Ο άνθρωπος αναλαμβάνει τον ρόλο του «μαέστρου» ή του «επιμελητή», καθοδηγώντας το μοντέλο της ΤΝ και εξευγενίζοντας το αποτέλεσμα, με αποτέλεσμα η μουσική δημιουργία να διευρύνεται σημαντικά. Θα μπορούσαμε να πούμε ότι εξαιτίας αυτής της δυνατότητας καλλιτεχνικής έκφρασης σε περισσότερους ανθρώπους, ξεπερνώντας το εμπόδιο της μακροχρόνιας εκμάθησης ή του κόστους του επαγγελματικού εξοπλισμού, έχουμε μία εκδημοκρατικοποίηση ως προς την πρόσβαση στη μουσική παραγωγή.
Αυτή η νέα πραγματικότητα συνοδεύεται και από σημαντικές προκλήσεις: η χρήση δεδομένων εκπαίδευσης που προέρχονται από υπάρχοντα κομμάτια θέτει σοβαρά ζητήματα πνευματικών δικαιωμάτων, καθώς συχνά είναι ασαφές αν και πώς αποζημιώνονται οι αρχικοί δημιουργοί όταν το μοντέλο παράγει περιεχόμενο σε παρόμοιο ύφος. Παράλληλα, η ευκολία παραγωγής μπορεί να οδηγήσει σε υπερπληθώρα ομοιόμορφων έργων, μειώνοντας την καλλιτεχνική καινοτομία.
Δημιουργούνται, λοιπόν, σημαντικά ερωτήματα για το μέλλον της πρωτοτυπίας και τη δίκαιη κατανομή της αξίας στην καλλιτεχνική κοινότητα. Πέρα από το προφανές νομικό ζήτημα– «θα αποζημιωθεί ο Χ καλλιτέχνης αν τα έργα του χρησιμοποιήθηκαν στην εκπαίδευση ενός μοντέλου ΤΝ;»– τίθεται και το ερώτημα κατά πόσο η ΤΝ μπορεί πράγματι να συνεισφέρει στην καλλιτεχνική καινοτομία.
Κανένα μοντέλο ΤΝ δεν θα μπορούσε να δημιουργήσει τα πρώτα τραγούδια των Talking Heads, ούτε να προβλέψει την εξέλιξή τους σε ένα νέο μουσικό υποείδος, καθώς αδυνατεί να ενσωματώσει απρόβλεπτες δημιουργικές στιγμές όπως η συνεργασία με τον Brian Eno. Αντίστοιχα, ένα μοντέλο παραγωγής βίντεο δεν θα μπορούσε να αναπαράγει την οπτική και αφηγηματική ιδιομορφία του Stanley Kubrick, αφού οι γεωμετρίες, οι εντάσεις και οι αισθητικές επιλογές του προκύπτουν από δημιουργικές διαδικασίες που δεν χωρούν σε ένα στατιστικό πλαίσιο.
Η ΤΝ μπορεί να ανοίξει νέους δρόμους στη δημιουργική διαδικασία, προσφέροντας στους καλλιτέχνες εργαλεία που ενισχύουν τον πειραματισμό και διευρύνουν τις δυνατότητες έκφρασης.
Ωστόσο, ο ρόλος της παραμένει υποστηρικτικός, επιταχύνοντας και διευκολύνοντας επιμέρους στάδια χωρίς να αντικαθιστά τη φαντασία και το καλλιτεχνικό ένστικτο σκηνοθετών, ζωγράφων ή μουσικών.
Γι’ αυτό και απαιτείται ένα σαφές και προσεκτικά διαμορφωμένο νομικό πλαίσιο, ώστε να διασφαλίζεται ο σεβασμός στα πνευματικά δικαιώματα και η δίκαιη αποζημίωση των δημιουργών.
*Ο Θοδωρής Γιαννακόπουλος είναι διευθυντής Ερευνών (Ερευνητής Α’) στο Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών, ΕΚΕΦΕ Δημόκριτος








