Είναι δύσκολο να περιγράψει κανείς τον ενθουσιασμό με τον οποίο υποδέχτηκε η κοινότητα της Τεχνητής Νοημοσύνης το DeepSeek R1, ένα νέο ανοιχτού κώδικα μοντέλο συλλογιστικής που παρουσίασε πριν λίγο καιρό η κινεζική startup DeepSeek, η οποία έχει την έδρα της στο Χανγκζού της Κίνας.

Σύμφωνα με αναλυτές το μοντέλο της DeepSeek όχι μόνο συναγωνίζεται, αλλά και ξεπερνάει τα αμερικανικά μοντέλα όπως το ChatGPT της OpenAI σε πολλούς βασικούς δείκτες.

Οι ερευνητές επαινούν ιδιαίτερα το κινεζικό μοντέλο για την ικανότητα να δίνει απαντήσεις σε σύνθετα προβλήματα συλλογιστικής, με ιδιαίτερη έμφαση στα μαθηματικά και τον προγραμματισμό. Επιπλέον είναι απείρως φθηνότερο, πιο προσιτό και πιο διαφανές.

Η ξαφνική εμφάνισή του από «το πουθενά» έχει προκαλέσει αμφιβολίες για την ικανότητα των δυτικών τεχνολογικών κολοσσών να προβλέψουν τις δυνατότητες των ανταγωνιστών τους.

Χάρη στο γεγονός ότι είναι πλήρως ανοικτού κώδικα, πολλοί χρήστες έχουν ήδη τελειοποιήσει και εκπαιδεύσει πολλές παραλλαγές του νέου μοντέλου για διαφορετικούς σκοπούς, όπως το να το καταστήσουν αρκετά μικρό ώστε να τρέχει σε μια κινητή συσκευή ή να το συνδυάσουν με άλλα μοντέλα ανοικτού κώδικα.

Ακόμη και αν κάποιος θέλει να το χρησιμοποιήσετε για σκοπούς ανάπτυξης, το κόστος του DeepSeek R1 είναι πάνω από 90% φθηνότερο από το κόστος του αντίστοιχου μοντέλου o1 της OpenAI.

Εντυπωσιακή καινοτομία

«Το DeepSeeκ R1 είναι μια από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ και καθώς είναι ανοιχτού κώδικα αποτελεί ένα μεγάλο δώρο σε ολόκληρο τον κόσμο», έγραψε πριν λίγες ημέρες στο Χ, ο Μαρκ Αντρίσεν, Αμερικανός επιχειρηματίας, επενδυτής και μηχανικός λογισμικού.

Πολλοί ειδικοί αναφέρουν ότι το νέο μοντέλο είναι μια «πυρηνική βόμβα» στην καρδιά της Silicon Valley. Είναι μια ευθεία πρόκληση για τους μεγιστάνες της τεχνολογίας της Αμερικής που πίστευαν ότι η βασιλεία τους θα διαρκούσε για πάντα.

Ισως η πιο σημαντική εξέλιξη είναι ότι τώρα πλέον το μέλλον της Τεχνητής Νοημοσύνης αποφασίζεται στο Χανγκζού και όχι στο Πάλο Αλτο της Καλιφόρνιας.

Επίσης η DeepSeek έρχεται να ανατρέψει εκ θεμελίων τα σχέδια του προέδρου Τραμπ, που ανακοίνωσε πριν λίγες ημέρες ένα πρόγραμμα υποδομών Τεχνητής Νοημοσύνης ύψους 500 δις δολαρίων.

Όπως δήλωσε πρόσφατα ο ειδικός σε θέματα τεχνολογίας Ανταμ Μπάτον «ας υποθέσουμε ότι βρισκόμαστε πίσω στο 2017 και το iPhone X μόλις κυκλοφόρησε. Η τιμή του είναι 999 δολάρια και η Apple κάνει χρυσές πωλήσεις. Τώρα φανταστείτε, ότι λίγες μέρες αργότερα, μια άλλη εταιρεία να

παρουσιάζει ένα τηλέφωνο, ισάξιο αν όχι καλύτερο, στην τιμή των 30 δολαρίων. Αυτό ακριβώς συμβαίνει στον χώρο της τεχνητής νοημοσύνης σήμερα».

Και προσθέτει: «Το μοντέλο της DeepSeek λειτουργεί στο ίδιο επίπεδο με τα τελευταία μοντέλα της OpenAI, αλλά η λειτουργία του κοστίζει απείρως φθηνότερα. Επιπλέον, μπορεί κάποιος ακόμη και να το κατεβάσει και να το τρέξει δωρεάν ή με μόνο το κόστος του ηλεκτρικού ρεύματος».

Ενάντια στους περιορισμούς

Τα επιτεύγματα της DeepSeek, που ιδρύθηκε το 2023, είναι ακόμα πιο εντυπωσιακά αν λάβει κανείς υπόψη τους περιορισμούς που αντιμετωπίζουν οι κινεζικές εταιρείες Τεχνητής Νοημοσύνης λόγω των δρακόντειων περιορισμών εξαγωγών τεχνολογιών «αιχμής» από τις ΗΠΑ.

Όπως όλα δείχνουν οι περιορισμοί αυτοί αντί να αποδυναμώσουν την ανάπτυξη της Κίνας στον τομέα της Τεχνητής Νοημοσύνης έχουν το αντίθετο αποτέλεσμα, καθώς ωθούν startups όπως η DeepSeek να καινοτομούν με τρόπους που βάζουν προτεραιότητα στην αποδοτικότητα, την οικονομία πόρων και τη συλλογικότητα.

Για παράδειγμα η εταιρεία βρήκε τρόπους να μειώσει τη χρήση μνήμης που απαιτούν τα μοντέλα Τεχνητής Νοημοσύνης και να επιταχύνει την υπολογιστική δύναμη χωρίς σημαντικές απώλειες στην ακρίβεια των υπολογισμών.