Το μικροβίωμα, το σύνολο δηλαδή των μικροοργανισμών που συμβιούν με τον καθένα από εμάς παίζοντας καθοριστικό ρόλο στη φυσιολογία μας, είναι μάλλον γνωστό στους αναγνώστες του ΒΗΜΑ-Science. Λιγότερο όμως γνωστό, ακόμη και στους επιστήμονες, είναι το περιβαλλοντικό μικροβίωμα, το σύνολο δηλαδή των οργανισμών στο περιβάλλον. Αν και αόρατοι με γυμνό μάτι, οι μικροοργανισμοί (ιοί, βακτήρια, μύκητες) βρίσκονται παντού: στο έδαφος, στον αέρα, στα υδάτινα οικοσυστήματα, επιβιώνοντας ακόμη και στις πλέον ακραίες συνθήκες, όπως είναι, παραδείγματος χάριν, τα ηφαίστεια, οι ωκεάνιες θερμοπηγές ή οι πάγοι των πόλων.

Μια βάση-χρυσωρυχείο

Παραδοσιακά, η μελέτη ενός μικροοργανισμού προϋπέθετε την απομόνωσή του και στη συνέχεια τη (συχνά ανέφικτη) καλλιέργειά του σε εργαστηριακές συνθήκες. Οι τεχνολογικές (και κυρίως οι υπολογιστικές) πρόοδοι όμως, οι οποίες έφεραν επανάσταση στη βιολογία ήδη από τα τέλη του περασμένου αιώνα και συνεχίζονται ακόμη με αμείωτη ένταση, έχουν επιτρέψει τη μελέτη των μικροβιωμάτων συνολικά, χωρίς να είναι απαραίτητη η απομόνωση και καλλιέργεια των επιμέρους μικροοργανισμών που τα απαρτίζουν. Στην πρωτοπορία της ανάλυσης των Μεγάλων Δεδομένων (Big Data) των μικροβιωμάτων βρίσκεται εδώ και μια εικοσαετία το εργαστήριο του δρος Νίκου Κυρπίδη, το οποίο ανήκει στο Joint Genome Institute (JGI) του υπουργείου Ενέργειας των Ηνωμένων Πολιτειών (DOE) και εδρεύει στο Εθνικό Εργαστήριο Lawrence Berkeley. Ο έλληνας βιολόγος και οι συνεργάτες του έχουν, μεταξύ άλλων, δημιουργήσει εκεί μια τεράστια βάση δεδομένων περιβαλλοντικών μικροβιωμάτων, την οποία θα μπορούσε κανείς να περιγράψει ως «χρυσωρυχείο» πληροφορίας. Δεν είναι τυχαίο εξάλλου το γεγονός ότι οι μελέτες που βασίζονται σε στοιχεία από βάσεις δεδομένων ονομάζονται «εξορύξεις» (mining).

Στις «στοές» αυτού του ιδιότυπου ψηφιακού χρυσωρυχείου καταδύθηκε μια διεθνής ομάδα επιστημόνων στην οποία η ελληνική συμμετοχή ήταν έντονη. Ειδικότερα, εκτός από τον δρα Κυρπίδη, ο οποίος είχε την επίβλεψη και τον συντονισμό των ερευνών, στη μελέτη συμμετείχαν μεταξύ άλλων τρία εργαστήρια με έδρα την Ελλάδα: το εργαστήριο του δρος Χρήστου Ουζούνη, καθηγητή Βιοπληροφορικής στο Τμήμα Πληροφορικής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης και διευθυντή Ερευνών του Εθνικού Κέντρου Ερευνας & Τεχνολογικής Ανάπτυξης, το εργαστήριο του δρος Ιωάννη Ηλιόπουλου, αναπληρωτή καθηγητή Μοριακής Βιολογίας – Βιοπληροφορικής στην Ιατρική Σχολή του Πανεπιστημίου Κρήτης, και το εργαστήριο του δρος Γεωργίου Παυλόπουλου, κύριου ερευνητή Βιοπληροφορικής στο ερευνητικό κέντρο «Αλέξανδρος Φλέμινγκ», το οποίο είχε και τη μερίδα του λέοντος στη συγκεκριμένη μελέτη. Ετσι, ο δρ Παυλόπουλος είναι ο πρώτος και βασικός συγγραφέας στο σχετικό επιστημονικό άρθρο, το οποίο δημοσιεύθηκε στα μέσα Οκτωβρίου στην έγκριτη επιστημονική επιθεώρηση «Nature».

Φως στη σκοτεινή ύλη

Ο τίτλος του άρθρου είναι «Αποκαλύπτοντας τη λειτουργική σκοτεινή ύλη μέσω παγκόσμιας μεταγονιδιωματικής» (Unraveling the functional dark matter through global metagenomics), που ίσως να μη σημαίνει και πολλά στους μη ειδικούς. Αξίζει λοιπόν τον κόπο να δώσουμε ορισμένες διευκρινίσεις. Το γονιδίωμα είναι το γενετικό υλικό ενός οργανισμού, ενώ ως μεταγονιδίωμα ορίζεται το σύνολο του γενετικού υλικού που υπάρχει σε ένα περιβαλλοντικό δείγμα που αποτελείται από πολλούς οργανισμούς. Κατ’ αντιστοιχία μεταγονιδιωματική είναι το πεδίο που μελετά το μεταγονιδίωμα, ενώ το έως τώρα ανεξερεύνητο γενετικό υλικό περιγράφει ο όρος «σκοτεινή ύλη» του τίτλου.

Τόσο στο γονιδίωμα όσο και στο μεταγονιδίωμα υπάρχει κωδικοποιημένη η γενετική πληροφορία για τη δημιουργία πρωτεϊνών, των μορίων που εμπλέκονται στο σύνολο των βιολογικών διεργασιών. Το τιτάνιο έργο της συγκριτικής ανάλυσης των πρωτεϊνών της τεράστιας βάσης δεδομένων του εργαστηρίου του δρος Κυρπίδη ανέλαβε η διεθνής ομάδα επιστημόνων. Χωρίς υπερβολή, θα μπορούσε κανείς να πει ότι στην πραγματικότητα οι ερευνητές ανέλυσαν το πλανητικό μικροβίωμα καθώς η εν λόγω βάση δεδομένων καλύπτει κάθε γωνιά του πλανήτη. Οπως εξήγησε μιλώντας στο ΒΗΜΑ-Science ο δρ Παυλόπουλος, «αρχικά συγκρίναμε μεταξύ τους, μία προς μία, τις 8,5 περίπου δισεκατομμύρια πρωτεΐνες της βάσης. Αυτές οι μαζικά παράλληλες υπολογιστικές συγκρίσεις μάς οδήγησαν στο συμπέρασμα ότι περίπου 1,2 δισεκατομμύρια από αυτές δεν σχετίζονται με καμία πρωτεΐνη που είναι κωδικοποιημένη στα μέχρι σήμερα γνωστά ως γονιδιώματα αναφοράς».

Οικογένειες πρωτεϊνών

Με άλλα λόγια, οι ερευνητές διαπίστωσαν αρχικά την ύπαρξη τουλάχιστον 1,2 δισεκατομμυρίων άγνωστων μέχρι σήμερα πρωτεϊνών. Γιατί όμως επέλεξαν να μελετήσουν τις πρωτεΐνες; «Οι πρωτεΐνες είναι το αποτέλεσμα ενός πανάρχαιου ταξιδιού που ξεκίνησε πάνω από 3,5 δισεκατομμύρια χρόνια πριν. Αυτές οι μακρομοριακές μηχανές έχουν οργανώσει τις δομές και λειτουργίες τους από την αυγή της ζωής στη Γη. Εχουν εξελιχθεί και προσαρμοστεί για να ανταποκρίνονται στις διαρκώς μεταβαλλόμενες απαιτήσεις των ζωντανών οργανισμών» εξήγησε ο δρ Ουζούνης και πρόσθεσε: «Επιπλέον, οι πρωτεΐνες δεν είναι μεμονωμένα στοιχεία: συνιστούν περίπλοκες κοινότητες γνωστές ως οικογένειες πρωτεϊνών. Αυτές οι οικογένειες αποτελούνται από πρωτεΐνες που προέρχονται από έναν κοινό πρόγονο με παρόμοιες δομές και λειτουργίες, που χρησιμεύουν ως μαρτυρία της κοινής εξελικτικής τους κληρονομιάς».

Αναζητώντας λοιπόν τις εξελικτικές μεταξύ τους σχέσεις, οι ερευνητές ομαδοποίησαν τις άγνωστες πρωτεΐνες σε οικογένειες. «Χρησιμοποιώντας παράλληλους αλγορίθμους και πάνω από 170.000 υπολογιστικούς πυρήνες σε έναν από τους μεγαλύτερους υπερυπολογιστές του κόσμου, ομαδοποιήσαμε αυτές τις άγνωστες πρωτεϊνικές αλληλουχίες σε οικογένειες» εξήγησε ο δρ Παυλόπουλος και συνέχισε: «Για να πληροί τις προϋποθέσεις που θέσαμε ώστε να μειωθεί ο κίνδυνος λάθους, μια πρωτεϊνική οικογένεια θα έπρεπε να έχει τουλάχιστον 100 μέλη. Εντοπίσαμε έτσι περισσότερες από 100.000 νέες οικογένειες πρωτεϊνών, αριθμός αντίστοιχος με αυτόν των οικογενειών που γνωρίζαμε μέχρι σήμερα, οι οποίες προέρχονται αποκλειστικά από τα καταχωρισμένα γοδιώματα αναφοράς. Διπλασιάσαμε δηλαδή τον αριθμό των πρωτεϊνικών οικογενειών».

Απαρχή νέων ανακαλύψεων

Στη φύση οι πρωτεΐνες δεν είναι γραμμικά μόρια αλλά υιοθετούν τρισδιάστατες δομές οι οποίες υπαγορεύονται από την αλληλουχία των δομικών συστατικών τους (αμινοξέα). Ετσι, οι ερευνητές δεν αρκέστηκαν στο γεγονός ότι με τα αρχικά ευρήματά τους διπλασίασαν τον αριθμό των πρωτεϊνικών οικογενειών, αλλά θέλησαν να ελέγξουν και τη δομή τους με τη βοήθεια της τεχνητής νοημοσύνης. «Εφαρμόζοντας τη μεθοδολογία της Google DeepMind, θυγατρικής της Alphabet, υπολογίσαμε πιθανές τρισδιάστατες δομές των πρωτεϊνών και τις συγκρίναμε με όλες τις υπάρχουσες δομές του πλανήτη. Εντοπίσαμε έτσι εκατοντάδες εντελώς νέες δομές, οι οποίες αξίζει να επαληθευτούν πειραματικά» εξήγησε ο δρ Παυλόπουλος, ενώ ο δρ Κυρπίδης τόνισε ότι «η συγκεκριμένη έρευνα δεν διπλασίασε μόνο την υπάρχουσα γνώση για την ποικιλία των διαφορετικών πρωτεϊνών, αλλά και για πρώτη φορά παρέχει ποσοτικές πληροφορίες σχετικά με το μέγεθος αυτής της ποικιλομορφίας στη φύση, που ακόμα δεν έχει εξερευνηθεί πλήρως. Επιπλέον, προσφέρει πρώτες ενδείξεις σχετικά με τον πιθανό ρόλο των νέων πρωτεϊνών, το οποίο αναμένουμε να οδηγήσει σε νέες μεγάλες ανακαλύψεις και νέες βιοτεχνολογικές εφαρμογές τα επόμενα χρόνια».

Επομένως, τα αποτελέσματα του τιτάνιου έργου της ερευνητικής ομάδας δεν είναι μόνο η αποκάλυψη ενός άγνωστου πρωτεϊνικού κόσμου, πράγμα που συνεπάγεται την ύπαρξη πληθώρας άγνωστων ακόμη μικροοργανισμών, αλλά και το γεγονός ότι αποτελεί την απαρχή για αναρίθμητες νέες ερευνητικές μελέτες. Πρόκειται δηλαδή για ένα δώρο στην παγκόσμια ερευνητική κοινότητα η αξιοποίηση του οποίου θα αποδίδει καρπούς για πολλά ακόμη χρόνια.