Από την ιατρική έρευνα και την οικονομία μέχρι την τεχνητή νοημοσύνη και τη μελέτη του περιβάλλοντος, όλο και περισσότερα πεδία βασίζονται στην ανάλυση μεγάλων συνόλων δεδομένων. Η Στατιστική και η Επιχειρησιακή Έρευνα αξιοποιούν ισχυρά μαθηματικά μοντέλα για να μετατρέψουν αυτά τα δεδομένα σε γνώση και να υποστηρίξουν τη λήψη αποφάσεων. Στον Τομέα Στατιστικής και Επιχειρησιακής Έρευνας του Τμήματος Μαθηματικών του Πανεπιστημίου Αθηνών η έρευνα κινείται ακριβώς προς αυτή την κατεύθυνση.

Ζούμε σε μια εποχή όπου παράγεται τεράστιος όγκος δεδομένων: από ιατρικές εξετάσεις και επιδημιολογικές μελέτες μέχρι οικονομικές συναλλαγές, ψηφιακές υπηρεσίες και δορυφορικές παρατηρήσεις της Γης. Σε πολλούς τομείς της επιστήμης, της οικονομίας και της τεχνολογίας, δε, η δυνατότητα συλλογής και αποθήκευσης δεδομένων έχει αυξηθεί εντυπωσιακά τα τελευταία χρόνια. Το βασικό ερώτημα δεν είναι πλέον μόνο πώς συλλέγονται αυτά τα δεδομένα, αλλά κυρίως πώς μπορούμε να τα αναλύσουμε και να τα κατανοήσουμε ώστε να οδηγηθούμε σε αξιόπιστα συμπεράσματα και καλύτερες αποφάσεις.

Σε αυτό το σημείο συναντώνται δύο στενά συνδεδεμένοι κλάδοι των μαθηματικών: η Στατιστική και η Επιχειρησιακή Έρευνα. Η Στατιστική αναπτύσσει μεθόδους για την ανάλυση δεδομένων και την εξαγωγή συμπερασμάτων από αυτά, ενώ η Επιχειρησιακή Έρευνα κατασκευάζει μαθηματικά μοντέλα που βοηθούν στον σχεδιασμό και τη βελτιστοποίηση πολύπλοκων συστημάτων. Η θεωρία πιθανοτήτων και γενικότερα τα στοχαστικά μαθηματικά αποτελούν το κοινό μαθηματικό υπόβαθρο και των δύο περιοχών. Στην πράξη, τα δεδομένα τροφοδοτούν τα μοντέλα και τα μοντέλα βοηθούν να κατανοήσουμε καλύτερα τα δεδομένα και να πάρουμε τεκμηριωμένες αποφάσεις.

Στον Τομέα Στατιστικής και Επιχειρησιακής Έρευνας του Τμήματος Μαθηματικών εργαζόμαστε πάνω σε μια σειρά από ερευνητικά θέματα που συνδέουν τη μαθηματική θεωρία με πραγματικές εφαρμογές. Και εκεί εντάσσεται το εργαστήριο «Κέντρο Στατιστικής Υποστήριξης και Στρατηγικής Ανάπτυξης», το οποίο προωθεί τη χρήση σύγχρονων μεθόδων ανάλυσης δεδομένων και μαθηματικής μοντελοποίησης μέσα από ερευνητικές συνεργασίες και επιστημονικές δράσεις. Έρευνα και στην Ιατρική για τα δεδομένα επιστημονικών μελετών Η στατιστική έχει κεντρικό ρόλο στη βιοϊατρική έρευνα. Σε συνεργασία με την Ιατρική Σχολή του Πανεπιστημίου Αθηνών συμμετέχουμε στην ανάλυση δεδομένων από μεγάλες επιδημιολογικές μελέτες. Τι σημαίνουν τα παραπάνω; Ένα παράδειγμα αφορά τη μελέτη καρκινικών και προκαρκινικών βλαβών στον καρκίνο του στόματος, η οποία βασίζεται σε μία από τις μεγαλύτερες βάσεις δεδομένων διεθνώς για το συγκεκριμένο θέμα.

Η ανάλυση τόσο μεγάλων συνόλων δεδομένων απαιτεί σύγχρονες μεθόδους στατιστικής και μηχανικής μάθησης. Μέσα από την ανάπτυξη κατάλληλων μοντέλων προσπαθούμε να κατανοήσουμε καλύτερα την εξέλιξη της νόσου, να εντοπίσουμε παράγοντες κινδύνου και να προβλέψουμε την πορεία της σε διαφορετικές ομάδες ασθενών. Παράλληλα αναπτύσσουμε στατιστικά μοντέλα για την ανάλυση δεδομένων επιβίωσης και δεδομένων επαναλαμβανόμενων μετρήσεων ασθενών. Σε τέτοιες μελέτες παρακολουθούμε την εξέλιξη ενός βιολογικού δείκτη σε συνάρτηση με διάφορους παράγοντες κινδύνου, με στόχο την πρόγνωση σημαντικών γεγονότων στην πορεία μιας ασθένειας, όπως για παράδειγμα στη μελέτη της εξέλιξης των CD4 λεμφοκυττάρων – κυττάρων που παίζουν βασικό ρόλο στη λειτουργία του ανοσοποιητικού συστήματος – σε ασθενείς με HIV πριν από την έναρξη θεραπείας. Στο πλαίσιο αυτής της έρευνας αναπτύσσονται επίσης μέθοδοι επιλογής κατάλληλων μοντέλων ώστε οι αναλύσεις να ανταποκρίνονται καλύτερα στις πραγματικές συνθήκες των δεδομένων. Για παράδειγμα, λαμβάνονται υπόψη φαινόμενα όπως η αποχώρηση ασθενών από μια μελέτη ή η ύπαρξη διαφορετικών ανταγωνιστικών κινδύνων που μπορεί να επηρεάζουν την εξέλιξη της ασθένειας.

Κινητικότητα, ψυχολογία αλλά και νόσος του Πάρκινσον

Η στατιστική ανάλυση αποτελεί επίσης βασικό εργαλείο στην αξιολόγηση κλινικών δοκιμών. Ένα χαρακτηριστικό παράδειγμα είναι κλινική δοκιμή που μελετά την επίδραση θεραπευτικού χορού – διά ζώσης ή διαδικτυακά – στην κινητικότητα, την ψυχολογία και τον χρόνιο πόνο ασθενών με τη νευροεκφυλιστική νόσο του Πάρκινσον.

Η ανάλυση δεδομένων χρησιμοποιείται επίσης στη γεωργία και την περιβαλλοντική επιστήμη. Αναπτύσσουμε μαθηματικά και στατιστικά μοντέλα για τη μελέτη της ανάπτυξης φυτών, την παρακολούθηση καλλιεργειών μέσω δορυφορικών δεδομένων και την ανάλυση δασικών οικοσυστημάτων. Τα δεδομένα αυτά συχνά προέρχονται από τηλεπισκόπηση και αισθητήρες πεδίου. Με τη βοήθεια χωρικών στατιστικών μοντέλων και τεχνικών μηχανικής μάθησης μπορούμε να εξάγουμε χρήσιμη πληροφορία για πρακτικά προβλήματα, όπως η πρόβλεψη της κατανάλωσης νερού σε θερμοκήπια ή η παρακολούθηση της εξέλιξης καλλιεργειών σε μεγάλη κλίμακα.

Παρόμοιες μέθοδοι εφαρμόζονται και σε πολλούς άλλους επιστημονικούς τομείς. Στην αρχαιομετρία εφαρμόζονται τεχνικές στατιστικής και μηχανικής μάθησης για την κατηγοριοποίηση αρχαιολογικών ευρημάτων με βάση χημικές μετρήσεις, ενώ στην οικονομετρία αναπτύσσονται μοντέλα για την ανάλυση οικονομικών και χρηματοοικονομικών δεδομένων και για τη μελέτη σύνθετων οικονομικών δεικτών.

Η ανάλυση δεδομένων όμως δεν είναι αυτοσκοπός. Συχνά τα δεδομένα χρησιμοποιούνται για να κατασκευαστούν ή να βελτιωθούν μαθηματικά μοντέλα που περιγράφουν τη λειτουργία πραγματικών συστημάτων. Τα μοντέλα αυτά επιτρέπουν όχι μόνο την κατανόηση της συμπεριφοράς ενός συστήματος αλλά και τον καλύτερο σχεδιασμό του. Ένα τέτοιο πλαίσιο είναι τα συστήματα υπηρεσιών, όπου πολλοί χρήστες ζητούν ταυτόχρονα μια υπηρεσία, όπως συμβαίνει σε νοσοκομεία, δίκτυα μεταφορών ή ψηφιακές πλατφόρμες. Σε αυτές τις περιπτώσεις δημιουργούνται ουρές αναμονής και η συμπεριφορά των χρηστών επηρεάζει τη συνολική λειτουργία του συστήματος. Μελετούμε μαθηματικά μοντέλα ουρών αναμονής στα οποία οι χρήστες λαμβάνουν αποφάσεις ανάλογα με τον χρόνο αναμονής ή την ποιότητα της υπηρεσίας. Τα δεδομένα που συλλέγονται από τη λειτουργία τέτοιων συστημάτων – για παράδειγμα για τους χρόνους εξυπηρέτησης ή τις αφίξεις χρηστών – βοηθούν στην ανάπτυξη πιο ρεαλιστικών μοντέλων και στον καλύτερο σχεδιασμό της λειτουργίας τους.

Σε ένα περιβάλλον που διαρκώς μεταβάλλεται

Η ανάπτυξη συστημάτων τεχνητής νοημοσύνης βασίζεται σε αλγορίθμους μάθησης που επιλύουν προβλήματα βελτιστοποίησης μεγάλης κλίμακας. Μελετούμε τη θεωρητική συμπεριφορά τέτοιων αλγορίθμων ώστε να κατανοήσουμε καλύτερα πώς εκπαιδεύονται τα νευρωνικά δίκτυα και πώς μπορούν να λειτουργούν αποτελεσματικά σε πολύπλοκα και μεταβαλλόμενα περιβάλλοντα. Αυτό συμβάλλει στην ανάπτυξη πιο αξιόπιστων και αποδοτικών συστημάτων τεχνητής νοημοσύνης που βασίζονται στην επεξεργασία μεγάλων συνόλων δεδομένων.