Το ανοιχτό λογισμικό Τεχνητής Νοημοσύνης ChatGPT είχε αντίστοιχες επιδόσεις με τους καλά εκπαιδευμένους γιατρούς στο να δίνει πιθανές διαγνώσεις σχετικά με ασθενείς που κατέφυγαν σε Τμήμα Επειγόντων Περιστατικών (ΤΕΠ) ολλανδικού νοσοκομείου. Αυτό έδειξε πιλοτική μελέτη η οποία αναμένεται να παρουσιαστεί στο Ευρωπαϊκό Συνέδριο Επείγουσας Ιατρικής (EUSEM) το οποίο ξεκινά το ερχόμενο Σάββατο στη Βαρκελώνη.

Η μελέτη η οποία δημοσιεύεται επίσης αυτόν τον μήνα στο επιστημονικό περιοδικό «Annals of Emergeny Medicine» διεξήχθη από τον δρα Χίντε τεν Μπεργκ από το Τμήμα Επείγουσας Ιατρικής και τον δρα Στεφ Kούρστιενς από το Τμήμα Κλινικής Χημείας και Αιματολογίας του Νοσοκομείου Jeroen Bosch στην Ολλανδία.

O ένας εκ των δύο επικεφαλής της μελέτης, Χίντε τεν Μπεργκ από το Τμήμα Επείγουσας Ιατρικής του Νοσοκομείου Jeroen Bosch στην Ολλανδία.
Credit: Hidde ten Berg/EUSEM

Συγκριτική μελέτη

Οπως ανέφερε δρ τεν Μπεργκ «όπως συμβαίνει με πολλούς ανθρώπους δοκιμάζαμε το ChatGPT και θελήσαμε να δούμε πόσο καλά αποδίδει σε ορισμένες πολύπλοκες περιπτώσεις διάγνωσης. Ετσι σχεδιάσαμε μια μελέτη προκειμένου να αξιολογήσουμε πόσο καλά μπορεί να εργαστεί το chatbot σε σύγκριση με τους γιατρούς σε ό,τι αφορά περιστατικά επείγουσας ιατρικής».

Στη μελέτη περιελήφθησαν στοιχεία σχετικά με 30 ασθενείς οι οποίοι έλαβαν φροντίδα στο ΤΕΠ του Νοσοκομείου Jeroen Bosch το 2022. Οι ερευνητές εισήγαγαν τις σημειώσεις των γιατρών που περιέθαλψαν τους ασθενείς σε ό,τι αφορούσε τα συμπτώματά τους αλλά και τις κλινικές εξετάσεις που διεξήγαγαν σε δύο εκδόσεις του ChatGPT (τη δωρεάν

έκδοση 3.5 και την έκδοση 4.0 που απευθύνεται σε συνδρομητές). Για κάθε περιστατικό, συγκρίθηκε η λίστα των πιθανών διαγνώσεων που έκανε το chatbot με τη λίστα που είχαν κάνει οι γιατροί καθώς και με την τελική σωστή διάγνωση που έγινε στον κάθε ασθενή.

Μεγάλη αλληλοεπικάλυψη

Οι ερευνητές εντόπισαν μεγάλη αλληλοεπικάλυψη (της τάξεως του 60%) μεταξύ των δύο λιστών – του ChatGPT και των γιατρών. Συγκεκριμένα οι γιατροί περιελάμβαναν τη σωστή διάγνωση στο τοπ 5 των πιθανών διαγνώσεών τους στο 87% των περιπτώσεων ενώ το ChatGPT (έκδοση 3.5) στο 97% των περιπτώσεων και στο 87% των περιπτώσεων στην έκδοση 4.0.

Διάγνωση από το chatbot όπως από τον γιατρό

Ο δρ τεν Μπεργκ σημείωσε ότι «ανακαλύψαμε πως το ChatGPT είχε καλή επίδοση στη δημιουργία μιας λίστας πιθανών διαγνώσεων καθώς και στο να προτείνει την πιο πιθανή σωστή επιλογή. Ανακαλύψαμε επίσης μεγάλη αλληλοεπικάλυψη μεταξύ της λίστας του ChatGPT και εκείνης των πιθανών διαγνώσεων που είχαν κάνει οι γιατροί. Με απλά λόγια αυτά τα αποτελέσματα μαρτυρούν ότι το ChatGPT ήταν σε θέση να κάνει ιατρική διάγνωση όπως θα την έκανε ένας γιατρός».

Υπεροχή του chatbot στη διάγνωση περιστατικού

Ο ερευνητής έδωσε μάλιστα το ακόλουθο παράδειγμα το οποίο αποδεικνύει την καλή… διαγνωστική δουλειά του chatbot. «Περιλάβαμε στη μελέτη την περίπτωση ενός ασθενούς που προσήλθε στο ΤΕΠ με πόνο

στις αρθρώσεις ο οποίος περνούσε με παυσίπονα. Ωστόσο η ερυθρότητα, οι πόνοι των αρθρώσεων και το οίδημα συνεχώς επανεμφανίζονταν. Τις ημέρες πριν από την επίσκεψη στο νοσοκομείο ο ασθενής είχε πυρετό και πονόλαιμο ενώ κάποιες φορές είχε εμφανίσει αποχρωματισμό στις άκρες των δαχτύλων του. Με βάση την κλινική εξέταση και επιπρόσθετες εξετάσεις, οι γιατροί υπέθεσαν ότι η πιο πιθανή διάγνωση ήταν ο ρευματικός πυρετός. Ωστόσο το ChatGPT ήταν τελικώς το σωστό καθώς έδωσε ως πιο πιθανή διάγνωση την αγγειίτιδα».

Στόχος η ΑΙ βοήθεια προς τους γιατρούς

Κλείνοντας ο δρ τεν Μπεργκ τόνισε ότι είναι ζωτικής σημασίας το να θυμόμαστε πως το ChatGPT δεν είναι ιατρικό εργαλείο καθώς και ότι υπάρχουν φόβοι σε ό,τι αφορά τα θέματα προστασίας των προσωπικών δεδομένων όταν το chatbot χρησιμοποιεί ιατρικά δεδομένα ανθρώπων. «Ωστόσο υπάρχει δυναμική για εξοικονόμηση χρόνου και μείωση της αναμονής στα ΤΕΠ. Το όφελος από τη χρήση της Τεχνητής Νοημοσύνης μπορεί να είναι σημαντικό για γιατρούς με λιγότερη κλινική εμπειρία ή για τον εντοπισμό σπανίων νόσων».