Dai chatbot medici alle malattie inventate: perché fidarsi troppo dell’IA può diventare un problema
- Uno studio guidato dall’Harbor-UCLA Medical Center ha rilevato che quasi il 50% delle risposte mediche fornite dai chatbot IA è problematico
- I ricercatori hanno testato strumenti come ChatGPT, Gemini, Meta AI, Grok e DeepSeek con domande su cancro, vaccini, nutrizione e cellule staminali
- Il caso della falsa malattia “Bixonimania” ha mostrato come alcune IA abbiano trattato come reale una patologia completamente inventata
- Le risposte più problematiche riguardavano nutrizione, prestazioni atletiche e cellule staminali
- Secondo gli studiosi, utilizzare chatbot per diagnosi o consigli sanitari può amplificare la disinformazione medica
Chiedere un consiglio medico a un chatbot sta diventando sempre più comune. C’è chi carica sintomi, chi cerca diagnosi lampo e chi domanda persino quali farmaci assumere. Il problema è che l’Intelligenza Artificiale, almeno per ora, sembra cavarsela molto meglio con le email che con la salute delle persone.
Uno studio guidato dall’Harbor-UCLA Medical Center e pubblicato su BMJ Open ha acceso un campanello d’allarme piuttosto serio: quasi una risposta su due fornita dai principali chatbot IA in ambito medico è risultata problematica, fuorviante o addirittura potenzialmente dannosa. Non esattamente quello che si vorrebbe leggere dopo aver digitato “mal di testa persistente” alle due di notte.
Il caso della malattia che non esisteva
Tra gli episodi più surreali emersi nello studio c’è quello della cosiddetta “Bixonimania”, una falsa malattia inventata apposta da alcuni ricercatori per verificare quanto facilmente le IA potessero essere ingannate. Sono stati pubblicati due falsi preprint scientifici e, nel giro di poco tempo, chatbot come ChatGPT, Gemini, Copilot e Perplexity hanno iniziato a descrivere la patologia come reale.
Non solo: alcuni sistemi collegavano la presunta malattia alla luce blu degli schermi, elencavano sintomi dettagliati e consigliavano perfino visite specialistiche. Perplexity si era spinta oltre, stimando addirittura una prevalenza di un caso ogni 90 mila persone. La situazione è diventata ancora più paradossale quando la falsa patologia è finita anche in un articolo scientifico pubblicato realmente e poi ritirato.
Le domande “trabocchetto” ai chatbot
Per testare l’affidabilità delle IA, i ricercatori hanno utilizzato una tecnica chiamata Adversarial Machine Learning, cioè un metodo pensato proprio per mettere in difficoltà i modelli artificiali attraverso domande studiate per provocare errori. Sono stati coinvolti cinque chatbot: ChatGPT, Gemini, Meta AI, Grok e DeepSeek. Le domande riguardavano temi molto delicati come vaccini, cancro, nutrizione, cellule staminali e prestazioni atletiche.
Due esperti per ciascun settore hanno poi valutato le risposte ricevute. Il risultato? Il 49,6% delle risposte è stato classificato come problematico. Il 30% “in qualche modo problematico”, mentre quasi il 20% addirittura “altamente problematico”. Grok è stato il chatbot che ha prodotto il maggior numero di contenuti gravemente inaffidabili.
Fonti inventate e consigli da prendere con cautela
A preoccupare gli studiosi non sono state solo le risposte sbagliate, ma anche le cosiddette allucinazioni dell’IA: citazioni scientifiche inesistenti, fonti incomplete e riferimenti bibliografici inventati. La completezza media delle fonti si è fermata attorno al 40%, un dato molto basso per argomenti che riguardano la salute.
Leggi anche: A 14 anni sviluppa un’app basata sull’IA che rileva le malattie cardiache in pochi secondi
Le performance migliori sono arrivate sui vaccini e sul cancro, mentre nutrizione, cellule staminali e performance sportive si sono rivelati i terreni più fragili. In pratica, l’IA tende a sembrare molto sicura anche quando sta sbagliando completamente. Ed è proprio questo il punto più delicato: i chatbot riescono spesso a scrivere risposte convincenti, ordinate e credibili. Ma una frase detta con sicurezza non diventa automaticamente corretta, soprattutto quando si parla di medicina.

La redazione di commentimemorabili.it si impegna contro la divulgazione di fake news. La veridicità delle informazioni riportate su commentimemorabili.it viene preventivamente verificata tramite la consultazione di altre fonti.
Questo articolo è stato verificato con:
- https://www.greenme.it/salute-e-alimentazione/salute/diagnosi-tramite-intelligenza-artificiale-errori/
- https://bmjopen.bmj.com/content/16/4/e112695
- https://pubmed.ncbi.nlm.nih.gov/41980854/
developed by Digitrend