Diagnosi con l’IA? Uno studio lancia l’allarme: quasi una risposta su due è sbagliata o fuorviante

Commenti Memorabili CM

Diagnosi con l’IA? Uno studio lancia l’allarme: quasi una risposta su due è sbagliata o fuorviante

| 12/06/2026
Fonte: Pexels

Dai chatbot medici alle malattie inventate: perché fidarsi troppo dell’IA può diventare un problema

  • Uno studio guidato dall’Harbor-UCLA Medical Center ha rilevato che quasi il 50% delle risposte mediche fornite dai chatbot IA è problematico
  • I ricercatori hanno testato strumenti come ChatGPT, Gemini, Meta AI, Grok e DeepSeek con domande su cancro, vaccini, nutrizione e cellule staminali
  • Il caso della falsa malattia “Bixonimania” ha mostrato come alcune IA abbiano trattato come reale una patologia completamente inventata
  • Le risposte più problematiche riguardavano nutrizione, prestazioni atletiche e cellule staminali
  • Secondo gli studiosi, utilizzare chatbot per diagnosi o consigli sanitari può amplificare la disinformazione medica

  

Chiedere un consiglio medico a un chatbot sta diventando sempre più comune. C’è chi carica sintomi, chi cerca diagnosi lampo e chi domanda persino quali farmaci assumere. Il problema è che l’Intelligenza Artificiale, almeno per ora, sembra cavarsela molto meglio con le email che con la salute delle persone.

Uno studio guidato dall’Harbor-UCLA Medical Center e pubblicato su BMJ Open ha acceso un campanello d’allarme piuttosto serio: quasi una risposta su due fornita dai principali chatbot IA in ambito medico è risultata problematica, fuorviante o addirittura potenzialmente dannosa. Non esattamente quello che si vorrebbe leggere dopo aver digitato “mal di testa persistente” alle due di notte.

Il caso della malattia che non esisteva

Tra gli episodi più surreali emersi nello studio c’è quello della cosiddetta “Bixonimania”, una falsa malattia inventata apposta da alcuni ricercatori per verificare quanto facilmente le IA potessero essere ingannate. Sono stati pubblicati due falsi preprint scientifici e, nel giro di poco tempo, chatbot come ChatGPT, Gemini, Copilot e Perplexity hanno iniziato a descrivere la patologia come reale.

Non solo: alcuni sistemi collegavano la presunta malattia alla luce blu degli schermi, elencavano sintomi dettagliati e consigliavano perfino visite specialistiche. Perplexity si era spinta oltre, stimando addirittura una prevalenza di un caso ogni 90 mila persone. La situazione è diventata ancora più paradossale quando la falsa patologia è finita anche in un articolo scientifico pubblicato realmente e poi ritirato.

Le domande “trabocchetto” ai chatbot

Per testare l’affidabilità delle IA, i ricercatori hanno utilizzato una tecnica chiamata Adversarial Machine Learning, cioè un metodo pensato proprio per mettere in difficoltà i modelli artificiali attraverso domande studiate per provocare errori. Sono stati coinvolti cinque chatbot: ChatGPT, Gemini, Meta AI, Grok e DeepSeek. Le domande riguardavano temi molto delicati come vaccini, cancro, nutrizione, cellule staminali e prestazioni atletiche.

Due esperti per ciascun settore hanno poi valutato le risposte ricevute. Il risultato? Il 49,6% delle risposte è stato classificato come problematico. Il 30% “in qualche modo problematico”, mentre quasi il 20% addirittura “altamente problematico”. Grok è stato il chatbot che ha prodotto il maggior numero di contenuti gravemente inaffidabili.

Fonti inventate e consigli da prendere con cautela

A preoccupare gli studiosi non sono state solo le risposte sbagliate, ma anche le cosiddette allucinazioni dell’IA: citazioni scientifiche inesistenti, fonti incomplete e riferimenti bibliografici inventati. La completezza media delle fonti si è fermata attorno al 40%, un dato molto basso per argomenti che riguardano la salute.

Leggi anche: A 14 anni sviluppa un’app basata sull’IA che rileva le malattie cardiache in pochi secondi

Le performance migliori sono arrivate sui vaccini e sul cancro, mentre nutrizione, cellule staminali e performance sportive si sono rivelati i terreni più fragili. In pratica, l’IA tende a sembrare molto sicura anche quando sta sbagliando completamente. Ed è proprio questo il punto più delicato: i chatbot riescono spesso a scrivere risposte convincenti, ordinate e credibili. Ma una frase detta con sicurezza non diventa automaticamente corretta, soprattutto quando si parla di medicina.

logo-img
La redazione di commentimemorabili.it si impegna contro la divulgazione di fake news. La veridicità delle informazioni riportate su commentimemorabili.it viene preventivamente verificata tramite la consultazione di altre fonti.
Questo articolo è stato verificato con:
Chiedi la correzione di questo articoloValuta il titolo di questa notizia
Copyright © 2018 - Commenti Memorabili srl
P. IVA 11414940012

digitrend developed by Digitrend