94% de Acurácia, Mas Alucinações Persistem — O Que 67 Estudos Revelam Sobre LLMs em Laudos Radiológicos

A evidência acumulada nos 67 estudos aponta para uma conclusão inequívoca: LLMs são ferramentas poderosas quando utilizadas em tarefas bem definidas, com supervisão humana e com consciência de suas limitações. São perigosos quando tratados como oráculos.

Para o radiologista na prática diária, três princípios emergem desta revisão:

Utilize LLMs para automatizar tarefas repetitivas e estruturadas — simplificação, formatação, vocabulário padronizado. Não delegue o julgamento diagnóstico a um modelo que não entende o que está dizendo.

Todo texto gerado por LLM deve ser tratado como rascunho, não como produto final. A fluência linguística não é indicador de acurácia factual. Revise cada achado, cada medida, cada recomendação.

LLMs treinados ou fine-tuned especificamente para radiologia demonstram melhor performance e menor taxa de alucinações domínio-específicas do que modelos generalistas. Priorize ferramentas desenvolvidas para o contexto radiológico.

"A melhor IA para radiologia não é a que gera o laudo mais bonito. É a que potencializa a capacidade do radiologista sem nunca deixá-lo esquecer que a responsabilidade final é dele."

Fluxo atual

Voz natural

O radiologista fala os achados como pensa; a plataforma organiza estrutura, pontuação e revisão.

Laudo estruturado

Templates e campos preservam padrão por modalidade sem bloquear edição médica antes da assinatura.

Governança

A adoção real depende de acesso, auditoria, LGPD, integrações e rastreabilidade operacional.

LLMs em Laudos Radiológicos: O Que 67 Estudos Revelam Sobre GPT-4 e Alucinações

Voz natural

Laudo estruturado

Governança