Episódio 39 - Diagnóstico Sequencial com Modelos de Linguagem

Échec de l'ajout au panier.

Veuillez réessayer plus tard

Échec de l'ajout à la liste d'envies.

Veuillez réessayer plus tard

Échec de la suppression de la liste d’envies.

Veuillez réessayer plus tard

Échec du suivi du balado

Ne plus suivre le balado a échoué

Episódio 39 - Diagnóstico Sequencial com Modelos de Linguagem

Écouter gratuitement

Voir les détails du balado

À propos de cet audio

O artigo introduz o Sequential Diagnosis Benchmark (SDBench), uma nova plataforma que transforma 304 casos complexos do New England Journal of Medicine em simulações interativas de diagnóstico clínico para agentes de Inteligência Artificial e médicos. Diferente de avaliações estáticas, o SDBench exige que o agente diagnostique de forma iterativa, solicitando informações e exames com base no que foi aprendido, e avaliando o desempenho tanto pela precisão diagnóstica quanto pelo custo cumulativo dos exames. Para enfrentar esse desafio, o texto apresenta o MAI Diagnostic Orchestrator (MAI-DxO), um sistema que simula um painel de médicos especializados (como Dr. Hypothesis e Dr. Stewardship) para orientar o raciocínio diagnóstico e as solicitações de testes de forma estratégica. O MAI-DxO demonstrou um desempenho significativamente superior ao de modelos de linguagem prontos e de médicos experientes, alcançando maior precisão enquanto reduz drasticamente os custos, estabelecendo uma nova fronteira de eficiência no diagnóstico assistido por IA. Este trabalho propõe uma avaliação mais realista do raciocínio clínico da IA, focando na capacidade de coleta de informações e gestão de custos.
doi: O documento tem uma identificação de pré-impressão, conforme indicado no título dos excertos: 2506.22405v2 [Source metadata].

Pas encore de commentaire