A Microsoft revelou, na segunda-feira (30), detalhes do seu sistema de inteligência artificial (IA) inédito, o Microsoft AI Diagnostic Orchestrator (MAI-DxO), que promete ser mais eficiente do que médicos humanos no diagnóstico de quadros de saúde complexos. Em testes, a equipe demonstrou que a ferramenta também é capaz de chegar ao reconhecimento correto das doenças de forma mais econômica do que os profissionais de carne e osso.
Em nota, a empresa indica que o serviço demonstrou uma taxa de acerto de 85% nos experimentos de identificação de doenças, a partir de casos descritos em 304 artigos recentes do artigo científico New England Journal of Medicine. Esse valor expressivo é 4,25 vezes maior do que aquele apresentado pelo grupo controle, formado por um conjunto de médicos experientes (20%).
Por mais que destaque o potencial do serviço, a gigante de tecnologia minimiza as suas implicações para o emprego, dizendo acreditar que a IA complementaria as funções dos médicos, não as substituiria: “Os papéis clínicos são muito mais amplos do que simplesmente fazer um diagnóstico. Eles precisam navegar pela ambiguidade e construir confiança com os pacientes e suas famílias de uma forma que a IA não foi criada para fazer”.
Desenvolvimento do sistema
À medida que a demanda por saúde continua a crescer, os custos aumentam a um ritmo insustentável, e bilhões de pessoas enfrentam múltiplas barreiras para uma saúde melhor – incluindo diagnósticos imprecisos e tardios. Cada vez mais, as pessoas estão recorrendo a ferramentas digitais para aconselhamento e suporte médico. Dados da própria Microsoft apontam que mais de 50 milhões de buscas são feitas todos os dias nesse sentido.
“De uma primeira consulta sobre dor no joelho a uma busca noturna por uma clínica de atendimento de urgência, mecanismos de busca e companheiros de IA estão rapidamente se tornando a nova linha de frente na área da saúde”, escreve a empresa. Foi pensando nisso que a Microsoft passou a investir de forma mais intensa em soluções para aprimorar os serviços do ramo.
Em apenas três anos, a IA generativa avançou a ponto de alcançar pontuações quase perfeitas no Exame de Licenciamento Médico dos Estados Unidos (USMLE), uma avaliação rigorosa e padronizada do conhecimento clínico e da tomada de decisões. Mas esse teste se baseia principalmente em questões de múltipla escolha, que privilegiam a memorização em detrimento da compreensão profunda.
Para a equipe da Microsoft, ao reduzir a medicina a respostas únicas em questões de múltipla escolha, esses parâmetros superestimam a aparente competência dos sistemas de IA e obscurecem suas limitações. Assim, de forma a superar as limitações das questões de múltipla escolha, os especialistas focaram no diagnóstico sequencial.
Nesse processo, o médico começa com uma apresentação inicial do paciente e, em seguida, seleciona perguntas e testes diagnósticos para chegar ao diagnóstico final. Por exemplo, um paciente com tosse e febre pode levar o médico a solicitar e revisar exames de sangue e uma radiografia de tórax antes de se sentir confiante para diagnosticar pneumonia.
Experimento de diagnóstico
Com isso em mente, aproveitou-se das publicações semanais do New England Journal of Medicine, que apresenta as jornadas de cuidado de centenas de pacientes em um formato narrativo detalhado, para verificar o potencial da IA em seguir as etapas do processo de diagnóstico sequencial. Mais de 304 casos foram avaliados pela máquina ou por um médico, que podiam ainda fazer perguntas e solicitar exames.
À medida que novas informações se tornam disponíveis, era esperado que o modelo ou o clínico atualizasse seu raciocínio, aproximando-se gradualmente de um diagnóstico final. Esse diagnóstico pode então ser comparado ao resultado padrão-ouro publicado no periódico pelos especialistas responsáveis pela observação do caso real.
Cada investigação solicitada também incorre em um custo (virtual), que reflete os gastos reais com saúde. Isso permitiu aos pesquisadores da Microsoft avaliar o desempenho tanto na precisão diagnóstica quanto no gasto de recursos.
Eficiência de MAI-DxO
Durante sua execução, o MAI-DxO consulta vários modelos líderes de IA, que incluem o GPT da OpenAI, o Gemini do Google, o Claude da Anthropic, o Llama da Meta e o Grok da xAI. Essa forma de funcionamento imita vagamente a maneira como vários especialistas humanos trabalham juntos nos hospitais.
Na comparação dos diagnósticos encontrados pela IA e aqueles apontados no novo estudo, os pesquisadores verificaram que o MAI-DxO resolveu corretamente 85,5% dos casos. Em paralelo, a equipe formada por 21 médicos atuantes nos Estados Unidos e no Reino Unido, cada um com cinco a 20 anos de experiência clínica, alcançou uma precisão média de apenas 20% nos casos.
Como o sistema de IA é configurável, permitindo que opere dentro de restrições de custo definidas, foi possível programá-lo para conduzir sua investigação dos casos de maneira a considerar o custo-benefício dos exames. Assim, ao invés de solicitar todos os testes possíveis – independentemente do custo, do desconforto do paciente ou dos atrasos no atendimento – o MAI-DxO pediu apenas aqueles de maior precisão diagnóstica e menores custos gerais.
Futuro do sistema
A partir de seus testes, a Microsoft destaca que o MAI-DxO tem um grande potencial a explorar. “Nenhum médico consegue abranger toda a complexidade da série de casos do New England Journal of Medicine, a IA, por outro lado, não enfrenta esse dilema. Ela pode combinar amplitude e profundidade de expertise, demonstrando capacidades de raciocínio clínico que, em muitos aspectos do raciocínio clínico, excedem as de qualquer médico individualmente”, pondera em nota.
Isso, porém, não quer dizer que a tecnologia poderá substituir a mão de obra humana. Pelo contrário, o raciocínio artificial tem o potencial de remodelar a saúde, conforme capacita os pacientes a autogerenciar aspectos rotineiros do atendimento e equipa os médicos com suporte avançado à decisão para casos complexos.
“É claro que nossa pesquisa apresenta limitações importantes”, lembram os responsáveis. “Embora o MAI-DxO se destaque em lidar com os desafios diagnósticos mais complexos, são necessários mais testes para avaliar seu desempenho em apresentações mais comuns e cotidianas”. Ou seja: a IA, sozinha, ainda não é capaz de diagnosticar e dar um encaminhamento para pacientes humanos.
Outro aspecto inovador do trabalho é a atenção dada aos custos. Por mais que os custos reais da saúde variem entre regiões e sistemas, a metodologia utilizada serve para ajudar a quantificar as compensações de alto nível entre a precisão diagnóstica e o uso de recursos.
“Ainda existem desafios importantes antes que a IA generativa possa ser implantada com segurança e responsabilidade na área da saúde”, conclui a empresa. “Mas, para nós, este é apenas o primeiro passo. Estamos animados com as oportunidades que temos pela frente”.
Fonte: Revista Galileu