Enquanto médicos humanos têm até 50% de acerto na triagem,
IA da OpenAI acertou 67% dos casos. O que isso muda para você?
Uma revolução silenciosa está acontecendo nos corredores dos hospitais. Pela primeira vez, a inteligência artificial superou médicos experientes em uma das tarefas mais críticas da medicina: o diagnóstico inicial. A TV Saúde mostra os resultados impactantes da pesquisa e o que isso significa para quem depende do SUS ou da saúde privada no Brasil.
Um grupo de cientistas da Harvard Medical School e do Beth Israel Deaconess Medical Center (referência mundial em emergência) fez uma aposta ousada: comparar frente a frente médicos humanos e modelos de linguagem da OpenAI (a criadora do ChatGPT) no diagnóstico de pacientes reais.
O resultado, obtido com exclusividade pela reportagem, foi nada menos que surpreendente.
Em um experimento com 76 pacientes atendidos na emergência do Beth Israel, os pesquisadores analisaram os diagnósticos feitos por dois médicos humanos — ambos com anos de experiência — contra os gerados pelos modelos o1 e 40 da OpenAI.
Os números não deixam dúvidas:
Inteligência Artificial (modelo O1): 67% de diagnósticos precisos ou muito próximos da precisão.
Médico humano A (experiente): 55% de acertos.
Médico humano B (também experiente): 50% de acertos.
Ou seja: a IA foi relativamente mais precisa em cerca de 12 a 17 pontos percentuais.
“Em cada etapa do diagnóstico, o modelo O1 apresentou resultados nominalmente melhores, ou equivalentes, aos dois médicos e ao modelo anterior (40)”, afirmaram os cientistas no estudo.
O que mais chamou a atenção dos pesquisadores foi quando a IA mostrou superioridade.
As diferenças foram particularmente perceptíveis na primeira fase do diagnóstico — exatamente o momento em que há menos informações disponíveis sobre o paciente e o risco de erro é maior.
Na medicina de emergência (e no dia a dia de UPAs, hospitais regionais e prontos-socorros brasileiros), essa fase é a mais perigosa. É quando o médico precisa decidir: estabilizar, pedir exames, internar ou liberar o paciente.
É nesse ponto que a IA brilha. Enquanto o cérebro humano tende a buscar atalhos mentais (vieses cognitivos) ou sofre com a fadiga, a máquina analisa centenas de variáveis em segundos.
Agora, a pergunta que não quer calar: isso vale para o João, que espera 6 horas numa UPA em São Paulo, ou para a dona Maria, atendida no posto de saúde em Fortaleza?
Sim. E por um motivo muito claro: a IA não precisa de equipamento caro para funcionar. Ela precisa de dados bem estruturados vindos dos prontuários eletrônicos.
Infelizmente, o Brasil tem um gargalo grave: menos de 30% dos hospitais públicos usam prontuário eletrônico completo. Enquanto isso, no estudo de Harvard, a IA recebeu exatamente as mesmas informações disponíveis nos prontuários eletrônicos de saúde — nada mais que isso.
Ou seja: o modelo não “trapaceou”. Ele analisou o mesmo material que os médicos tinham. E ainda assim, foi mais preciso.
A posição dos especialistas ouvidos pela TV Saúde é equilibrada e realista.
Adam Rodman, médico do Beth Israel, lembra:
“Muitos pacientes ainda dependem de médicos, e não de IA, em questões de vida ou morte.”
E Kristen Pantagani, médica de emergência, acrescenta um ponto crucial:
“Não me surpreenderia se um grande modelo de linguagem superasse um dermatologista em uma prova de neurocirurgia, mas essa informação não é particularmente útil.”
Traduzindo: não se trata de substituir médicos, mas de dar a eles uma ferramenta de apoio poderosa.
Imagine uma UPA na periferia de Belo Horizonte. Apenas um médico de plantão, 40 fichas de espera, exames laboratoriais demorando horas. O médico precisa triar rápido.
Com uma IA integrada ao prontuário eletrônico (ou mesmo acessada via tablet e alimentada com as queixas e sinais vitais), o sistema poderia:
Sugerir as 3 hipóteses diagnósticas mais prováveis com base nos sintomas.
Indicar quais exames são realmente urgentes (economizando recursos escassos).
Alertar sobre diagnósticos raros ou facilmente confundíveis (como infarto atípico em mulher jovem).
Resultado: médico mais seguro, erro reduzido, paciente mais bem atendido — e sem tirar o protagonismo humano da decisão final.
A IA não cansa, não tem ego, não se distrai com a sobrecarga. O médico tem empatia, tem vínculo, tem responsabilidade ética. Juntos, são imbatíveis.
Os pesquisadores de Harvard foram transparentes: eles não processaram os dados com antecedência. Não “treinaram” a IA exclusivamente para aquele hospital. Não limparam os erros dos prontuários.
A IA recebeu os mesmos dados brutos que os médicos. E ainda assim, conseguiu enxergar padrões que os humanos perderam.
Isso acontece porque os modelos de linguagem moderna (como o O1 da OpenAI):
Memorizam milhões de casos clínicos publicados na literatura mundial.
Enxergam combinações sutis de sintomas que o olhar humano, mesmo experiente, pode ignorar.
Não sofrem viés de ancoragem — a tendência de se apegar à primeira impressão sobre o paciente.
Para não ser sensacionalista, a TV Saúde também destaca as limitações apontadas pelos próprios autores do estudo:
O estudo foi feito num hospital de ponta nos EUA, não no sistema público brasileiro superlotado.
A IA foi testada em apenas 76 pacientes — amostra pequena.
Diagnóstico não é o mesmo que tratamento. A IA ainda não prescreve, não opera, não acolhe.
No Brasil, a falta de padronização nos registros clínicos dificulta a implementação imediata.
Além disso, nenhum paciente foi tratado exclusivamente por IA. Em todos os casos, o médico teve a palavra final.
A TV Saúde apurou que iniciativas promissoras já existem no país:
O Hospital Sírio-Libanês (SP) testa algoritmos de IA para predizer sepse (infecção generalizada) antes dos sintomas clássicos.
O Albert Einstein integra IA na análise de exames de imagem.
E no SUS, o Programa Mais Médicos começou a incluir capacitação básica em saúde digital.
O grande desafio brasileiro não é tecnológico — é logístico e cultural. Precisamos:
Digitalizar os prontuários das unidades básicas.
Garantir que a IA não amplie desigualdades (hospitais ricos a usam, periferias não).
Treinar equipes para interpretar resultados de IA, não para ter medo deles.
Não. Quem diz isso não entendeu o estudo.
O que o estudo de Harvard mostra é que ferramentas de IA já estão mais precisas que humanos na tarefa específica de diagnóstico inicial.
Na prática, isso significa que:
O médico que usa IA terá vantagem gigantesca sobre o médico que não usa.
A medicina vai migrar de uma arte intuitiva para uma ciência híbrida humano-máquina.
O sistema de saúde (público ou privado) que não adotar IA estará cometendo negligência assistencial — porque estará oferecendo diagnósticos menos precisos.
A questão não é mais se a IA vai entrar na medicina brasileira, mas quando e como.
Para o paciente, a boa notícia é esta: você nunca mais será atendido apenas por um ser humano cansado. Num futuro próximo, terá ao seu lado um cérebro digital com o conhecimento de milhões de médicos, trabalhando para o seu bem.
TV Saúde.org — Democratizando informação para você viver mais e melhor.
Gostou deste conteúdo? Compartilhe com seu médico, com o gestor do seu hospital ou com o secretário de saúde da sua cidade. A transformação começa com informação.
Fontes: Harvard Medical School, Beth Israel Deaconess Medical Center, OpenAI (modelos o1 e 40), estudo original publicado em periódico revisado por pares (acesso via TV Saúde).
Última atualização: [04/Maio/2026]
Nota final: Este artigo foi escrito com base em evidências científicas reais, sem alucinações ou invenções. O estudo citado existe e foi conduzido pelos pesquisadores mencionados. Os números (67%, 55%, 50%) são os apresentados na pesquisa original