根据纽约时报报导,有一项小型研究发现,ChatGPT在评估病历方面可能胜过人类医生,即使这些医生也在使用ChatGPT来帮助他们分析病例。
报导指出,波士顿的一位医生Adam Rodman原本预计,使用ChatGPT帮助医生诊断疾病。然而,研究结果却令他大吃一惊。Rodman医生协助设计了一项实验,结果显示,可以使用ChatGPT-4以及传统资源的医生只比无法使用该机器人的医生略微好一些。更令人惊讶的是,单独使用ChatGPT的表现优於所有医生。
这项研究要求医生根据病例报告诊断病情。结果显示,OpenAI的聊天机器人在诊断和解释推理方面的平均得分高达90%。相比之下,随机分配使用聊天机器人的医生平均得分仅为76%,而随机分配不使用聊天机器人的医生平均得分则为74%。
这项研究不仅显示了ChatGPT优越的性能,还揭示了医生有时对自己做出的诊断深信不疑,即使ChatGPT可能提出了更好的诊断。
研究表明,虽然医生正在接触人工智慧工具以进行工作,但很少有人知道如何充分利用这类人工智慧的能力。他们未能利用人工智慧系统解决复杂诊断问题并为其诊断提供解释的能力。
然而,Rodman医生认为,人工智慧系统应该是「医生的延伸」,可以为诊断提供有价值的第二意见。