根據紐約時報報導,有一項小型研究發現,ChatGPT在評估病歷方面可能勝過人類醫生,即使這些醫生也在使用ChatGPT來幫助他們分析病例。
報導指出,波士頓的一位醫生Adam Rodman原本預計,使用ChatGPT幫助醫生診斷疾病。然而,研究結果卻令他大吃一驚。Rodman醫生協助設計了一項實驗,結果顯示,可以使用ChatGPT-4以及傳統資源的醫生只比無法使用該機器人的醫生略微好一些。更令人驚訝的是,單獨使用ChatGPT的表現優於所有醫生。
這項研究要求醫生根據病例報告診斷病情。結果顯示,OpenAI的聊天機器人在診斷和解釋推理方面的平均得分高達90%。相比之下,隨機分配使用聊天機器人的醫生平均得分僅為76%,而隨機分配不使用聊天機器人的醫生平均得分則為74%。
這項研究不僅顯示了ChatGPT優越的性能,還揭示了醫生有時對自己做出的診斷深信不疑,即使ChatGPT可能提出了更好的診斷。
研究表明,雖然醫生正在接觸人工智慧工具以進行工作,但很少有人知道如何充分利用這類人工智慧的能力。他們未能利用人工智慧系統解決複雜診斷問題並為其診斷提供解釋的能力。
然而,Rodman醫生認為,人工智慧系統應該是「醫生的延伸」,可以為診斷提供有價值的第二意見。