新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

xxn 阅读:7007 2024-12-25 16:07:20 评论:0

IT之家于12月25日报道,来自哈佛医学院和斯坦福大学的研究团队对OpenAI的o1-preview模型在医学诊断领域进行了深入分析,结果显示该模型在处理复杂医疗案例方面的表现优于人类医生。

研究结果表明,o1-preview在测试案例中的正确诊断率达到了78.3%,在70个特定案例的比较测试中,有高达88.6%的准确率,远超其前身GPT-4的72.9%。

借助医学推理质量评估标准R-IDEA,o1-preview在80个案例中取得了78个满分成绩。相对而言,资深医生在满分案例中仅获28个,而住院医生的满分数量更是仅为16个。

在25位专家设计的复杂案例测试中,o1-preview的得分高达86%,远远超过使用GPT-4的医生(得分41%)和使用传统工具的医生(34%)。

尽管如此,研究人员也指出此次测试的局限性。部分测试案例或许已经包含在o1-preview的训练数据中,且测试过程主要侧重于系统的单独运行,未充分考虑其与人类医生合作的情境。此外,o1-preview推荐的诊断测试成本较高,其实际应用面临一定的限制。

IT之家提供参考链接

广告声明:本文包含的外部链接(包括但不限于超链接、二维码、口令等形式)旨在传达更多信息,提升信息获取的便利性,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容