OpenAI 最强大的人工智能模型在决定如何治疗眼部问题患者方面的表现优于初级医生,并且接近眼科医生的得分——至少在这项测试中是这样。
挑战:当医生在医学院就读时,他们会轮流跨临床领域,与外科、精神病学、眼科等领域的专家一起工作,以确保他们在获得行医执照时掌握所有科目的基本知识。
然而,如果他们成为一名全科医生 (GP),他们可能很少会使用在某些专业和治疗不太常见的疾病中学到的信息。
GPT-4 的表现明显优于初级医生,得分为 69%,而初级医生的得分为 43%。
这个想法:剑桥大学的研究人员很好奇大型语言模型(LLM)——能够理解和生成对话文本的人工智能——是否可以帮助全科医生治疗患有眼部问题的患者,而他们日常可能无法处理这些问题。以天为基础。
为一个 学习 他们在《PLOS Digital Health》上发表了 GPT-4(为 OpenAI 的 ChatGPT Plus 提供支持的法学硕士),其中包含 87 个患有一系列眼部问题的患者场景,并要求其从四个选项中选择最佳诊断或治疗方案。
他们还对专业眼科医生、眼科医生实习生以及非专业初级医生进行了测试,他们对眼部问题的了解与全科医生一样多。
“最重要的是让患者能够决定是否希望计算机系统参与其中。”
阿伦·蒂鲁纳乌卡拉苏
GPT-4 显着优于初级医生,测试得分为 69%,而他们的中位得分为 43%。 它的得分也高于学员的中位分 59%,并且非常接近眼科医生专家的中位分:76%。
“这项工作表明,这些大型语言模型在眼睛健康方面的知识和推理能力现在几乎与专家没有区别,”主要作者 Arun Thirunavukarasu 告诉英国《金融时报》。
展望未来:剑桥团队并不认为法学硕士会取代医生,但他们确实设想将这些系统集成到临床工作流程中——一名全科医生在与专家联系时遇到困难,寻求如何治疗他们没有的疾病的建议例如,在一段时间(或曾经)看到的可以查询人工智能。
“最重要的是让患者能够决定是否希望计算机系统参与其中,” 说 蒂鲁纳乌卡拉苏。 “这将是每个患者做出的个人决定。”
资讯来源:由a0资讯编译自THECOINREPUBLIC。版权归作者A0资讯所有,未经许可,不得转载