周日. 3 月 15th, 2026

人工 AI 在临床医学上的应用发展到什么程度了?

近日,谷歌于 Nature 发表了题为:Large language models encode clinical knowledge 的研究论文,展现了专精于医学领域的大语言模型——Med-PaLM——的测评结果。

打开凤凰新闻,查看更多高清图片

论文截图

Med-PaLM 在大语言模型 Flan-PaLM 的基础上进行微调。研究人员首先对 Flan-PaLM 进行测试,结果发现,在整合了美国医师执照考试类问题的数据集中,Flan-PaLM 达到了 67.6% 的准确率,达到了通过考试的标准(60%)。不过,进一步评估显示,Flan-PaLM 在回答消费者的医疗问题方面依然存在不足。

论文截图

经过更适应医学领域的调整后,Med-PaLM 诞生。研究人员让真正的人类临床医生和 Flan-PaLM、Med-PaLM 共同回答了 140 个临床问题,并将答案交由一组临床医生评分。

测试结果显示,评分小组认为 Flan-PaLM 的答案只有 61.9% 符合科学共识,而 Med-PaLM 的这一比例为 92.6%,与临床医生生成的答案(92.9%)相当。此外,29.7% 的 Flan-PaLM 答案被评为可能导致有害结果,而 Med-PaLM 的这一比例为 5.9%,这与临床医生生成的答案(5.7%)的结果相似。

论文截图

论文表示,尽管研究结果展现出了一定的希望,但医学领域非常复杂,依然有许多困难需要克服和改善,在 Med-PaLM 真正应用于临床之前,还需要更详细的进一步评估。(策划:z_popeye|监制:gyozua、carellero)

Avatar photo

作者 UU 13723417500

友情提示:现在网络诈骗很多,做跨境电商小心被骗。此号发布内容皆为转载自其它媒体或企业宣传文章,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。---无意冒犯,如有侵权请联系13723417500删除!

声明本文由该作者发布,如有侵权请联系删除。内容不代表本平台立场!

发表回复

服务平台
跨境人脉通
专利检索
U选Market
选品平台
展会&沙龙
群通天下