谷歌医疗大模型登上Nature杂志 水平媲美临床医生 AI+医疗有望加速融合
“医疗保健是AI能真正影响人类结果的领域。”AMD CEO苏姿丰几天前在世界人工智能大会上的话语言犹在耳,Google医疗大模型的论文又登上了《Nature》。这篇论文于7月12日发表,不仅详解了医疗大模型Med-PaLM的进化过程,还介绍Google全新的MultiMedQA评估基准。
研究人员表示,当回答医学问题时,微调后的医疗大模型Med-PaLM表现良好,一组临床医生对其回答的评分为92.6%,与现实中临床医生的水平(92.9%)相当。
临床医生对答案的评估
除了专家评估,研究团队还请一组非领域专家(印度的非医学背景普通人)评估答案。Med-PaLM在80.3%的情况下被认为是有帮助的。另外,Med-PaLM的答案在94.4%的情况下被认为直接回答了用户问题,临床医生的答案在95.9%。
非医学背景的人对答案的评估
而MultiMedQA涵盖七个医学问答数据集,包括医学考试、医学研究、消费者查询等相关问题和回答,以评测大模型在临床方面的能力。
▌技术尚不成熟 但科技大佬强烈看好
在AI+医疗领域,Google走在前列。其最新的医疗大模型Med-PaLM 2为首个在美国医疗执照考试中达到专家水平的大模型。据华尔街日报报道,自4月份以来,该模型一直在美国梅奥诊所等顶尖私立医院进行测试。
据Google在5月份发布的论文,和其他大模型类似,GoogleMed-PaLM 2也存在“幻觉”问题,容易“胡言乱语”,但总体来看,Google研究人员认为其表现与实际医生不相上下。
曾参与训练Med-PaLM 2Google高级研究主管Greg Corrado表示:“我并不觉得这种技术现在已经达到了我愿意让家人使用的程度,但在医疗领域AI可以带来好处的环节,它能创造10倍的价值。”
这与AMD CEO苏姿丰不谋而合,几天前落幕的世界人工智能大会上,苏姿丰表示,基本上每个层面的科研都受到你所拥有的计算能力的影响,无论是气候研究还是能源研究,所有这些领域的研究都可以在人工智能下得到显著加速,个人对医疗卫生的前景非常期待,认为医疗保健是能找出的一个AI能真正影响人类结果的领域,会帮助医生作出更好的诊断,加速疾病预防研究。
▌大模型为AI医疗插上翅膀 应用场景有望加速落地
Google之外,微软、IBM等科技大厂一直在持续关注AI医疗方面的应用落地。在这轮大模型浪潮之前,AI检测心电图、X光片已在一些医院中投入应用。
大模型则有望为AI医疗插上翅膀。华泰证券便表示,随着基于大模型的生成式AI的出现,AI+医疗有望迎来一波新的发展机遇。浙商证券分析师刘雯蜀称,AI大模型将在医疗信息化、互联网医疗、医卫和医保信息化等领域产生生产力变革性推动。
综合来看,在大模型的加持下,智能问诊、新药开发、医疗影像这三大AI应用场景有望加速落地。
国内,AI与医疗的融合进程也在加快。5月,在上海市经济信息化委的指导下,国内首个基于算力网络的医疗算法模型Uni-talk发布。产业端,科大讯飞、百度、云从科技、卫宁健康等公司都正积极布局医疗领域的垂直大模型;CRO企业药明康德、美迪西、药石科技、成都先导、皓元医药、泓博医药等公司均对AI制药相关业务有所布局。
华西证券表示,Med-PaLM 2进入实测,医疗大模型应用加速,具备行业Know-How和客户基础,在AI领域早有布局,且积极拥抱大模型技术变革的公司具有先发优势,受益标的包括润达医疗、创业慧康、嘉和美康、安必平、健麾信息、数字人等。