《科(kē)创板日报(bào)》12月28日(rì)讯(编(biān)辑 宋(sòng)子乔) 众多(duō)专业(yè)学科(kē)中,医(yī)学以难度强、压力大(dà)著称,但仍有无(wú)数人接受(shòu)挑战,选择迎难而上,如今,AI也跑来(lái)和医学生“抢饭(fàn)碗(wǎn)”。
当地时(shí)间12月27日,谷歌公布了(le)一个新的医疗AI模(mó)型“Med-PaLM”。在经历(lì)一系列考核(hé)后(hòu),该模型被(bèi)证(zhèng)实“几乎达到”了人类医生的水平。
![]()
具体来看(kàn),研究团队准(zhǔn)备(bèi)了(le)一个医学问题问答数据集“MultiMedQA”,涵盖医学考试、医学研究和消费者医学问题,该“题库”收集了MedQA(USMLE,美国医师执(zhí)照考试(shì)题),还引(yǐn)入(rù)了他(tā)们自己(jǐ)的新数据集HealthSearchQA,它由搜索(suǒ)过的健康问题组成。
该团队又请来一组临床医生作答(dá)。这些临床医(yī)生分布于美(měi)国和(hé)英国,在初级保健、外科、内科和(hé)儿科(kē)方面具有专业经(jīng)验。
最后,研(yán)究人员将模型和人类医生的答案匿名后交(jiāo)给(gěi)9名分别来自美(měi)国、英国和印度的(de)临床医生进(jìn)行(háng)评估。
结果显(xiǎn)示,Med-PaLM在科学常识方面的正确率在92%以上,在理解、检(jiǎn)索和推理能力方(fāng)面,也几乎达到了人(rén)类(lèi)医生的水平(píng),并在克(kè)服隐性(xìng)偏见(jiàn)方面略(luè)胜一筹。
不过,该研究负(fù)责人(rén)也表示,Med-PaLM给出的答(dá)案在(zài)整体上仍然不如临床医生,该模型在实际应用(yòng)前有(yǒu)待进一步(bù)完善。
追根溯源,Med-PaLM是怎么诞生的呢?
这里不得不提(tí)谷歌在今年发布的转换器语言模型——PaLM,该模型基于Pathways架构、拥有5400亿参数(shù),是(shì)Google迄今(jīn)为止研发的最大(dà)规模的模型,全名为Pathways Language Model。
PaLM模型(xíng)在语(yǔ)言(yán)理解等各(gè)种方面的评估测试中的表现(xiàn)十分出色,甚至还在(zài)语言和推理类的测评中超过了人类。
Med-PaLM正是PaLM的(de)衍生品。谷歌研究团队(duì)首先在上(shàng)文提及的医学问题问答数据集“MultiMedQA”上(shàng)评估了PaLM及(jí)微调变体Flan-PaLM,然后,基于(yú)此提出了指令(lìng)提示x调(diào)整,让Flan-PaLM进(jìn)一步与医学接轨(guǐ),进一步产生(shēng)了Med-PaLM。
值得注意的是(shì),AI模型的每一次突破,都(dōu)预示着(zhe)更聪明的机器人即(jí)将到(dào)来。指挥(huī)机器(qì)人干活不是什么新奇的事,但要让机器人能够理解你的(de)命(mìng)令背后的意图,那就要(yào)考验它的“大脑”好不好用了。将AI模(mó)型应用到机器人身上相当(dāng)于给机器人(rén)“开智(zhì)”。
据了解(jiě),今年8月(yuè)份,谷歌(gē)就将大(dà)型语言模型(xíng)首(shǒu)次集成到机(jī)器人中,有了AI模型的加持(chí),机器人能像人类一样响应完(wán)整的命令。
谷(gǔ)歌研究人员就此做了演示(shì)。当对机器人说(shuō):“我饿了,你能给我点零食(shí)吗?”机器人(rén)在自助(zhù)餐厅中搜索一番后,打开了一个抽屉,找(zhǎo)到一袋(dài)薯片并将它拿给研究(jiū)人员。
可以(yǐ)预见的是(shì),通过进(jìn)一步的训练、优化,Med-PaLM模(mó)型的回答准确率将进(jìn)一步提高,基于此模型的机(jī)器人医生也有望更快出现。