医学诊断专家、医生助理和制图师对于贝克曼先进科学技术研究所的研究人员开发的人工智能模型来说都是公平的头衔。
他们的新模型可以准确识别医学图像中的肿瘤和疾病,并通过编程来用视觉图解释每个诊断。该工具独特的透明度使医生能够轻松遵循其推理思路,仔细检查准确性并向患者解释结果。
“我们的想法是帮助在最早阶段发现癌症和疾病——就像地图上的 X 一样——并了解决策是如何做出的。我们的模型将有助于简化这一过程,让医生和患者都更轻松,”Sourya 说森古普塔(Sengupta)是该研究的主要作者,也是贝克曼研究所的研究生研究助理。
这项研究发表在 IEEE Transactions on Medical Imaging上。
猫、狗、洋葱和食人魔
人工智能首次概念化于 20 世纪 50 年代,即计算机可以像人类一样学习适应、分析和解决问题的概念,现已得到家喻户晓的认可,部分原因是 ChatGPT 及其易于使用的工具系列。
机器学习(ML)是研究人员用来创建人工智能系统的众多方法之一。机器学习之于人工智能就像驾驶员教育之于 15 岁的孩子:一个受控、受监督的环境来练习决策、校准新环境以及在错误或错误转弯后重新规划路线。
深度学习——与机器学习相比更明智、更世俗——可以消化大量信息以做出更细致的决策。深度学习模型的决定性力量来自我们最接近人脑的计算机模拟:深度神经网络。
这些网络——就像人类、洋葱和食人魔一样——具有层次,这使得它们难以导航。网络的智能丛林层次越厚,或者说非线性,它就越能更好地执行复杂的、类似人类的任务。
考虑一个经过训练来区分猫和狗的图片的神经网络。该模型通过查看每个类别的图像并将其显着特征(如大小、颜色和解剖结构)归档以供将来参考来进行学习。最终,模型学会了留意胡须,并在杜宾犬一出现舌头松软的迹象时就哭起来。
但深度神经网络并不是绝对可靠的——就像过度热心的幼儿一样,在诺伊大学厄巴纳-香槟分校电气与计算机工程系研究生物医学成像的森古普塔说。
“他们有时会做对,甚至大多数时候都是对的,但可能并不总是出于正确的原因,”他说。“我相信每个人都知道有一个孩子曾经看到过一只棕色的四足狗,然后认为所有棕色的四足动物都是狗。”
森古塔的抱怨?如果你问一个幼儿他们是如何决定的,他们可能会告诉你。
“但你不能问深度神经网络它是如何得出答案的,”他说。
黑匣子问题
尽管深度神经网络可能很时尚、熟练且快速,但它仍然难以掌握高中微积分学生所学到的开创性技能:展示他们的工作。这被称为人工智能的黑匣子问题,多年来一直困扰着科学家。
从表面上看,说服不情愿的网络承认将博美犬误认为是猫似乎并不那么重要。但随着相关图像变得更加改变生活,黑匣子的引力变得更加尖锐。例如:乳房 X 光检查的 X 射线图像可能表明乳腺癌的早期迹象。
世界不同地区的医学图像解码过程看起来有所不同。
“在许多发展中国家,医生短缺,病人排队等候。人工智能在这些场景中可以提供帮助。”森古普塔说。
森古普塔说,当时间和人才需求量很大时,自动化医学图像筛查可以作为一种辅助工具,但绝不能取代医生的技能和专业知识。相反,人工智能模型可以预先扫描医学图像,并标记那些包含异常情况的图像,例如肿瘤或疾病的早期迹象,称为生物标记物,以供医生检查。这种方法可以节省时间,甚至可以提高负责阅读扫描件的人员的表现。
这些模型运行良好,但当患者询问为什么人工智能系统将图像标记为包含(或不包含)肿瘤时,它们的床边方式还有很多不足之处。
从历史上看,研究人员曾使用大量旨在从外到内破译黑匣子的工具来回答此类问题。不幸的是,使用这些工具的研究人员经常面临与不幸的窃听者类似的困境,他们靠在上锁的门上,手里拿着一个空的东西。玻璃到他们的耳朵。
“只需打开门,走进房间,直接聆听对话就会容易得多,”森古普塔说。
使问题进一步复杂化的是,这些解释工具存在许多变体。森古普塔说,这意味着任何给定的黑匣子都可以以“看似合理但不同”的方式进行解释。
“现在的问题是:你相信哪种解释?” 他说。“你的选择有可能会受到主观偏见的影响,这就是传统方法的主要问题。”
森古普塔的解决方案?森古普塔说,这是一种全新类型的人工智能模型,每次都能自我解释,解释每个决定,而不是平淡地报告“肿瘤与非肿瘤”的二元关系。
换句话说,不需要水杯,因为门已经消失了。