马萨诸塞大学阿默斯特分校的一个计算机科学家团队正在研究两个不同的问题——如何快速检测危机地区受损的建筑物以及如何准确估计鸟群的大小——最近宣布了一个人工智能框架,可以两个都。该框架名为 DISCount,将人工智能的速度和大量数据处理能力与人类分析的可靠性相结合,快速提供可靠的估计,从而可以从大量图像中快速查明和计算特定特征。这项研究由人工智能促进协会发表,并获得了该协会的认可,并荣获人工智能社会影响力最佳论文奖。
“DISCount 是两个截然不同的应用程序,”麻省大学阿默斯特分校信息和计算机科学副教授、该论文的作者之一Subhransu Maji说道。 “通过麻省大学阿默斯特分校的数据科学中心,我们多年来一直与红十字会合作,帮助他们构建计算机视觉工具,可以准确计算在或战争等事件中受损的建筑物。与此同时,我们正在帮助科罗拉多州立大学和俄克拉荷马大学的鸟类学家利用天气雷达数据来准确估计鸟群的大小。”
Maji 和他的合著者、主要作者古斯塔沃·佩雷斯 (Gustavo Pérez)和丹·谢尔顿 (Dan Sheldon)认为他们可以解决受损建筑物的问题。计算机视觉的鸟群问题,一种人工智能,可以扫描大量图像档案,寻找特定的东西——一只鸟、一堆瓦砾——并进行计数。
但团队在每个项目上都遇到了相同的障碍:“标准计算机视觉模型不够准确,”佩雷斯说。 “我们希望构建可供非人工智能专家使用的自动化工具,但可以提供更高程度的可靠性。”
谢尔顿说,答案是从根本上重新思考解决计数问题的典型方法。
“通常,要么让人类对一个非常小的数据集进行耗时且准确的手工计数,要么让计算机视觉对庞大的数据集进行不太准确的自动计数,”谢尔顿说。 “我们想:为什么不两者都做呢?”
DISCount 是一个可以与任何现有的 AI 计算机视觉模型配合使用的框架。它的工作原理是使用人工智能来分析非常大的数据集(例如,十年内特定区域拍摄的所有图像),以确定人类研究人员应该查看哪些特定的较小数据集。例如,这个较小的集合可以是计算机视觉模型确定的最能显示该地区建筑物损坏程度的几个关键日子的所有图像。然后,人类研究人员可以从更小的图像集中手工计算受损的建筑物,算法将使用它们来推断整个区域受影响的建筑物的数量。最后,DISCount 将估计人工估计的准确度。
“对于我们考虑的任务,DISCount 的效果明显优于随机抽样,”Pérez 说。 “我们框架的优点之一在于它与任何计算机视觉模型兼容,这让研究人员可以根据自己的需求选择最佳的人工智能方法。因为它还给出了一个置信区间,所以研究人员能够对他们的估计有多好做出明智的判断。”