新的计算机视觉工具荣获社会影响奖

马萨诸塞大学阿默斯特分校的一个计算机科学家团队正在研究两个不同的问题——如何快速检测危机地区受损的建筑物以及如何准确估计鸟群的大小——最近宣布了一个可以同时解决这两个问题的人工智能框架。 该框架名为 DISCount,将人工智能的速度和大量数据处理能力与人类分析的可靠性相结合,快速提供可靠的估计,从而可以从大量图像中快速查明和计算特定特征。 这项研究由人工智能促进协会发表,并获得了该协会的认可,并荣获人工智能社会影响力最佳论文奖。

“DISCount 是两个截然不同的应用程序,”麻省大学阿默斯特分校信息和计算机科学副教授、该论文的作者之一 Subhransu Maji 说道。 “通过麻省大学阿默斯特分校的数据科学中心,我们多年来一直与红十字会合作,帮助他们构建一种计算机视觉工具,可以准确计算在地震或战争等事件中受损的建筑物。同时,我们也在帮助鸟类学家科罗拉多州立大学和俄克拉荷马大学的研究人员对使用天气雷达数据来准确估计鸟群的大小感兴趣。”

Maji 和他的合著者、主要作者古斯塔沃·佩雷斯 (Gustavo Pérez) 和丹·谢尔顿 (Dan Sheldon) 认为他们可以解决受损建筑物的问题。计算机视觉的鸟群问题,一种人工智能,可以扫描大量图像档案,寻找特定的东西——一只鸟、一堆瓦砾——并进行计数。

但团队在每个项目上都遇到了相同的障碍:“标准计算机视觉模型不够准确,”佩雷斯说。 “我们希望构建可供非人工智能专家使用的自动化工具,但可以提供更高程度的可靠性。”

谢尔顿说,答案是从根本上重新思考解决计数问题的典型方法。

“通常,要么让人类对一个非常小的数据集进行耗时且准确的手工计数,要么让计算机视觉对庞大的数据集进行不太准确的自动计数,”谢尔顿说。 “我们想:为什么不两者都做呢?”

DISCount 是一个可以与任何现有的 AI 计算机视觉模型配合使用的框架。 它的工作原理是使用人工智能来分析非常大的数据集(例如,十年内特定区域拍摄的所有图像),以确定人类研究人员应该查看哪些特定的较小数据集。 例如,这个较小的集合可以是计算机视觉模型确定的最能显示该地区建筑物损坏程度的几个关键日子的所有图像。 然后,人类研究人员可以从更小的图像中心化手工计算受损的建筑物,算法将使用它们来推断整个区域受影响的建筑物的数量。 最后,DISCount 将估计人工估计的准确度。

“对于我们考虑的任务,DISCount 的效果明显优于随机抽样,”Pérez 说。 “我们框架的优点之一在于它与任何计算机视觉模型兼容,这让研究人员可以根据自己的需求选择最佳的人工智能方法。因为它还给出了置信区间,所以它使研究人员能够做出明智的决策判断他们的估计有多好。”

“回想起来,我们有一个相对简单的想法,”谢尔顿说。 “但是这种小小的心理转变——我们不必在人类和人工智能之间做出选择,让我们构建了一种比单独使用任何一种方法更快、更全面、更可靠的工具。”

资讯来源:由a0资讯编译自THECOINREPUBLIC。版权归作者A0资讯所有,未经许可,不得转载

上一篇 2024年 5月 31日 上午9:34
下一篇 2024年 5月 31日

相关推荐