东南教育网您的位置:首页 >无人驾驶 >

科学家创建了AI系统以识别并消除数据中的错误

导读 我们生活在数据世界中。我们的设备很智能,周围充满了各种开关和传感器,我们的数据正在以多种不同方式进行分析和使用。但是,这些过程

我们生活在数据世界中。我们的设备很智能,周围充满了各种开关和传感器,我们的数据正在以多种不同方式进行分析和使用。但是,这些过程中没有人,这些数据实际上很脏。我们如何筛选它以找出真正重要的内容?滑铁卢大学,威斯康星大学和斯坦福大学的科学家开发了一种名为HoloClean的工具,该工具可以识别和删除脏数据。

脏数据本质上是由各种传感器或算法收集的噪声。想象一个系统正在分析您的网站数据。它可以访问各种信息,但并非所有信息都是相关的。实际上,其中一些甚至都不是真实的-噪声,它自然地出现在所有电子系统中。HoloClean是世界上第一个基于人工智能的技术,旨在识别脏数据并在将其传递给处理之前对其进行纠正。科学家表示,该工具可能对处理大量数据的各种组织有用。

科学家注意到,,公用事业公司和许多其他企业正在处理大量数据。不可避免地,其中有些不好-它可能是不准确的,错误的或根本不相关的。可以培训HoloClean找出错误并自行纠正。当然,训练AI本身就是一个漫长的过程,但是最终HoloClean会根据这些数据去研究,分离错误并进行纠正。或者,如果这是最好的决定,则将它们从数据池中排除。这将为用户提供一个更干净的数据集,以便在他们的分析中使用。最终目标是更轻松地进行分析,从而获得更准确,更可靠的结果。

直到今天,必须手动识别和纠正错误的数据。这是一个漫长而昂贵的过程,甚至不完全准确。科学家希望HoloClean可以加快这项工作的速度,使其变得更容易,更准确。HoloClean的开发商之一Ihab Ilyas说:“该系统解决了信息存在的问题,人们正在使用它来运行分析,但这是不正确的。它不提供不存在的信息,而是更正您认为正确的信息”。

操作准确的数据非常重要。只有这样,您才能希望获得准确的结果并做出有意义的决定。这是人工智能手中最好的工作之一。可以训练此类系统以筛选大量数据,识别错误并纠正它们,并且此过程可以快速而准确。

免责声明:本文由用户上传,如有侵权请联系删除!