东南教育网您的位置:首页 >教育动态 >

研究表明 广泛使用的机器学习方法并不像声称的那样有效

导读 分析复杂网络的模型和算法被广泛应用于研究中,并通过其在在线社交网络、搜索引擎和推荐系统中的应用而影响整个社会。 然而,根据一项新的研究,一种广泛使用的算法方法来建模这些网

分析复杂网络的模型和算法被广泛应用于研究中,并通过其在在线社交网络、搜索引擎和推荐系统中的应用而影响整个社会。 然而,根据一项新的研究,一种广泛使用的算法方法来建模这些网络是根本上有缺陷的,没有捕捉到现实世界复杂网络的重要特性。

“不是这些技术给了你绝对的垃圾。 加州大学圣克鲁斯分校巴斯金工程学院计算机科学与工程副教授C.“Sesh”Seshadhri说:“他们可能有一些信息,但没有很多人相信的那么多。

Seshadhri是3月2日发表在《国家科学院院刊》上的关于新发现的论文的第一作者。 这项研究评估了被称为“低维嵌入”的技术,这些技术通常被用作机器学习模型的输入。 这是一个活跃的研究领域,新的嵌入方法正在迅速发展。 但Seshadhri和他的合著者说,所有这些方法都有同样的缺点。


为了解释原因,Seshadhri使用了社交网络的例子,这是一种熟悉的复杂网络。 许多公司将机器学习应用于社交网络数据,以生成关于人们行为的预测、对用户的建议等。 嵌入技术本质上将一个人在社交网络中的位置转换为几何空间中一个点的一组坐标,为每个人生成一个可以插入到算法中的数字列表。

“这很重要,因为一些抽象的东西,比如一个人在社交网络中的位置,可以转换成一个具体的数字列表。 另一件重要的事情是,你想把它转换成一个低维空间,这样代表每个人的数字列表就会相对较小,“Seshadhri解释说。

一旦进行了这种转换,系统就会忽略实际的社交网络,并根据空间中各点之间的关系进行预测。 例如,如果在那个空间里与你亲近的很多人都在购买某一特定产品,系统可能会预测你可能会购买相同的产品。

seshadhri和他的合著者在数学上证明了复杂网络的重要结构方面在这个嵌入过程中丢失了。 他们还通过在不同类型的复杂网络上测试各种嵌入技术来验证这一结果。

“我们并不是说某些特定的方法失败了。 我们是说,任何给你一个小数字列表的嵌入方法都会从根本上失败,因为一个低维几何对社交网络和其他复杂网络来说是不够表达的,“Seshadhri说。

三角形密度

现实世界社交网络的一个关键特征是三角形的密度,或三个人之间的联系。

“如果你有很多三角形,那就意味着社交网络的那一部分有很多社区结构,”Seshadhri说。 “此外,当你看到社交网络有限的人时,这些三角形就更重要了。 在一个典型的社交网络中,有些人有很多联系,但大多数人没有很多联系。

在对嵌入技术的分析中,研究人员观察到许多代表社区结构的社会三角形在嵌入过程中丢失。 “所有这些信息似乎都消失了,所以就像你想找到的东西在构造这些几何表示时丢失了一样,”Seshadhri说。

低维嵌入绝不是唯一用于生成预测和建议的方法。 它们通常只是一个非常大和复杂的机器学习模型的许多输入之一。

“这种模型是一个巨大的黑匣子,很多积极的结果被报道说,如果你包括这些低维嵌入,你的表现会上升,也许你会得到一个轻微的颠簸。 但如果你自己使用它,似乎你会错过很多,“Seshadhri说。

他还指出,新的嵌入方法主要与其他嵌入方法进行比较。 然而,其他研究人员最近的实证研究表明,不同的技术可以为特定的任务提供更好的结果。

“假设你想预测谁是共和党人,谁是民主党人。 有专门为这项任务开发的技术比嵌入更有效,“他说。 “这种说法是,这些嵌入技术适用于许多不同的任务,这就是为什么很多人采用它们的原因。 也很容易将它们插入到现有的机器学习系统中。 但对于任何特定的任务,事实证明,总有更好的事情可以做。

鉴于机器学习在我们社会中的影响越来越大,Seshadhri说,调查模型背后的基本假设是否有效是很重要的。

“我们所有这些复杂的机器都在做影响我们生活的事情。 我们的信息只是,我们需要更小心地评估这些技术,“他说。 “特别是在机器学习越来越复杂的今天和时代,对什么可以做,什么不什么是不能做的有一些了解是很重要的。

除了Seshadhri,论文的合著者包括谷歌的Aneesh Sharma、UCSC研究生Andrew Stolman和斯坦福大学的AshishGoel。 这项工作由国家科学基金会和陆军研究室资助。

免责声明:本文由用户上传,如有侵权请联系删除!