在线调查系统,几何组成分析等效变换公式

在线调查系统,几何组成分析等效变换公式

几何等变图神经网络:一个调查

摘要:许多科学问题都需要以几何图的形式来处理数据。与一般的图数据不同,几何图表现出平移、旋转和/或反射的对称性。研究人员利用了这种归纳偏差,并开发了几何等变图神经网络(gnns)来更好地描述几何图的几何和拓扑结构。尽管取得了卓有成效的成果,但仍然缺乏关于等变gnn如何发展的调查,这反过来又阻碍了等变gnn的进一步发展。为此,基于必要但简明的数学基础,我们分析并将现有的方法分为如何表示消息传递和聚合的三组。我们还总结了基准和相关的数据集,以促进以后的研究方法开发和实验评估。并提供了对未来潜在发展方向的展望。

简介

许多问题,特别是在物理和化学中,需要以几何图的形式处理数据[Bronstein等人,2021]。与一般图数据不同,几何图不仅分配每个节点一个特征,还分配一个几何向量。例如,一个分子/蛋白质可以看作是一个几何图,其中原子的三维位置坐标是几何向量;或者在一般的多体物理系统中,三维状态(位置、速度或自旋)是粒子的几何向量。

值得注意的是,几何图显示出平移、旋转和/或反射的对称性。这是因为,无论我们如何将分子(或一个一般的物理系统)从一个地方翻译或旋转到另一个地方,控制原子(或粒子)动力学的物理定律都是相同的。在处理这类数据时,将对称性的归纳偏差引入到模型的设计中是非常必要的,这就激发了对几何等变图神经网络(GNNs)的研究。

gnn,最初由[斯珀杜蒂和斯塔里塔,1997]提出,已经证明了它们在建模图支柱中显示了它们的突出地位。在深度学习的最新进展的保护下[汉密尔顿等人,2017年;黄等人,2018年;荣等人,2020年;桑切斯-冈萨雷斯等人,2019年]。虽然已经发展了丰富的架构,但大多数以前的gnn都不是几何等变的1,这使得它们不适合几何图形。为了实现几何等方差,人们提出了大量的工作来改进gnn中的消息传递和聚合机制。这些工作包括TFN[托马斯等人,2018]等变组SE(3)一组3d翻译和旋转转换,Finzi等人,2020]一组微分变换超越3D翻译和旋转,和EGNN卫星等人,2021b]所有n维欧几里得变换包括平移、旋转和反射。

然而,鉴于这些富有成效的成果,仍然没有一份调查报告来描述等变gnn是如何发展的。它不仅阻止了外部研究者快速进入这一领域,而且还阻碍了那些想要进一步推进边界的研究者从现有论文中提取经验教训、新想法和愿景。因此,我们建立了这项调查,以便以一种系统的方式完整地引入几何等变gnn,解释它们所解决的挑战,并探索未来勘探的潜在方向。我们总结了我们的贡献如下。

容易参考

我们提供了必要的数学初步工作,包括等方差的定义,组和组表示。我们试图使数学部分完整但简洁,以避免任何不必要的符号,可能会使读者感到困惑。更重要的是,所有的典型模型都是由一个具有一致符号的通用框架引入的,这样读者就可以更容易地区分不同方法之间的差异。

新的分类学

我们提出了一种新的分类方法来跟踪各种等变gnn的发展路径。通过关注消息传递和聚合的表示方式,我们将等变变量进行了分类gnn可分为三种风格:不可可约表示、正则表示和比例化。

丰富的资源

除了方法学外,我们还研究了现有研究的应用范围。我们根据它们使用的数据类型和它们的目标任务来描述一个完整的基准测试列表。这可以作为模型开发、实验评估和比较的手工指导。

未来的前景

通过对当前工作和前沿进展的分析,我们从理论和实践的角度讨论了未来的未来方向。特别地,我们展望了这四点:理论的完整性、可伸缩性、层次结构,以及更真实的应用程序和数据集。

未来的研究方向

理论完整性

与描述gnn的表达性和推广的成熟的理论框架不同,关于等变gnn的揭示很少。虽然有几部作品[Dym和Maron,2021;Villar等人,2021;Jing等人,2021]分析了一些方法的普遍性,但他们的讨论仅仅是基于消息传递函数,而整个图模型的性质仍然未知。看看现有的构建强大的等变gnn的理论框架如何收敛到这方面将是很有趣的。

可扩展性

如在3中所讨论的,利用群表示理论的方法消耗了很高的计算成本,限制了它们对蛋白质等大型和复杂系统的可扩展性。当他们有注意力时,这个问题就变得更加重要。因此,在等变消息传递中,仍然需要加快计算速度。提高可伸缩性的可能解决方案包括近似化和有效的采样。

层次结构

许多真实世界的系统都表现出层次结构。例如,有机分子由多个官能团组成,蛋白质由氨基酸组成。通过利用这些层次结构,等变gnn可以在多个粒度中建模系统。与现有工程所采用的平面消息传递方案相比,我们期望通过分层机制提高了模型的效率和泛化性。

更多真实世界的应用和数据集

许多等变gnn只在有限规模和复杂性的系统上进行了评估,例如n体系统和小分子数据集。更具挑战性的任务包括用更多的对象、更多样化的约束和更复杂的交互来加强系统。对蛋白质的研究是一个很有前途的尝试,但由于收集困难,它们的多样性大多有限,对现有方法的综合评价尚未建立。

结论

本文对几何等变的gnn进行了研究。我们通过不可约表示、正则表示或标度化证明了现有的几何消息传递范式的规范,其中在于我们改进的几何消息传递范式。我们讨论了它们在各种任务上的广泛应用前景,包括模拟物理动力学,建模分子或蛋白质,和处理点云。随着未来的发展方向发展,我们希望将等变gnn视为应对科学领域任务的强大工具。

本文来自作者:书影,不代表小新网立场!

转载请注明:https://www.xiaoxinys.cn/529140.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。