Appearance
本报告由 MaltSci•麦伴科研 基于最新文献和研究成果撰写
图神经网络在生物学中的应用有哪些?
摘要
随着生物医学领域数据的迅速增长,尤其是高通量技术的发展,生物学数据的复杂性和多样性日益增加。这些数据通常以网络结构的形式呈现,如基因调控网络、蛋白质相互作用网络等。传统的机器学习方法在处理这些非欧几里得结构的数据时面临挑战,因此亟需新的计算工具。图神经网络(GNNs)作为一种新兴的深度学习模型,近年来在生物医学领域展现出了巨大的应用潜力。GNNs能够直接处理图结构数据,利用节点之间的关系和边的特性,深入挖掘数据中的复杂依赖关系和模式。本文系统综述了GNNs在生物医学领域的应用,包括基因组学中的基因调控网络建模、药物发现中的药物-靶标相互作用预测、疾病预测及生物标志物识别等。研究表明,GNNs在这些领域中能够提供更为准确的预测和分析,推动疾病的早期诊断、个性化治疗及新药的研发。尽管GNNs的应用取得了一系列进展,但仍面临数据稀疏性、噪声问题和模型可解释性等挑战。未来的研究应致力于克服这些挑战,进一步提升GNNs在生物医学数据分析中的表现,以推动相关研究的发展。
大纲
本报告将涉及如下问题的讨论。
- 1 引言
- 2 图神经网络的基本原理
- 2.1 图神经网络的定义与发展历程
- 2.2 图神经网络的基本架构与算法
- 3 图神经网络在基因组学中的应用
- 3.1 基因调控网络的建模与分析
- 3.2 基因表达数据的解析
- 4 图神经网络在药物发现中的应用
- 4.1 药物分子结构的表示与分析
- 4.2 药物-靶标相互作用的预测
- 5 图神经网络在疾病预测与生物标志物识别中的应用
- 5.1 疾病分类与风险评估
- 5.2 生物标志物的发现与验证
- 6 当前挑战与未来发展方向
- 6.1 数据稀疏性与噪声问题
- 6.2 模型可解释性与临床应用
- 7 总结
1 引言
随着生物医学领域数据的迅速增长,特别是高通量技术的发展,生物学数据的复杂性和多样性日益增加。这些数据通常以网络结构的形式呈现,例如基因调控网络、蛋白质相互作用网络和细胞间相互作用等。这些网络不仅包含了丰富的生物信息,还反映了生物体内复杂的相互作用关系[1]。然而,传统的机器学习方法在处理这些非欧几里得结构的数据时往往面临挑战,难以有效捕捉其内在的结构信息和复杂关系。因此,急需新的计算工具来解析这些生物网络数据。
图神经网络(Graph Neural Networks, GNNs)作为一种新兴的深度学习模型,近年来在生物医学领域展现出了巨大的应用潜力。GNNs能够直接处理图结构数据,利用节点之间的关系和边的特性,深入挖掘数据中的复杂依赖关系和模式[2]。通过这种方式,GNNs在基因组学、药物发现、疾病预测及生物标志物识别等领域取得了显著的成果。例如,GNNs被广泛应用于蛋白质功能预测、药物-靶标相互作用预测等生物信息学任务中[1][3]。
研究图神经网络在生物医学领域的应用具有重要的理论和实际意义。首先,GNNs为生物数据分析提供了一种全新的视角,使研究人员能够更好地理解生物系统的复杂性[4]。其次,随着数据规模的不断扩大,GNNs的高效性和可扩展性使其成为处理大规模生物数据的理想工具。通过对GNNs的深入研究,能够为生物医学研究提供更为准确的预测和分析,从而推动疾病的早期诊断、个性化治疗以及新药的研发等重要应用[5][6]。
当前,GNNs在生物医学领域的应用已经取得了一系列的进展,但仍面临一些挑战,例如数据稀疏性、噪声问题、模型的可解释性等[7]。为了应对这些挑战,研究者们正在不断探索改进GNNs的算法和模型,以提高其在生物医学数据中的表现。
本报告将围绕GNNs在生物医学领域的应用进行系统的综述。首先,我们将介绍GNNs的基本原理,包括其定义、发展历程及基本架构与算法。接着,我们将探讨GNNs在基因组学中的应用,重点分析基因调控网络的建模与基因表达数据的解析。随后,我们将讨论GNNs在药物发现中的应用,特别是药物分子结构的表示与药物-靶标相互作用的预测。此外,我们还将探讨GNNs在疾病预测和生物标志物识别中的应用,包括疾病分类与风险评估以及生物标志物的发现与验证。最后,我们将总结当前GNNs在生物医学领域面临的挑战与未来的发展方向,以期为相关研究提供参考和启示。
通过对现有文献的分析与总结,本报告旨在为研究人员提供一个全面的视角,以便更好地理解图神经网络在生物医学领域的重要性及其潜在价值。希望本报告能够为推动GNNs在生物医学领域的应用与发展贡献一份力量。
2 图神经网络的基本原理
2.1 图神经网络的定义与发展历程
图神经网络(Graph Neural Networks, GNNs)在生物学中的应用日益广泛,主要集中在以下几个领域:
生物网络分析:GNNs被用于分析生物网络,特别是在预测蛋白质功能、蛋白质-蛋白质相互作用和药物发现等方面。这些网络通常由生物实体(如蛋白质、基因等)及其相互作用构成,GNNs能够有效捕捉这些复杂的依赖关系和模式,这些是传统神经网络可能遗漏的[1]。
单细胞RNA测序数据分析:在单细胞RNA测序(scRNA-seq)数据中,GNNs用于提取配体-受体(L-R)关联,并构建细胞-细胞关联网络。通过这种方式,GNNs能够增强细胞间通信路径的生物学相关性和准确性,尤其是在处理具有异质性的生物数据时[4]。
癌症和肿瘤研究:GNNs在癌症研究中被应用于分析多模态结构化数据,包括分子结构、空间成像和数字病理学等。这些方法能够结合图结构表示和深度学习的高预测性能,尤其是在处理大型多模态数据集时,显示出其优越性[3]。
链接预测:GNNs在生物医学网络中用于预测不同实体之间的潜在相互作用,例如药物-靶标相互作用和合成致死预测。通过集成来自不同数据源的节点特征,GNNs能够有效提高链接预测的准确性[8]。
图嵌入和表示学习:图嵌入技术被用于将生物网络数据嵌入到低维空间中,同时保留图的拓扑结构和节点属性。这种方法能够促进图数据的机器学习应用,如药物发现和基因组学等[9]。
多组学数据整合:GNNs能够整合多组学数据,包括基因表达谱和配体-受体相互作用,从而提供对细胞环境和相互作用的更全面的理解[4]。
生物信号处理:GNNs在生物信号的图域分析中也表现出色,能够为复杂的生物过程提供新的解析视角。这些技术有助于研究复杂的生物过程,如基因调控网络和疾病诊断[2]。
计算药物开发:在药物开发和发现的过程中,GNNs能够应用于分子属性和活性预测、相互作用预测以及药物合成预测等任务。这些方法为药物相关问题提供了新的解决方案,推动了药物研发的进展[5]。
总的来说,图神经网络通过其强大的结构化数据处理能力,正在推动生物学和生物医学领域的研究进展,为理解复杂的生物系统和开发新型治疗策略提供了新的工具和方法。
2.2 图神经网络的基本架构与算法
图神经网络(Graph Neural Networks, GNNs)在生物学中的应用日益广泛,主要体现在以下几个方面:
生物网络分析:GNNs可以有效地处理生物网络数据,这些数据通常具有复杂的关系和交互。例如,GNNs被应用于蛋白质功能预测、蛋白质-蛋白质相互作用预测以及计算药物发现等领域。这些网络中的节点通常代表生物实体(如蛋白质、基因等),而边则表示它们之间的相互作用[1]。
单细胞RNA测序数据分析:在单细胞RNA测序(scRNA-seq)数据中,GNNs能够捕捉细胞之间复杂的依赖关系。通过提取配体-受体(L-R)关联并构建细胞-细胞关联网络,GNNs可以增强对细胞通信通路的生物学相关性和准确性[4]。此外,研究表明,考虑数据特定特征的GNN方法能够有效解读scRNA-seq数据中的复杂模式[4]。
癌症与肿瘤研究:GNNs在癌症研究中也表现出良好的应用前景。通过结合图结构表示和深度学习的高预测性能,GNNs能够处理多模态数据,包括分子结构、空间成像和数字病理学等,帮助研究者更好地理解癌症的生物学机制[3]。
链接预测:GNNs在生物网络中用于链接预测,即预测不同实体(如蛋白质和药物)之间的潜在相互作用。这对于理解各种复杂人类疾病的病理机制以及药物发现中的靶点筛选至关重要[8]。
图嵌入与表示学习:图嵌入技术利用GNNs将图数据嵌入到低维空间中,同时保留图的拓扑结构和节点属性。这种方法在生物信息学中得到广泛应用,如分子级别的药物发现、基因组学和健康系统层面的应用[9]。
多组学数据整合:GNNs还被用于整合多组学数据,例如基因表达谱和配体-受体相互作用,提供更全面的细胞环境和相互作用的理解[4]。
生物信号处理:通过图信号处理,GNNs能够分析生物信号,提供对生物过程的深入理解。这些方法为研究复杂的生物交互提供了新的视角[2]。
总之,GNNs的基本原理在于通过图结构来建模生物实体及其关系,使其在处理生物学中的复杂交互时具有显著优势。这些应用不仅推动了生物学研究的进展,也为新药开发和疾病诊断提供了新的工具和思路。
3 图神经网络在基因组学中的应用
3.1 基因调控网络的建模与分析
图神经网络(Graph Neural Networks, GNNs)在生物学,尤其是基因组学领域的应用日益广泛,特别是在基因调控网络(Gene Regulatory Networks, GRNs)的建模与分析方面。GNNs能够有效处理生物数据中复杂的结构关系,这对于理解基因调控及其在细胞过程中的作用至关重要。
首先,GNNs被用于推断基因调控网络,通过分析基因表达数据来重建基因之间的调控关系。Juexin Wang等人在2020年的研究中提出了一种基于图神经网络的基因调控图神经网络(GRGNN)方法,该方法通过整合基因表达数据,采用监督和半监督框架来重建基因调控网络。该研究表明,利用部分信息构建的噪声起始图结构能够有效指导基因调控网络的推断,并在DREAM5基因调控网络推断基准测试中取得了优异的表现[10]。
此外,图神经网络还被应用于处理单细胞RNA测序数据(scRNA-seq),如Yao Sun和Jing Gao在2025年的研究中提出的HGATLink框架。该框架结合了异构图注意力网络和简化的变换器,旨在有效捕捉基因之间的复杂相互作用,以提高基因调控网络推断的准确性和稳定性[11]。这项研究突出了单细胞数据中基因调控网络推断面临的稀疏性和噪声问题,并展示了如何通过图神经网络克服这些挑战。
另外,Wentao Cui等人在2025年提出的层次图变换器(HGTCGRN)模型,利用层次化的图变换器来捕捉基因调控网络中的结构语义。这种方法通过引入虚拟节点来表示基因功能,从而增强了节点表示的多样性,并利用基因本体信息来优化基因调控网络的对比学习[12]。该模型在基因调控网络推断方面显示出优越的性能,进一步证明了图神经网络在基因组学中的潜力。
综上所述,图神经网络在基因调控网络的建模与分析中展现出强大的应用潜力,不仅能够有效整合和分析复杂的生物数据,还能够提升对基因调控机制的理解。这些进展为基因组学的研究提供了新的视角和工具,有助于揭示基因调控的复杂性及其在生物过程中的重要性。
3.2 基因表达数据的解析
图神经网络(Graph Neural Networks, GNNs)在生物学领域的应用日益广泛,尤其是在基因组学和基因表达数据的解析方面。GNNs能够有效捕捉复杂的生物网络结构和节点之间的关系,进而促进对基因表达数据的深入理解。
在基因表达数据的解析中,GNNs展现出了显著的优势。例如,Kim等人(2025年)展示了一种基于图神经网络的基因表达推断方法,该方法利用L1000数据生成的基因表达谱,表明GNN模型在预测基因表达值和基因排名方面的表现优于线性和非线性非GNN模型。该研究强调,GNN模型所需的信息量比其他模型少约10倍,且通过特征选择或整合来源于基因表达数据的器官特征,进一步提升了基因表达推断的性能[13]。
此外,Yan等人(2024年)提出了一种新颖的空间图神经网络方法,通过整合调控和结构特征,进一步增强了对基因表达的预测能力。这种方法利用图特征,包含基因间的配对相关性、生物通路、蛋白质-蛋白质相互作用网络以及转录因子的调控,展现出相较于传统回归和其他深度学习模型更优越的性能[14]。
在空间转录组数据的分析中,Yuan和Bar-Joseph(2020年)开发了GCNG(Graph Convolutional Neural networks for Genes),该模型通过将空间信息编码为图结构,并结合表达数据进行监督训练,显著改善了空间转录组数据的分析,能够推断细胞内外的基因相互作用[15]。
Muzio等人(2021年)回顾了GNNs在生物信息学中的应用,指出其在蛋白质功能预测、蛋白质-蛋白质相互作用预测及药物发现等领域的广泛应用,表明GNNs在处理生物网络时的强大能力[1]。
综上所述,图神经网络在基因组学和基因表达数据的解析中展现出强大的潜力,通过其对生物网络结构的深刻理解,能够促进对复杂生物过程的解析和新发现的推动。
4 图神经网络在药物发现中的应用
4.1 药物分子结构的表示与分析
图神经网络(GNNs)在生物学和药物发现领域的应用日益广泛,特别是在药物分子结构的表示与分析方面,展现出其独特的优势和潜力。以下是图神经网络在这一领域的几个主要应用:
药物-靶标相互作用预测:图神经网络能够有效地处理非欧几里得数据,如药物分子结构和蛋白质相互作用网络。这些数据可以通过图的形式进行表示,GNNs被广泛应用于药物-靶标相互作用(DTI)的预测,帮助识别潜在的药物重定位和加速药物发现过程[16]。
药物副作用预测:在药物发现过程中,预测药物副作用是一个重要任务。GNNs利用药物的分子图结构,能够有效捕捉分子内部的复杂信息。通过将问题表述为多类多标签的图分类任务,GNNs展示了在副作用预测中的优越性能,尽管当前的模型仍需进一步提高其临床适用性[17]。
药物分子特性预测:GNNs在药物分子特性预测方面表现出色。通过捕捉分子图的结构和空间信息,GNNs能够在多个药物发现相关的基准数据集上实现先进的预测性能。这种方法可以帮助化学家和药剂师识别分子的关键组成部分,从而设计出具有期望特性或功能的更好分子[18]。
药物-药物相互作用预测:药物-药物相互作用(DDI)的预测是药物发现和临床研究中的重要环节。传统的临床试验和实验方法通常成本高昂且耗时。GNNs通过网络结构和分子特征的学习,能够提高DDI的预测准确性,从而加速药物开发过程[19]。
分子表示学习:图神经网络在分子表示学习中发挥着重要作用,能够通过对分子图的深度学习来提取有效的特征表示。这种表示不仅能够捕捉分子的全局结构信息,还能通过层次化的学习方法提高模型的解释能力[20]。
结构生成与分类:基于图结构生成的模型可以更有效地学习分子的关键结构,通过深度优先策略生成图的关键结构,解决了现有GNN在深度探索和噪声问题上的局限性。这种方法提高了分子分类的准确性,推动了药物发现的效率[21]。
综上所述,图神经网络在药物发现中的应用涵盖了从药物-靶标相互作用预测到药物特性预测、药物副作用预测等多个方面。这些应用展示了GNNs在处理复杂生物数据时的强大能力,为未来的药物发现研究提供了新的思路和方法。
4.2 药物-靶标相互作用的预测
图神经网络(GNNs)在生物医学领域,尤其是在药物发现中的应用越来越广泛,特别是在药物-靶标相互作用(DTI)的预测方面。以下是一些具体的应用和研究成果:
药物-靶标相互作用的预测:GNNs能够有效地表示药物分子和靶标蛋白之间的复杂关系。Zhang等人(2022)指出,图神经网络通过图的形式有效地表示药物分子结构、靶标残基结构和蛋白质相互作用网络,从而在DTI预测中取得了显著效果[16]。同样,Xu等人(2024)提出了一种基于异构信息网络的强化元路径优化方法,通过优化元路径来提升预测性能,表明GNNs在处理复杂生物数据时的优势[22]。
多源数据集成:Long等人(2022)提出了一种名为PT-GNN的框架,通过预训练图神经网络来集成来自不同数据源的特征,以实现对DTI的预测。该方法通过图重构任务预训练节点特征,并在合成致死性预测和DTI预测任务中表现优于现有方法[8]。
异构图结构的应用:Ning等人(2025)提出了双重多视角异构图神经网络(DMHGNN),通过构建多视角图来学习药物-靶标对的信息。这种方法不仅考虑了药物和靶标之间的直接相互作用,还整合了药物、靶标、药物副作用和疾病之间的复杂关系,从而提升了DTI预测的准确性[23]。
高阶信息整合:Ruan等人(2021)开发了一种基于异构超图的框架HHDTI,通过超图模型整合药物和靶标之间的高阶信息,显著提高了预测的准确性。这种方法表明,通过整合复杂的生物网络信息,可以有效地发现未知的药物-靶标相互作用[24]。
动态学习与对比学习:Tao等人(2023)提出了一种动态超图对比学习框架(DGCL),通过提取药物和基因之间的局部和全局关系来提高DTI预测的准确性。这种方法在数据稀疏和过平滑问题上表现出色,进一步验证了GNN在生物数据中的应用潜力[25]。
图卷积网络的优势:Wang等人(2022)提出的GCHN-DTI方法利用图卷积操作在异构网络中获取药物和靶标的节点嵌入,并结合注意力机制提高了预测性能。这一研究表明,GNN能够有效利用异构网络中的节点信息,从而在DTI预测中取得优异结果[26]。
通过以上研究可以看出,图神经网络在药物-靶标相互作用的预测中展现了强大的能力,能够处理复杂的生物数据,并为药物发现提供重要的计算支持。
5 图神经网络在疾病预测与生物标志物识别中的应用
5.1 疾病分类与风险评估
图神经网络(GNN)在生物医学领域的应用越来越广泛,特别是在疾病预测和生物标志物识别方面。以下是一些具体的应用示例:
疾病预测:GNN在疾病预测中发挥了重要作用。研究表明,GNN能够有效地利用电子病历(EMR)数据进行疾病分类和预测。例如,Zhenchao Sun等人在2021年的研究中提出了一种基于GNN的模型,通过外部知识库增强不足的EMR数据,从而生成患者、疾病和症状的高度代表性节点嵌入。这种方法能够对新患者进行有效的疾病预测,包括罕见疾病的识别[27]。
生物标志物识别:在生物标志物的发现方面,GNN被用于构建与疾病相关的网络。例如,Yang Liu等人在2025年提出的表达图网络框架(EGNF)通过整合基因表达数据和临床属性,构建生物学上相关的网络,利用图学习技术识别具有统计学意义和生物学相关性的基因模块,从而提高生物标志物的预测识别能力[28]。EGNF在多种肿瘤类型和临床场景下的验证结果显示,其在分类准确性和可解释性方面均优于传统机器学习模型。
精神疾病的生物标志物:在精神疾病的研究中,GNN同样展现了其潜力。Yi Hao Chan等人在2025年的系统综述中指出,GNN被广泛应用于功能性磁共振成像(fMRI)数据集的建模,以改进精神疾病的分类性能。尽管已有多项研究表明GNN能够显著提升分类准确性,但在生物标志物的可重复性方面仍存在挑战[29]。
多组学数据的整合:GNN还被用于整合多种数据源以支持疾病分类和风险评估。Kamilia Zaripova等人提出的Graph-in-Graph(GiG)架构利用输入数据样本之间的潜在关系,通过学习消息传递机制来改善下游任务的性能[30]。这种方法不仅能够用于蛋白质分类,还可用于脑成像应用,显示了GNN在处理复杂生物数据中的广泛适用性。
图注意力网络的应用:Minghao Yang等人提出的GTGenie模型利用图注意力网络和文本表示方法来预测生物标志物与疾病之间的关联,展示了GNN在加速生物标志物发现中的潜力[31]。
综上所述,图神经网络在疾病预测和生物标志物识别中提供了强大的工具,通过其独特的网络结构和学习能力,能够处理复杂的生物数据并提取出重要的生物学信息。这些应用不仅提升了疾病分类的准确性,还为精准医学的发展提供了新的思路和方法。
5.2 生物标志物的发现与验证
图神经网络(Graph Neural Networks, GNNs)在生物医学领域的应用日益广泛,尤其在疾病预测和生物标志物的识别方面展现出强大的潜力。通过构建和分析生物网络,GNN能够有效地处理复杂的生物数据,挖掘潜在的生物标志物并进行疾病分类。
在生物标志物的发现与验证中,图神经网络通过整合基因表达数据和临床特征,构建生物信息网络,利用图学习技术如图卷积网络和图注意力网络,识别具有统计学意义和生物学相关性的基因模块。例如,EGNF(表达图网络框架)通过动态生成患者特异性的分子交互表示,显著提高了生物标志物的预测识别能力,并在多个独立数据集中验证了其优越性,能够实现正常样本与肿瘤样本的完美分离,同时在疾病进展分类和治疗结果预测等细微任务中表现出色[28]。
此外,图神经网络还被用于精神疾病的生物标志物识别。在一项系统性回顾中,研究者发现使用GNN对功能性磁共振成像(fMRI)数据进行建模,能够显著提高疾病分类的性能,并揭示出潜在的生物标志物。然而,现有的生物标志物评估方法往往依赖于文献交叉验证,这一过程主观且不一致,因此亟需建立基于客观评估指标的新标准来验证这些潜在生物标志物的稳健性[29]。
在慢性阻塞性肺病(COPD)的预测中,GNN也显示出了良好的应用前景。通过构建知识引导的图注意力网络,研究者能够从电子病历中提取临床数据的特征,结合医学知识图谱中的疾病定义和医疗概念,增强了与目标疾病相关的医学概念的指示性影响,从而提高了疾病诊断的准确性[32]。
综上所述,图神经网络在生物标志物的发现与验证中,提供了一种新颖而强大的工具,能够通过构建和分析生物网络,深入挖掘复杂疾病的分子特征,为精准医学和疾病机制的阐明提供了广泛的应用前景。
6 当前挑战与未来发展方向
6.1 数据稀疏性与噪声问题
图神经网络(Graph Neural Networks, GNNs)在生物学中的应用广泛,涵盖了多个领域,尤其是在处理复杂的生物网络和数据时表现出色。随着生物高通量技术的进步,生物数据的可用性和数量大幅增加,这些数据通常以生物网络的形式表示,反映了蛋白质之间的相互作用或化合物内部的键合等关系[1]。在生物信息学中,GNNs被应用于蛋白质功能预测、蛋白质-蛋白质相互作用预测以及药物发现和开发等领域[1]。
尽管GNNs在生物学中的应用潜力巨大,但在实际应用中也面临诸多挑战。其中,数据稀疏性和噪声问题是最为突出的一类挑战。生物数据往往是高度复杂和异构的,许多生物网络中的节点(如基因、蛋白质等)和边(如相互作用、连接等)可能存在大量缺失或不准确的信息。这种稀疏性使得模型在学习和推理时难以捕捉到完整的生物学关系,进而影响到预测的准确性[33]。
此外,生物数据中的噪声问题也不容忽视。实验过程中的误差、样本污染以及数据采集技术的局限性都可能导致数据质量下降,进而影响GNNs的性能[34]。例如,在药物发现的研究中,噪声可能导致药物-靶标相互作用的预测不准确,从而影响新药的开发过程[35]。
为应对这些挑战,未来的研究方向可以集中在以下几个方面:首先,开发更为强健的GNN架构,以增强模型对稀疏和噪声数据的鲁棒性。例如,可以通过引入图嵌入技术和深度学习算法,优化数据表示,增强模型对不完整数据的学习能力[7]。其次,利用迁移学习和多任务学习等方法,可以在不同数据集之间共享知识,从而提高模型在数据稀疏场景下的表现[9]。最后,加强数据的预处理和清洗,以提高数据质量,从而为GNN模型提供更可靠的输入,进一步提升模型的预测能力[36]。
综上所述,图神经网络在生物学中的应用前景广阔,但也需克服数据稀疏性和噪声问题等挑战。通过不断的技术创新和方法改进,GNNs有望在生物信息学和药物发现等领域发挥更大的作用。
6.2 模型可解释性与临床应用
图神经网络(GNNs)在生物学中的应用广泛且多样,涵盖了从基础生物信息学到临床应用的多个领域。随着生物学数据的复杂性和规模的增加,GNNs逐渐成为分析生物网络的重要工具。
首先,在生物信息学中,GNNs被广泛应用于蛋白质功能预测、蛋白质-蛋白质相互作用预测以及药物发现等领域。例如,GNNs可以通过图结构有效地捕捉生物系统中节点之间的复杂关系,这使得它们在处理与药物靶点识别、癌症基因发现等相关的任务中表现出色[37]。此外,GNNs还被应用于基因调控网络和疾病诊断等领域,利用深度学习技术自动化地预测基因相互作用和疾病发生[1]。
然而,尽管GNNs在生物学研究中展现出巨大的潜力,但它们在临床应用中仍面临一些挑战。模型的可解释性是一个主要问题。在临床决策中,医生和研究人员需要理解模型的预测依据,而当前的许多GNN模型往往缺乏足够的可解释性,难以为生物学结果提供清晰的解释。这限制了GNNs在临床环境中的广泛应用[38]。例如,GNNexplainer等工具旨在提高模型的可解释性,帮助研究人员更好地理解GNN的预测结果[37]。
未来的发展方向包括加强GNN模型的可解释性和透明性,使其在临床环境中更具可接受性。此外,结合知识图谱的GNN模型可以提高模型的可解释性,通过将模型驱动的洞察与医学知识对齐,帮助临床医生做出更明智的决策[38]。此外,研究者们还需解决数据可用性和伦理监督的问题,平衡计算资源,并开发具有更好可解释性的GNN模型,以应对当前技术挑战[35]。
综上所述,GNNs在生物学中的应用前景广阔,但要实现其在临床中的有效应用,必须克服可解释性不足等挑战。未来的研究应聚焦于提高模型的透明性和解释能力,以促进GNN在生物医学领域的广泛应用。
7 总结
本报告系统地综述了图神经网络(GNNs)在生物医学领域的应用,重点探讨了其在基因组学、药物发现、疾病预测及生物标志物识别等方面的潜力和成就。GNNs通过有效捕捉生物数据中的复杂结构和相互关系,为理解生物系统的复杂性提供了新的工具。当前的研究表明,GNNs在蛋白质功能预测、药物-靶标相互作用预测及疾病分类等领域已取得显著进展。然而,GNNs的广泛应用仍面临数据稀疏性、噪声问题及模型可解释性等挑战。未来的研究应集中在改进模型的鲁棒性和可解释性,结合多种数据源以提高预测准确性,同时推动GNNs在临床应用中的实际转化。通过这些努力,GNNs有望为生物医学研究提供更为强大的支持,推动个性化医疗和新药研发的进展。
参考文献
- [1] Giulia Muzio;Leslie O'Bray;Karsten Borgwardt. Biological network analysis with deep learning.. Briefings in bioinformatics(IF=7.7). 2021. PMID:33169146. DOI: 10.1093/bib/bbaa257.
- [2] Rui Li;Xin Yuan;Mohsen Radfar;Peter Marendy;Wei Ni;Terrence J O'Brien;Pablo Casillas-Espinosa. Graph Signal Processing, Graph Neural Network and Graph Learning on Biological Data: A Systematic Review.. IEEE reviews in biomedical engineering(IF=12.0). 2023. PMID:34699368. DOI: 10.1109/RBME.2021.3122522.
- [3] Grigoriy Gogoshin;Andrei S Rodin. Graph Neural Networks in Cancer and Oncology Research: Emerging and Future Trends.. Cancers(IF=4.4). 2023. PMID:38136405. DOI: 10.3390/cancers15245858.
- [4] Lian Duan;Mahshad Hashemi;Alioune Ngom;Luis Rueda. Ligand-receptor dynamics in heterophily-aware graph neural networks for enhanced cell type prediction from single-cell RNA-seq data.. Frontiers in molecular biosciences(IF=4.0). 2025. PMID:40421418. DOI: 10.3389/fmolb.2025.1547231.
- [5] Mengying Sun;Sendong Zhao;Coryandar Gilvary;Olivier Elemento;Jiayu Zhou;Fei Wang. Graph convolutional networks for computational drug development and discovery.. Briefings in bioinformatics(IF=7.7). 2020. PMID:31155636. DOI: 10.1093/bib/bbz042.
- [6] Michelle M Li;Kexin Huang;Marinka Zitnik. Graph representation learning in biomedicine and healthcare.. Nature biomedical engineering(IF=26.6). 2022. PMID:36316368. DOI: 10.1038/s41551-022-00942-x.
- [7] Paola Lecca;Michela Lecca. Graph embedding and geometric deep learning relevance to network biology and structural chemistry.. Frontiers in artificial intelligence(IF=4.7). 2023. PMID:38035201. DOI: 10.3389/frai.2023.1256352.
- [8] Yahui Long;Min Wu;Yong Liu;Yuan Fang;Chee Keong Kwoh;Jinmiao Chen;Jiawei Luo;Xiaoli Li. Pre-training graph neural networks for link prediction in biomedical networks.. Bioinformatics (Oxford, England)(IF=5.4). 2022. PMID:35171981. DOI: 10.1093/bioinformatics/btac100.
- [9] Hai-Cheng Yi;Zhu-Hong You;De-Shuang Huang;Chee Keong Kwoh. Graph representation learning in bioinformatics: trends, methods and applications.. Briefings in bioinformatics(IF=7.7). 2022. PMID:34471921. DOI: 10.1093/bib/bbab340.
- [10] Juexin Wang;Anjun Ma;Qin Ma;Dong Xu;Trupti Joshi. Inductive inference of gene regulatory network using supervised and semi-supervised graph neural networks.. Computational and structural biotechnology journal(IF=4.1). 2020. PMID:33294129. DOI: 10.1016/j.csbj.2020.10.022.
- [11] Yao Sun;Jing Gao. HGATLink: single-cell gene regulatory network inference via the fusion of heterogeneous graph attention networks and transformer.. BMC bioinformatics(IF=3.3). 2025. PMID:39934680. DOI: 10.1186/s12859-025-06071-x.
- [12] Wentao Cui;Qingqing Long;Wenhao Liu;Chen Fang;Xuezhi Wang;Pengfei Wang;Yuanchun Zhou. Hierarchical Graph Transformer With Contrastive Learning for Gene Regulatory Network Inference.. IEEE journal of biomedical and health informatics(IF=6.8). 2025. PMID:39401117. DOI: 10.1109/JBHI.2024.3476490.
- [13] Tae Hyun Kim;Harim Kim;Hyunjin Hwang;Shinwhan Kang;Kijung Shin;Inwha Baek. Gene expression inference based on graph neural networks using L1000 data.. Briefings in bioinformatics(IF=7.7). 2025. PMID:40505083. DOI: 10.1093/bib/bbaf273.
- [14] Fengyao Yan;Limin Jiang;Danqian Chen;Michele Ceccarelli;Yan Guo. Reinventing gene expression connectivity through regulatory and spatial structural empowerment via principal node aggregation graph neural network.. Nucleic acids research(IF=13.1). 2024. PMID:38884259. DOI: 10.1093/nar/gkae514.
- [15] Ye Yuan;Ziv Bar-Joseph. GCNG: graph convolutional networks for inferring gene interaction from spatial transcriptomics data.. Genome biology(IF=9.4). 2020. PMID:33303016. DOI: 10.1186/s13059-020-02214-w.
- [16] Zehong Zhang;Lifan Chen;Feisheng Zhong;Dingyan Wang;Jiaxin Jiang;Sulin Zhang;Hualiang Jiang;Mingyue Zheng;Xutong Li. Graph neural network approaches for drug-target interactions.. Current opinion in structural biology(IF=7.0). 2022. PMID:35074533. DOI: 10.1016/j.sbi.2021.102327.
- [17] Pietro Bongini;Elisa Messori;Niccolo Pancino;Monica Bianchini. A Deep Learning Approach to the Prediction of Drug Side-Effects on Molecular Graphs.. IEEE/ACM transactions on computational biology and bioinformatics(IF=3.4). 2023. PMID:37656647. DOI: 10.1109/TCBB.2023.3311015.
- [18] Weimin Zhu;Yi Zhang;Duancheng Zhao;Jianrong Xu;Ling Wang. HiGNN: A Hierarchical Informative Graph Neural Network for Molecular Property Prediction Equipped with Feature-Wise Attention.. Journal of chemical information and modeling(IF=5.3). 2023. PMID:36519623. DOI: 10.1021/acs.jcim.2c01099.
- [19] Xuan Lin;Lichang Dai;Yafang Zhou;Zu-Guo Yu;Wen Zhang;Jian-Yu Shi;Dong-Sheng Cao;Li Zeng;Haowen Chen;Bosheng Song;Philip S Yu;Xiangxiang Zeng. Comprehensive evaluation of deep and graph learning on drug-drug interactions prediction.. Briefings in bioinformatics(IF=7.7). 2023. PMID:37401373. DOI: 10.1093/bib/bbad235.
- [20] Zhen Wang;Zheng Feng;Yanjun Li;Bowen Li;Yongrui Wang;Chulin Sha;Min He;Xiaolin Li. BatmanNet: bi-branch masked graph transformer autoencoder for molecular representation.. Briefings in bioinformatics(IF=7.7). 2023. PMID:38033291. DOI: 10.1093/bib/bbad400.
- [21] Lixuan Che;Yide Jin;Yuliang Shi;Xiaojing Yu;Hongfeng Sun;Hui Liu;Xinyu Li. A drug molecular classification model based on graph structure generation.. Journal of biomedical informatics(IF=4.5). 2023. PMID:37481052. DOI: 10.1016/j.jbi.2023.104447.
- [22] Ben Xu;Jianping Chen;Yunzhe Wang;Qiming Fu;You Lu. Reinforced Metapath Optimization in Heterogeneous Information Networks for Drug-Target Interaction Prediction.. IEEE/ACM transactions on computational biology and bioinformatics(IF=3.4). 2024. PMID:39316496. DOI: 10.1109/TCBB.2024.3467135.
- [23] Qiao Ning;Yue Wang;Yaomiao Zhao;Jiahao Sun;Lu Jiang;Kaidi Wang;Minghao Yin. DMHGNN: Double multi-view heterogeneous graph neural network framework for drug-target interaction prediction.. Artificial intelligence in medicine(IF=6.2). 2025. PMID:39579417. DOI: 10.1016/j.artmed.2024.103023.
- [24] Ding Ruan;Shuyi Ji;Chenggang Yan;Junjie Zhu;Xibin Zhao;Yuedong Yang;Yue Gao;Changqing Zou;Qionghai Dai. Exploring complex and heterogeneous correlations on hypergraph for the prediction of drug-target interactions.. Patterns (New York, N.Y.)(IF=7.4). 2021. PMID:34950907. DOI: 10.1016/j.patter.2021.100390.
- [25] Wen Tao;Yuansheng Liu;Xuan Lin;Bosheng Song;Xiangxiang Zeng. Prediction of multi-relational drug-gene interaction via Dynamic hyperGraph Contrastive Learning.. Briefings in bioinformatics(IF=7.7). 2023. PMID:37864294. DOI: 10.1093/bib/bbad371.
- [26] Wei Wang;Shihao Liang;Mengxue Yu;Dong Liu;HongJun Zhang;XianFang Wang;Yun Zhou. GCHN-DTI: Predicting drug-target interactions by graph convolution on heterogeneous networks.. Methods (San Diego, Calif.)(IF=4.3). 2022. PMID:36058415. DOI: 10.1016/j.ymeth.2022.08.016.
- [27] Zhenchao Sun;Hongzhi Yin;Hongxu Chen;Tong Chen;Lizhen Cui;Fan Yang. Disease Prediction via Graph Neural Networks.. IEEE journal of biomedical and health informatics(IF=6.8). 2021. PMID:32749976. DOI: 10.1109/JBHI.2020.3004143.
- [28] Yang Liu;Jason Huse;Kasthuri Kannan. Expression graph network framework for biomarker discovery.. Briefings in bioinformatics(IF=7.7). 2025. PMID:41139924. DOI: 10.1093/bib/bbaf559.
- [29] Yi Hao Chan;Deepank Girish;Sukrit Gupta;Jing Xia;Chockalingam Kasi;Yinan He;Conghao Wang;Jagath C Rajapakse. Discovering robust biomarkers of psychiatric disorders from resting-state functional MRI via graph neural networks: A systematic review.. NeuroImage(IF=4.5). 2025. PMID:40886780. DOI: 10.1016/j.neuroimage.2025.121422.
- [30] Kamilia Zaripova;Luca Cosmo;Anees Kazi;Seyed-Ahmad Ahmadi;Michael M Bronstein;Nassir Navab. Graph-in-Graph (GiG): Learning interpretable latent graphs in non-Euclidean domain for biological and healthcare applications.. Medical image analysis(IF=11.8). 2023. PMID:37263109. DOI: 10.1016/j.media.2023.102839.
- [31] Minghao Yang;Zhi-An Huang;Wenhao Gu;Kun Han;Wenying Pan;Xiao Yang;Zexuan Zhu. Prediction of biomarker-disease associations based on graph attention network and text representation.. Briefings in bioinformatics(IF=7.7). 2022. PMID:35901464. DOI: 10.1093/bib/bbac298.
- [32] Qing Zhao;Jianqiang Li;Linna Zhao;Zhichao Zhu. Knowledge Guided Feature Aggregation for the Prediction of Chronic Obstructive Pulmonary Disease With Chinese EMRs.. IEEE/ACM transactions on computational biology and bioinformatics(IF=3.4). 2023. PMID:35969556. DOI: 10.1109/TCBB.2022.3198798.
- [33] David Ahmedt-Aristizabal;Mohammad Ali Armin;Simon Denman;Clinton Fookes;Lars Petersson. Graph-Based Deep Learning for Medical Diagnosis and Analysis: Past, Present and Future.. Sensors (Basel, Switzerland)(IF=3.5). 2021. PMID:34300498. DOI: 10.3390/s21144758.
- [34] Margaret G Guo;Daniel N Sosa;Russ B Altman. Challenges and opportunities in network-based solutions for biological questions.. Briefings in bioinformatics(IF=7.7). 2022. PMID:34849568. DOI: 10.1093/bib/bbab437.
- [35] Rufan Yao;Zhenhua Shen;Xinyi Xu;Guixia Ling;Rongwu Xiang;Tingyan Song;Fei Zhai;Yuxuan Zhai. Knowledge mapping of graph neural networks for drug discovery: a bibliometric and visualized analysis.. Frontiers in pharmacology(IF=4.8). 2024. PMID:38799167. DOI: 10.3389/fphar.2024.1393415.
- [36] Edwin Alvarez-Mamani;Reinhard Dechant;César A Beltran-Castañón;Alfredo J Ibáñez. Graph embedding on mass spectrometry- and sequencing-based biomedical data.. BMC bioinformatics(IF=3.3). 2024. PMID:38166530. DOI: 10.1186/s12859-023-05612-6.
- [37] Bastian Pfeifer;Anna Saranti;Andreas Holzinger. GNN-SubNet: disease subnetwork detection with explainable graph neural networks.. Bioinformatics (Oxford, England)(IF=5.4). 2022. PMID:36124793. DOI: 10.1093/bioinformatics/btac478.
- [38] Ruth Johnson;Michelle M Li;Ayush Noori;Owen Queen;Marinka Zitnik. Graph Artificial Intelligence in Medicine.. Annual review of biomedical data science(IF=6.0). 2024. PMID:38749465. DOI: 10.1146/annurev-biodatasci-110723-024625.
麦伴智能科研服务
在麦伴科研 (maltsci.com) 搜索更多文献
图神经网络 · 生物医学 · 基因调控网络 · 药物发现 · 疾病预测
© 2025 MaltSci 麦伴科研
