数理科学学院2025年第一期研究生论坛顺利举办

来源:数理科学学院 作者:李汉中审核:郑仟发布时间:2025-03-06 16:13 浏览次数:


应用数学与交叉科学研究中心生物信息学团队于2025年3月5日第1次组会按期举行,小组全体成员和各位导师共同参加。在这次组会上,由两名研一学生和两名研二学生分别汇报自己的研究进展,然后老师与同学们对汇报内容进行学术探讨,并对存在的问题给出相应的指导和建议。

李代欣:本次组会汇报了一篇文献《Evaluation of AlphaFold 3’s Protein−Protein Complexes for Predicting Binding Free Energy Changes upon Mutation》。这篇文献评估了AlphaFold 3(AF3)在预测蛋白质-蛋白质复合物结构方面的表现,特别是其在预测突变引起的结合自由能(BFE)变化方面的能力。AF3作为AlphaFold的升级版,不仅能够预测单个蛋白质结构,还能够预测蛋白质-蛋白质复合物的结构,这是计算生物学中的重要进展。实验使用SKEMPI 2.0数据库评估了AF3预测的蛋白质-蛋白质复合物结构,该数据库包含317个蛋白质-蛋白质复合物和8338个突变引起的BFE变化。文章将AF3的性能与以前使用PDB结构的模型进行了比较。AF3在使用多任务拓扑拉普拉斯模型(MT-TopLap)预测BFE变化时达到了0.86的皮尔逊相关系数,这略低于使用PDB结构时达到的0.88。这表明,虽然AF3的预测表现出色,但其预测误差(RMSE增加了8.6%)略有增加。AF3预测的复合物结构大多数与真实结构对齐良好,但一些复合物的结构不对齐,这些问题未被传统的性能指标(如ipTM)捕捉到。此外,AF3在预测蛋白质中高度灵活区域或结构域时的表现较差。研究表明,AF3在处理高度灵活的蛋白质或区域时表现较差,这可以通过结构不对齐和高B因子的关联来证明(高B因子表示蛋白质的柔性区域)。尽管AF3在一些柔性区域的预测中存在挑战,但整体表现仍然具有竞争力,特别是在药物发现、蛋白质工程和疾病治疗等领域。未来,改进AF3的柔性区域预测能力,以及进一步减少RMSE误差,将增强其在更广泛的生物学和医学研究中的应用。此外,结合其他补充技术(如实验数据)和更高质量的蛋白质复合物数据,可以进一步提高AF3的预测准确性和可靠性。

王桂林:本次汇报了一篇名为《Rapid response to fast viral evolution using AlphaFold 3-assisted topological deep learning》的文献。本研究提出了一种基于AlphaFold 3(AF3)辅助的拓扑深度学习模型(MT-TopLap),旨在应对病毒快速进化对疫苗和抗体设计的挑战。该模型通过三步流程进行:首先利用AF3预测病毒蛋白与宿主受体的3D复合物结构,其次提取结构中的拓扑和几何特征,再结合多任务深度学习进行突变效应预测。核心创新在于将持久拉普拉斯引入病毒进化预测,并通过轻量化迁移学习快速适应新变体数据。该模型在性能验证中表现出色,能够替代实验数据预测突变对结合能力的影响,成功提前预警变体传播趋势,并为疫苗设计提供指导。优势在于加速疫苗研发周期、主动应对变体进化、突破传统预测方法的局限,为AI驱动的结构生物学提供了新范式,具有广泛的实际应用前景。

万智康:本次组会汇报了关于RNA基序的研究思路及进展。RNA基序是具有特定序列或结构模式的RNA片段,广泛存在于细胞中并与多种生物过程相关,如基因表达调控、蛋白质合成和RNA加工等,其研究对揭示RNA功能和机制具有重要意义。从Rfam数据库中提取所有RNA家族的序列集合,并从PDB数据库筛选具有已解析三维结构的RNA序列,确保结构和功能上的代表性。利用MEME工具识别RNA序列中的潜在保守序列基序,并将其与PDB中的三维结构RNA序列比对,识别具有功能意义的关键序列。根据三维结构信息进行统计分析,评估基序在RNA折叠与功能中的潜在作用。构建多模态特征集,包括序列保守性、位置特异性得分矩阵(PSSM)、二级结构预测(RNAfold)等生物学特征。通过标准化多源数据,形成统一的特征矩阵,为模型训练提供输入,在模型构建与训练阶段,尝试多种深度学习框架,包括残差神经网络(ResNet)、图神经网络(GNN)、卷积神经网络(CNN)和长短期记忆网络(LSTM),并结合不同模型结构进行交叉验证与超参数优化。模型训练过程中,使用Adam优化器与交叉熵损失函数,评估各模型的性能表现,筛选出最佳模型结构。模型性能评估采用真阳率(TPR)、马修斯相关系数(MCC)、F1分数等多种指标,通过持续的交叉验证和性能优化,进一步提高模型的泛化能力与预测精度。最终,将高可信度的RNA基序预测结果提交专业数据库比对验证,探索其在RNA-蛋白质相互作用中的潜在功能。同时,将研究成果应用于药物设计和功能性RNA分子工程,推动RNA功能研究与应用的发展。

黎红艳:本次组会汇报了一篇文献《Weighted Feature Fusion of Convolutional Neural Network and Graph Attention Network for Hyperspectral Image Classification》,卷积神经网络(CNN)和图神经网络(GNN),如图注意力网络(GAT),是两种经典的神经网络模型,分别应用于网格数据和图数据的处理。它们在高光谱图像分类领域取得了突出的性能,引起了人们的极大兴趣。然而,CNN一直面临着小样本的问题,GNN必须支付巨大的计算成本,这限制了两种模型的性能。本文利用基于超像素的GAT和基于像素的CNN的互补特性,提出了用于HSI分类的卷积神经网络和图注意力网络的加权特征融合(WFCG)。我们首先借助基于超像素的编码器和解码器模块建立GAT。然后我们结合注意力机制构建CNN。最后,将特征与两个神经网络模型的特征进行加权融合。对三个真实世界HSI数据集的严格实验表明,WFCG可以充分探索HSI的高维特征,并与其他最先进的方法相比获得有竞争力的结果。