应用数学与交叉科学研究中心生物信息学团队于2024年4月第2次组会按期举行,小组全体成员和各位导师共同参加。在这次组会上,由一名研一学生和两名研二学生分别汇报自己的研究进展,然后老师与同学们对汇报内容进行学术探讨,并对存在的问题给出相应的指导和建议。
郭贞贞:本次汇报了一篇文献《Disentangling Intrinsic and Extrinsic Gene Expression Noise in Growing Cells》,本文研究方法允许研究者明确考虑细胞的生长和分裂,并研究蛋白质浓度的变化,这与细菌、酵母或癌细胞等增殖细胞的实验直接相关。作者推导出一种广泛适用的蛋白质浓度噪声分解方法,发现总噪声可以表示为上游因素导致的噪声、随机生产和降解过程导致的泊松噪声以及细胞分裂过程中随机分配导致的噪声之和。这些结果与 mRNA 和蛋白质合成特定动态的基本细节无关。另外,给定蛋白质浓度的时间轨迹,可以将蛋白质浓度的离散时间导数作为蛋白质浓度的函数进行线性拟合。作者发现,在没有测量噪声的情况下,拟合的斜率(按增长率归一化)等于总蛋白质浓度噪声中内部噪声的比例。作者在具有各种基本基因表达动态的基因蛋白质浓度合成数据上验证了理论框架。
张秋玉:本次组会汇报了自己的工作进展。我们希望mRNA数量的实验分布符合数学模型的预测,通过数学模型可以准确获得几个重要转录过程速率的估计(即参数估计)。每个细胞 mRNA 计数的快照分布可以使用单分子荧光原位杂交或单细胞 RNA 测序来测量。这些分布通常适合二态电报模型的稳态分布,以估计感兴趣基因的三个转录参数:mRNA 合成率、开启率(开启状态是活跃转录状态)和关闭率。值得注意的是,scRNA-seq 数据容易出现技术噪声和生物噪声,本研究尝试提出一种新的数学理论解决这个问题。
郭成:本次汇报了近期的研究进展,前面我们根据准备的共进化特征,输入到构建的卷积网络中,多次训练测试后得到的结果不稳定,做了一些修改,得到每次迭代的稳定损失函数变化。之后就对多个测试集(coconet_23、plmc_19、RNAcontact_80)分别进行测试,同时我们还构建了自己的训练测试集,重新训练和测试,分别在前面几个测试集上测试,效果跟他人比还是较差一些,接下来找到导致这样的原因,再进行修改。
— 学生汇报照片展示 —