研究背景
基因调控网络(GRN)定义细胞特性,转录因子(TF)通过结合基因调控元件调节表达。单细胞技术如scRNA-seq和snATAC-seq揭示了细胞状态和染色质可及性,为研究细胞类型特异性GRN提供了机会。肝脏细胞沿门静脉至中央静脉的梯度变化,受微环境影响。这些变化如何与基因组调控相互作用,尚待进一步研究。
研究结果
1.小鼠肝脏的空间单细胞多组图谱分析
作者应用单细胞多组学技术,包括snRNA-Seq和snATAC-Seq,对小鼠肝脏组织进行多次高通量测序,分析肝脏细胞的染色质可及性和基因表达。结果揭示了细胞亚群和沿门静脉的单向梯度空间轴。
2.关键基因调控网络和转录因子
使用pyscisTarget分析,作者筛选了关键转录因子(TF),并预测了它们的目标增强子区域,构建了增强子调控网络。研究发现,肝细胞核心调控因子包括ONECUT1、CEBPA等,而TBX3和TCF7L1在特定区域特异表达。此外,还发现了与营养、激素和生物钟相关的调控因子。
3.MPRA解析增强子活性的核心基序
采用增强子条码进行大规模平行突变分析(MPRA),筛选肝细胞可及的10,845个基因组区域,克隆后转染至小鼠肝脏和HepG2细胞。结果显示,这些区域的增强子活性显著高于随机序列,特别是HNF1A、HNF4A等因子的靶区域。通过基序分析和随机森林模型,揭示了活性增强子的关键基序,为理解增强子活性的分子机制提供了新见解。
4.DeepLiver解码肝细胞增强子
作者开发了一种深度学习框架DeepLiver,通过卷积神经网络(CNN)分析DNA序列,识别肝脏调控模式。该模型利用迁移学习,优化了对体内MPRA活性和肝细胞分区的预测。尽管样本数量有限,DeepLiver在预测准确性和损失上优于随机分类器,与实验数据的高相关性验证了其有效性。该模型能准确预测DNA序列的细胞类型、增强子活性和分区模式。