我室鞠熀先教授、Jean-Louis Mergny特聘教授和周俊副教授研究组在i-DNA研究领域取得新进展

        i-DNA也即i-motif DNA,是1993年发现的一种由富含胞嘧啶序列形成的非典型四链体核酸结构(图1A)。近年来,越来越多的证据表明i-DNA结构在人细胞核中能保持稳定,i-DNA的形成序列在基因组中广泛存在,尤其集中在癌症基因启动子区域。尽管该结构具有维持端粒长度、调节基因转录和翻译等一系列重要的生理功能,且作为一类新型的抗癌靶点得到广泛关注,但实验验证过的i-DNA形成序列至今总数不超过230条。极其有限的实验数据导致当前科学界对i-DNA结构形成的序列多样性缺乏足够的认知,甚至不同实验室发表的数据中出现了相互矛盾的结果。此外,大多数关于i-DNA结构的研究都集中细胞外,这导致科学界缺乏对细胞内/外i-DNA结构性质的统一认识,由此产生疑惑:细胞外的数据能否代表细胞内的性质?

图1.(A)分子内i-DNA三维结构示意图;(B)半质子化胞嘧啶-胞嘧啶碱基对(C·C+)。

        为了厘清序列对i-DNA结构的影响,并探究i-DNA在细胞内/外稳定性,我室鞠熀先教授、Jean-Louis Mergny特聘教授和周俊副教授研究组设计了近300条序列,系统考察了半质子化胞嘧啶-胞嘧啶碱基对(C·C+, 图1B)数量、环状区域的碱基数量和组成、末端序列的位置和碱基组成等对i-DNA热稳定性和pH稳定性的影响。该工作还基于大量的实验数据,通过机器学习首次构建了i-DNA稳定性的数学预测模型。

        研究发现,在一定范围内环状区域的总长度对i-DNA稳定性几乎没有明显影响(图2A)。作为对比,G-四链体稳定性随着环状区域总长度的延长而单调递减。因此,在揭示基因组中搜索i-DNA和G-四链体的形成序列时,尤其要注意环状区域序列对这两种结构的不同影响。同时,当中间环状区域相对较长时,i-DNA的稳定性会更高(图2B),这个结论与该研究组之前关于G-四链体的发现是类似的(Nucleic Acids Res., 2018, 46, 9264-9275)。此外,i-DNA稳定性会随着C·C+碱基对数量增加而增加,但是增加量会逐渐衰减(图2C)。

图2.(A)环状区域总长度,(B)环状区域的相对排列,(C)C·C+碱基对数量对i-DNA稳定性的影响。

        该研究团队还通过对比细胞内外NMR谱图(图3),发现部分i-DNA不仅可以稳定存在于细胞内,其细胞内的稳定性也明显高于其在溶液中的稳定性。细胞内外的i-DNA稳定性表现出高度的一致性,即在溶液中具有较高稳定性的i-DNA,其在细胞内也具有较高的稳定性。

图3. 细胞内NMR测试后的(A)共聚焦显微镜图和(B)双染色FCM分析;(C)溶液与(D)细胞内变温NMR谱图。

        圆二色(CD)和热差谱(TDS)是表征i-DNA结构最常用的两种基本方法。然而长期以来,谱图的解析却缺乏深刻认识。基于实验中获得的大量CD和TDS数据,通过多元数据分析,首次发现C·C+碱基对作为构成i-DNA结构的核心成份决定CD和TDS谱的主要峰形,而环状区域主要影响主峰之间的过渡区域(图4)。

图4. CD谱图的多元数据分析。(A,B)C·C+碱基对数量,(C,D)环状区域总长度,(E,F)中间环状区域长度。

        这项工作使得i-DNA研究序列数量成倍增加,并对i-DNA的光谱特征提供了详尽的理论解释。研究结果以研究全文的形式背对背投稿到Angew. Chem.杂志 (Angew. Chem., Int. Ed. 2021, DOI: 10.1002/anie.202016801; Angew. Chem., Int. Ed. 2021, DOI: 10.1002/anie.202016822),得到了多位审稿人的高度评价:“i-motif研究领域最系统的研究,并将有助于解决该领域的多个难题”以及“i-motif研究领域的里程碑”。该工作有助于研究人员深刻理解i-DNA的结构性质,并在此基础上为进一步构建i-DNA数据库、开发基因组层次上的i-DNA信息检索方法,以及合理设计基于i-DNA结构的核酸纳米器件等方面具有实际指导意义。

        研究工作的细胞内外核磁、机器学习和光谱分析分别得到捷克马萨里克大学Lukáš Trantírek课题组,英国牛津大学Aleksandr B. Sahakyan课题组,意大利那不勒斯大学Antonio Randazzo课题组的大力支持。感谢国家自然科学基金、南京大学、中央高校业务经费和生命分析化学国家重点实验室的经费资助。