黄硕教授课题组《Nature Methods》报道纳米孔蛋白质组学重大突破

蛋白质是生命活动的执行者,由20种天然存在的蛋白质氨基酸构成。与高歌猛进的DNA测序技术相比,高灵敏、高通量的蛋白质测序技术的发展严重滞后,目前仅Edman降解法和质谱法能做到蛋白质测序。然而,Edman降解法的序列分析长度有限,质谱法的检测限和动态范围阻碍了低丰度蛋白质的分析鉴定和新型生物标志物的发现。单分子蛋白质测序技术可以提供更高的灵敏度和准确度,有望助力单细胞蛋白质组学的发展。2023年,《Nature》杂志将单分子蛋白质测序技术评为未来一年对科技创新产生巨大影响的七项新技术之一。

相比于核酸的4种核苷酸基本单元,蛋白质由20种氨基酸组成,具有更复杂的化学多样性。无论采取哪种读出方式,检测20个可区分的信号本身就是一个很大的挑战,准确解读蛋白质上的翻译后修饰信息对分析方法的检测分辨率提出了更高的要求。 

近日,我室黄硕教授课题组构建了一种工程化耻垢分枝杆菌膜蛋白A (MspA) 纳米孔,实现了全部蛋白质氨基酸及它们的翻译后修饰检测。研究团队在孔道的收缩区域引入了一个镍离子-次氮基三乙酸(Ni-NTA)适配体,利用配位相互作用实现了全部蛋白质氨基酸的直接检测和区分,区分准确率高达98.8%,是世界上第一个能完全分辨所有20种蛋白质氨基酸的纳米孔。在本篇工作中,作者亦采用了同种孔道,进而同时区分了4种常见的翻译后修饰氨基酸。

图1:基于Ni-NTA修饰的MspA纳米孔对20种氨基酸的检测

随后,作者将该策略用于多肽的氨基酸组成分析:使用氨肽酶将肽消化为单个的氨基酸,然后利用纳米孔读取电流事件,经过机器学习识别氨基酸身份,最终重构出原始肽序列的氨基酸图谱。

图2:基于纳米孔策略的肽的氨基酸组成鉴定

该纳米孔传感器还可以在分辨20种氨基酸的同时直接分辨翻译后修饰(如磷酸化、甲基化、糖基化、乙酰化),对纳米孔蛋白质测序和翻译后修饰的测序检测具有里程碑意义。

3:机器学习辅助20种天然氨基酸及4种修饰氨基酸的识别

该工作以“Unambiguous discrimination of all 20 proteinogenic amino acids and their modifications by nanopore”为题,于2023925日在《Nature Methods》发表相关论文(DOI: https://doi.org/10.1038/s41592-023-02021-8)。黄硕教授为该论文唯一通讯作者,我院博士生王可凡、张善雨及南京大学物理学院博士生周骁为论文共同第一作者。此项研究得到了生命分析化学国家重点实验室以及南京大学化学和生物医药创新研究院(ChemBIC)的重要支持,科技部国家重点研发计划(项目编号:2022YFA1304602)、国家自然科学基金(项目编号:2222540531972917)、中央高校基本科研业务费资助项目(项目编号:020514380257)、江苏省高层次创业创新人才引进计划(个人、团体计划)、江苏省自然科学基金(项目编号:BK20200009)、南京大学生命科学分析化学国家重点实验室(项目编号:5431ZZXM1902),中国博士后科学基金资助项目(项目编号:2021M6915082022T150308)等经费支持。