蛋白质是构建生命体的基本物质之一,在合成、催化和信号传感等所有生命活动中均承担着重要的功能。开发一种可靠、高效的蛋白质测序技术对于理解生命过程和揭示疾病机理而言至关重要。作为构成蛋白质的组成片段,多肽,成为打开蛋白质这扇大门的“钥匙”。
纳米孔测序技术是近年来新兴的一种单分子测序技术,其中多肽纳米孔测序仍面临诸多挑战。近日,南京大学化学化工-手机(首页)版伟德bv研究团队在国际知名期刊《纳米快报》杂志发表论文,他们利用纳米孔错位测序技术,像在水井里提绳打水一样,构建了多肽-DNA嵌合链,用DNA测序酶与DNA的结合,通过DNA的移动,带动多肽分子在纳米孔内的棘轮运动,从而实现了多肽的纳米孔测序,破解了技术瓶颈。
无法进行序列扩增,制约蛋白质测序灵敏度
蛋白质,组成人体一切细胞、组织的重要物质,可以说,没有蛋白质就没有生命。而蛋白质的功能是由蛋白质的序列决定的,序列的微小改变,可能导致蛋白质失去生物活性或者诱发疾病。
如果能为蛋白质测序,就可以确定蛋白质是否有序列变化,判断是否会对人类健康有影响。
“与核酸检测不同,目前蛋白质测序的难点在于,缺乏有效的序列扩增方法,技术发展上停滞不前,主要靠质谱法和埃德曼降解法来测序。”该篇论文的通讯作者、南京大学化学化工-手机(首页)版伟德bv教授黄硕说。
通俗地说,质谱法是用生物酶将蛋白质分解成很多多肽片段,再通过质谱仪器检测,确定蛋白质片段的信息,最终将这些片段重构成蛋白质序列。而埃德曼降解法是用化学方法将蛋白质N端的一个氨基酸切下来进行鉴定,再进行第二轮的氨基酸切割和鉴定,多次循环操作后,确定氨基酸的序列。
但在黄硕看来,这两个方法都有局限性。“相较于DNA和RNA测序,构成蛋白质的氨基酸种类更多,质谱法的检测难度大于核酸测序。而对埃德曼降解法来说,它只能对单一的蛋白质样品序列解析,如果降解的样品纯度不够,混合有多种蛋白质样品,那么被切下来的氨基酸就会有很多种,就无法确定哪个氨基酸来自哪个蛋白质的,无法判断蛋白质的序列。另外,还有一些肽段的末端是封闭的,就不能用降解法。”黄硕介绍。
更重要的是,由于无法实现序列扩增,蛋白质测序的灵敏度度较低,这意味着无法检测自然界中一些丰度很低的蛋白质样品。黄硕认为,利用现有的技术,复杂环境中的蛋白质,难以直接测序,比如体液、土壤、水体中的蛋白质样品,要先做一些纯化、富集,达到测序的样品标准,才能在质谱仪中测序。同时,蛋白质的化学修饰很丰富,这也有可能干扰蛋白质测序。
借助DNA与酶的反应,牵引肽链在纳米孔中可控运动完成测序
能不能找到一种更微观的测序方式,只用一个分子就能为蛋白质测序?从2015年开始,纳米孔测序技术进入黄硕课题组研究视野。
纳米孔测序技术是近年来新兴的一种单分子测序技术,已在DNA和RNA测序方面取得成功,它通过让单链的核酸通过纳米孔,通过纳米孔内的检测器获得核酸链的碱基信息。
“如果能在单分子水平上为蛋白质测序,将为检测低丰度蛋白和单细胞蛋白质组学提供极高的灵敏度。”受此启发,黄硕课题组开始研究,用纳米孔测序技术,进行蛋白质或多肽的单分子测序。
但是多肽纳米孔测序仍面临诸多挑战,其中一个主要的困难是如何实现多肽在纳米孔中可控的棘轮运动,而这主要受限于目前没有和肽链相匹配、有很强的亲和力的多肽测序酶。
“棘轮运动指的生物高分子贴着纳米孔的内壁,顺着同一个方向做匀速、定向运动,类似于附着在齿轮内壁上移动一样,这需要找到一种酶来控制多肽的运动速度,从而控制它穿过纳米孔的速度,以精准测序。”
此前,黄硕课题组曾尝试对非天然核酸测序,但是苦于没有找到合适的酶来匹配棘轮运动,后来,他们突发奇想,利用纳米孔的错位效应来测序,并开创了纳米孔错位测序技术。
“核酸的纳米孔识别位点和酶的反应位点,有一个固定的约14-15个碱基的错位,这就形成了一个测序窗口,可以利用这个不受酶反应限制的窗口,实现多肽的测序。”黄硕说。
纳米孔错位测序技术能否应用在多肽测序领域?近期,黄硕课题组在技术验证时发现可行。在此次研究中,他们将多肽和DNA嵌合成一条链条,嵌合链的DNA部分为“牵引链”,在检测过程中,DNA测序酶与DNA结合,通过拉动DNA部分,牵动整条链条在纳米孔中的可控棘轮运动,实现多肽的纳米孔直接读取。
黄硕打了个比方,“这就相当于用绳子在井里提水桶,如果井是纳米孔的话,井绳就是DNA,水桶就是多肽。‘井口’的DNA测序酶拉动DNA在纳米孔内移动,而DNA又与多肽嵌合在一起,DNA的移动,也就直接拉动了多肽的移动,从而实现了多肽的纳米孔测序。”
黄硕介绍,经验证,多肽的纳米孔测序信号表现出高度的一致性和序列相关性,由单氨基酸替换引起的电流变化也能被清楚地检测到。通过将多肽的N端或C端与DNA驱动链进行偶联,实现了对多肽两端氨基酸序列信息的读取。
“这意味着,可以对蛋白质单分子进行测序,这为今后的蛋白质高通量测序,蛋白质重构,提供了一个全新的工具。”黄硕说,借助蛋白质序列研究,可以对蛋白质的功能进行预测,从而帮助理解、解释相关生命活动。