转载:paired-ends 测序原理(陈云地)
问题:read 1结束之后进行read 2是一个什么原理?
先看图:
(图中的示意在细节上有少许错误。由于图片难以修改,随它去了。能够找到错误,能够想到改正错误的办法,也是一种乐趣)
以下解答基于除了HiSeq X10、X5以外的其他Illumina高通量测序平台(比如HiSeq 2500)的测序化学。HiSeq X系列平台的PE反应原理也许有所不同。由于Illumina没有公开,作者无从得知。
Read 1测序完成后,进行以下步骤:
1、碱变性。用稀的氢氧化钠溶液变性DNA双链(效果与热变性一样),使read 1测序过程中所合成的产物链(连带read 1测序引物)与模板链分开,成为单链;用缓冲液冲过FC的各条LANE,把游离的DNA链(即read 1测序的合成产物)冲走,冲出FC。
2、末端修补。在read 1测序前的cluster生成过程中,有一个片段化步骤,使用特定的酶切断了P5接头导致所有P5接头的3‘末端成为不自然的状态。现在要用PNK酶把它们修复好,使这些游离末端恢复自然状态,形成-OH基,为再一次的互补链合成作好准备。
3、再次搭桥,准备桥式PCR。模板单链与固定在FC上的、位于它附近的、末端已经修补完成的、比最开始短了一截的P5接头完成互补杂交。此时接头可以作为合成互补链(即桥式PCR)的引物起作用。这一过程可以与末端修补同时进行。P5接头之所以短了一截,是因为在read 1测序前被切断,去掉了几个碱基。
4、互补链合成。加入DNA聚合酶、dNTP、缓冲液,37°C左右保温一定时间,合成互补链。此dNTP是普通的dNTP,没有终止子修饰、没有荧光基团标记、也没有双脱氧修饰。此DNA聚合酶也是普通的聚合酶,不需要高保真,因为只有一个循环,而且模板也不长,通常也就300-500碱基左右。保温的具体温度和时间,需要Illumina研发专家告诉我们。理论上,read 2的桥式PCR只要进行一个循环就可以了。实际上进行了多少个循环,也需要Illumina的研发专家指导。
5、线性化。线性化是“使DNA分子变得单链化且同一方向单向化”的意思。用fpg试剂把P7接头内的一个特殊修饰的G碱基切断,形成一个单链缺口,使DNA模板链在3’端附近与FC断开。下面只要进行碱变性,就可以使它从FC上游离下来。
6、末端封闭。所有完整的游离末端都用ddNTP延伸一个碱基,防止它们在read 2的测序过程中非模板依赖地随机延伸(这时所使用的dNTP带荧光标记)而形成过高的背景噪音。P7接头的末端由于已经被fpg切断破坏,不是自然的结构,无法延伸,也不需要封闭。
7、碱变性。read 1的模板链已经被fpg切断,使用氢氧化钠溶液进行碱变性,使它从FC上游离下来,然后被缓冲液从FC里冲走,只留下新合成的互补链作为read 2测序的模板。
8、Read 2测序引物杂交。Read 2测序引物在新合成的互补链(模板分子)的5‘端杂交。
9、开始read 2测序。测序长度在HiSeq 2500上是100个碱基。
10、Read 2实际测得的碱基序列在方向上与read 1是相反的,是其互补链。测序仪的软件自动把它互补过来,使之与read 1保持同一个方向,方便后续的数据分析。