更快更精确!专门为碱基转换测序方法设计的序列比对软件



碱基转换测序法 (nucleotide conversion sequencing technology),是将一段遗传物质(DNA或者RNA)中的一种特定碱基转化成另一种碱基的测序方法。例如重亚硫酸盐定序(Bisulfite sequencing)就是将DNA中未被甲基化的C转化成T。类似的测序方式包括TAPS,TAB-seq,oxBS-seq。这些方法可以检测出遗传物质中具体的甲基化位点,所以被广泛应用。其他的测序方式,例如SLAM-seq,将4-thiouridine (s4U) 引入细胞,取代原本用来合成RNA的U,用来标记新合成的RNA(nascent RNA)。这些方法将一种特定的碱基转化成另一种碱基,从而让科学家标记细胞内遗传物质的变化。传统的序列比对(sequence alignment)软件不能很好的用于碱基转换的比对。尽管有一些为碱基转换测序设计的比对软件,例如Bismark,SLAM-DUNK,但是比对的结果总是很不理想。


2021年6月8日,特克萨斯大学西南医学中心Daehwan Kim研究团队在Genome Research上发文题为Rapid and accurate alignment of nucleotide conversion sequencing reads with HISAT-3N的方法论文。发布了一个专门为碱基转换测序设计的比对软件:HISAT-3N。



HISAT-3N 的设计基于HISAT2测序软件,加入了三核酸比对算法(three-nucleotide alignment algorithm)。HISAT-3N首先把reads和reference中所有的C都转化成T,然后用只有三种碱基的reads和只有三种碱基的reference做比对,最后根据原始序列过滤比对结果。



根据模拟的测序数据,HISAT-3N的运行速度远超过其他的比对软件,并且精确度在98%以上(其他的软件精确度都在95%-97%之间)。HISAT-3N的可拓展性也远好于其他的软件,运行核心数与运行时间的比例接近1:1,非常适合大型项目使用。和其他的软件相比,HISAT-3N有5个重要的特点:1. 支持所有现有的碱基转换测序方法。2. 所有的测序方法只用同一种索引文件。3. 同时支持RNA和DNA的比对。4. 运行速度很快,并且不产生任何的中间临时文件。5. 可以在短时间内找到所有的比对位点。


HISAT-3N是一个针对碱基转换测序的、快速、准确、灵活、拓展性强和内存消耗少的软件。研究者可以在更短的时间内使用HISAT-3N得到更精确的比对结果,为下游分析打下坚实的基础。


得克萨斯西南医学中心助理教授Daehwan Kim本文的通讯作者。该实验室的博士生张云是本文的第一作者。


原文链接:

https://genome.cshlp.org/content/early/2021/06/08/gr.275193.120.abstract


制版人:十一

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经允许禁止转载,作者拥有所有法定权利,违者必究。

举报
评论 0