源代码从多序列中批量设计引物primers-peaker.pdf
#源代码#从多序列中批量设计PCR引物primers
Peaker
首先假设我们手里有40个序列文件,每个文件中包含两个
sequence序列信息,那么我们现在一共有80个序列了。现在我们要对
这80个序列进行批量的primers设计。每个序列都来自一个clone的
末端,然后我们想要找出每个end之间的region区域。到现在为止,
我们需要从已知region区域设计primer引物,然后对序列进行PCR扩
增。这个想法就是通过第一段sequence序列去检索左侧的primer,然
后通过第二段序列检索右侧的primer。这个工作可以分为以下几个步
骤:
1.阅读.fasta为后缀的FASTA格式文件,序列信息,
并在一个列表中
2.通过SeqIO解析并每一个fasta文件,然后将第二条
序列转换为互补序列。
3.两条序列被整合为一个。这个原始的序列之间region现
在是的。这就是为什么我们要在第一步中选择primer,然后来
这条未知的region。要记住这个工作背后的原理是在每一个
end检索primer。
4.有了这些序列后,我们准备好去将primer设计结果写入
文件了,这依赖于Python的Primer3工具。
第一部分我们调用Python语言的SeqIO包,利用parse()函数解析
文件,序列信息,然后将第二条序列通过reverse_complement()函
数反转为互补序列。
第二部分我们利用Primer3设计primer引物,并在输出文件
中。
这一过程我们只需要通过一个迭代循环,批量fasta文件,对
每个文件中的序列都用上面方法结合PRIMER3设计引物,并写出文
件,这样就可以实现批量设计序列引物了。
最后输出结果如下
喜欢本文吗?欢迎加入云生信跟大家一起进步~