人-全基因组重测序结果报告.pdf
文本预览下载声明
人-全基因组重测序
结果报告
2017-03-10
- 1 -
目录
一、分析结果 - 4 -
1 测序评估 - 4 -
1.1 碱基含量分布检查 - 4 -
1.2 测序质量分布检查 - 4 -
1.3 测序数据质量情况汇总 - 5 -
2 比对统计 - 6 -
2.1 比对结果及比对 - 6 -
2.2 测序深度分布比对结果及统计 - 6 -
3 SNP 检测和注释 - 7 -
3.1 SNP 检测 - 7 -
3.2 SNP 注释及统计 - 7 -
3.3 大效应SNP 注释及统计 - 8 -
4 InDel 检测和注释 - 9 -
4.1 InDel 检测 - 9 -
4.2 InDel 注释及统计 - 9 -
5 SV 检测和注释 - 10 -
5.1 SV 检测 - 10 -
5.2 SV 注释及统计 - 11 -
6 CNV 检测和注释 - 11 -
6.1 CNV 检测 - 11 -
6.2 CNV 注释及统计 - 11 -
6.3 CNV 注释及统计 - 11 -
二、分析方法 - 13 -
1 重测序实验流程 - 13 -
2 生物信息分析流程 - 13 -
3 数据过滤参数设置 - 13 -
4 比对 - 14 -
5 SNP 和InDel 检测 - 14 -
6 SV 检测 - 15 -
- 2 -
7 CNV 检测 - 15 -
8 Web Resources - 15 -
三、结果表格 - 16 -
四、参考文献 - 19 -
- 3 -
一、分析结果
1 测序评估
根据项目合同要求,我们构建DNA 文库进行全基因组重测序。
1.1 碱基含量分布检查
单碱基组分分布图分布检查用于检测有无AT 、GC 分离现象。由于在基因组双螺旋DNA 中根据碱基
互补原则A 与T 配对、G 与C 配对,所以正常情况下A 与T、G 与C 碱基含量相等。在高通量测序过程
中,测序的对象是随机打断的DNA 片段,位点在基因组上近似均匀,所以测序结果中A 与T、G 与C 碱
基含量应该也近似相等。但是建库和测序的随机性问题,可能导致出现AT 、GC 分离现象。如果测序中该
碱基无法分辨是A 、T、G、C 这四种碱基的哪一种碱基,则标记为N ,测序reads 中N 含量也能反映测序
质量的好坏。
测序reads 前几个碱基AT 、GC 不等波动较大,高于其他测序区段是因为测序本身的关系属于正常情
况。其它区段的GC、AT 的含量相等,且分布均匀无分离现象,测序reads 中N 含量接近于0,说明测序
结果正常。样本碱基组分分布见下图:
图1 单碱基组分分布图
注:横坐标为reads 中的碱基位置,纵坐标为单碱基在该位点所占的比例;不同颜色代表不同的碱基类型;由于是双端
PE 测序,前 150 bp 为一个PE 对的第一端序列read1 ,后 150 bp 为另一端read2 。正常情况下样本无AT 和CT 分离,前几
bp 出现抖动情况是由于随机引物、测序反应开始酶和底物结合不太稳定导致,属于测序本身所带来的正常抖动。
1.2 测序质量分布检查
Illumina 的HiSeq2500/4000/XTen 平台的碱基质量值是用Qphred 表示,HiSeq2500 碱基识别(Bsae Calling)
分析软件为 OLB-1.9.4 ,HiSeq2500 V4 试剂碱基识别(Base
显示全部