外显子捕获结题报告分析.docx
文本预览下载声明
外显子捕获结题报告2010-11-22内容1 项目信息12 工作流程介绍22.1 Agilent液相捕获平台22.2 NimbleGen 液相捕获平台32.3 生物信息分析流程43 分析报告5结果53.1 标准生物信息分析53.1.1 数据产出统计53.1.2 目标区域单碱基深度分布图63.1.3外显子捕获测序的均一性73.1.4一致序列组装和SNP检测73.1.5 SNP注释83.1.6插入/缺失(indels)检测93.1.7插入/缺失(indels)注释93.2个性化分析93.2.1氨基酸替换预测93.2.2群体SNP检测和等位基因频率估计123.2.3孟德尔遗传病分析133.2.4 NGS-GWAS 分析143.2.5正向选择信号的检测144 数据分析方法说明154.1信息分析软件及常用参数介绍154.2参考数据库164.3数据文件格式171 项目信息PROJECT NAMECONTRACT NUMBERSAMPLE INFORMATIONSpecies InformationGenome InformationAdditional InformationCUSTOMER INFORMATIONPIContact PersonCompany NameContact MethodsNameTel E-mailNameTelE-mailCONTACT INFORMATION (BGI)Sales InformationNameTelE-mailNameTelE-mailCustomer ServiceNameTelE-mailNameTelE-mailPROJECT DIRECTOR APPROVALTHE RESULTS HAVE BEEN APPROVED AND CAN BE SUBMITTEDSignature:Date:2 工作流程介绍采用AglientSureSelect外显子靶向序列富集系统和NimbleGenSeqCap EZ人全外显子捕获系统。这两个系统都采用液相系统进行高特异性和高覆盖率的外显子区域捕获。2.1 Agilent液相捕获平台图2.1Aglient外显子捕获和测序流程基本流程:首先将基因组DNA随机打断成150-200bp左右的片段,随后在片段两端分别连接上接头制备杂交文库。文库经纯化后经过LM-PCR的线性扩增与SureSelect Biotinylated RNA Library (BAITS)进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序(Hiseq2000测序仪)。对每个捕获文库进行高通量测序并保证测序深度达到要求,原始图像文件经过Illumina basecalling Software 1.7进行碱基读取,获得读长为90bp双末端序列(reads)。2.2 NimbleGen液相捕获平台图2.2NimbleGen外显子捕获和测序流程基本流程:首先将基因组DNA随机打断成200-300bp左右的片段,随后在片段两端分别连接上接头制备杂交文库。文库经纯化后经过LM-PCR的线性扩增与Biotinylated DNA Library进行杂交富集,再经过LM-PCR的线性扩增,文库检测合格后即可上机测序(Hiseq2000测序仪)。对每个捕获文库进行高通量测序并保证测序深度达到要求,原始图像文件经过Illumina basecalling Software 1.7进行碱基读取,获得读长为90bp双末端序列(reads)。2.3 生物信息分析流程测序完成之后,下机数据为fastq文件格式,随后对数据进行信息分析,分析流程如下:图2.3 外显子测序信息分析流程(1)SOAPaligner是华大自主研发的比对软件,用于将高质量的原始reads比对到参考基因组上,详细说明见信息分析软件及参数介绍部分,或者登录网站/,仅比对到参考基因组的reads用于后续分析。(2)计算得到的Coverage和Depth是指目标区域的覆盖度和测序深度,计算时所用的数据是所有比对到参考基因组的reads。3 分析报告结果3.1 标准生物信息分析3.1.1 数据产出统计基本数据分析统计结果主要包括:测定的序列(reads)长度、reads数量、数据产量、reads序列与参考基因组序列比对结果、目标外显子区域测序深度及覆盖度分析、目标外显子区域SNP检测及注释等。具体统计结果参照表3.1。表3.1统计量详细说明统计量定义及计算方法Target region (bp) 设计探针覆盖的区域,作为目标区域,用于捕获外显子Raw reads测序得到的原始reads个数Raw data yield (Mb)原始reads产量,即所有碱基个数(以Mb为单位)Reads mapped to genome比对到
显示全部