全基因组范围内SNP关联分析(GWAS)技术.pdf
文本预览下载声明
基本内容
1 单核苷酸多态及数据格式
2 GWAS关联分析技术
3 SNP单倍型分析技术
4 SNP数据分析软件操作
一、单核苷酸多态及数据格式
一、单核苷酸多态及数据格式
单核苷酸多态性
(single nucleotide polymorphism,SNP)
主要是指在基因组水平上由单个核苷酸的变异所引
起的DNA序列多态性。它是人类可遗传的变异中最常见
的一种。
个体 序列
AGATACGGCTAAACTTGGGGGTTTTTAAACCCCTT
chr6
1 chr6
AGATAAGGCTAAACTTGGGGGTTTTTAAGCCCCTT
AGATAAGGCTAAACTTGGGGGTTTTTAAGCCCCTT
2 chr6
AGATAAGGCTAAACTTGGGGGTTTTTAAACCCCTT
AGATACGGCTAAACTTGGGGGTTTTTAAGCCCCTT
3 chr6
AGATACGGCTAAACTTGGGGGTTTTTAAGCCCCTT
AGATAAGGCTAAACTTGGGGGTTTTTAAACCCCTT
4 chr6
AGATAAGGCTAAACTTGGGGGTTTTTAAACCCCTT
突变率低,一次突变,遗传+ 自然选择使得等位扩增,snp多为二态
一、单核苷酸多态及数据格式
注:
(1)理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多
态性,但实际上,后两者非常少见,几乎可以忽略。
(2 )占所有已知多态性的90% 以上。
(3 )SNP数目:
目前,测得大约1500~3000 万个SNP 位点(平均约每100~200 bp )
存在一个单碱基突变。
一、单核苷酸多态及数据格式
(4 )从对生物的遗传性状的影响上来看,SNP又可分为2种:
同义SNP(synonymous SNP),即SNP所致的编码序列的改变并不影响其所
翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同。
非同义SNP(non-synonymous SNP),指碱基序列的改变可使以其为翻译的
蛋白质序列发生改变,从而影响了蛋白质的功能。
一、单核苷酸多态及数据格式
人类基因组中3000万的SNP,遍布全基因组,由于其分布广、密度
高、检测技术手段成熟,伴随和HapMap计划的完成和1000genome计划
的开展,目前已被广泛应用于复杂疾病风险位点的检测中。
我们的目的:
寻找哪些SNP标记与疾病相关—关联分析
一、单核苷酸多态及数据格式
单核苷酸多态的测定及数据格式
(1)PCR
(2 )SNP芯片
(3 )新一代测序技术
AGATACGGCTAAACTTGGGGGTTTTTAAACCCCTT
1 chr6
AGATAAGGCTAAACTTGGG
显示全部