基因芯片数据的标准化及分析方法.pdf
文本预览下载声明
1·22 · 中国卫生统计2004 年 4 月第 21 卷第 2 期
基因芯片数据的标准化及分析方法
1 1 2
贺宪民 贺 佳 XIAN G Zhaoying
随着人类基因组计划的发展 ,编码人类全部染色 不对称性。
体的约 3~4 万条基因被发现 ,人类基因组计划由此进 C5 ij
x ij = log2
入后基因组时代 ,研究重点由发现基因转向探索基因 C3 ij
的功能 , 由此产生了用于基因功能分析的新技术和新 C5 ij 为基因 i 在试验j 上的 Cye - 5 荧光测量值
方法 〔1〕。基因芯片是生物芯片中发展最成熟的一种 C3 ij 为基因 i 在试验j 上的 Cye - 3 荧光测量值
高通量处理技术 ,它提供了从染色体水平分析基因表 2 基因芯片数据的标准化
达模式的手段 ,而它所产生的大量数据对数据的分析 基因芯片实验中的变异来源很多 ,如荧光标记效
和信息的提取提出新的挑战 ,如基因芯片数据的标准 率、扫描参数的设置、空间位置的差异等 ,都可能对基
化 ,差异表达基因的鉴别 ,基因功能的分类 ,基因间的 因表达水平的测量产生影响。因此 ,原始数据需经过
网络调控模式的分析等。 标准化 , 以消除由于系统变异引起的误差,使得基因表
达数据真实地反映测量样品的生物学差异。常规标准
基因芯片数据的产生及标准化
化包括 :
( )
1 基因芯片数据的产生 1 均数或中位数中心化
包括基因中心化和序列中心化。
通常在实验中使用的共同参照样本与实验本身是
独立的 ,而分析时也应该把参照样本表达水平的影响
去除 ,基因中心化就可以实现这一目的。基因中心化
是把每个基因在各实验中的表达值减去该基因在各实
验中表达值的均数或中位数。基因中心化后的值就反
映了该基因在不同序列下的变异。而当参照基因是实
验的一部分 ,或要了解基因差异表达的程度时 ,不适宜
进行中心化。
显示全部