遗传平衡检验 HWE
一、理论讲解
当我们提取完snp的原始文献的数据后,我们最好对对照组进行哈代温伯格定律(Hardy Weinberg Equilibrium,HWE)检验,以减少病例-对照研究中出现的抽样偏倚(这是由病例-对照研究的设计特点决定的)。
表1 模拟数据如下
Author | Year | Country | Study design | Cases/
Controls |
C282T | C63T | ||||||||||
cases | controls | cases | controls | |||||||||||||
CC | CT | TT | CC | CT | TT | CC | CT | TT | CC | CT | TT | |||||
A | 2008 | Maroc | Case-control | 96/222 | 95 | 1 | 0 | 219 | 3 | 0 | 59 | 34 | 3 | 160 | 60 | 2 |
B | 2008 | France | Cohort | 103/198 | 91 | 12 | 0 | 180 | 18 | 0 | 75 | 28 | 0 | 149 | 49 | 0 |
C | 2007 | Spain | Case-control | 196/181 | 183 | 12 | 1 | 158 | 23 | 0 | 102 | 85 | 9 | 124 | 52 | 5 |
D | 2005 | England | Case-control | 144/1508 | 119 | 17 | 8 | 1331 | 168 | 9 | ||||||
E | 2003 | Germany | Case-control | 137/233 | 120 | 17 | 0 | 223 | 10 | 0 | 108 | 27 | 2 | 177 | 52 | 4 |
HWE检验可在Excel表格设置上表的函数进行检验。
或者
也可在Stata中进行检验,所用的是Stata独有的search功能。
使用Stata计算时,在命令窗口输入“search Hardy Weinberg equilibrium”,就会在结果窗口显示很多相关的资料,并附带有检验HWE的安装包,选择其中一个点击安装即可。
或者在stata中输入
*安装hwe软件包
ssc install genhwcci
*输入对照组 cc ct tt 数据
*HWE检验
genhwcci 33 118 67, label(cc ct tt)
二、统计学原理
意义:群体遗传学基本定律,如果符合H-W定律,表示样本具有代表性,支持分析结论。
内容:如果没有选择、突变和迁移等外在压力,人群随机婚配,基因型分布经几代传递后能够达到平衡。
检验方法:常用拟合优度卡方检验chi ^2= sum ((obs -exp)^2) / exp),自由度为df=m(m-1)/2, m为等位基因数。
三、实战分析
1.数据如下
2.哈温平衡算法stata中输入,复制红色部分
ssc install genhwcci
help genhwcci
genhwcci 41 47 21 37 58 18 /*先病例组,后对照组*/
Genotype | Case Control | Total
------------+-------------------------------+-------------
AA | 41 37 | 78
Aa | 47 58 | 105
aa | 21 18 | 39
------------+-------------------------------+-------------
total | 109 113 | 222
Case
Allele | Case Frequency Std. Err.
------------+--------------------------------------
A | 129 0.5917 0.0350
a | 89 0.4083 0.0350
------------+--------------------------------------
total | 218 1.0000
------------+--------------------------------------
Estimated disequilibrium coefficient (D) = 0.0260
SE = 0.0232
Hardy-Weinberg Equilibrium Test:
Pearson chi2 (1) = 1.261 Pr= 0.2614
likelihood-ratio chi2 (1) = 1.258 Pr= 0.2620
Exact significance prob = 0.0796
Control
Allele | Control Frequency Std. Err.
------------+--------------------------------------
A | 132 0.5841 0.0318
a | 94 0.4159 0.0318
------------+--------------------------------------
total | 226 1.0000
------------+--------------------------------------
Estimated disequilibrium coefficient (D) = -0.0137
SE = 0.0227
Hardy-Weinberg Equilibrium Test:
Pearson chi2 (1) = 0.360 Pr= 0.5487
likelihood-ratio chi2 (1) = 0.361 Pr= 0.5481
Exact significance prob = 0.6983
Test H0: cases under HWE: (given controls under HWE)
likelihood-ratio chi2 (2) = 1.285 Pr= 0.5260
我们需要的是对照组的数据就可以了。
根据p值<0.05 与否,整理为如下表格,p <0.05, hwe为0 no—不符合哈温平衡。
拓展知识:
SNPmeta
网状emta分析必备技能
网状meta分析必备技能6_R+Rstudio运用meta包做简单meta分析
网状meta分析必备技能7_使用R、GeMTC和STATA软件实现连续变量的网状Meta分析
网状meta分析stata简易教程
NMA(网状meta分析)stata简易教程(4)漏斗图的制作
NMA(网状meta分析)stata简易教程(5)排序图的制作
诊断性meta分析简单实现
其他
本文由 GCBI学院 作者:其明技术专家 发表,转载请注明来源!