医学教育网:美国纽交所上市公司,十大品牌教育机构!

Re:搞复杂疾病易感基因的请进!

不知道国内搞复杂疾病易感基因研究的同道有多少。建议搞这方面的兄弟或姐妹一起交流交流。自己觉得很多东西都不太明白,国内又没有这方面的教材。

我先提几个问题,大家交流交流吧
1.连锁和关联研究的区别和联系。

2.连锁不平横的评价指标,及连锁不平衡和关联研究的关系。

3.单体型估计的常用方法。

4.tagSNP的选择标准,及常用方法。

5.复杂疾病研究常用的研究设计,及统计方法。

感兴趣的可以发帖讨论讨论。2005年LANCET上连续的七期刊登了遗传流行病学的系列文章。标题分别为:
1.Key concepts in genetic epidemiology
2.Genetic linkage studies
3.Genetic association studies
4.Shaking the tree mapping complex disease genes with linkage disequilibrium
5.What makes a good genetic association study
6.Population-based family studies in genetic epidemiology
7.Genetic epidemiology and public health hope, hype, and future prpspects

建议大家看看。
我们现在正搞这样的课题,但是我是新手,上述一些问题也不是很清楚,希望高手们不吝赐教!
首先介绍连锁和连锁不平横的这两个最基本但又最重要的两个概念。两个位点从父代共遗传给子代的概率比按独立分配原则的概率高则称两个位点连锁。两个位点连锁不平衡则是指整个人群中两个位点处在同一个单体型的频率比期望值高。通常,如果两个位点连锁不平衡则两位点连锁,但是两个位点间存在连锁并不一定代表两位点间连锁不平衡。

连锁比连锁不平衡在染色体上延伸的区域要长。如果两个位点在减数分裂的过程中发生重组的概率小于50%则两个位点间连锁。但是,人群中两个位点间发生的每次重组都会削弱这两个位点间的连锁不平衡,仅当两个位点靠的非常近时连锁不平衡才能得以维持。
连锁分析(1inkageanalysis)是基因定位中的主要策略之一。其基本原理是:在家系中,位于同一条染色体上的两个位点(致病基因与遗传标记)在减数分裂的过程中会发生交换与重组,染色体上的两个位点间相距越远,发生重组的机率越高,两个位点在一起传给后代的机会就越少。因此,由家系中标记位点与疾病位点间的重组率可估算出两者间的距离以及连锁程度。通过对覆盖密度适当的遗传图中的遗传标记(marker)在家系中进行分型(genotyping),以此找到与致病基因紧密连锁的某一标记,从而确定该基因在染色体上的粗略位置,在此基础上再在该染色体区域使用覆盖程度更高的标记物作深入的连锁分析,就可将致病基因确定在较小的区域,这样,再利用物理图提供的该区域的染色体片段将基因确定或克隆。连锁分析中,家系提供的信息量主要取决于两个方面:①家系的结构及大小,如世代数、核心家系数及患者数等;②遗传标记物杂和度,高者信息量大。
连锁分析法主要适用于已知遗传方式的单基因遗传病的基因定位,而在多基因遗传病易感基因定位研究中的作用非常有限。其主要原因是:①多基因疾病的遗传没有一个固定的模式,无法设置参数并套用公式;②多基因遗传病一般发生率很高,使基因突变的机会大大增高,影响了基因定位时目的基因的确定;③多基因遗传病在不同家系中甚至在一个大家系中存在遗传异质性,使这些家系资料无法累加;④此外,有假阳性或假阴性出现。解决的方法是遗传模式一定要选正确,并重复已做的实验和分析。
群体相关研究(population association studies)和连锁不平衡分析(likage-likagequiligrium)基于观察群体中遗传标记位点等位基因与致病基因位点间存在连锁不平衡,最常用的群体相关研究是在无亲缘关系群体中随机选取一个疾病组及一个相应非疾病组,比较标记位点的等位基因频率在组间是否存在显著差异,故称病例一对照研究。所用的标记位点多为候选基因的DNA多态标记。如两组基因频率有显著差异,则表明该候选基因与所研究的疾病相关。即在两组不相关(无亲缘关系)的群体中寻找某一遗传标记与疾病表型的关联。在人类遗传学中,常用△值来衡量两个连锁基因座的等位基因A与B之间的关联。△值=AB基因型频率—A基因频率×B基因频率,并且△值以1-r的速率递减,直到0。r为两点之间的重组值。因而,经过n代的随机交配后,△n=△0(1—r)n。若△=0,则A,B随机关联,亦即A,B连锁平衡;若△=1,则A,B完全关联;△值为0<△<1,非随机关联;即连锁不平衡。假如A位点代表易感基因,B位点代表遗传标记,如两者处于连锁不平衡,患者中遗传标记的频率将高于对照组人群。显然,标记位点与致病基因位点越近,且突变率越低,杂合度越高,用标记检出致病基因位点的机率越高。在人类中位点间连锁不平衡相当稳定,其半衰期为69代或2000年。除了遗传距离这一影响因素外,连锁不平衡的发生可能是由于具有不同等位基因频率的人群的混杂、不同选择压力、遗传漂变及产生新的突变等。但是由于遗传漂变和选择产生的不平衡在不连锁的基因座将很快消失,而紧密连锁的基因座之间的连锁不平衡消失很慢。因而,研究一个位标与疾病相关基因座之间的连锁不平衡将有助于遗传病基因的精细定位。
相关分析有许多优点:①无亲缘关系患者样本收集较易,可随机采集,完全符合群体中疾病的临床谱;②相关分析为非参数分析(non-parametric analysis),不如常用家系连锁分析那样需设定遗传方式等各种参数;③检出力高于家系连锁分析。在复杂病例中,不但可检出主效基因,而且可检出相对风险率小于5.0的次效基因。此是同一位点相关分析阳性而连锁分析阴性的原因之一;④检出的相关位点与致病突变的距离多在1Mb(约等于lcM)之内,而家系连锁的阳性位点可远至2—10cM。因此,用前者发现相关位点后进行基因定位克隆的范围较后者为小;⑤可提示相关位点或基因的传递方式及效应性质[正性(促进发病)或负性(保护致不发病)作用],并可由亚组分析发现疾病的遗传异质性。
谢谢twer2003对连锁和关联研究的基本原理的讲述。如果有人感兴趣的话,我会继续写一些复杂疾病研究的内容。
很感兴趣,请houliping继续讲讲这方面的问题.我先问一个问题吧,在做基因组扫描时,用的标记为微卫星(STR),在遗传分析仪上跑的电泳,里面出的峰有size 和height,height是代表的等位基因频率,频率越高,峰越高,但是size代表的是STR的长度吗?比如说一个位点出了好多峰,说明每个峰都是不同长度的str吗?不明白啊,请houliping帮忙回答一下!谢谢!!
对不起, 我做的是复杂疾病候选基因的关联研究, 你提的问题我解答不了。
评价连锁不平衡的指标包括:Lowontin’s D 和 D' 和 r2. 内容太多,我传个文件给大家, 文件的内容主要包括评价连锁不平衡的指标和影响连锁不平衡的因素以及连锁不平衡的作用.

LDnote.doc (146.0k)
呵呵,谢谢houliping,这个问题我已经问过导师了,答案正是我想的那样.关于连锁不平衡,我们暂时还没有用到,相信以后应该有机会用到.再次感谢!!
看样子这个问题没多少人感兴趣,到此结束吧。不再跟帖讲了。
crescent1999 wrote:
很感兴趣,请houliping继续讲讲这方面的问题.我先问一个问题吧,在做基因组扫描时,用的标记为微卫星(STR),在遗传分析仪上跑的电泳,里面出的峰有size 和height,height是代表的等位基因频率,频率越高,峰越高,但是size代表的是STR的长度吗?比如说一个位点出了好多峰,说明每个峰都是不同长度的str吗?不明白啊,请houliping帮忙回答一下!谢谢!!

size代表的是STR PCR产物的相对长度。height 是峰高,代表的是荧光信号的强度,也就是PCR产物的量,而不是等位基因频率。具体为什么会出现这么多峰,你可以参考下面这个帖子,里面有一些回帖涉及到该方面的内容:
>

另外,这个话题很不错啊,我刚开始涉及这方面的工作,很希望有人给大家普及一下基础的理论知识。谢谢houliping。希望可以继续发一些相关知识。

希望继续讲啊,我也急需这方面的知识。
希望继续讲啊,我也急需这方面的知识。
jasmy520570 谢谢!你发的那贴我看过,我基本明白那个意思,呵呵继续向大家学习!
对多基因遗传病的易感性研究很感兴趣,请教一下,在搜集病例时该注意什麽问题呢,一个家庭中只有叔叔和侄子同患病,这样的家系在基因扫描时是否能用?作基因扫描所需要的家系或者散发病例都有什么要求呢,请各位不吝赐教!
对多基因遗传病的易感性研究很感兴趣,请教一下,在搜集病例时该注意什麽问题呢,一个家庭中只有叔叔和侄子同患病,这样的家系在基因扫描时是否能用?作基因扫描所需要的家系或者散发病例都有什么要求呢,请各位不吝赐教!
连锁研究方面的问题看样子挺多的,对连锁研究我了解的不是很多,主要是因为我现在没有从事这方面的研究工作。相关的文章我倒是看了一些。我在前面提到的2005年LANCET上连续的七期刊登的遗传流行病学的系列文章还是建议各位找来看看。我给各位看看我翻译的第二篇文章"Genetic linkage studies"。感兴趣的可以找来英文原文对照着看看。其中有的地方可能比较难以理解,我也不能保证我的翻译正确无误。有不对的地方还希望各位帮我指出。也希望我的翻译能给各位提供一定的帮助。

2.连锁分析.part1.rar (200.0k)
翻译的不错,houliping,高手啊!呵呵!向您学习!
换成PDF格式了,两部分一起下载。然后解压。

2.连锁分析.part2.rar (121.58k)
希望大家继续展开讨论!
我在这里搬板凳坐着呢,大家快说呀。
我们课题组搞心血管疾病的,等我对这些问题有了理解,来和大家交流阿(近期)
好帖子,学习学习!
3.单体型估计的常用方法。

4.tagSNP的选择标准,及常用方法。

我对以上两个问题很感兴趣,有战友能帮助解答一下吗?

多谢了!
国内较好开展多基因遗传病(复杂性疾病)的有北京的沈岩院士、上海的陈竺院士、贺林教授(院士?)等。
前段时间沈岩院士的弟子许祺副研究员曾来我校讲座。
他们正在做精神分裂症的遗传基因分析。
大体的方法是:先选几个他们认为较可能起作用的基因采用以前单基因的方法研究,然后他们和清华大学合作,搞了一个计算机程序分析第一步得出的结果之间相互之间的关系,得出相关连锁的信息,大体意思是这样。有兴趣的园有可搜索他们相关的文章。
好像是发在分子精神病学杂志(英文的)。
我曾做过一单基因疾病的基因突变研究,对多基因遗传疾病的研究很感兴趣,希望大家多多交流
这是我们某个标书中别人写的,借得写得不错,大家看看
一般做疾病研究就是采用大家系做连锁分析,病例或核心家系做关联分析
连锁分析一般采用以下方法:
基本是察看文献选取候选基因,根据候选基因选择合适的
STR marker 做连锁分析
微卫星荧光标记基因扫描常选用杂合度(Het)大于0.6的二核苷酸重复。GDB Human Genome Database () 或者 MEMSAT PSIPRED () 或者 MEMSAT PSIPRED (http://bioinf.cs.ucl.ac.uk/psipred/)等.

要区别是正常人群中的突变还是和疾病相关联的突变
这有一个部分是要看他在正常人群中的频率,和疾病
相关的snp一般在人群中的频率不会太高大约1/1000以下
如果太高了,一般都不是真正的主效位点,而是和他共
在一个block的位点
明白。多谢楼上!正在学习中,不知道得太多了!赫赫
谢谢大家,我还是刚刚入手,也正在学习中,期望还能看到大家在这些方面的讨论。
我的课题是通过在一个显性遗传病家系里面通过500K的SNP基因芯片里对家系成员进行基因分型,再通过遗传学软件对基因分型结果进行单倍型作图、连锁分析,病定位出在家系患者中共享并连锁的染色体区域为致病基因所在的候选染色体区域,并在此区域里寻找该家系的致病基因。
我现在正在尝试用dchip软件进行数据分析处理,在分析过程中遇到了一些问题,不知有国内有那位高手也在用dchip、genehunter等遗传学分析的。方便的话和我联系一下,向你们请教一下,不胜感激!
我的email是huangym128@yahoo.com.cn
楼上的xiangxiang_mm Wrote:
"zxyapple wrote:
这是我们某个标书中别人写的,借得写得不错,大家看看
一般做疾病研究就是采用大家系做连锁分析,病例或核心家系做关联分析
连锁分析一般采用以下方法:
基本是察看文献选取候选基因,根据候选基因选择合适的
STR marker 做连锁分析
微卫星荧光标记基因扫描常选用杂合度(Het)大于0.6的二核苷酸重复。GDB Human Genome Database (http://www.gdb.org/ )的STR数据是公开的,可以查询STR的引物序列、PCR条件等信息。Genethon database(http://www.genethon.fr/) 以及Marshfield genetic database可以查询基因座位间的距离、基因座位的顺序。全基因扫描可以用ABI PRISM Linkage Mapping Sets v2.5 – MD10成套STR引物。
基因扫描和分型:
ABI3730自动基因分析仪分析多重PCR扩增产物,用GeneScan软件将电泳收集的电泳图谱信息经过电子计算机处理成数据信息。GeneMapperV 3. 0分析扩增产物片段。GeneMapperV 3. 0软件是高通量、全自动的DNA片段分析和基因分型软件。功能上相当于GeneScan、Genotyper、Template软件的整合。
连锁分析:
用linkage.5.2软件包进行参数分析:
用软件包中的preplink生成datafile,设该家系为常染色体显性遗传,外显率为100%,基因频率为0.0001,在GDB数据库中查出等位基因频率。生成pedfile文档,用unknown运行,再运行mlink,得到LODS值。Lods值大于3肯定连锁,大于1支持连锁,lods值小于-2排除连锁。
筛选候选基因,检测突变
选择连锁染色体区段内的相关基因,NCBI:http://www.ncbi.nlm.nih.gov/Genbank查询基因的外显子、启动子区域及临近内含子序列,设计引物,PCR扩增先证者的该基因,直接双向测序,Blast比对检测突变位点,用SSCP(单链构象多态性)或者RFLP(限制性片段长度多态性)的方法证实突变与疾病在家系中共分离。正常人群中验证突变,否定其为SNP。
写得很清楚,学到不少东西,~~~~~~~~~~~~~~~~为什么要否定SNP呢?"

因为如果在正常人群中也检测到和疾病家系中一致的突变则该突变只是遗传多态性-SNP而已而非致病突变(致病突变是不应该在正常人群里检测到的)。
很有价值的专题,高手们再多发言啊!
您的位置:医学教育网 >> 医学资料