基因组关联分析疾病研究篇

全国治白癜风最好医院 https://m-mip.39.net/news/mipso_6314286.html
正值端午佳节,小编为您整理了诚意满满的大礼包,带您回顾一下疾病研究中的分析利器-关联分析,祝您端午节快乐!什么是关联分析

关联分析是针对某一群体,研究表型数据与基因型数据之间的关系,定位到与目标性状相关联的基因变异的一种快速高效的手段[1]。随着二代高通量测序时代的到来,全基因组测序、外显子测序、高深度目标区域测序等产品应用而生。如何在测序数据得到的大量变异信息中,定位与疾病表型相关的阳性变异信息,是研究者们思考的问题。基于此,关联分析技术应用而生。目前,已经有多篇顶级研究利用关联分析策略研究复杂疾病,如发现髋关节炎[2]、冠心病[3]、肌萎缩侧索硬化[4]等疾病的关联基因。近期,GWAS也被应用于COVID-19[5]、精神性疾病及神经退行性疾病[6]的研究,充分证明了关联分析研究思路的可行性及优越性。

关联分析-研究思路关联分析根据研究群体的不同可分为无关个体研究和相关个体研究(图1)。无关个体研究根据群体特点分为病例对照和人群队列研究。其中病例对照研究也就是经典的Case-Control关联分析。人群队列研究,可以针对健康人群或者患病人群建立突变频率数据库;另一方面,可获取遗传性表型的特定遗传图谱。相关个体研究即采用传递不平衡检验(TDT)进行家系样本的关联分析。图1关联分析的研究思路关联分析-分析流程

关联分析的分析流程主要包含以下步骤(图2):样本选择→上机测序→数据质控→变异检测→样本及位点质控→获取基因型数据→关联分析(Site-based、Gene-based、Pathway-based等)→得到候选基因→基因与表型的相关性分析。

图2关联分析的分析流程关联分析-结果解读

Site-based关联分析

利用PLINK软件对单核苷酸多态性位点进行关联分析,寻找case相对control存在显著性差异的位点:计算每个SNP位点的P值和OR值,通过关联的显著度(P-value),筛选显著性关联的SNP变异。

图3Site-based关联分析结果注:该图为曼哈顿图,为遗传标志效应值(全基因组检测P值)按染色体上物理位置的排序图,横坐标为基因组坐标,纵坐标-log10P,P值越小关联性越强,表现为纵坐标越大。

CNV-based关联分析

对case和control中检测出的CNV数目进行统计,不同CNV区间重叠率(overlap)大于50%认为是相同的CNV,通过Fisher统计学检验(FisherExactTest),计算P值和OR值,通过关联的显著度(P-value),筛选显著性关联的拷贝数变异。对显著性较强的拷贝数变异影响的基因进行进一步疾病-基因相关性挖掘。

图4CNV-based关联分析结果

注:上图为曼哈顿图,为遗传标记效应值(全基因组检验P值)按染色体上物理位置的排序图,横坐标为基因组坐标,纵坐标-log10P,P值越小关联性越强,表现为纵坐标越大;

下图为Q-Q图(Quantile-quantileplot),表示实际P值和无关联零假设期望P值的分布,用于检测群体分层和个体亲缘关系对关联分析的影响,如果观测到的P值与期望P值仅在分布最右端出现,表明性状并非由群体分层造成。

Gene-based关联分析

通过Burden分析方法或SKAT算法,可以进行以基因为单位的显著性分析:经过突变过滤之后,可以得到与疾病相关联的候选基因及相应有害性突变位点,在此基础上以基因为基本单位进行显著性分析。

图5BurdenAnalysis结果的热图展示

横轴为患者样本,纵轴为统计显著性最高的10个基因;每个色块表示对应样本的对应基因区域内所有指定类型的突变数量。

Pathway-based关联分析

利用GWAS相关的遗传变异及其P值,基于对数据进行的过滤与筛选,通过通路关联分析计算每条通路的显著性,即存在于case和control样本中具有显著性差异的P值,寻找与疾病显著性关联的通路。

图6通路多维聚类MDS图

注:展示q-values0.1的通路聚类,其中不同的颜色代表显著性和通路排名,颜色越深代表通路排名越靠前,显著性P值越小;方块大小及数字代表每个通路中的基因数量。

诺禾致源疾病研究部-项目文章

文章一:GermlineBMP9mutationcausesidiopathicpulmonaryarterialhypertension

期刊:EuropeanRespiratoryjournal

影响因子:11.

主要内容:该研究基于大量IPAH患者和诺禾自建的Novo-Zhonghua数据库中的正常人数据,采用Burden分析的方法,鉴定BMP9为IPAH的新易感基因。

文章二:HLA-B*35:01AlleleIsaPotentialBiomarkerforPredictingPolygonummultiflorum-InducedLiverInjuryinHumans

期刊:Hepatology

影响因子:14.

主要内容:本研究采用“整合证据链法”,首次发现HLA-B*35:01等位基因型是何首乌肝损伤发生的特异性生物标志物,揭示了何首乌肝损伤发生与机体遗传背景之间的关系。

文章三:AssociationofRarePTGISVariantsWithSusceptibilityandPulmonaryVascularResponseinPatientsWithIdiopathicPulmonaryArterialHypertension

期刊:JAMAcardiology

影响因子:11.

主要内容:该研究采用两阶段的罕见变异关联分析思路,鉴定PTGIS为IPAH的新易感基因。

诺禾致源疾病研究部主要提供人类遗传性疾病的测序分析服务,涵盖了基于二代Illumina平台的全基因组测序分析、外显子测序分析、目标区域测序分析等多种基因组产品,并配套了相应的关联分析流程。对于control样本的选择,除了客户收集送样外,诺?致源拥有自己的内部?然?数据库(Novo-Zhonghua数据库)供您选择。

我们期待您的disease

novogene.



转载请注明地址:http://www.keqiaotrade.com/jzpm/5577.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章