马凡氏综合症遗传

DNA甲基化和基因表达的综合分析,以鉴定


临沂白癜风医院 http://m.39.net/pf/a_5837446.html
Aging(AlbanyNY)

Aug8

IF:4.

Introduction

胶质母细胞瘤(GBM)在全球范围内排名最常见和最具侵略性的原发性脑肿瘤。它是一种快速生长的恶性肿瘤,由多种具有神经干细胞样特性的细胞类型引起。尽管采用了各种治疗方法,但患者的预后仍保持在12至15个月的存活率之间,而五年的存活率仅为10%。因此,迫切需要GBM的分子肿瘤学领域的进展。

导致人类癌症(包括GBM)发病机理的主要因素是表观遗传分子机制。随着基因芯片和RNA序列的帮助,GBM在基因组和转录组水平的异常表达谱不断增加。之前的一项研究使用来自GeneExpressionOmnibus(GEO)数据库的基因表达数据,在GBM和正常样品之间鉴定出总共个差异表达基因(DEG)。经过各种生物信息学分析,确定了69个DEG与GBM预后显着相关。另一项研究基于GSE的基因表达谱发现了个DEG。对CDK1,CCNB1和CDC20进行生存分析,高表达与GBM的不良生存密切相关。

在基因组中接近80%的CpG岛的二核苷酸中发现了DNA甲基化。它由控制各种细胞活动(例如增殖、凋亡和分化)的DNA甲基转移酶催化。至于人类癌症,已知甲基化在所有形式的癌症中都是异常的,而启动子的异常甲基化可能导致肿瘤抑制基因的沉默,影响转录途径并导致癌症的进展。肿瘤内DNA甲基化异质性已被证明是GBM的特征。此外,O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)基因的启动子甲基化状态已被描述为化疗反应和GBM患者生存率的预测指标。之前的一项研究使用CGGA和TCGA的数据,开发了具有三个基因(FPR3,IKBIP和SA9)的标签,用于预测MGMT启动子甲基化GBM患者的预后。在另一项研究中进行了甲基化基因分析,作为评估GBM恶性程度的潜在生物标记。在这项研究中,他们发现总共、、和个甲基化或去甲基化基因与1至4级的GBM程度相关。因此,异常甲基化基因可以作为潜在的癌基因或抗癌基因在发育和进展中发挥作用,提示其潜在的生物标志物作用。

ResultsDNA甲基化数据的选择和特征

对DNA甲基化和基因表达进行了综合分析,确定了GBM中的关键表观遗传基因(图1)。使用了来自TCGA数据库的基因表达和DNA甲基化谱,共获得个含临床信息数据的GBM和正常样本。此外,从TCGA数据库下载了20,个基因用于后续分析。因为启动子区域中的DNA甲基化强烈影响基因表达,所以我们选择了启动子区域中的CpG,其定义为TSS上游2kb到下游0.5kb。经过预处理数据,我们最终获得了,个甲基化位点,用于下游分析。

确定为GBM的差异基因(DEG)

根据筛选标准,从所有肿瘤和正常样品中共获得了个显着的DEG,有1,个上调基因,3,个下调基因。图2显示了最重要的个基因的表达谱。

DEGs与存活甲基化基因的相关性分析

DNA甲基化水平会影响基因表达。高甲基化表达通常抑制下游基因表达,而低甲基化水平则倾向于增加下游基因表达。

计算差异表达基因和差异甲基化基因的相关分析步骤如下:1)计算差异甲基化基因与DEGs的交集;2)鉴定差异表达被上调而差异甲基化被下调和差异表达被下调且差异甲基化被上调的基因的基因数目。总共获得了个上调基因,个下调基因,个甲基化的下调基因和个甲基化的上调基因。

然后,我们分析了上调的DEGs和下调的生存甲基化基因以及下调的DEGs和上调的生存甲基化基因之间的皮尔森相关性。在上调的DEGs和下调的生存甲基化基因之间共有个基因,在下调的DEG和上调的生存甲基化基因之间共有个基因(图3A)。接下来,我们分析了肿瘤样品和正常样品之间DEGs的启动子甲基化分布。结果表明,在肿瘤中高表达的基因在正常样品中具有较低的启动子甲基化,这表明在正常组织和肿瘤组织中启动子DNA甲基化与基因表达之间呈负相关(图3B)。

EI和ES基因的途径富集分析

我们发现共有个低启动子甲基化-高表达的基因(EI基因),以及总共个具有高启动子甲基化-低表达的基因(ES基因)。

接下来,使用在线工具“Metascape”进行途径富集分析。如图4A所示,我们发现EI和ES基因在以下途径中显着丰富:WNT信号传导、细胞分化的负调控、细胞外基质组织的调控以及对cAMP的细胞应答。“Metascape”还提供了基于这些途径的基因相互作用(图4B)。这些结果表明,在我们的研究中筛选的EI和ES基因参与了GBM发生和发展的生物学过程。

基于甲基化基因的预后风险模型的构建

为了进一步筛选潜在的EI和ES基因,使用皮尔森相关性分析计算启动子甲基化与EI和ES基因表达之间的相关性。有16个负相关的关键基因。接下来,我们选择相关系数大于0.75的基因作为关键标记,它们是C1orf61和FAM50B。

另外我们在聚类分析中选择了上述两个基因的20个CpG甲基化位点(表1)。使用欧几里德距离来计算样本之间的相似度,我们发现,根据20个CpG甲基化位点,可以将所有样本分为两组1和2。此外,聚类1中的样品甲基化水平高,而聚类2中的样品甲基化水平低(图5A)。进行进一步分析以探讨两组之间的预后,我们发现低甲基化组的预后明显优于高甲基化组(图5B,p值=0.)。此外,我们比较了这两组患者的年龄,发现低甲基化组的患者年龄分布低于高甲基化组的患者年龄分布(图5C)。

GBM中的IDH1突变和DNA甲基化

IDH突变是一种发生在肿瘤早期的现象,IDH突变被认为是低级别神经胶质瘤和GBM的重要标志。IDH突变可以促进大多数基因启动子中CpG的甲基化,这有助于肿瘤细胞的表观遗传不稳定。为了探究GBM中IDH1突变与DNA甲基化之间的关系,根据IDH1基因突变将所有样本分为IDH突变组(n=7)和IDH非突变组(n=)。如图6所示,IDH突变组的样品的甲基化水平低于IDH非突变组的样品。

然后,我们比较了两组中每个甲基化位点的表达。如图7所示,我们发现20个位点中的19个在IDH突变和IDH非突变组之间显着表达(p值0.01)。以上结果表明这些甲基化位点与IDH1突变密切相关。

在TCGA测试集中和GEO数据集中进行验证

为了验证我们甲基化数据和预后模型的结果,我们使用了基于TCGA数据的测试集(n=69)。我们使用了20个甲基化位点的表达,并进一步使用了层次聚类分析。我们发现20个CpG甲基化位点也可以清楚地将所有样品分为两组(图8A)。聚类1组的甲基化水平显着高于聚类2。此外,低甲基化组的样品预后显着优于高甲基化组(p值=0.02)(图8B)。还可以看到,低甲基化组的年龄分布低于高甲基化组的年龄分布,这与训练集的结果一致(图8C)。

另外,下载了GBM的DNA甲基化数据(GSE),共有例患者。首先,我们选择了20个甲基化位点的表达谱(补充表9)和临床信息(补充表10)。接下来,我们使用层次聚类方法将所有样本分为两组(图9A)。结果表明,在两组中发现了显着的生存差异(p值=0.)(图9B)。此外,我们比较了两组之间的年龄分布,发现高甲基化组高于低甲基化组(图9C)。这些结果与TCGA数据集一致,表明该模型可以应用于其他样本。

Conclusion

利用癌症基因组图谱(TCGA)数据库中GBM患者的甲基化数据和基因表达数据。

我们在肿瘤和正常样品之间鉴定了4,个差异表达基因(DEGs),包括1个上调的基因和3个下调的基因。

然后,我们将所有样本随机分为训练集(n=69)和测试集(n=69)。

接下来,我们通过单变量和多变量Cox回归分析获得了11,个生存甲基化位点。

在相关分析中,我们将个低启动子甲基化-高表达基因定义为表观遗传诱导(EI)基因,将个高启动子甲基化-低表达基因定义为表观遗传抑制(ES)基因。

选择的关键标记包括C1orf61和FAM50B,其皮尔森相关系数大于0.75。此外,在欧氏距离的聚类分析中,我们选择了上述两个基因的20个CpG甲基化位点。我们发现低甲基化组的预后明显优于高甲基化组(p值=0.)。

基于TCGA测试集和GEO数据集的验证,我们验证了该标签的预后值(TCGA中p值=0.02,GEO中p值=0.)。

总之,我们的发现基于甲基化的生物标记物对GBM的诊断和治疗具有预测和预后价值。

Reference:IntegrativeanalysisofDNAmethylationandgeneexpressiontoidentifykeyepigeneticgenesinglioblastoma

PMID:

DOI:10./aging.

预览时标签不可点收录于话题#个上一篇下一篇


转载请注明:http://www.bianjibj.com/mzhz/5173.html


当前时间: