基于全基因组序列注释的自闭症基因组结构
日期: 2024-10-10
点击量: 161
---杭州敏泰 译

全面了解自闭症谱系障碍(ASD)的遗传学需要全基因组测序(WGS)。我们提供最新版本的自闭症之声MSSNG资源,其中包括来自5100名自闭症患者和6212名非自闭症父母和兄弟姐妹的WGS数据(n = 11312)。研究了MSSNG和Simons家族的各种遗传变异单纯形集合(SSC;n= 9205),我们在718/ 5100名来自MSSNG的ASD患者(14.1%)和350/ 2419名来自SSC的ASD患者(14.5%)中发现了ASD相关的罕见变异。考虑到基因组结构,52%是核序列水平的变异,46%是核结构变异(包括拷贝数变异、倒位、大插入、单系异二体和串联重复扩增),2%是线粒体变异。我们的研究为探索携带ASD相关罕见变异的家庭的基因型-表型相关性提供了指南,并作为扩展研究的切入点,以解析约85%的特发性ASD人群的病因。
自闭症谱系障碍(ASD)是一种神经发育障碍,其核心症状是社交和沟通困难、重复行为和兴趣限制。自闭症谱系障碍在1-2%的个体中被观察到,男性的发病率是女性的四倍。ASD在临床上是异质性的,一些人表现出轻微的症状,而另一些人则表现出严重的症状和一系列共同发生的身体和精神健康状况。双胞胎研究估计其遗传能力为64 - 91%。ASD在基因上也是异质的,涉及到许多基因。罕见或新发的高影响基因变异通常在5-20%的ASD患者中被发现,在那些有复杂医学表现的患者中更常见。以前的全基因组测序(WGS)研究已经检查了不同类别的变异的贡献,然而他们通常一次只分析一个或几个,因此不能完全捕获ASD的基因组结构。
这项研究有两个目的。首先是对自闭症之声MSSNG资源进行了实质性的更新。与之前的版本相比,MSSNG现在包含的WGS数据是ASD患者(5100人vs2613人)和总个体(包括家庭成员;11,312vs5,152),扩展的遗传变异数据,重新设计的门户网站允许探索基因型和表型数据,与Terra云平台集成(https://terra.bio),以及其他增强功能。我们的第二个目标是利用MSSNG的WGS数据来全面检查多种类型的遗传变异在ASD中的作用,包括常见的单核苷酸多态性(snp),以及罕见和新出现的单核苷酸变异(snv),短插入/缺失(indels),线粒体DNA (mtDNA)变异和结构变异(SVs,包括拷贝数变异(cnv)、倒位、较大插入、单系二体(upd)和串联重复序列扩展(TREs))。这些分析包括编码区和非编码区以及显性和隐性遗传模式。我们还使用了来自Simons Simplex Collection (SSC)的9,205个个体的WGS数据进行复制,并使用了来自1000基因组计划的2,504个不相关的群体对照(1000G),共分析了> 23000个WGS样品。
在最新版本的MSSNG中,我们生成了丰富的遗传数据资源,包括序列水平、结构和线粒体变异、串联重复序列和多基因风险评分。为了满足具有不同假设或专业知识的研究人员的需要,这些信息可以通过几个接口访问。MSSNG门户适合没有编程经验的用户或对少数基因或区域的变体感兴趣的用户。Terra集成针对的是有更复杂研究问题的用户。最后,高级用户可以通过GCP中的BigQuery表或平面文件访问MSSNG。重要的是,MSSNG的治理将其参与者置于所有决策的最前沿。招募家庭的临床医生积极参与研究,并定期向参与者咨询委员会征求意见。每年召开一次会议,数百个参与家庭讨论新的发展,同意定期更新参与者的意见,多学科团队考虑解释和交流基因组发现的最合适方法。符合标准临床报告的研究结果将连同遗传咨询一起返还给家庭。
我们对MSSNG的分析产生了许多加强(或挑战)先前结果或为ASD基因组结构提供新见解的发现。我们确定了134个ASD相关基因,以及许多没有WGS很难检测到的ASD相关变异。我们发现的证据挑战了先前的说法,即某些线粒体单倍群与ASD有关,并且ASD儿童的异质性传播增加。在不同的祖先群体中,ASD相关罕见变异的产量没有显著差异。在我们的共识表型测量中,ASD相关的罕见变异与较低的得分有关。我们发现罕见的显性变异可能在MPX ASD中发挥更大的作用,考虑到这些家庭中罕见的、破坏性的隐性事件的减少和多基因风险的缺乏。最后,我们报告了不同变异类型对ASD基因组结构的贡献的全面描述,为未来研究约85%的遗传未解决的家庭奠定了基础(认识到遗传可能不是唯一的贡献者)。
与WES相比,WGS的一个优势是能够探索非编码变异。然而,我们的分析显示,影响ASD个体非编码元件的罕见变异的富集程度有限,这与之前的研究结果一致。与之前的结果相反,我们没有观察到影响SSC启动子区域的新生变异的富集。这些观察结果突出了在遗传异质性的疾病中检测稳健和可重复的非编码信号所固有的挑战,根据使用的方法,可以观察到不同的趋势。
有研究表明,PRS对许多不同的疾病具有或将具有临床或预测效用。然而,我们的PRS分析(特别是低OR和R2),结果表明,自闭症患者和非自闭症患者的平均PRS差异较小,而自闭症患者的最高PRS十分位数略有增加,ASD PRS应谨慎解读,目前在个人或家庭层面上可能没有提供信息。尽管目前存在局限性,但ASD PRS最终可能有助于更全面地了解罕见和常见变异对ASD的影响。例如,更大的ASD GWASs,以及涉及更大的对照队列(如UK BioBank)的比较,可能会增加解释方差的比例。此外,PRS可能会成为ASD多因素特性模型框架的重要组成部分,例如责任阈值模型。
随着基因组测序开始在精准医学应用中占有一席之地,本文为ASD研究提供了重要的新资源和分析路线图。随着对基因型-表型相关性的日益重视,个体水平的理解将是早期诊断的关键,这可能通过早期治疗来改善结果。从这项研究中产生的分子靶点也可能最终为药理学干预提供信息。
创建神经精神类疾病的科研、科普知识交流平台,为患者提供专业诊断、治疗、预防的共享平台。

自闭症谱系障碍(ASD)是一种神经发育障碍,其核心症状是社交和沟通困难、重复行为和兴趣限制。自闭症谱系障碍在1-2%的个体中被观察到,男性的发病率是女性的四倍。ASD在临床上是异质性的,一些人表现出轻微的症状,而另一些人则表现出严重的症状和一系列共同发生的身体和精神健康状况。双胞胎研究估计其遗传能力为64 - 91%。ASD在基因上也是异质的,涉及到许多基因。罕见或新发的高影响基因变异通常在5-20%的ASD患者中被发现,在那些有复杂医学表现的患者中更常见。以前的全基因组测序(WGS)研究已经检查了不同类别的变异的贡献,然而他们通常一次只分析一个或几个,因此不能完全捕获ASD的基因组结构。
这项研究有两个目的。首先是对自闭症之声MSSNG资源进行了实质性的更新。与之前的版本相比,MSSNG现在包含的WGS数据是ASD患者(5100人vs2613人)和总个体(包括家庭成员;11,312vs5,152),扩展的遗传变异数据,重新设计的门户网站允许探索基因型和表型数据,与Terra云平台集成(https://terra.bio),以及其他增强功能。我们的第二个目标是利用MSSNG的WGS数据来全面检查多种类型的遗传变异在ASD中的作用,包括常见的单核苷酸多态性(snp),以及罕见和新出现的单核苷酸变异(snv),短插入/缺失(indels),线粒体DNA (mtDNA)变异和结构变异(SVs,包括拷贝数变异(cnv)、倒位、较大插入、单系二体(upd)和串联重复序列扩展(TREs))。这些分析包括编码区和非编码区以及显性和隐性遗传模式。我们还使用了来自Simons Simplex Collection (SSC)的9,205个个体的WGS数据进行复制,并使用了来自1000基因组计划的2,504个不相关的群体对照(1000G),共分析了> 23000个WGS样品。
在最新版本的MSSNG中,我们生成了丰富的遗传数据资源,包括序列水平、结构和线粒体变异、串联重复序列和多基因风险评分。为了满足具有不同假设或专业知识的研究人员的需要,这些信息可以通过几个接口访问。MSSNG门户适合没有编程经验的用户或对少数基因或区域的变体感兴趣的用户。Terra集成针对的是有更复杂研究问题的用户。最后,高级用户可以通过GCP中的BigQuery表或平面文件访问MSSNG。重要的是,MSSNG的治理将其参与者置于所有决策的最前沿。招募家庭的临床医生积极参与研究,并定期向参与者咨询委员会征求意见。每年召开一次会议,数百个参与家庭讨论新的发展,同意定期更新参与者的意见,多学科团队考虑解释和交流基因组发现的最合适方法。符合标准临床报告的研究结果将连同遗传咨询一起返还给家庭。
我们对MSSNG的分析产生了许多加强(或挑战)先前结果或为ASD基因组结构提供新见解的发现。我们确定了134个ASD相关基因,以及许多没有WGS很难检测到的ASD相关变异。我们发现的证据挑战了先前的说法,即某些线粒体单倍群与ASD有关,并且ASD儿童的异质性传播增加。在不同的祖先群体中,ASD相关罕见变异的产量没有显著差异。在我们的共识表型测量中,ASD相关的罕见变异与较低的得分有关。我们发现罕见的显性变异可能在MPX ASD中发挥更大的作用,考虑到这些家庭中罕见的、破坏性的隐性事件的减少和多基因风险的缺乏。最后,我们报告了不同变异类型对ASD基因组结构的贡献的全面描述,为未来研究约85%的遗传未解决的家庭奠定了基础(认识到遗传可能不是唯一的贡献者)。

与WES相比,WGS的一个优势是能够探索非编码变异。然而,我们的分析显示,影响ASD个体非编码元件的罕见变异的富集程度有限,这与之前的研究结果一致。与之前的结果相反,我们没有观察到影响SSC启动子区域的新生变异的富集。这些观察结果突出了在遗传异质性的疾病中检测稳健和可重复的非编码信号所固有的挑战,根据使用的方法,可以观察到不同的趋势。
有研究表明,PRS对许多不同的疾病具有或将具有临床或预测效用。然而,我们的PRS分析(特别是低OR和R2),结果表明,自闭症患者和非自闭症患者的平均PRS差异较小,而自闭症患者的最高PRS十分位数略有增加,ASD PRS应谨慎解读,目前在个人或家庭层面上可能没有提供信息。尽管目前存在局限性,但ASD PRS最终可能有助于更全面地了解罕见和常见变异对ASD的影响。例如,更大的ASD GWASs,以及涉及更大的对照队列(如UK BioBank)的比较,可能会增加解释方差的比例。此外,PRS可能会成为ASD多因素特性模型框架的重要组成部分,例如责任阈值模型。
随着基因组测序开始在精准医学应用中占有一席之地,本文为ASD研究提供了重要的新资源和分析路线图。随着对基因型-表型相关性的日益重视,个体水平的理解将是早期诊断的关键,这可能通过早期治疗来改善结果。从这项研究中产生的分子靶点也可能最终为药理学干预提供信息。

创建神经精神类疾病的科研、科普知识交流平台,为患者提供专业诊断、治疗、预防的共享平台。