GPB | RegVar:基于深度神经网络的非编码区突变功能预测新方法

fcdfad754a4ae5d87bc97338abe7c82a.png

Genomics, Proteomics & Bioinformatics (GPB)发表了由军事医学研究院辐射医学研究所张成岗研究员周钢桥研究员卢一鸣副研究员团队完成的题为“RegVar: Tissue-specific Prioritization of Noncoding Regulatory Variants”的方法文章。我们的“要文译荐”栏目很高兴邀请到文章的通讯作者张成岗研究员为大家介绍RegVar方法的建立与应用。

要点介绍

研究问题:

基于全基因组测序的研究工作,研究人员已在人类基因组上发现了超过8000万个基因突变位点,在单个个体基因组上也存在400~500万个突变位点。如何对这些海量突变位点在个体疾病与性状产生过程中的作用进行系统研究,仍然是基因组学与遗传学领域的一大难题。此外,由于基因组上绝大部分突变位于非编码区,可通过影响基因转录和翻译过程中的不同生物事件来发挥作用,对其进行准确的功能注释和靶基因鉴定仍是一重大挑战。

研究方法:

利用来自基因型-组织表达(genotype-tissue expression, GTEx)研究项目的组织类型特异性表达数量性状基因座(expression quantitative trait loci, eQTL)数据,采用深度神经网络(deep neural network, DNN)的计算框架,对发挥调控功能的SNP位点与其靶基因位点的多种分子特征进行整合建模分析,包括其序列特征、表观组学特征和进化保守性特征等,在17种人体组织中构建了组织特异性的非编码区调控型突变预测模型,并在多种条件下对模型的预测性能进行了充分评估。

主要结果:

我们建立了一种基于DNN的计算框架RegVar,它可以准确预测非编码区调控型突变的组织特异性调控功能,并对其靶基因进行高准确性鉴定。通过学习多种人类组织中“遗传位点-基因表达”关联的分子特征,RegVar在多种情景下表现出对非编码区调控型突变功能预测的优异性能。我们期待RegVar能够帮助深入理解人类基因组的遗传结构,并有助于揭示复杂性状和疾病背后新的分子机制。

背景和研究对象

来自全基因组关联分析(genome-wide association studies, GWAS)的研究结果显示,大量变异位点与疾病表型之间存在显著关联,其中绝大部分位于基因组的非编码区。非编码区的变异位点不改变编码蛋白的序列和功能,主要通过调控基因的表达来发挥效应。如何对这些具有调控功能的变异位点进行鉴定和注释是医学遗传学研究中的一大挑战。

以往针对非编码区突变效应的研究大多关注于致病型突变的注释,对这些方法的评测结果显示其并不适用于调控型突变的鉴定。与致病型突变相比,调控型突变的突变效应更为微弱,使得其鉴定更加困难。调控元件与其调控的靶基因之间通常具有较远的基因组距离,如何在远距离上将调控元件上的变异位点与靶基因联系起来,是本领域的研究难点。此外,调控型突变的作用往往具有组织或细胞类型特异性,对不同组织类型中的变异位点进行特异性注释,也具有十分重要的生物学意义。

方法建立

RegVar采用DNN算法框架,利用来自GTEx研究项目的eQTL数据进行建模分析,结合了突变位点及其所调控的靶基因的序列、表观组学和进化保守性等特征,在17种人体组织中构建了组织特异性的非编码区调控型突变预测模型。为了对方法的稳健性与有效性进行充分评估,构建了多种情景下的阴性数据集对RegVar的预测性能进行测试,包括:(1)随机突变组,即选择基因组上随机阴性SNP位点与靶基因构成阴性数据集;(2)镜像突变组,即选择基因组上与阳性突变位点关于靶基因镜像对称位置的阴性SNP位点与靶基因构成阴性数据集;(3)邻近突变组,即选择基因组上阳性突变位点附近的阴性SNP位点与靶基因构成阴性数据集;(4)随机基因组,即选择基因组上阳性突变位点1Mb之内的随机基因与阳性突变构成阴性数据集。对这些条件下的阴性数据集进行预测评估,发现RegVar均表现出良好的预测性能,说明RegVar具有较好的稳健性与有效性(图1)。与以往方法相比,RegVar也表现出更高的预测准确性。

e36a26566c5a420ae81b1ce65227e75f.jpeg

图1  在不同条件下RegVar与已有方法在肝脏eQTL数据上的预测表现

RegVar应用性分析

在可应用性方面,采用RegVar对22号常染色体上所有SNP位点进行了调控概率的注释,结果显示其中存在大量具有高调控功能概率的变异位点,可能影响到特定靶基因的表达(图2)。在真实的eQTL研究中,这些位点并不能被成功检测出来,可能是由于这些位点的调控效应十分微弱而导致的,此外也可能受到样本量与统计效力等限制因素的影响。

be8c38c52ebec6c15c97e624f4c824f3.jpeg

图2  RegVar对22号常染色体上SNP位点进行调控概率预测

随后,使用RegVar模型对全基因组中随机选取的变异位点进行了组织特异性预测分析,鉴定到跨组织与组织特异性调控型突变位点(图3)。对其进行表观特征注释,结果显示,跨组织调控型突变位点往往带有多个组织的启动子表观修饰,而组织特异性调控型突变位点则大多带有组织特异性的增强子表观修饰(图3)。

d3427dfb5ede48505d9ccb4830ada8e0.jpeg

图3  RegVar在全基因组上鉴定跨组织与组织特异性调控型突变位点

为了进一步探究RegVar模型的可拓展性,利用人类基因突变数据库(human gene mutation database, HGMD)中的致病型突变位点信息,利用相似的研究框架构建了致病型突变预测模型。与已发表的同类方法相比,RegVar可达到同等程度的预测性能。RegVar同时提供了可在线访问的网页应用(https://regvar.omic.tech/)和可下载的模型程序包供相关领域的研究者使用和参考。

222c0378970fb154b13c9cbe2bf33ff9.png

扫描二维码获取链接

总结和讨论

非编码区突变能够通过多种复杂机制在许多疾病和复杂性状产生过程中发挥重要作用,然而如何将非编码区突变,尤其是长距离突变,与其靶基因联系起来一直是一个巨大挑战。目前已经有研究者开发了许多方法对非编码区突变进行功能注释,尽管这些方法在基本假设和具体算法框架上各不相同,但它们主要关注于致病型突变作用。因此,大量具有微弱调节作用的突变将被忽视。我们展示了RegVar在不同情景下对调控型突变进行功能预测的优异性能,RegVar有望应用于候选突变位点的筛选、靶基因的鉴定等研究中,为揭示基因组中复杂的调控关系以及阐明复杂性状的分子成因提供帮助。

审校人:

GPB青年编委侯娅丽

文章编译来源:

Lu H, Ma L, Quan C, Li L, Lu Y, Zhou G, Zhang C. RegVar: Tissue-specific Prioritization of Noncoding Regulatory Variants. Genomics Proteomics Bioinformatics 2023;21(2):385-395. 

英文全文详见:

https://www.sciencedirect.com/science/article/pii/S1672022921002564

作者资助信息:

军事科学院军事医学研究院辐射医学研究所张成岗研究员周钢桥研究员卢一鸣副研究员为论文的共同通讯作者,该所的路浩助理研究员为论文的第一作者,马露雨权诚李磊为文章共同作者。该研究得到了国家自然科学基金、北京市科技新星计划的资助。

GPB论文:

RegVar: Tissue-specific Prioritization of Noncoding Regulatory Variants

长按并识别二维码,阅读原文

0d2d8d1f9432680bffc382f92772c06e.png

97edc70b40fe26c9e67d6f12e55a8056.png

     相关推荐     

GPB | CARMEN:基因表达调控相关非编码变异的精准功能预测算法

GPB | NetGO 3.0: 蛋白语言大模型有效提升蛋白质功能预测性能

GPB | GREPore-seq:通过长片段PCR和纳米孔测序高效检测基因编辑后突变的实验流程

   About GPB   

Genomics, Proteomics & Bioinformatics(基因组蛋白质组与生物信息学报,简称GPB)于2003年创刊,是由中国科学院主管、中国科学院北京基因组研究所(国家生物信息中心)与中国遗传学会共同主办的英文学术期刊,由牛津大学出版社金色开放获取(Gold Open Access)出版。刊载来自世界范围内组学、生物信息学及相关领域的优质稿件。现为中国科学引文数据库(CSCD)和中国科技论文与引文数据库(CSTPCD)核心期刊,被SCIE、PubMed/MEDLINE、Scopus等数据库收录。2023年公布的官方数据显示,CiteScore为11.7;2年和5年Impact Factor分别为9.5和10.1,分别排名WoS遗传学领域12/171和13/171;2022 JCI为2.08,排名WoS遗传学领域10/189。期刊由科技部等七部门联合实施的“中国科技期刊卓越行动计划“资助(2019–2023)。

高颜值免费 SCI 在线绘图(点击图片直达)

7aa93e641da47ad070832f2522b103c0.png

最全植物基因组数据库IMP (点击图片直达)

039899faa0c742f0b5067bbbc6262c9a.png

往期精品(点击图片直达文字对应教程)

ac7c826828c2457cc76ab0d594ca6213.jpeg

237ef6b61dee6dbbf028e03f008d6b6d.jpeg

d7087f423a71c7998ef382ca30756a3a.jpeg

6b303feb01902cf9b29c65590f3b35d3.jpeg

c0f9bffe5e87cd1747cbd79b49917a90.jpeg

57870c4f4f44d4493f607541213ff775.jpeg

a4ccffbbfbf477519b2ae4e55f2acb29.jpeg

0ad3737513b0516bcb3bf9dacfe1ca83.jpeg

4692884a59cefd8d19d67f8cef5e5599.jpeg

833b176a1faf81328a0116aee7ffbcce.jpeg

f52b7ef475cba95e5805174534186317.jpeg

7a5ea94f72dcdabbef67187dc01312d5.jpeg

7a8da0faf00cc63a842bed2890633971.png

64e2622433b30462763e0bdf3cbfc6c6.png

29877e1d03bc2db8a827bf5812dff3f4.png

ebe327c91d65063ae37abbb3dc88a2b8.png

da6ba79cd3c8a701512757a06edfb334.jpeg

fb54a88df76387b366320712b6c453a9.jpeg

590b2d63ac3b152bbafbffd71e2aaa28.jpeg

69d5a9cded79c59e4d2f5e7a79c9dd69.jpeg

c1c55a610fbbde6eb2cf5d11d150273d.png

7b31f8d0c5173e8f5acb31b75ab14ec1.png

3cace33fef0e7d123f6b75ab16a27455.jpeg

2252962a368a4694b6f0200e50820077.png

571c38b5caed88a3001c45a4e8074e25.png

10d746eefac37af09ab2c2448f7f0b63.jpeg

205064660d0a9bac6979ab766bbf2f4d.png

415f06f6e39310f30fe07b704e001adc.png

机器学习

605c74eb2f1103e3929f6d8cf2436fb4.jpeg

49177c2edb9dbef4b55703138758551e.jpeg

204c2baed2a886beb5d4d872936612da.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/576902.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据结构 - 栈

目录 一. 栈的概念 二. 栈的结构 三. 栈的实现 1. 实现栈的两种方式 链表实现栈 顺序表实现栈 选择依据 栈的创建 栈的初始化 栈的销毁 入栈 出栈 获取栈顶元素 判断栈是否为空 获取栈中有效数据的个数 一. 栈的概念 栈(Stack)是一种重要…

VScode Failed to parse remote port from server output

在使用VScode 在连接AutoDL 过程中一直连接不上,显示 Failed to parse remote port from server output 在网上查了很多资料,貌似的没啥用。和我有相同 error 的可以尝试修改setting.json 文件。 添加这条命令(我的json文件里面没有&#…

共享购:融合社交分享与消费返利的创新电商模式

共享购电商模式是一种独特的商业模式,巧妙地将社交分享与消费返利结合,让消费者在购物的同时,也能通过平台资产奖励实现价值的双重增长。该平台资产体系主要由共享值和共享积分两大要素构成,共同构建了一个充满活力的电商生态系统…

区块链技术与应用学习笔记(8-9节)——北大肖臻课程

目录 8.挖矿 对于全节点和轻节点思考问题? ①全节点在比特币的主要作用? ②挖矿时当监听到别人已经挖出区块并且延申了最长合法链此时应该立刻放弃当前区块在 本地重新组装一个指向最后这个新合法区块的候选区块,重新开始挖矿。节点这么做…

vivado 使用“链路 (Links)”窗口查看和更改链路设置

使用“链路 (Links) ”窗口查看和更改链路设置 创建链路后 , 就会将其添加到“ Links ”视图 ( 请参阅下图 ) 中 , 该视图是更改链路设置和查看状态的主要方法 , 也是最佳方法。 “ Links ”窗口中的每一行都对应 1 …

pymilvus创建多向量

pymilvus创建多向量 从 Milvus 2.4 开始,引入了多向量支持和混合搜索框架,单个collection可以支持10个向量字段。不同的向量字段可以表示不同的方面、不同的embedding模型甚至表征同一实体的不同数据模态。该功能在综合搜索场景中特别有用,例…

python学习笔记----python基础语法(二)

一、字面量 在 Python 中,字面量 是一种直接在代码中表示其自身值的数据。字面量用于创建值,并且可以直接被 Python 的解释器识别和处理。不同类型的数据有不同的字面量形式。下面是一些常见的字面量类型: 二、注释 注释:在程序…

[Android14] SystemUI的启动

1. 什么是System UI SystemUI是Android系统级应用,负责反馈系统及应用状态并与用户保持大量的交互。业务主要涉及的组成部分包括状态栏(Status Bar),通知栏(Notification Panel),锁屏(Keyguard),控制中心(Quick Setting)&#xff…

Babylon.js和Three.js的区别

Babylon.js和Three.js都是基于WebGL的3D图形库,它们使得开发者能够在网页上创建和展示3D内容。尽管它们的目标相似,但在设计理念、功能集、性能和社区支持等方面存在一些差异。北京木奇移动技术有限公司,专业的软件外包开发公司,欢…

SpringCloud引入SpringBoot Admin

Spring Boot Admin可以监控和管理Spring Boot&#xff0c;能够将 Actuator 中的信息进行界面化的展示&#xff0c;也可以监控所有 Spring Boot 应用的健康状况&#xff0c;提供警报功能。 1. 创建SpringBoot工程 2. 引入相关依赖 <dependency><groupId>com.alib…

MinIO分布式文件系统介绍

1、不同存储方式的对比&#xff1a; 2、 分布式文件系统对比 3、MinIO的特点 MinIO特点 数据保护&#xff1a;Minio使用Minio Erasure Code&#xff08;纠删码&#xff09;来防止硬件故障。即便损坏一半以上的driver&#xff0c;但是仍然可以从中恢复。 高性能&#xff1a;作…

PID算法学习

PID算法介绍 在过程控制中&#xff0c;按偏差的比例&#xff08;P&#xff09;、积分&#xff08;I&#xff09;和微分&#xff08;D&#xff09;进行控制的PID控制器&#xff08;亦称PID调节器&#xff09;是应用最为广泛的一种自动控制器。它具有原理简单&#xff0c;易于实…

冯唐成事心法笔记 —— 知世

系列文章目录 冯唐成事心法笔记 —— 知己 冯唐成事心法笔记 —— 知人 冯唐成事心法笔记 —— 知世 冯唐成事心法笔记 —— 知智慧 文章目录 系列文章目录PART 3 知世 成事者的自我修养怎样做一个讨人喜欢的人第一&#xff0c;诚心第二&#xff0c;虚心 如何正确看待别人的评…

MQTTX工具获取及使用

工具获取地址&#xff1a;百度网盘 请输入提取码 新建连接 订阅主题

Redis分布式锁手动实现

Redis分布式锁手动实现 java中锁机制 在 Java 中&#xff0c;锁是用来同步并发访问共享资源的机制。它确保了在一个时间点&#xff0c;只有一个线程可以执行某个代码块或方法&#xff0c;从而防止了数据的不一致和竞态条件。Java 提供了多种锁机制&#xff0c;包括内置锁&…

全国各地级市财政收入支出明细统计数据2003-2022年

01、数据简介 全国各地级市财政统计主要是按地级市财政支出和财政收入两项统计&#xff0c;反映地区财政资金形成、分配以及使用情况的统计&#xff0c;​是由地区各地级市统计局统计公布&#xff0c;是加强财政资金管理使用的依据&#xff0c;研究国民收入分配和再分配的重要…

山东省2024年首版次测试报告具体的要求是什么?

山东省首版次测试报告的具体要求可能会根据每年的政策调整、行业变化以及申报的具体产品而有所不同。但一般而言&#xff0c;山东省首版次测试报告需要满足以下一些基本要求和标准&#xff1a; 1.完整性&#xff1a;测试报告应涵盖所有关键的测试环节&#xff0c;包括但不限于测…

张小泉签约实在智能,用实在Agent打造自动化高

在不少老杭州人的童年记忆里&#xff0c;妈妈裁剪衣服、料理食材、修剪各种物品&#xff0c;用的都是张小泉刀剪。 近日&#xff0c;实在智能与“刀剪第一股”张小泉&#xff08;股票代码&#xff1a;301055.SZ&#xff09;正式达成合作&#xff0c;实在Agent数字员工助力张小…

AM解调 FPGA(寻找复刻电赛电赛D题的)

设计平台 Quartus II10.3mif产生工具modelsimSE &#xff08;仿真用&#xff09; DDS&#xff08;直接数字式频率合成器&#xff09; 从前面的内容可知&#xff0c;我们需要产生一个载波&#xff0c;并且在仿真时&#xff0c;我们还需要一个较低频率的正弦波信号来充当我们的…

划重点:用这个技巧,抖音粉丝涨不停!

在这个信息爆炸的时代&#xff0c;如何在抖音上脱颖而出&#xff0c;吸引大量粉丝&#xff0c;成为了每一个创作者心中的痛。你是否曾经在发布作品后焦急等待评论&#xff0c;期待着每一次互动&#xff1f;如果你有这样的困扰&#xff0c;那么这篇文章将为你打开一扇新的大门&a…
最新文章