近年来,随着测序技术的快速发展,动物(尤其是非模式动物)全基因组数据(WGS)获取变得简单、便宜,这使得数据库中全基因组数据量呈指数态势增长。全基因组测序数据往往同时包含线粒体序列和核基因序列,通过生物信息学的方法从中提取并组装完整的线粒体基因组,是非常好的技术手段。虽然已有部分学者开发了一些生物信息学软件用以实现此目的,但是,其大都具有自身的局限性,包括需要人工提供参考序列(“种子”)、数据兼容性差、准确率低等难点,未能高效、准确、便捷地完成相关任务。为克服这一难点,提升研究人员的工作效率,近日,中国科学院成都生物研究所(以下简称成都生物所)李家堂课题组开发了一种不依赖“种子”序列从动物全基因组数据中提取并组装线粒体全基因组的方法,并使用Python及C++编写为软件——MEANGS。
据介绍,MEANGS工作流程比较简单,极大地提升了研究人员的可操作性。首先,利用预置的线粒体模块数据库,MEANGS使用nhmmer根据线粒体序列特征对输入的二代数据进行预筛选并获取潜在的线粒体编码reads;获得潜在的线粒体编码reads后,MEANGS利用线性迭代算法(SSAKE)(C++改写)组装模块对reads进行组装获取线粒体编码contigs;相关contigs经由nhmmer进行二次筛选,非冗余线粒体编码contigs将被选择作为“种子”序列用于全线粒体基因组的组装;最后利用“种子”序列,MEANGS再次使用组装模块以“种子”contigs为基础,组装完整的线粒体基因组。另外,针对组装好的线粒体基因组,MEANGS可对编码基因进行辅助注释。
图1 MEANGS利用动物全基因组数据组装线粒体基因组的工作流程 成都生物所提供
针对MEANGS,本研究使用了来自不同类群(哺乳类、鸟类、鱼类、爬行类、两栖类,昆虫和软体动物),不同测序质量的16组数据来进行相关测试。同时,本研究选取了其他三款同类型软件(norgal, NOVOPlasty, MitoZ)进行同条件测试,并基于常规的评价标准(运行时长、内存使用、准确性、完整性、完成数量等)对软件的表现进行评价。测试及比较结果表明,MEANGS数据兼容性最好,完成了所有测试数据的测试,而其他三款软件均有失败案例。在常规的评价指标上,MEANGS表现出最优的整体性能,除了在内存使用上稍逊色于norgal,其余表现均优于其他软件。MEANGS的开发有利于研究人员开展相关工作,推动相关学科的高质量快速发展。
图2 MEANGS与其他三款软件相比表现出最好的数据兼容性 成都生物所提供
图3 MEANGS与其他三款软件在常规评价指标上显示出明显优势 成都生物所提供
该研究成果以MEANGS: an efficient seed-free tool for de novo assembling animal mitochondrial genome using whole genome NGS data为题,已在生物信息学国际顶级期刊Briefings in Bioinformatics(IF: 11.62)在线发表。成都生物所在读博士研究生宋梦洹,特别研究助理严超超博士为论文的共同第一作者,李家堂研究员为论文的通讯作者。本研究得到成都生物所高级工程师蒋海波博士和硕士生桂承波的大力帮助。本研究得到中国科学院B类先导科技专项、科技部第二次青藏高原综合科学考察研究项目、中国科学院对外合作重点项目、中国科学院西部之光交叉团队项目、中国科学院前沿科学重点研究项目及四川省杰出青年科技人才项目等项目的资助。
相关论文链接:
https://doi.org/10.1093/bib/bbab538
近年来,随着测序技术的快速发展,动物(尤其是非模式动物)全基因组数据(WGS)获取变得简单、便宜,这使得数据库中全基因组数据量呈指数态势增长。全基因组测序数据往往同时包含线粒体序列和核基因序列,通过生物信息学的方法从中提取并组装完整的线粒体基因组,是非常好的技术手段。虽然已有部分学者开发了一些生物信息学软件用以实现此目的,但是,其大都具有自身的局限性,包括需要人工提供参考序列(“种子”)、数据兼容性差、准确率低等难点,未能高效、准确、便捷地完成相关任务。为克服这一难点,提升研究人员的工作效率,近日,中国科学院成都生物研究所(以下简称成都生物所)李家堂课题组开发了一种不依赖“种子”序列从动物全基因组数据中提取并组装线粒体全基因组的方法,并使用Python及C++编写为软件——MEANGS。
据介绍,MEANGS工作流程比较简单,极大地提升了研究人员的可操作性。首先,利用预置的线粒体模块数据库,MEANGS使用nhmmer根据线粒体序列特征对输入的二代数据进行预筛选并获取潜在的线粒体编码reads;获得潜在的线粒体编码reads后,MEANGS利用线性迭代算法(SSAKE)(C++改写)组装模块对reads进行组装获取线粒体编码contigs;相关contigs经由nhmmer进行二次筛选,非冗余线粒体编码contigs将被选择作为“种子”序列用于全线粒体基因组的组装;最后利用“种子”序列,MEANGS再次使用组装模块以“种子”contigs为基础,组装完整的线粒体基因组。另外,针对组装好的线粒体基因组,MEANGS可对编码基因进行辅助注释。
图1 MEANGS利用动物全基因组数据组装线粒体基因组的工作流程 成都生物所提供
针对MEANGS,本研究使用了来自不同类群(哺乳类、鸟类、鱼类、爬行类、两栖类,昆虫和软体动物),不同测序质量的16组数据来进行相关测试。同时,本研究选取了其他三款同类型软件(norgal, NOVOPlasty, MitoZ)进行同条件测试,并基于常规的评价标准(运行时长、内存使用、准确性、完整性、完成数量等)对软件的表现进行评价。测试及比较结果表明,MEANGS数据兼容性最好,完成了所有测试数据的测试,而其他三款软件均有失败案例。在常规的评价指标上,MEANGS表现出最优的整体性能,除了在内存使用上稍逊色于norgal,其余表现均优于其他软件。MEANGS的开发有利于研究人员开展相关工作,推动相关学科的高质量快速发展。
图2 MEANGS与其他三款软件相比表现出最好的数据兼容性 成都生物所提供
图3 MEANGS与其他三款软件在常规评价指标上显示出明显优势 成都生物所提供
该研究成果以MEANGS: an efficient seed-free tool for de novo assembling animal mitochondrial genome using whole genome NGS data为题,已在生物信息学国际顶级期刊Briefings in Bioinformatics(IF: 11.62)在线发表。成都生物所在读博士研究生宋梦洹,特别研究助理严超超博士为论文的共同第一作者,李家堂研究员为论文的通讯作者。本研究得到成都生物所高级工程师蒋海波博士和硕士生桂承波的大力帮助。本研究得到中国科学院B类先导科技专项、科技部第二次青藏高原综合科学考察研究项目、中国科学院对外合作重点项目、中国科学院西部之光交叉团队项目、中国科学院前沿科学重点研究项目及四川省杰出青年科技人才项目等项目的资助。
相关论文链接:
https://doi.org/10.1093/bib/bbab538
推荐内容
-
成都生物所开发新型生物信息学软件
-
国内首个民航科技示范区一期项目开工
-
中国科学院华南植物园第十届牡丹花展春节展出
-
亚热带常绿阔叶林樟科鳄梨族演化历史研究获进展
-
8万吨半潜船“新耀华”号在广州南沙命名交付
-
醉酒失仪殴打劝阻路人,广州警方破获2宗醉酒故意伤害案
-
冰雪运动热潮席卷全国 这个寒假体育作业唱“主角”
-
当涂县人民法院冬季执行攻坚再出击 执行到位13.3万余元
-
“双减”后第一个寒假 “早睡早起”“互换角色”等走进寒假作业清单
-
合肥年夜饭预订火爆 多家酒店年夜饭一桌难求
-
降温+降水!安徽将再迎新一轮明显雨雪天气
-
2021年安徽利用省外资金同比增长14.9% 四大战略区域均衡发展
-
未来一周南京阴雨连绵 全市最高气温仅8℃
-
南京春节捧出丰盛“文旅大餐” 56家国家等级旅游景区正常开放
-
深圳去年进出口总额3.54万亿人民币 民营企业稳居领头羊地位
-
广东去年支出近1.3万亿元保障和改善民生
-
广东成首个GDP破12万亿省份 产业升级持续加速
-
江苏将为群众办50件实事 着力解决“急难愁盼”问题
-
雷杰纳隆科学奖决赛名单出炉 美国15名华裔学生入围
-
世卫专家:奥密克戎毒株不太可能帮助各国实现群体免疫
-
加强盲人按摩机构疫情防控检查 为残障人士筑起疫情防火墙
-
独家采访:解密广州疫情管控区内孕产妇如何就医
-
主播平台有“糊涂账”,工会律师来厘清
-
广东外贸进出口总额首破8万亿元 贸易结构进一步优化
-
“广东智造”受海外市场青睐 外贸高质量发展仍需“过坎”
-
北京市属公园迎冬奥庆春节景观上新 2.6万游客赏雪观景
-
北京至成都一航班挂出7700紧急代码 航班安全降落在双流机场
-
我国“飞秒激光”研究成果登上《科学》 光存储或成新一代存储和显示材料
-
湿地保护卓有成效 1926只黑颈鹤稳定栖息云南大山包湿地
-
1年期与5年期LPR双降 带动个人住房贷款利率降低
-
年货市场供销旺 农贸市场年味足
-
雄安新区新型地热能高效采热试验获成功
-
研究揭示缨甲快速飞行之谜
-
须鲸大口“吃饭”不溺水,它是关键
-
科学家发现控制小鼠运动的特殊神经元
-
衰老神经元会阻碍小鼠神经新生
-
全国地下水资源储存量首次查明
-
南沙大桥开启“加强版”春运保畅通模式
-
时空互联:催生更多未来数字生活梦想
-
截至1月20日24时新型冠状病毒肺炎疫情最新情况
-
买年货,就在广州日报电商大湾区年货节!百万现金券让利消费者
-
“广南花姐”:20年只和家人过了两次年,还都是因为休产假
-
“全民上冰雪·助力迎冬奥”呼兰冰雪英雄会系列赛收官之战
-
联合国教科文组织工作组在塔希提岛附近发现巨大珊瑚礁
-
关于奥密克戎最新权威解答来了!
-
每天追剧4小时 血栓风险增三成
-
宇宙中有4000亿亿个黑洞
-
北极1.7万亿吨冻融碳或成巨大威胁
-
美国航天局:汤加火山喷发不会对全球气候产生太大影响
-
中国综合极端条件大科学装置首批5个实验站面向中外用户开放
-
“慧眼”卫星带来的意外与惊喜
-
豚草天敌广聚萤叶甲能快速适应寒冷的气候环境
-
侯保荣院士获2021年度中科院杰出科技成就奖
-
齐鲁医院中子医学中心启用
-
青岛再添两处国家级海洋牧场示范区
-
多因素制约生育率 三孩将推系列配套支持措施
-
早参丨LPR下调,广州这些银行房贷利率有变化
-
AI主播丨LPR下调了!广州这些银行房贷利率有变化
-
美国航天局:汤加火山喷发不会对全球气候产生太大影响
-
中国综合极端条件大科学装置首批5个实验站面向中外用户开放
-
广东共青团为春节留穗家政青年送上“青春情暖”
-
福耀科大首任校长明确:厦大原校长朱崇实
-
北京大学国际医院医教研联盟成立仪式在京举行
-
警惕!9人被骗1576万元!
-
广州市场监管:网购进口冷链食品要做好个人防护和清洗消毒
-
警惕!上周广州涉诈网址诈骗多发→
-
广州残障粤剧演员获全国残疾人文艺汇演一等奖
-
2021近4成白领拿到年终奖,平均金额破万
-
科技部副部长张广军亲切看望顾诵芬院士
-
联合“减排”,共享RCEP经济红利
-
私家车当作“储物柜”?岁末年关停车需谨慎!
-
中国红:年味浓,南沙已换上一袭“红装”
-
从化乡村青少年公益爱心冬令营举行
-
广州市助农服务综合平台一期封顶、二期启动
-
进境邮件快件收件人没收到短信?有这些凭证可免费核酸检测
-
只是逛个菜市场 发现一个新物种
-
新研究揭示唾液外泌体可作食管癌液体活检标志物
-
读懂广州·解密|晚清广州画家,广告打到伦敦
-
广州雨雾天气即将上线
-
高分辨率中子照相机研制成功
-
研究揭示RNA两步渐进式加工新模式
-
适量补充维生素D或降低糖尿病患者痴呆风险
-
在畸形颅骨上打条“隧道” 肿瘤被成功切除
-
湖南完成首例手术机器人辅助骨肉瘤保肢治疗
-
新就业形态劳动者权益如何维护?请看广州工会的案例
-
宿松警方成功打掉跨区域流动赌场 抓获犯罪嫌疑人36名
-
安庆300余瓶假酒被查获 涉及古井贡、洋河等品牌
-
合肥私家车“环保免检”将延长至10年 可为车主减免费用近4000万元
-
年味饰品进入销售旺季 趣味春联成市场新宠
-
一碗炒米三个荷包蛋是标配 腊月炒米师傅很吃香
-
品牌联手营销效果“1+1>2” 联名款为何爆火?
-
迎新年“颜值经济”正热 为“好看”买单年轻人更“悦己”
-
江苏电子职业培训券发券量突破百万张 加快推进职业技能培训信息化
-
蔬菜商业库存1.5万吨 南京春节“菜篮子”供应平稳有序
-
兴山发布24项惠企政策 形成资金直达模式
-
2021年湖北出口农产品176.2亿元 食用菌出口占比提升
-
科学家“组装”出高效乙二醇脱水分离膜
-
最新研究揭开最小昆虫快速飞行之谜 促理解微观尺度飞行演化
-
《自然》论文:新冠封城降低地面二氧化氮浓度不同区域差别很大
-
吴孟超追思暨安葬仪式在上海举行