快速组装全基因组在个人电脑实现
admin
原标题:快速组装全基因组在个人电脑实现

  科技日报北京9月15日电 (记者张梦然)据《细胞系统》杂志14日发表的一项研究,美国麻省理工学院(MIT)和法国巴斯德研究所的科学家开发出一种在个人计算机上重建包括人类基因组在内的全基因组技术。这种技术比当前最先进的方法快大约一百倍,且仅使用目前五分之一的资源。这项研究以单词而非字母为语言模型提供压缩的构建模块,从而可以更紧凑地表示基因组数据。

  “我们可以在一台普通的笔记本电脑上快速组装整个基因组和宏基因组,包括微生物基因组,”MIT计算机科学和人工智能实验室教授波尼·博格说,“这种能力对于评估与疾病和细菌感染(例如败血症)相关的肠道微生物组变化至关重要,这让我们能够更快地治疗并挽救生命。”

  自人类基因组计划开展以来,基因组组装项目取得了长足的进步,该计划于2003年完成了首个完整的人类基因组组装,耗资约27亿美元,并进行了十多年的国际合作。虽然目前完成人类基因组组装已不再需要耗费数年时间,但仍然需要几天时间和强大的计算机能力。第三代测序技术虽可提供具有数万个碱基对的、太字节数量级的高质量基因组序列,但事实上,将如此巨量数据的基因组进行组装,仍具有挑战性。

  为了超越当前技术从而更有效地进行基因组组装,包括在所有可能的读数对之间进行成对比较,博格及其同事此次将研究目标转向了语言模型。他们基于“de Bruijn”图(一种用于基因组组装的简单、高效的数据结构)概念,开发了一种极小空间“de Bruijn”图,它使用被称为“极小值”的短核苷酸序列,代替单个核苷酸。

  博格表示:“极小空间‘de Bruijn’图只存储总核苷酸的一小部分,同时保留了整个基因组结构,使它们比经典‘de Bruijn’图更有效。”研究人员利用新方法为661406个细菌基因组的集合构建了一个索引,这是迄今为止同类集合中最大的一个。他们发现,这项新技术可在13分钟内搜索整个集合中的抗菌素抗性基因,而使用标准序列比对这一过程需要7小时。

  总编辑圈点

  基因组组装对于基因组分析的“前途”十分关键,这其实是一个把测序产生的读取片段经过拼接再生成基因组碱基序列的过程。听起来很绕,但基因组组装确实是生物信息学领域的核心问题,因为当前测序技术获得的序列一般都比较短,需要组装拼接成较长的、完整的序列,才能用于进一步分析。这一直以来都是很繁冗的一个步骤,但现在本文中的成果,让科学家们实现了在最省力的设备中、在最短的时间内,完成了更为精准的组装。

相关内容

热门资讯

视频丨我国已建成全球最完整清洁... 今天(22日),中国企业改革与发展研究会发布了《全球能源转型报告(2025)》,数据显示,我国已建成...
从“蓉”出发 链接世界!202... 11月20日,2025第八届中国国际光伏与储能产业大会在成都落幕。本届大会以“光储同辉融合赋能智创未...
长源电力控股子公司中标1426... 雷达财经 文|杨洋 编|李亦辉 11月21日,长源电力(000966)公告,其控股子公司国能长源荆门...
我国已建成全球最完整清洁能源产... 我国已建成全球最完整清洁能源产业链 今天(11月22日),中国企业改革与发展研究会发布了《全球能源...
漳州核电2号机组并网发电 “华... 央视网消息:11月22日,记者从中核集团获悉,位于福建漳州的全球最大“华龙一号”核电基地再传新进展。...
院士领航,点燃科学梦想:雷宪章... 活动现场 11月20日,由成都市教育局指导,成都市教师共享中心、成都院士联合会主办,四川师范大学附属...
2025第八届中国国际光伏与储... 11月17日至20日,2025第八届中国国际光伏与储能产业大会在成都世纪城新国际会展中心隆重举行。作...
憾失射手王!中超-卡扎伊什维利... 北京时间11月22日15点30分,2025赛季中超联赛最后一轮同时开战,提前保级的武汉三镇坐镇主场武...
央视专场主角,长安马自达新能源... 11月21日,2025广州国际车展盛大启幕,长安马自达携“九风道悦级智能SUV”MAZDA EZ-6...
原创 百... “幽灵工程”惹众怒,数百万菲律宾民众走上街头示威,军方却在此时传出了“兵变”的说法,声称示威人群背后...