软件为获得更多的完整基因组序列打开了大门。
NIH的研究人员开发并发布了一种创新的软件工具,用于组装来自各种物种的真正完整(即无间隙)的基因组序列。这种名为 Verkko 的软件在芬兰语中意为“网络”,它使组装完整基因组序列的过程更加经济实惠且易于使用。新软件的描述今天发表在Nature Biotechnology上。
Verkko 从组装第一个无间隙人类基因组序列中成长起来的,该序列于去年由端粒到端粒 (T2T) 联盟完成,这是一个由美国国立卫生研究院下属的国家人类基因组研究所 (NHGRI) 资助的合作项目。“我们利用了在 T2T 项目中学到的一切知识,并使流程自动化,”NHGRI 副研究员谢尔盖·科伦博士说,他领导了 Verkko 的创建,并且是该论文的主要作者。“现在有了 Verkko,我们基本上可以按下一个按钮并自动获得完整的基因组序列。”T2T 联盟使用新的 DNA 测序技术和分析方法来生成和组装剩余的 8-10% 的人类基因组序列。然而,研究人员手动组装了这些片段——这一过程需要这个庞大且技术精湛的团队花费数年时间才能完成。Verkko 可以在几天内完成同样的任务。
组装基因组序列就像拼拼图,不同的 DNA 测序技术会生成不同类型的基因组拼图。有些很小而且非常详细,而另一些虽然图像模糊但要大得多。Verkko 比较并组装两种类型的片段,以生成完整而准确的图片。Verkko 首先将细小的片段组合在一起,创建许多部分组装但不连续的序列片段。然后,Verkko 将组装的区域与较大、较不精确的片段进行比较。这些较大的片段作为一个框架来对更详细的区域进行排序。最终产品是准确完整的基因组序列。研究人员使用人类和非人类基因组序列数据测试了 Verkko。该软件快速准确地组装了整个染色体的序列,这曾经是一项艰苦的壮举。
随着 Verkko 可生成更完整的人类基因组序列,研究人员可以更好地评估人类基因组多样性。由于只有一个无间隙的人类基因组序列,科学家们目前缺乏对整个人类基因组许多部分多样性的了解,例如高度重复的 DNA 区域。Verkko 还将加速生成研究中常用物种的无间隙基因组序列,例如小鼠、果蝇和斑马鱼,以提高它们对科学家的实用性。此外,从各种植物、动物和其他生物中生成无间隙基因组序列将有助于比较基因组学,即研究不同物种基因组之间的异同。“Verkko 可以使生成无间隙基因组序列大众化,”NHGRI 高级研究员 Adam Phillippy 博士说,他曾参与 T2T 项目和 Verkko 的开发。“这种新软件将使组装完整的基因组序列尽可能经济实惠和常规化。”
内容来源:NIH
图片来源于网络,若侵权,请告知。
特别声明:本文由NIH作者撰写,观点仅代表NIH。“雅昂国际”转载,不代表“雅昂国际”立场和观点。