找到了!瑞士生物信息学研究所 (SIB) 借助 StorNext 破解“宏基因组代码”
瑞士生物信息学研究所处在下一场生命科学重大变革的前沿 — 将计算方法应用于基因组学、蛋白质组学以及其他生物信息科学。SIB 的工作日益专注于应用基因组学以提升生命质量。
Vital-IT Group 主任 Ioannis Xenarios 教授解释道:“SIB 最近针对唐氏综合征开发了一个产前诊断测试算法。利用 11 周时从母亲体内采集的血样我们能够对子宫内的胎儿进行遗传物质排序。与传统的羊膜腔穿刺术相比,这是一种低侵害性、低风险的方法。它表明,基因组学正变得与我们的日常生活愈发相关。”
每周超过 30TB 的数据带来了独特的数据管理挑战
SIB 运营六个测序中心,为约 300 个研究团队提供支持,每周生成的数据量高达 30TB。
Vital-IT 高级科学家兼 IT 经理 Roberto Fabbretti 指出:“过去几年,测序技术发展越来越快。这意味着比以往更多的项目并且我们的数据将非常迅速地增长。”
长寿研究需要有效管理
Xenarios 表示:“对于类似癌症和免疫疗法这样的领域,我们会采集每位患者的大量序列数据。如果患者每周或每月返诊一次,上次化验的所有数据都需要能在很多时间内供研究人员快速而准确地使用。为了对我们的生物信息学工作进行扩展以支持数以万计的患者,我们需要寻找经济高效的方法将基因数据保留 20 年、30 年甚至 40 年 — 对患者从生到死进行有效监控。”
PB 级高性能存储
Vital-IT 现在借助昆腾的 StorNext 横向扩展存储来支持其研究基础设施。通过四个单独的 StorNext 系统,研究人员可实现高速排序和分析 — 近 1PB 的主存储以及 4PB 经济高效的磁带归档。StorNext 支持使用基于 InfiniBand 的 IP (IP over Infiniband) 进行高性能处理,将活动数据保存在主存储中以供分析,同时随着数据的“老化”自动将文件移至 AEL 磁带归档。超过 600 名用户在任何一个数据中心或者通过 CIFS 接口以远程方式访问数据。
自助式访问确保基因组数据始终可供研究使用
Fabbretti 指出:“我们的研究人员所采集和分析的数据提供了重要答案,而且在数月甚至数年之后,当新的分析应用能够从相同原始序列中提取信息时,它可能依然有用。StorNext 使我们能够为我们的所有项目提供经济高效的长期归档 — 无论项目计划持续多长时间。”
归档文件仍将出现在研究人员预期在文件系统中会找到它们的地方,因此无需 IT 支持,即可轻松地直接访问它们。
正如 Xenarios 所言:“如果能为研究人员提供适当的工具,他们定能挑战极限。StorNext 分层存储帮助我们快捷地将数据移至归档,使其随时可用,这样,生物信息科研人员就能继续其工作。”
对世界上一些最宝贵的数据集进行自动保护
Fabbretti 指出:“StorNext 不仅帮助我们确保快速采集数据 — 还使归档成为一个自动的、经济高效的流程,以帮助我们履行作为‘数据管家’的职责。我们始终要在磁带上对文件做两个副本,一个在归档中保持可用,另一个被保存,从而提供更多一层的保护,防止任何硬件故障或站点损害。
我们还处理世界上一些最宝贵的数据集。StorNext 为我们提供了数 PB 的归档能力、长期数据保护以及轻松回滚文件版本的能力 — 这是该策略至关重要的组成部分。”
可扩展性使 SIB 始终为未来做好准备
“StorNext 已经为我们的发展提供了六年多的支持。我们知道,当我们需要时能够轻松添加更多磁盘和容量。实际上,我们已经不仅局限于基因组,而是对常规的医学研究数据进行存储和保护。随着时间的推移,StorNext 能够轻松地在我们的存储工作流中包含类似云或对象存储的更多层级,这对我们至关重要。”