专门致力于研究基因、蛋白质和疾病之间的关系的WRI综合性生物医学研究机构,日前采用中央数据仓储,将分子和临床信息汇总和整合到单一数据仓储中,帮助寻找乳癌和其他类型癌症的成因。该组织选择了Teradata技术方案。
由于WRI采纳了多个来源提供的数据,例如GenBank (供深入分析的 DNA 序列 )、PubMed (科学文献)、SWISS-PROT(供深入分析的蛋白质信息)、KEGG (新陈代谢途径)、DIP (蛋白质相互作用),然后将这些数据库链接到 WRI 自已的分子(DNA、RNA、蛋白质)和临床数据。这所有数据库必须加以整合,以加速医学研究,了解基因和蛋白质与人体再生癌和心血管疾病的相关性。
WRI的营运长暨首席科学家 Somiari 博士补充说:「人体共有 30,000 到 35,000 个基因,寻找与疾病的发作、发展和恶化相关的基因子集是一项极富挑战性的工作。我们在 DNA、RNA、蛋白质和细胞层次上对生物样品进行了大量分析。每个样本通常会生产 166 MB 信息,正因如此,我们需要 Teradata 提供的企业级数据仓储解决方案。WRI还拥有一个能够容纳 240,000 个组织样本的组织库。我们将在 9 个月时间内产成大约 50 TB 的数据量,包括图像和文字,信息必须唾手可得。由于我们继续寻找合作伙伴加入,签订更多协议,因而我们需要能随者我们的需求成长的数据仓储解决方案。」
藉由 Teradata 数据仓储技术, WRI 将能储存、提取、分析和管理透过大型生物技术所产生的大量 DNA、RNA 和蛋白质数据。实质上,WRI 的方法将加速医学探索和知识库的产生,并且在分子级别找出疾病的特定成因,为病人提供个别化药物。