專門致力於研究基因、蛋白質和疾病之間的關係的WRI綜合性生物醫學研究機構,日前採用中央資料倉儲,將分子和臨床資訊彙總和整合到單一資料倉儲中,幫助尋找乳癌和其他類型癌症的成因。該組織選擇了Teradata技術方案。
由於WRI採納了多個來源提供的資料,例如GenBank (供深入分析的 DNA 序列 )、PubMed (科學文獻)、SWISS-PROT(供深入分析的蛋白質資訊)、KEGG (新陳代謝途徑)、DIP (蛋白質相互作用),然後將這些資料庫連結到 WRI 自已的分子(DNA、RNA、蛋白質)和臨床資料。這所有資料庫必須加以整合,以加速醫學研究,瞭解基因和蛋白質與人體再生癌和心血管疾病的相關性。
WRI的營運長暨首席科學家 Somiari 博士補充說:「人體共有 30,000 到 35,000 個基因,尋找與疾病的發作、發展和惡化相關的基因子集是一項極富挑戰性的工作。我們在 DNA、RNA、蛋白質和細胞層次上對生物樣品進行了大量分析。每個樣本通常會生產 166 MB 資訊,正因如此,我們需要 Teradata 提供的企業級資料倉儲解決方案。WRI還擁有一個能夠容納 240,000 個組織樣本的組織庫。我們將在 9 個月時間內產成大約 50 TB 的資料量,包括圖像和文字,資訊必須唾手可得。由於我們繼續尋找合作夥伴加入,簽訂更多協定,因而我們需要能隨者我們的需求成長的資料倉儲解決方案。」
藉由 Teradata 資料倉儲技術, WRI 將能儲存、提取、分析和管理透過大型生物技術所產生的大量 DNA、RNA 和蛋白質資料。實質上,WRI 的方法將加速醫學探索和知識庫的產生,並且在分子級別找出疾病的特定成因,為病人提供個別化藥物。