一个国际研究团队开发了突破性的技术,结合人工智慧和基因分析,更精准地预测疾病风险。这项发表於《自然》期刊的研究,利用名为lentiMPRA的技术,分析了人类基因组中数十万个控制基因表达的DNA片段,并通过机器学习模型MPRALegNet预测基因的活性,准确度堪比实验结果。
以往分析这些称为顺式调节元件 (CREs) 的DNA片段十分困难,但lentiMPRA 技术利用独特的DNA条形码标记CREs,能同时分析它们的活性,效率大幅提升。研究人员将此技术应用於肝细胞、淋巴细胞和诱导多能干细胞,发现 MPRALegNet模型能准确预测 CREs的活性,并揭示了不同细胞类型中基因表达的差异。
更重要的是,MPRALegNet能识别关键的DNA序列,这些序列决定着基因的开启和关闭,有助於理解特定因子如何影响基因表达,例如研究发现HNF4和GATA基序分别对肝细胞和淋巴细胞的基因活性至关重要。
这项研究为探索人类疾病的分子机制开辟了新道路,例如分析基因多态性,即 DNA 序列的变异,这些变异可能导致个体差异和疾病易感性。通过结合大规模实验数据和机器学习,这项技术为基因组学和个性化医疗的未来发展奠定了基础,预计将在疾病预测、诊断和治疗方面发挥重要作用。