Amazon Web Services(AWS)日前在其年度盛会AWS re:Invent上,宣布推出完全托管的营运服务Amazon DevOps Guru。利用机器学习技术,该服务能助开发人员以自动化的方式检测操作问题,并建议补救措施,提高应用程式的可用性。
利用Amazon.com和AWS多年的营运资料,Amazon DevOps Guru机器学习技术能够自动收集和分析应用程式的指标、日志、事件和追踪等资料,识别偏离正常的程式运作模式,例如运算能力配置不足、资料库I/O过度使用、记忆体漏失(memory leak)等。
当Amazon DevOps Guru识别出潜在风险,例如延迟、错误率和资源限制增加而导致应用程式异常服务中断,就会向开发人员发出关於该问题的详细资讯,例如涉及的资源、问题时间表和相关事件等,并透过Amazon Simple Notification Service(Amazon SNS)、Atlassian Opsgenie和PagerDuty等合作夥伴的整合服务,协助开发人员快速了解问题的潜在影响和可能原因,并提出具体的修复建议。开发人员无需手动设置或机器学习专业知识,即可提高应用程式的可用性和可靠性。
负责亚马逊机器学习的AWS??总裁Swami Sivasubramanian表示:「客户希??AWS运用专业知识持续提供新服务以增进应用程式可用性,同时学习Amazon.com的多年营运经验。藉助Amazon DevOps Guru,我们透过AWS过往的经验建立专门的机器学习模型,协助客户检测、排除故障并预防操作问题,在出现问题时提供智慧化建议。使客户立即受益於营运Amazon.com中学到的最隹操作实践,节省配置和管理多个监测系统上所花费的时间和精力。」
开发人员只需在Amazon DevOps Guru控制台简单操作,即可自动提取和分析所有应用程式的历史资源、延迟、错误率、请求率等基础架构的指标,进而建立操作基准线,Amazon DevOps Guru就可透过预先训练的机器学习模型识别与既定基准线的偏差。
当Amazon DevOps Guru分析系统和应用程式资料自动检测异常时,能将这些资料产生营运洞察包括异常指标、随着时间的推移对应用程式列为视觉化、以及相关补救措施的建议。
Amazon DevOps Guru现已在美国东部(北维吉尼亚)区域、美国东部(俄亥俄)区域、美国西部(俄勒冈)区域、亚太(新加坡)区域和欧洲(爱尔兰)区域进行预览,并将在未来几个月中在其它地区推出。
Amazon DevOps Guru不用预付费用或预先承诺,客户只需为Amazon DevOps Guru分析的资料付费。