AIOps 是 APM 的附属品?AIOps 和 APM 要二选一?小心商业炒作陷阱
随着 AI、大数据技术在 IT 运维领域的落地,AIOps 成为传统运维厂商、新兴 APM/NPM 厂商和云服务商追捧的焦点,越来越多的用户开始了解、尝试和应用 AIOps。但是,由于不同厂商的 AIOps 发展路径和自身产品技术实力的不同,对于 AIOps 的定义和宣传有很大的差异,而用户面对嘈杂的市场声音往往就像雾里看花,显得无所适从。
美国著名 IT 研究机构 Enterprise Management Associates(EMA) 副总裁 Dennis Drogseth 在《AIOps IT Analytics at the Crossroads》网络研讨会上,同样被欧美用户多次问及 AIOps 和传统监控工具之间界限的问题,特别是 AIOps 和 APM 产品的功能差异,如:它们到底有何不同?如果已经有了 APM,还需要 AIOps 吗?企业为什么要同时购买 APM 和 AIOps 产品?
根据 Gartner 在 2019 年 7 月发布的 IT 性能分析技术成熟度曲线显示,AIOps 正在从科技诞生的促动期 (Technology Trigger) 进入过高期望的峰值(Peak of Inflated Expectations),而 APM/NPM 等技术已经进入稳步爬升的光明期 (Slope of Enlightenment),为什么还会出现 AIOps 和 APM/NPM 概念混淆?这里既有两种产品相互交叉造成的误解的因素,也有市场炒作和竞争的原因。Dennis Drogseth 将在本文中为我们理清 AIOps 和 APM 的异同。
APM 和 AIOps 的本质区别
APM 的本质是监控工具。顾名思义,Application Performance Monitoring(Gartner 对 APM 的定义)主要关注应用程序的性能,包括一些应用程序 / 基础架构的相互依赖性(应用拓扑)。诚然,随着 APM 逐渐向智能化发展,越来越多的 APM 产品开始在某种程度上提供故障预测能力,让 APM 和 AIOps 的边界变得有些模糊,但在更广泛的 IT 运维管理与分析场景中,APM 的重点仍是监控,同时也是 AIOps 平台的最重要数据来源。
AIOps 是覆盖全部 7 层 IT 技术栈的平台解决方案。AIOps 作为一种运维策略,可以与企业现有的 ITOM 工具、基础设施监控(ITIM)、网络性能监控(NPM)、应用性能监控(APM)和数字性能监控(DPM)工具进行整合,同时 AIOps 的数据源还包括了 IoT、配置数据、日志文件,甚至电子表格等文档信息。
此外,从大数据分析到故障预测,AIOps 解决方案可利用超过 13 种不同的分析探索方法,用于规范和 if / then 风格的机器学习。EMA 研究表明,目前市场上流行的 AIOps 平台,有超过 50% 能接入 23 种以上不同监测系统和 ITOM 工具。最重要的是,AIOps 解决方案能够支持变更管理、容量预测、安全及 SecOps、成本优化、云迁移以及 DevOps 和终端用户体验分析,这些是远远超出 APM 能力范围的。
因此,我们能够得出一个基本结论:AIOps 是一种涵盖了 APM、网络管理、系统管理、数据库管理和多云管理的统一管控技术,能够关联整合和主动分析来自不同数据源的数据。AIOps 比 APM 在范围、用例和价值上更广泛,本质上与 EMA 定义的高级自动化分析(AIA)的目标是一致的。
APM 和 AIOps 的几点相似之处
但是,如果我们把 AIOps 看做可以替换 APM/NPM/DPM 的监控工具,同样有失偏颇。事实上,APM 的应用为 AIOps 能力的完善提供了巨大帮助。Dennis Drogseth 总结出以下四个方面:
APM 通过基础设施依赖性进行应用程序管理的价值越来越高,因此 APM 也就成为自上而下评估服务管理和服务交付有效性的重要依据。
APM 的核心能力之一是发现应用 / 基础架构拓扑,而应用发现和依赖关系映射(ADTD)提供了更多动态功能,这些功能同样是 AIOps 解决方案的基础,可以直接集成或借助 APM 的发现功能进行实现。
APM 越来越关注终端用户体验管理(DEM),这也是追求与业务价值保持一致的 AIOps 解决方案不断增强的能力之一。
业务绩效指标是选择 APM 解决方案的重要依据,这同样是用户选择 AIOps 解决方案的关键参数。当然 AIOps 平台拥有更全面的基础指标数据,可以更加全面的评估业务价值,分析容量、成本、安全 / 合规性问题和其他指标。
AIOps 如何实现 IT 统一管控
AIOps 作为一种覆盖全部技术栈的统一管控技术,能够帮助企业内部所有与 IT 相关部门进行变革,而不仅局限于运维部门。EMA 连续两年的研究显示,AIOps 能够在所有造成数据孤岛的 IT 工具整合中发挥巨大价值。此外,AIOps 与 IT 服务管理(ITSM)的集成也至关重要,因为这样才能帮助开发、安全团队和运营部门更有效地协同工作。
但是,企业内部应该正确认知 AIOps 并就起目标和价值达成共识,才能实现 IT 的统一管控。而要发挥统一平台的最大价值,需要把 AIOps 的领导力、创造力和灵活性应用在 IT 思维和工作方式中。与 CMDB/CMS 计划并行,AIOps 计划需要各部门主动共享数据,探索新的流程效率水平,同时提高自动化水平。此外,AIOps 需要更具凝聚力和更积极主动的心态,去探索遇到的新问题。当然,最佳实践仍然适用于 AIOps,与数字化转型计划保持一致,这些计划为 IT 转型提供了额外的砝码和价值。
虽然我们常常在市场上听到关于 AIOps 的错误概念,或从字面上把 AIOps 误解为 Ops 专用的运维工具平台,但希望大家通过本文清楚认识到:AIOps 是激发所有 IT 系统价值的基础。由于 AIOps 在产品设计和价值输出是非常多样化的,所以它不仅是一个市场概念,更是一个创新的 IT 环境。因此,我们需要根据现阶段的 IT 成熟度和业务需求,按照优先级选择适合的场景、用例,逐步推进 AIOps 的落地。