本文主要讲述了算法在运维中的作用,涉及异常检测和属性分析,并重点介绍了运维系统Kale中的skyline、Oculus模块、Opprentice系统、Grangercausality和FastDTW算法。IT运维平台算法背后的两个“神辅助”智能运维(AIops)是目前IT运维领域最热的词汇,全称是算法运维平台,正式翻译是“基于算法的IT运维平台”,直观的算法是智能运维的核心要素之一。
智能运维(AIops)是目前IT运维领域最火的一个词,全称是算法运维平台。形式翻译是基于算法的IT运维平台,直观的算法是智能运维的核心要素之一。本文主要讲述了算法在运维中的作用,涉及异常检测和属性分析,并重点介绍了运维系统Kale中的skyline、Oculus模块、Opprentice系统、Grangercausality和FastDTW算法。
毕竟监控报警是所有运维工作的基础。设置告警门限是一个费时费力的工作,需要运维人员对业务有充分的了解,也需要考虑业务是否处于稳定发展状态,否则一两周换一次,运维工程师肯定会疯掉。如果这部分工作可以交给算法去解决,无疑会推倒一座大山。当然,机器学习可以做到这一点。但也可以用基于数理统计的算法代替机器学习,效果还不错。
Operations在中国和SRE(sitereabilityengineering)在国外也叫Devops。负责维护和保证整个服务的高可用性,同时不断优化系统架构,提高部署效率,优化资源利用率,提高整体ROI。运维工程师最基本的职责就是负责服务的稳定性,保证服务能够24小时为用户提供服务。
3、linux运维工作主要做什么根据公司业务需求和发展规划网站架构。选择机房和云平台,购买服务器,安装系统,为公司服务器配置web服务、数据库服务和监控服务。调试服务,优化服务和操作系统,开发提交代码后配合R
文章TAG:运维 算法 智能 平台 sre