百亿美元的AIOps市场,微软早已开始布局

当AIOps与云计算相容,Azure还是那个Azure?

2022年1月13日,微软亚洲研究院在智能运维媒体交流会议上分享了智能运维的应用场景、挑战和未来发展方向,并详细解释了微软亚洲研究院的智能运维Azure智能原动力提供。

随着越来越多的企业拥抱云计算,云已成为企业的共识。企业在享受云计算带来的快速服务的同时,也面临着传统运维带来的挑战。

那么如何规划和设计云服务呢?如何使运维系统更适应云的变化?如何快速部署和监控云资源?AIOps应运而生。

大数据与人工智能相结合AIOps,可实现智能操作,快速分析和处理大量数据,得到有效的操作和维护决策,有效地进行大规模系统软件的操作和维护。

目前微软亚洲研究院与微软云产品团队深入合作,取得了哪些成果?AIOps微软云有什么变化?目前微软云有什么变化?AIOps发展现状如何?

会议上,雷峰网及相关媒体与微软亚洲研究院执行副院长、微软杰出首席科学家张冬梅、首席研究员林庆伟进行了深入交流。

百亿美元的AIOps市场,微软早已开始布局

张冬梅,微软亚洲研究所常务副院长,微软杰出首席科学家

百亿美元的AIOps市场,微软早已开始布局

林庆维,微软亚洲研究院首席研究员

一、AIOps市场规模可观,吃肉还是喝汤?

“AIOps”是 Gartner 术语成立于2016年。AIOps通过创新的AI/ML该技术能有效地设计、构建和运营大规模复杂的云服务。AIOps该平台集大数据、机器学习和可视化技术于一体 IT包括可用性和性能监控、事件关联和分析在内的操作和维护过程和任务,IT服务管理和自动化。

Research and Markets预计到2025年,AIOps市场规模将达到143亿美元。

面对如此大的市场规模,AIOps轨道发展真的好吗?数据量少、应用场景等都是人们关注的问题。

随着云计算时代的到来,AIOps它已经成为云计算中不可或缺的一部分。正如张东梅总统所说:现在云计算平台已经成为世界的基础设施,未来云计算将像水、电、气一样不可或缺。

对于整个系统管理来说,它也面临着前所未有的挑战。大量的用户、大规模的集群和复杂的系统架构使传统的操作和维护方法无力。

智能运维是传统运维的必然趋势。

早在10年前,微软亚洲研究所就率先开展云智能和云智能AIOps相关领域的研究提出了主动系统设计、数据驱动安全部署等新方法和设计;在全球有影响力的学术会议上发表了50多篇论文。发起并组织一系列的研讨会@AAAI 2020、ICSE 2021、Chinasoft、MLSys 2022等。

目前,微软亚洲研究所正在微软研究AIOps研究成果已应用于微软Azure、Skype、OneDrive、Office 365、Azure在很多在线服务中,比如。

在AIOps在这条赛道上,微软走得更早,走得更远。无论谁吃肉,谁喝汤,微软的实力都不容小觑。

二、AIOps如何应用微软云?

目前,微软云在世界五大洲部署了数千万多台物理服务器,数千个数据中心运营数百万客户的应用和服务,其中全球500强企业95%以上,每月更新硬件和软件。

微软云计算和人工智能部首席数据科学家党英农指出:面对微软云等大规模、高度复杂、承载大量客户应用的云计算系统,不可行使用传统的非智能软件开发和运维技术进行高效开发、部署、运营和管理。早在五六年前,微软云就意识到实现智能运维的必要性,因此开始加强与微软亚洲研究所的合作。现在看来,在微软云中,AIOps应用和影响是深远的。”

在Azure的应用中,AIOps也表现出了不错的能力。

据了解,微软云在智能运维方面积累了许多重要的技术创新,包括云服务系统的智能化和管理的自动化、云开发和部署的智能化和智能客户响应。另一方面,人工智能和机器学习技术已深入集成到微软云基础设施管理软件站,包括智能监控、智能预测、智能维修等。

一方面,云服务的可用性、可靠性和效率得到了提高,另一方面,云服务运行的自主性得到了提高,需要人工维护的场景不断减少,机器学习技术也得到了极大的改进,微软云的开发和维护得到了极大的提高,如智能测试、智能诊断、智能部署等,大大提高了开发和运营工程师的效率。

根据Gartner数据,微软Azure占全球云计算的近20%。AIOps能力赋能给Azure,想必微软也看到了人人都能上云的时代, Azure“升维”AIOps必不可少。

三、服务、客户、工程AIOps的核心

在过去,操作和维护是一个小数据,每个操作和维护模块都是一个数据岛,不涉及算法,只能满足传统操作和维护的使用场景。到目前为止,传统的操作和维护还不能适应云计算时代的新操作和维护。

随着人工智能浪潮的到来,基于人工智能的智能运维(AIOps)它开始流行起来,起了更广泛的关注。

院长张冬梅说:AIOps服务/系统、客户、开发/运维三个核心。

具体来说,AIOps一方面,服务/系统的设计和构建可以更加可靠、高性能和高效;另一方面,智能操作和维护可以提高用户体验和满意度;最后AIOps智能运维工具可以赋予工程师更高的开发/运维生产力。

据林庆维介绍,目前AIOps可应用于云系统故障预测、异常检测、智能诊断、容量规划、事故管理等实际应用场景。

例如,为了确保云平台的高可靠性和高可用性,实时检测可能的系统异常尤为重要。通过监控平台的性能指标数据(访问成功率、响应速度、CPU 利用率、内存占用率)、系统事件、系统日志等,从数据中窥探系统的健康状况。

此外,还有智能诊断:利用系统数据自动定位可能的故障原因,缩小问题空间;故障预测:提前预测,避免硬盘故障预测、大规模服务故障预测等可能的损失。

同时,我们也要注意,AIOps短板挑战。在检测、诊断、预测和优化方面存在差异化需求、缺乏标记数据、在线系统的大规模和复杂性等不同问题,给操作和维护带来了困难。一般来说,适用于机器学习的场景与实际环境仍存在一定差距。

因此,微软亚洲研究所将继续探索AIOps领域,让AIOps未来更加自动化、主动化、通用化。

(0)
上一篇 2023年1月9日 下午8:10
下一篇 2023年1月9日 下午8:18

相关推荐

wx