HawkEye企业一体化IT运维平台


产品介绍

   HawkEye企业一体化IT运维平台是依据ITIL核心架构为设计标准,以IT服务的全生命周期管理为核心管理要素,结合自动化管理工具和标准服务管理流程,帮助企业更好地管理IT基础设施,为企业数字化转型提供支撑。

   平台支持各类主流操作系统、数据库、中间件、云平台、服务器、网络设备等软硬件基础设施的运维操作自动化能力。

产品总体架构

产品总体架构

主要功能

   功能一:采集管理

   采控管理以平台化思路切入,沉淀采控作业中主流、常用的运维场景,一站式管理发现、监控、日志等多采集能力。避免了过去各个产品“agent竖井式分布”的局面,减少资源浪费,降低部署成本。

采集管理

   功能二:配置管理

   配置管理将以应用为中心,维护各类资源的配置属性、关联关系,形成运维活动的作战主地图,并与指标、告警、日志、操作、流程等数据整合,为监、管、控、析等运维管理提供数据支撑。通过流程和自动发现等手段维护配置数据,达到实时、准确的反映IT环境,保证配置数据鲜活、有效。

配置管理

   功能三:设备监控

   设备监控管理提供了一键部署的采集机制、丰富可扩展的监测指标,涵盖了传统与互联网技术的监测指标,实现了对操作系统、中间件、数据库、虚拟化、基础设施服务器、基础服务等IT环境的监控。针对细粒度指标,达到了秒级的数据采集及数据分析和告警。使用全景仪表盘、瀑布事件台、灵动资源圈以及巡检监测器等丰富的数据可视化手段,提升运维的易用性、实用性以及准确性,降低运维的成本和难度,保障IT环境的稳定健康。

设备监控

   功能四:告警管理

   告警管理是设备监控、网络监控、日志监控等场景的下游,其提供了统一的告警管理能力。其面向运维中最关键的日常值班与故障处理场景,告警平台提供了优秀的告警关联能力,它将告警与配置信息、服务流程、监控数据相关联,形成了一警一场景,可以让运维团队的协作像流水线作业一样主动和高效。

告警管理

   功能五:流程管理

   流程管理提供了灵活的产品管理界面,其内置服务请求、事件、问题、变更、巡检等ITIL常用流程模型。在流程模型设计上同时支持复杂的串并混排、条件分支判断流程和敏捷瀑布式流程,满足ITIL和DevOps稳、敏双态运维场景。并提供了多种运维门户接入方式,允许将设计好的流程模型定义为服务项,发布到服务目录中,以便运维人员或业务客户快捷享受流程服务,通过“流程即服务”的理念提升运维服务效率和质量。

流程管理

   功能六:运维数据分析

   运维数据分析是一个作用于将整个运维监控数据、业务数据、运维协同等串联起来,并能全局呈现态势的产品。它通过对运行监控、资源状况、运维协同的多维度数据汇总展现。形成定期性汇报,让运维管理者实时了解运维态势,更好的做运维决策;让运维服务人员实时跟踪业务运行状况,更快的做业务响应;让运维技术人员全面了解故障,更准确的做故障定位与处理。

运维数据分析

案例

   案例一

   某所运维监控管理系统项目,HawkEye平台采用微服务架构与集群部署方式,通过一体化集中运维管理平台实现多维度服务纳管,项目主要模块有大规模云监控、配置管理、服务流程管理、知识库等多个服务模块。同时支持国产化环境,适配包括清华同方、银河麒麟、达梦数据库在内的各类自主可控软硬件。打造“数据+平台+应用”的信息化新模式,建立统一、稳定、安全、高效的IT运维保障体系。

案例一

   案例二

   某城市地铁智能运维项目,HawkEye平台可监控线网内的站内计算机系统、车站终端设备等自动售检票系统硬件设备。通用软件(操作系统、中间件、数据库、杀毒软件等通用软件)系统设备运行时的各项指标,包括设备监控、硬件监控、应用监控、数据库监控、中间件监控、日志监控、其他应用监控等,并将监控情况实时在监控界面更新,如有异常,实现声、光、信息通知等告警方式提醒相关人员。建立相关故障处理知识库,出现故障通过大数据分析将相应处理方法提醒相关人员。

案例二

   案例三

   某国产服务器健康管理系统项目,通过HawkEye健康管理(PHM)系统实现数据采集、设备监控、数据服务、故障诊断分析、健康评估、故障预测、其他管理等功能。其中对关键部件:电源、显示器、电子盘、处理器、操控模块、风机模块要建立故障诊断分析模型、健康评估模型、故障预测模型。

案例三