作者:监控易 来源:九游会时代
发布时间:2023-08-23
随着大数据基础设施的快速发展,集中监控和统一运维面临着一些挑战。首先,大数据基础设施的增长速度非常快,涉及的数量级、种类、关键技术和范式都在指数级增长,这增加了集中监控和统一运维的复杂度。其次,IT运维的范围越来越广,涉及的领域、设备和职能也日益丰富,传统的适配方式已经无法满足现代数字化浪潮的需求。
监控易全面适配信创国产化、适配一切协议和设备、海量秒级设备监控、一体化智能运维、独有的多TS分布式运维,跨区域多层级管理,精准告警、定位故障。
可监控2200多种不同品牌和型号的网络设备
监控易可以对2200多种不同品牌和型号的网络设备进行全面的监控,监测点包括TCP信息、UDP信息、OSPF接口信息、BGP信息、OSPF区域信息、CPU、内存信息、System、物理指标等。
这些监测点可以全面覆盖网络设备的运行状态,帮助管理员及时发现并解决问题,提高网络设备的可靠性和安全性。同时,监控易提供了多种数据报表和统计分析工具,可以帮助管理员了解网络设备资源的使用情况和趋势,进一步优化系统运行效率和资源利用率。
信创国产化,是九游会时代战略部署的重要一环。九游会时代产品均为自主研发、国内全栈式自主可控,全面适配信创国产化,性能优于国外同类产品,可运行在Windows、Linux和国产统信、麒麟、凝思等操作系统之上,支持在Android、iOS等移动平台上应用。
多种协议的网络设备接入,统一管理
各品牌和型号的网络设备可统一接入监控易,并对设备的监测点进行监控;支持按照设备分类、资源组、机房、采集集群等维度管理设备,支持单个添加设备,按照IP地址、凭证协议扫描获取设备并自动纳管;支持导出Excel表格统一添加;支持按照多条件组合查询设备和监测点。
支持按照Agent、IPMI、SSH、Telnet、VMI、SNMP、配置管理等多种协议接入,并统一管理;采用采集集群+数据库双机,通过采集集群单元模式接入设备,实现采集模块的健康监测、任务分配、负载均衡以及灾备能力,系统更稳定可靠;支持定义设备监测点模板,快速给一批设备创建监控规则,极大的提高了维护人员的工作效率。
九游会监控易可以面向多渠道进行数据采集,并基于此进行多管控模式监控,最终实现综合监控运维管理。对于各厂家自带的运维工具,或企业单位之前已有的监控工具,监控易可以通过南向北向接口,根据应用场景需要集成或被集成到管理平台,实现多资源统一监控。基于此,提供更为高效的机房动环、网络管理、IP地址管理、视频管理等多场景运维案。
多渠道资源统一监控,解决了数据采集和统一纳管问题,而后面对的是海量设备的运维压力,如何实现高效、稳定、高性能的统一监控?九游会时代的监控易智能运维给出如下解决方案:
01
采集集群单元模式和凭证式管理,设备批量接入
凭证是指监控易系统连接设备时所使用的各种协议参数。通过凭证设置,能够将使用相同协议参数连接的设备进行统一管理。当使用相同凭证的设备协议参数发生修改时,则无需在系统内依次修改各个设备上的参数,只需修改凭证,即可实现统一修改的效果。
“凭证设置”模块提供对SNMP、IPMI、SSH、Telnet、WMI、Agent等凭证的统一管理。采用凭证模式,对于大批量设备维护更简单,可批量接入、修改设备信息,维护更便捷。
监控易提供采集集群单元模式接入设备,系统更稳定可靠。
监控易设备接入模块,提供海量设备的接入和运维管理能力,支撑设备数据采集、 数据分析、视图展示、告警通知,可帮助运维团队全面了解设备的使用情况、业务的健康走势。只需提供IP地址和选择凭证,便可自动添加网络设备;支持定义监测点模板,快速给一批设备创建监控规则,极大的提高了维护人员的工作效率。
02
基于单机房/多机房基础设施的统一监控
从机房运维管理的角度来看,运维系统支持多机房管理,可基于运维平台实时了解机房设备、动力环境、安防情况、设备告警等信息。对于机柜管理,运维平台支持将设备在机柜虚拟上架,可以在机柜中直观查看设备的信息和当前状态。此外,还支持3D机房管理,通过3D仿真形式展示机房以及机柜和设备,并可在视图中显示监控状态和告警。
针对不同规模的企业,可进行机房动环及能耗大屏自主配置,实现多个功能大屏配置及切换展示;支持随时查看各机房设备运行状况以及机房日常巡检报告,供用户快速定位故障设备及所属机房位置。全面支持机房设备监控,如:UPS、配电柜、精密空调、温湿度、气体监测、新风系统、烟感等。
03
自定义复杂场景、标签管理,实现多级资源组管理
在实际的运维工作中,会面临各种不同的复杂场景,涉及的运维对象、运维团队、终端用户等角色也比较多。如何通过管理工具,高效应对纷杂的设备、人和需求等因素,是运维领域一直面临的一个挑战。
在监控易最新推出的火星版本中,支持基于业务、运维、地域、智能等企业管理视角创建多个场景的资源分组集中管理。支持围绕场景对设备分组管理,支持用户自定义场景,按需执行运维工作。
可以按照运维团队的职责范围进行分组管理,如分为硬件运维组、软件运维组、网络运维组、机房运维组等。支持按照部门职责或者使用人员进行分组设置,如对业务部门、运维部门、技术部门、系统维护部门等进行分组管理。
另外,监控易平台支持对每个软硬件监控对象设置多个标签,比如给一个服务器,设置标签为硬件运维、二楼机房、第五机柜、张三、OA系统等,勾选配置不同标签就可以临时组建自己想要查看的虚拟运维对象组,即时响应任何监控和管理需求,辅以采集的各类数据指标,协助快速解决目前面临的问题。
04
全域资源纳管,助力远程巡检
运维系统能够解决因IOT资源分散而导致人工巡检费时费力的问题。通过统一纳管,实现跨区域跨网络的远程自动巡检、故障告警。运维平台可按照一定维度对采集及监控对象进行分类管理,全域纳管覆盖如下四个方面:
1、IT基础设施,如服务器主机、操作系统、网络设备、安全设备、存储设备、无线等。
2、应用和业务系统,如数据库、中间件、应用服务、虚拟化、云平台等。
3、机房和物联网,如动力系统、环境系统、安防系统、物联网设备等。
4、其他扩展监控,如被动式设备监控、自定义脚本监控、高级监测点监控等。
监控易采用采集集群+数据库双机,实现容灾备份,减少故障率,采集能力更稳定;系统按照采集量自动分配采集器,实现负载均衡,达到性能最优。对于大中型企业而言,可大大降低重复化、大量化、标准化的管理运维工作,并提升大数据基础设施的产出价值。