1、ICS35.240.01L67DB32江苏省地方标准DB 32/T 3514.82019电子政务外网建设规范第 8 部分:运维服务Construction Specifications of E-Government NetworkPart 8:Operational service2019 - 01 - 12 发布2019 - 01 -30 实施江苏省市场监督管理局发 布DB32/T 3514.82019I目次前言.IV1范围.12规范性引用文件.13术语和定义.14建设目标.24.1联动运维.24.2主动运维.24.3智能运维.25运维服务总体架构.25.1总体架构.25.2基础服务.35
2、.3运维服务管理平台.35.4服务管理体系.36运维服务管理平台.36.1总体要求.36.2平台功能要求.36.2.1资源管理.36.2.2集中监控管理.46.2.3日常运维管理.56.2.4ITIL 服务.56.2.5级联管理.66.2.6系统管理.67平台对接设计要求.67.1网络资源对接.67.2安全综合管理平台对接.67.2.1对接设备信息库接口,具体接收字段件附录 B。.67.2.2对接告警管理接口,具体接收字段请见附录 C。.77.2.3对接运行监测性能接口,基本信息接收字段见附录 E,运行信息接收字段见附录 D。.77.3日常运维管理对接.78运维队伍管理.79运维制度管理.7附
3、录 A(规范性附录)网管平台对接字段. 8附录 B(规范性附录)对接设备信息库接口对接字段.10DB32/T 3514.82019II附录 C(规范性附录)对接告警管理接口对接字段.11附录 D(规范性附录)监测设备信息接收字段. 12附录 E(规范性附录)监测设备性能信息接收字段.13DB32/T 3514.82019III前言DB32/T 3514-2018 电子政务外网建设规范分为八个部分:第1部分:网络平台;第2部分:IPv4地址、路由规划;第3部分:IPv4域名规划;第4部分:安全实施指南;第5部分:安全综合管理平台技术要求与接口规范;第6部分:安全接入平台技术要求;第7部分:电子认
4、证注册服务机构建设;第8部分:运维服务。本部分为DB32/T 3514-2018电子政务外网建设规范第8部分。本部分按照GB/T 1.1-2009给出的规则起草。本部分由江苏省人民政府办公厅提出并归口。本部分起草单位:江苏省人民政府办公厅电子政务办公室。本部分起草人:吴中东、李强、朱德宇、李寒、叶纪华、张坤、徐慧琴。DB32/T 3514.820191电子政务外网建设规范 第 8 部分:运维服务1范围本标准规定了电子政务外网建设中运维服务的术语和定义、建设原则与目标、运维服务总体架构、运维服务管理平台功能要求、平台对接设计要求、运维队伍管理和运维制度管理。本标准适用于电子政务外网建设的运维服务
5、工作。2规范性引用文件下列文件对于本文件的应用是必不可少的。 凡是注日期的引用文件, 仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 20985.1-2017 信息技术 安全技术 信息安全事件管理指南GB/T 21061-2007 国家电子政务网络技术和运行管理规范ISO 20000系列 信息技术 服务管理系列3术语和定义3.1国家电子政务外网数字证书中心National Center for E-government Network DigitalCertificate承担国家电子政务外网电子认证服务工作的机构。3.2资产目录Ass
6、ets Directory运行于电子政务外网所有软硬件产品、IP地址等资产的数据目录体系。3.3IT 服务管理IT Service Management(ITSM)帮助企业提升对IT系统的规划、研发、实施和运营进行有效管理的高质量方法。3.4信息技术基础架构库Information Technology Infrastructure Library(ITIL)适用于IT服务管理(ITSM)。ITIL为IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。3.5配置管理信息库Configuration Management Database(CMDB)DB32/T 3514.820192存储
7、与管理企业IT架构中设备的各种配置信息。3.6简单网络管理协议Simple Network Management Protocol(SNMP)由一个应用层协议(application layer protocol)、数据库模型(database schema)和一组资源对象组成的网络管理协议。3.7Java 管理扩展Java Management Extensions(JMX)一个为应用程序、设备、系统管理功能的框架。3.8Java 数据库连接Java Data Base Connectivity (JDBC)一种用于执行SQL语句、可以为多种关系数据库提供统一访问的Java API。4建设目
8、标4.1联动运维建设省、市二级运维服务体系,并实现与国家电子政务外网运维服务体系的互连互通。4.2主动运维实时监测IT基础资源运行状态, 及时识别事件并启动相关处理流程和应急响应机制, 实现业务系统平稳运行。4.3智能运维利用大数据和人工智能技术,进行更精确的故障定位和趋势预测,实现智能化运维。5运维服务总体架构5.1总体架构运维服务总体架构由基础服务、运维服务管理平台和服务管理体系组成。按照ISO20000的要求,参考ITIL V3基础架构,规范运维服务管理平台和服务管理体系。如图1所示:DB32/T 3514.820193图 1总体架构图5.2基础服务采集网络设备、安全设备和数据中心相关运
9、维资源信息,通过数据清洗进行格式化、标准化处理,供相关运维服务应用系统使用。5.3运维服务管理平台由资源管理、集中监控管理、日常运维管理、ITIL服务、级联管理以及系统管理组成。资源管理包括资源登记、资源类型管理、资源目录管理、全生命周期管理、IP地址管理;集中监控管理包括网络资源运行监控、安全资源运行监控、数据中心运行监控(计算机设备、存储设备、数据库、中间件、安全设备、业务应用等资源);日常运维管理包括值班管理、日常巡检、供应商管理;ITIL服务包括服务台、事件管理、问题管理、变更管理、发布管理、知识库。5.4服务管理体系建立运维服务管理体系,包括运维队伍建设和运维制度建设等。6运维服务管
10、理平台6.1总体要求应按照:a)采用成熟的技术,并满足先进性与实用性并重;b)符合 GB/T 20985.1-2017 中 7.2 的要求;c)具有开放性、可移植性、可扩展性;d)实现运维服务过程可控、可视、可分享、可追溯。6.2平台功能要求6.2.1资源管理DB32/T 3514.8201946.2.1.1资源登记按照GB/T 21061-2007要求,根据IT资源的基础特征属性参数、资源间关系建立资源信息档案,构建完整的IT资源配置管理数据库。资源来源主要包括采购、赠与、配发及租赁等。以资源设备统计数据为基础,对网络设备、服务器、数据库、中间件、业务系统等运行情况进行统计分析。6.2.1.
11、2资源类型管理提供IT服务相关的资源分类定义功能, 资源管理人员可以在运维服务管理平台中定义资源类别和性质。资源类别是指计算机设备、网络设备、安全设备、IP地址、软件资产等IT资源类别划分;资源性质是指软件、硬件、耗材等IT资源性质类别划分。6.2.1.3资产目录管理按照资产目录体系进行目录分类管理。其中软硬件产品目录包括该产品的使用寿命、厂商、参考价格、保修年限、参考折旧方案等信息。6.2.1.4全生命周期管理对资产目录定义的各类资源实现全生命周期的管理,主要包括资源的需求规划、新增(资源入库)、领用、维护、调拨、变更、报废等一系列操作管理。6.2.1.5IP 地址管理通过对IP-MAC实时
12、信息、变更信息的管理,实现IP地址的分配、使用、回收,全面管控IP地址的使用。6.2.2集中监控管理6.2.2.1网络资源运行监控包括网络设备自动发现、拓扑自动生成、网络故障管理、网络设备性能管理、网络链路流量管理、网络安全管理等内容,支持网络管理协议SNMP v1/v2/v3,支持对多厂商路由交换设备的监控和管理。6.2.2.2安全资源运行监控监测和管理安全设备的运行状态,对安全事件、脆弱性、配置、可用性与安全相关的数据进行统一采集、集中分析,并进行宏观可视化展现,发现事件或安全风险时可实时触发告警。6.2.2.3数据中心运行监控运行监控包括对服务器、存储设备、网络设备、数据库、业务系统以及
13、机房动环等资源的监测和控制;根据不同情况设置不同告警级别及阈值;自动报警,自动响应和自动处理;对监控的历史数据进行存档和查看。具体如下:a)服务器运行监控:监控内容包括基本信息、CPU 负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等;b)数据库运行监控:监控内容包括工作负载、配置、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性;c)中间件运行监控:监控内容象包括配置信息、连接池、线程队列、负载监测、通道情况监测等参数。分析和监测中间件的各项运行状态参数;DB32/T 3514.820195d)业务监控:
14、以业务为主线,实现面向业务的监测和管理,监控内容包括应用运行状态、应用连接数、进程、服务(端口)状态等,并能够实现阈值设定、故障告警、告警级别设置、流程管理、统计通报等功能;e)动环运行监控:根据机房分布,自动建立机房结构拓扑视图,采取分区管理方式,集中采集温湿度、电源、电压、UPS、空调、视频等性能状态及预警事件。6.2.3日常运维管理6.2.3.1值班管理建立值班负责人、值班人员、值班开始时间、结束时间、交班开始时间、交班结束时间、强制交班时间等信息。6.2.3.2日常巡检设定巡检范围、指标、频度以及巡检报告表单,通过自动、手动两种方式对服务器、网络设备、数据库、中间件、业务系统等配置指标
15、、性能指标、网络指标、链路状态、小型日志、系统进程状态进行日常性、周期性巡检,自动生成巡检报告。6.2.3.3供应商信息管理建立管理设备和服务供应商清单,包括供应商的基本信息,联系人和联系方式。6.2.4ITIL 服务6.2.4.1服务台作为服务窗口统一接受呼叫请求,同时反馈请求处理进度;服务台功能包括事件支持、工作调度、任务指派以及其他IT服务流程等。6.2.4.2事件管理制定事件报告和处理管理制度,明确不同告警事件的报告、处理和响应流程,规定事件的处理管理职责等。事件管理应具备以下功能:a)上报所发现的事件;b)对造成运维服务管理平台中断的重大事件采用不同的处理程序;c)在事件报告和响应处
16、理过程中,分析和鉴定事件产生的原因,收集证据,记录处理过程,形成相关日志记录。6.2.4.3问题管理制定问题管理制度,规定问题处理管理职责等。问题管理应具备以下功能:a)上报所发现的问题事件;b)查找问题事件产生的根本原因,制定解决方案和预防措施,形成相关日志记录;c)建立问题管理申报和审批流程, 依据流程控制处理相关问题。 记录问题解决过程, 形成知识库。6.2.4.4变更管理应具备以下功能:a)建立变更的申报和审批流程,依据流程控制处理所有的变更,记录变更实施过程;DB32/T 3514.820196b)建立中止变更并从失败变更中恢复的流程,明确流程控制方法和人员职责;c)明确运维资源变更
17、需求,变更前根据变更需求制定变更方案,变更方案审批后方可实施。6.2.4.5发布管理运维服务主管部门负责制定发布管理制度。发布管理制度应通过正式、有效的方式发布,并进行版本控制。6.2.4.6知识库在运维服务管理过程中,对历史故障的现象、原因、处理方法等经验进行收集和分析,形成的解决方案集合。6.2.5级联管理将下级的告警信息、 运维工单、 知识库等同步到上级平台跟踪管理, 上级平台下发预警、 安全事件、通报等信息,实现省、市运维工作的联动与协调。6.2.6系统管理6.2.6.1用户管理集中管理运维服务用户账号,实现用户信息维护,包括修改、增加、删除等维护功能。6.2.6.2权限管理根据用户身
18、份从资源使用、用户角色等方面进行分级别、分功能授权,实现权限控制。6.2.6.3日志管理应具备以下功能:a)对运维管理平台的启动、自检、故障、恢复、关闭等运行状态信息进行记录;b)对运维管理平台的用户登录、退出、增加、删除、修改等操作进行记录;c)按照日志类型、时间等对日志进行检索与统计分析。7平台对接设计要求7.1网络资源对接应符合以下要求:a)通过 SNMP 协议采用定时轮询方式,采集网络设备资源信息和运行数据信息,进行统一管理;b)通过与网管平台统一告警管理接口对接, 实现对网管平台各类告警信息的接收和处理, 同时对产生的告警数据,形成统一的数据工单,并通过 API 接口标准数据的形式发
19、送给 ITIL 服务流程系统,完成不同设备和运维服务管理平台发出的告警信息集中展现在运维管理平台;c)与网关平台对接的接口的具体字段见附录 A。7.2安全综合管理平台对接7.2.1对接设备信息库接口,具体接收字段件附录 B。DB32/T 3514.8201977.2.2对接告警管理接口,具体接收字段请见附录 C。7.2.3对接运行监测性能接口,基本信息接收字段见附录 E,运行信息接收字段见附录 D。7.3日常运维管理对接省级节点建立知识库,下级节点可以访问并可上传案例;上级节点可以向下级节点推送工单信息,内容可以是按照指定的告警信息、工单处理信息等。8运维队伍管理根据运维服务内容和流程确定岗位
20、设置和职责分工, 并按照相应要求配备所需各类业务岗位的专职人员和执业技术人员。具体要求如下:a)及时性: 运维人员和客户保持良好的沟通机制, 快速响应客户的需求, 及时解决各类故障问题;b)专业性:运维人员需要具备高水平的运维经验,了解各项安全规范,熟悉网络架构以及设备的操作规范。9运维制度管理针对运维管理流程和内容,制定相应的运维管理制度,实现各项工作的规范化管理。具体包括:a)应对安全管理活动中的各类管理内容建立安全管理制度;b)应对要求管理人员或操作人员执行的日常管理操作建立操作规程;c)应形成由安全策略、管理制度、操作规程、记录表单等构成的全面的信息安全管理制度体系。DB32/T 35
21、14.820198AA附录A(规范性附录)网管平台对接字段表 A.1网管平台对接字段标签名名称类型id告警 ID长整数(long)类型OID告警事件 OID字符串(String)类型originalType告警来源类型整数(int)类型originalTypeDesc告警原始类型描述信息字符串(String)类型deviceId设备 Id长整数(long)类型deviceIp设备 Ip字符串(String)类型deviceName设备名称字符串(String)类型alarmLevel告警级别整数(int)类型alarmLevelDesc告警级别描述信息字符串(String)类型alarmCat
22、egory告警分类整数(int)类型alarmCategoryDesc告警分类描述信息字符串(String)类型faultTime告警发生时间长整数(long)类型faultTimeDesc告警发生时间详细信息字符串(String)类型recTimerecTime长整数(long)类型recTimeDesc告警恢复时间详细信息字符串(String)类型recStatus告警恢复状态整数(int)类型recStatusDesc告警恢复状态描述信息字符串(String)类型recUserName告警恢复人字符串(String)类型ackTime告警确认时间长整数(long)类型ackTimeDes
23、c告警确认时间详细信息字符串(String)类型ackStatus告警确认状态整数(int)类型ackStatusDesc告警确认状态描述信息字符串(String)类型ackUserName告警确认人字符串(String)类型alarmDesc告警描述信息字符串(String)类型paras告警参数字符串(String)类型parentId告警关联分析父 ID长整数(long)类somState告警分发状态整数(int)类型remark告警备注字符串(String)类型eventName告警事件名称字符串(String)类型DB32/T 3514.820199表 A.1网管平台对接字段(续)r
24、eason告警事件原因字符串(String)类型suggestion告警修复建议字符串(String)类型experience告警维护经验字符串(String)类型tipMessage告警事件定位字符串字符串(String)类型defineType告警定义类型整数(int)类型customAlarmLevel用户自定义级别整数(int)类型DB32/T 3514.8201910BB附录B(规范性附录)对接设备信息库接口对接字段表 B.1对接设备信息库接口对接字段标签名名称类型id设备唯一标识字符串(String)类型ip设备 ip字符串(String)类型mac设备 mac 地址字符串(Str
25、ing)类型name设备名称字符串(String)类型os设备操作系统字符串(String)类型type设备类型字符串(String)类型value设备价值整数(int)类型DB32/T 3514.8201911CC附录C(规范性附录)对接告警管理接口对接字段表 C.1对接告警管理接口对接字段标签名名称类型id告警唯一标识字符串(String)类型name告警名称字符串(String)类型risk告警级别整数(int)类型srcip源 ip字符串(String)类型dstip目标 ip字符串(String)类型time告警发生时间字符串(String)类型type告警类别字符串(String)
26、类型DB32/T 3514.8201912DD附录D(规范性附录)监测设备信息接收字段表 D.1监测设备信息接收字段标签名名称类型ip设备管理 IP字符串(String)类型manufacturer设备厂商字符串(String)类型hostName设备名称字符串(String)类型category设备型号字符串(String)类型osName操作系统名称字符串(String)类型osVersion操作系统版本字符串(String)类型sysObjectId设备的 sysObjectID字符串(String)类型instanceCPU 实例号整数(int)类型rawDescr原始描述字符串(St
27、ring)类型instance内存实例号整数(int)类型rawDescr原始描述字符串(String)类型memType内存类型整数(int)类型memSize内存总大小整数(long)类型instance接口实例号整数(int)类型ifAlias接口别名字符串(String)类型ifDescr接口描述字符串(String)类型ifType接口类型整数(int)类型ifMtu接口最大传输单元整数(int)类型ifSpeed接口速率整数(long)类型ifAdminStatus接口管理状态整数(int)类型ifOperStatus接口操作状态整数(int)类型ifLastChange当前状态时
28、间字符串(String)类型duplex接口(网卡)工作模式整数(int)类型ip接口 IP 地址字符串(String)类型mac接口 MAC 地址字符串(String)类型mask接口掩码字符串(String)类型instance硬盘分区实例号整数(int)类型rawDescr原始描述,即盘符或挂载点字符串(String)类型volumeSize硬盘分区总大小整数(long)类型DB32/T 3514.8201913EE附录E(规范性附录)监测设备性能信息接收字段表 E.1监测设备性能信息接收字段标签名名称类型ip设备管理 IP字符串(String)类型status设备状态整数(int)类型
29、instanceCPU 实例号整数(int)类型perfCpuCPU 单核使用率整数(float)类型instance内存实例号整数(int)类型memSize内存总大小整数(long)类型memUsed内存已用大小整数(long)类型instance接口实例号整数(int)类型ifSpeed接口速率整数(long)类型ifOperStatus接口操作状态整数(int)类型inFlow流入字节数整数(long)类型outFlow流出字节数整数(long)类型inPacket流入单播报文数整数(long)类型outPacket流出单播报文数整数(long)类型inNPacket流入非单播报文数整
30、数(long)类型outNPacket流出非单播报文数整数(long)类型inDiscard被丢弃的流入报文数整数(long)类型outDiscard被丢弃的流出报文数整数(long)类型inError流入的错误报文数整数(long)类型outError流出的错误报文数整数(long)类型instance硬盘分区实例号整数(int)类型volumeSize硬盘分区总大小整数(long)类型volumeUsed硬盘分区已用大小整数(long)类型instance进程号整数(long)类型processName进程名称字符串(String)类型processState进程状态整数(int)类型processCpu进程占用 CPU 时间整数(long)类型processMem进程占用内存大小整数(long)类型processType进程类型整数(int)类型_DB32/T 3514.8201914