公共信用信息平台运行维护管理规范
ICS 35.240.01 L 70 江 DB32 苏 省 地 方 标 准 DB 32/T 4144—2021 公共信用信息平台运行维护管理规范 Management specification for operation and maintenance of the public credit information platform 2021 - 12 - 09 发布 江苏省市场监督管理局 2022 - 01 - 09 实施 发 布 DB32/T 4144-2021 目 前 次 言 ........................................................................... III 1 范围 ............................................................................... 1 2 规范性引用文件 ..................................................................... 1 3 术语和定义 ......................................................................... 1 4 通用要求 ........................................................................... 2 5 基础设施运维 ....................................................................... 4 6 应用软件运维 ....................................................................... 8 7 安全管理 .......................................................................... 10 8 应急响应 .......................................................................... 11 II DB32/T 4144-2021 前 言 本文件按照GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起 草。 本文件由江苏省发展和改革委员会提出并归口。 本文件起草单位:江苏省战略与发展研究中心、中国标准化研究院、扬州市政府信息资源管理中心、 南京苏创瑞远网络科技有限公司、南京莱斯信息技术股份有限公司。 本文件主要起草人:张志飞、贺德荣、徐渠、施歌、顾遵雷、孟凡、陆建、周莉、赵燕、韩义森、 王睿、陈华、嵇绍康、钟鹤翔、王芸。 III DB32/T 4144-2021 公共信用信息平台运行维护管理规范 1 范围 本文件规定了各级公共信用信息平台运行维护管理的通用要求、基础设施运维、应用软件运维、安 全管理和应急响应。 本文件适用于各级公共信用信息平台的运行维护管理,其他相关信用信息系统运维管理可参考使用。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB 50174 电子信息系统机房设计规范 GB/T 20272 信息安全技术 操作系统安全技术要求 GB/T 22117 信用 基本术语 GB/T 22239 信息安全技术 网络安全等级保护基本要求 GB/T 23792 信用标准化工作指南 3 术语和定义 GB50174、GB/T 20272、GB/T 22117、GB/T 22239、GB/T 23792 界定的以及下列术语和定义适用 于本文件。 3.1 公共信用信息平台 public credit information platform 提供自然人、法人和非法人组织公共信用信息归集、处理、应用服务等功能的基础设施和应用软件 的总称。 注:公共信用信息平台在本文件中简称信用平台。 3.2 1 DB32/T 4144-2021 运行单位 operation organization 负责信用平台运行维护的单位。 3.3 基础设施 infrastructure 支撑信用平台运行的基础软硬件设施,包括:计算机硬件设备、网络和安全设备、云平台,以及基 础软件系统。 3.4 基础软件 basic software 支撑信用平台运行的操作系统、中间件、数据库管理系统等软件。 3.5 云平台 cloud platform 用于部署信用平台所用的云计算和存储资源的集合平台。 3.6 应用软件 application software 为满足信用信息归集、处理、交换、共享、服务、管理等工作需求而开发的软件。 4 通用要求 4.1 运维组织 4.1.1 运行单位应对运行维护工作进行明确分工,根据信用平台的规模和运行要求设置相应的运行保 障人员,成立运维小组,主要包括管理人员、技术支持人员、业务操作人员、安全审计人员: a) 管理人员:负责运行维护管理工作,编制运行维护工作整体规划,制定运行维护管理制度和操 作规程; b) 技术支持人员:负责基础设施、应用软件等运行维护工作,及时响应并处理信用平台运行中的 请求、故障等; 2 DB32/T 4144-2021 c) 业务操作人员:负责信用平台应用功能的日常操作,开展信用信息相关服务,包括业务的处理、 审核、异常情况处理等; d) 安全审计人员:负责对技术支持人员、业务操作人员行为进行安全审计、跟踪分析和监督检查, 包括查看和审计系统运行日志等。 4.1.2 运行保障人员应定期通过业务培训考核。 4.2 运维范围 4.2.1 运行维护范围包括但不限于:基础设施、应用软件、安全管理和应急响应等。 4.2.2 运行维护保障时间为 7×24 小时,以保障信用平台不间断稳定、可靠、高效运行。 4.3 文档管理 4.3.1 运维文档应包括但不限于:运维对象清单、网络拓扑图、设备台账、设备系统配置、用户账号、 基础设施产品资料及软件开发、使用和运维资料等资料性文档,以及设备维修、变更、巡检记录和运维 周报、月报、年度总结等过程性文档。 4.3.2 资料性文档应随记录事项变动实时更新,并记录变更人、责任人、版本号和变更日期。 4.3.3 过程性文档应及时如实记录并总结运维事件,保存电子文档和相关人员签字的纸质文档,纸质 文档至少保留 3 年。 4.3.4 设备台账应建立对象清单并实行动态管理,清单应标明对象标识、购置(形成)日期、购置价 格、保修期、功能授权、重要程度、所在位置、上线日期、供应商和变更说明等。 4.4 变更管理 4.4.1 信用平台的变更内容包括但不限于: a) 业务功能变更:业务需求变化引发的变更; b) 实现方式变更:数据库结构、软件实现方法的优化; c) 运行环境变更:软件、硬件更新和升级。 4.4.2 重要事项变更前应根据需求制定变更方案,经过运维小组讨论、审核、批准后实施,实施过程 主要包括: 3 DB32/T 4144-2021 a) 实施前:评估变更影响范围,做好相关应急预案,明确变更时间和实施人员,在业务服务相 对空闲情况下进行,提前发布变更公告; b) 实施中:做好数据和平台备份,密切监督变更方案执行,变更后应进行测试,如未变更成功, 应及时回退以保证系统正常运行; c) 实施后:应及时更新相关文档并提交变更报告。 5 基础设施运维 5.1 计算机硬件设备运维 5.1.1 安装部署 硬件设备应部署在不低于GB 50174划定的A级标准的机房内。 服务器应安装满足业务需求的最新版本操作系统和驱动,更新操作系统漏洞补丁,配置防火墙策略、 账户密码策略,配置IP地址并测试网络连通性。 存储设备应按照厂家操作手册进行安装,根据信用平台的数据规模和需求,配置RAID模式、LUN分 区,并将LUN分区映射到HOST节点,在HOST节点测试存储连通性。 5.1.2 日常巡检 每日应对硬件设备进行巡检,查看设备面板灯、硬盘灯、接口灯、运行状态灯、电源、风扇是否正 常,定期检查磁盘存储池状态、LUN划分状态、主机映射状态以及整体磁盘空间,并做好巡检记录。 5.1.3 优化 应及时分析硬件设备性能对信用平台业务的影响,优化硬件及其配置参数。 应定期检查平台业务对存储的需求并设计存储优化方案。按照经运维小组充分论证的存储优化方案 对存储设备进行优化, 优化的内容包括但不限于磁盘碎片整理、磁盘备份系统的升级、存储参数优化等。 5.1.4 变更 变更前应将旧设备存储的数据按需求进行归档或同步到新设备,数据迁移结束后验证数据完整性和 有效性。 应针对硬件故障及损坏情况预留一定量的备件,并定期对备件进行清点、检测和补充。更换下的设 备或部件应交由运行单位按要求统一处理。 5.1.5 故障处理 4 DB32/T 4144-2021 遇有故障发生时,应立即查看故障日志,排查故障原因,及时通知供应商和相关业务方。 在做好系统、 配置和业务数据备份后,停机或待机更换备件。待系统正常运行后测试验证应用系统, 检查业务数据存储空间并做好故障处理记录。 5.2 网络和安全设备运维 5.2.1 安装部署 网络设备安装部署应符合政府信息系统网络安全要求,并在确保网络设备和安全设备运转正常后进 行信用平台安装部署。 网络和安全设备应配置登录失败处理功能和会话超时自动退出功能,安全设备应配置基于源IP地址、 通信协议、目的IP地址、源端口、目的端口的细粒化访问控制策略。 5.2.2 日常巡检 每日应查看设备运转状态, 在日常巡检基础上,按照下列要求定期进行例行巡检,并做好巡检记录。 a) 网络安全设备应接入设备口检测设备连通性,查看设备日志、系统运行时间、软件版本、系统 服务启动、配置保存命令、HA 启用、系统时间等是否正常。 b) 其他安全设备应登录管理界面查看 CPU 负载、连接数、系统运行时间、WEB UI 管理超时设置、 系统服务启动、配置保存命令、HA 启用、系统时间、业务访问状况等是否正常,查看病毒库、 特征库等软件版本是否及时更新。 5.2.3 优化 应定期检查信用平台的网络通信情况,分析网络通信数据,并根据信用平台网络访问情况对网络配 置参数、网络设备等进行优化。 5.2.4 变更 更换网络和安全设备时,应提前归档旧设备配置文件,并将连接在该设备上的网线打上标签,记录 好对应的接口。变更后应立即对配置备份。 新设备上架后,应将旧设备导出的配置文件恢复到新设备上并测试相关业务网络连通性。 5.2.5 故障处理 遇有故障发生时,应立即查看故障日志,排查故障原因,及时通知供应商和相关业务方,做好策略 备份。待备件更换或固件升级后,应现场测试设备与应用系统的连通性,并做好故障处理记录。 5 DB32/T 4144-2021 5.3 云平台运维 5.3.1 安装部署 云平台安装部署应配置高可用性功能,如冗余、多副本等。应根据信用平台业务和数据需要提前做 好规划,分配云计算资源和云存储资源,以支撑平台稳定高效运行。 5.3.2 日常巡检 应对云平台进行日常巡检,查看有无告警日志,按序检查云平台计算节点服务器状态、计算和存储 资源使用率、云主机状态、业务网卡和管理段网卡状态,并做好巡检记录。 应定期备份与查看云平台上的关键云主机,定期测试并保证云主机迁移功能正常。 5.3.3 优化 应定期对云平台各种资源占用情况等进行分析,并按照实际使用情况优化相关设置,实现负载均衡, 以确保云主机稳定性。 5.3.4 变更 在集群增加物理节点后应将其他物理节点的部分云主机迁移至新增节点,以确保各物理节点负载均 衡。 在集群减少物理节点前应将其承载的云主机迁移至其他物理节点,做好数据备份,并在确认业务正 常、数据完整后变更。 5.3.5 故障处理 遇有故障发生时,应立即查看故障日志并排查故障原因。必要时及时切换至备份平台以保证业务系 统正常运行,并做好故障处理记录。 5.4 基础软件运维 5.4.1 操作系统及中间件运维 5.4.1.1 安装部署 应依据操作规程和信用平台软件及系统要求,安装操作系统、中间件补丁并配置和调试。 5.4.1.2 日常巡检 6 DB32/T 4144-2021 日常巡检应重点关注操作系统、应用中间件运行是否正常,同时应做好巡检记录。巡检内容包括但 不限于:CPU占用率、内存占用、内存换页、I/O吞吐量、主要文件系统占用量、操作系统安全补丁安装 情况、操作系统日志文件、中间件运行日志文件等。 5.4.1.3 优化 应及时清理操作系统中的临时文件,并根据操作系统中信用平台软件运行状况及时调优配置参数, 定期更新操作系统和中间件补丁。 5.4.1.4 变更 变更前应备份操作系统和信用平台涉及的中间件,并通知相关人员;如遇变更失败,应及时恢复至 变更前软件环境。 5.4.1.5 故障处理 遇有故障发生时, 应立即查看操作系统和中间件故障日志,排查故障原因,并及时通知相关业务方, 立刻开展故障修复,做好故障处理记录。 5.4.2 数据库运维 5.4.2.1 安装部署 应按照数据库操作手册进行安装,并根据应用软件需求和存储资源合理部署。 5.4.2.2 日常巡检 每日应对数据库运行状况进行巡检,监视数据库系统运行情况,并做好巡检记录,定期形成巡检报 告,检查点包括但不限于: a) 数据库运行状态:查看当前用户及进程信息、数据库中断或异常、错误或警告等情况; b) 数据库性能:查看目标占用空间、CPU、I/O、内存利用情况,判断是否存在性能隐患。 5.4.2.3 优化 应依据数据库运行状况优化性能,并及时备份相关参数。数据库调优包括但不限于: a) 根据数据增长情况调整数据库存储空间容量; b) 配置数据库负载均衡; c) 数据库磁盘碎片整理。 5.4.2.4 变更 7 DB32/T 4144-2021 数据库变更前应做好数据库备份工作,并根据数据库系统版本、结构等制定变更方案。变更过程中 如遇异常情况,应记录分析异常日志,并立即恢复原有数据库。 数据库变更后应对数据的正确性、完整性进行比对验证。 5.4.2.5 故障处理 遇有故障发生时,应立即查看数据库访问日志,分析原因,排除故障。 遇主机系统发生故障导致数据库系统瘫痪时,应排除主机故障。必要时,恢复相同版本的数据库系 统和最近备份点的数据,并验证确认。 6 应用软件运维 6.1 安装部署 应用软件上线前应通过功能测试、性能测试和安全测试。系统介质及相关文档应提交运行单位并按 照软件部署手册进行安装、升级、配置和测试。 6.2 日常巡检 6.2.1 应制定软件例行排查点并确定系统所需资源阈值或临界点。根据软件排查点,对应用软件进行 检查,并做好巡检记录,检查点包括但不限于: a) 程序运行所需的各项服务是否启动成功; b) 系统各模块性能是否超过预警线; c) 系统各项任务计划是否执行成功; d) 数据库服务是否正常; e) 数据文件增长及硬件资源是否超过资源阈值; f) 用户操作日志、数据库日志是否异常; g) 用户权限控制是否合规; h) 是否遭遇异常攻击。 6.2.2 应对日常巡检情况进行例行报告并按周、月、年提交巡检报告。应及时追查巡检过程中发现的 问题并且排除隐患。 6.3 优化 8 DB32/T 4144-2021 应定期对软件运行故障、运行效率、占用计算资源等内容进行分析,并按照实际使用情况对相关设 置进行优化。 6.4 变更 6.4.1 运行单位应明确软件变更需求,形成需求方案,提出变更申请,明确开发和上线周期。 6.4.2 功能需求发生变更时,应分析所影响的数据结构和业务模块,评估该变更对软件系统影响,设 计对应的修改方案,完善软件系统并进行回归测试,以确保系统正常运行。 6.4.3 软件变更应做好版本管理,应从运行单位借出相关应用软件源代码,并在此基础上进行变更。 同时,记录软件名称、版本、用途、相关参数、上线日期、变更记录、开发商等信息,待变更完成后提 交最新源代码及软件安装介质。 6.4.4 应用软件变更实施前应做好备份,升级过程中如发生故障,应及时回退到原有版本。 6.5 故障处理 6.5.1 应对信用平台实行分级运维管理,主要包括普通用户和管理用户: a) 普通用户:负责信用平台运行环境的维护、故障上报等; b) 管理用户:负责信用平台的运行维护,汇总处理各用户上报故障等;管理用户可根据软件使用 范围分为县、市、省不同层级。 6.5.2 应建立故障报告机制:普通用户遇到故障应及时上报管理用户,管理用户依职责处理和上报。 6.5.3 应制定故障处理流程,遇故障发生时应按照以下流程进行处理: a) 普通用户应先检查信用平台本地运行环境,检查点包括但不限于:网络环境异常、硬件设备异 常、基础软件异常、病毒攻击等; b) 普通用户检查运行环境无异常后报管理用户;管理用户检查软件是否存在故障,检查点包括但 不限于:权限分配,数据异常、接口访问异常等; c) 管理用户确认故障无法修复后,应上报运行单位;运行单位在收到故障处理请求后应立即排查 问题,检查点包括但不限于:业务平台异常、数据库异常、平台运行软硬件环境异常等。 6.5.4 运行单位应根据故障的严重程度进行等级分类,制定故障申报单,针对故障影响制定应急恢 复流程。故障等级主要包括: a) 一级故障:业务系统瘫痪或造成业务系统中断; 9 DB32/T 4144-2021 b) 二级故障:系统部分核心功能故障或无法满足核心业务运转,但未造成全部业务中断; c) 三级故障:系统非核心功能故障,系统仍可支撑主体业务正常运转; d) 四级故障:辅助性功能失效,系统无法通过用户交互页面正常使用,需通过技术支持在后台手 动完成。 6.5.5 遇有故障发生时,技术支持人员应根据故障现象判断问题影响,检查软件运行日志,定位故障 点,定义出故障级别,并按照故障级别处置方法采取相应措施: a) 一级故障处置:启动应急预案,立即启用备份平台保证系统运行,开始故障修复,直接上报运 行单位; b) 二级故障处置:记录故障影响业务范围和故障数据,立刻开始故障修复,直接上报运行单位; c) 三级故障处置:定位故障点,形成故障申报单,明确故障修复计划,逐级上报平台问题; d) 四级故障处置:联系技术支持人员提供技术支持,定期汇总逐级上报平台问题。 7 安全管理 7.1 基本要求 应按照 GB/T 22239 确定的安全等级保护三级相关要求开展网络安全等级保护和测评。 7.2 基础设施安全 依据《关键信息基础设施安全保护条例》的规定,运维小组必须加强基础设施安全管理,包括但不 限于网络安全、操作系统安全、数据库安全。 a) 网络安全:通过访问控制技术、防病毒系统、漏洞扫描系统、安全审计系统等进行网络安全管 理,定期对信用平台运行所在网络进行安全检测、流量控制、策略配置,定期提交网络安全审 计报告,对报告中存在的隐患及时排除。 b) 操作系统安全:通过关闭不需要的服务或端口,定期升级版本、安装补丁、修复漏洞、查杀病 毒、系统备份等措施保障操作系统安全,具体内容可参考GB/T 20272。 c) 数据库安全:通过设置数据库最小粒度访问权限,设置数据库访问审计功能,定期备份数据等 措施保证数据库安全,具体内容可参考GB/T 20273。 7.3 应用软件安全 10 DB32/T 4144-2021 运维小组应加强应用软件安全管理,通过安全程序编程、设置复杂口令、双机热备、防篡改、防爬 取、设置白名单、漏洞扫描、安全测试等措施保障应用软件安全。 7.4 用户及权限控制 7.4.1 应根据不同权限管理要求,依用户所属部门、工作职责等赋予相应功能模块、数据查询范围和 数据操作权限。 7.4.2 用户应设定满足复杂度要求的强口令密码,并定期对账号密码进行修改。 7.4.3 应定期精简系统用户,及时停用临时性或无需保留的用户。 7.5 数据安全 7.5.1 应对数据采取数据备份、数据同步、双活等可靠性策略。数据备份可按照每日增量、每周全量 备份策略进行备份,备份文件至少保留 14 天。在具备条件的情况下,可建立数据异地灾备。 7.5.2 应定期查看并妥善保管数据备份文件,定期对已备份的数据进行验证。应在测试环境中恢复备 份数据,与生产数据进行比较,以确保备份数据的完整性和可用性。 7.5.3 应制定数据恢复演练方案,并定期进行数据恢复测试演练。 7.5.4 应对信用平台加强反爬虫策略,包括但不限于:爬虫访问的自动识别、爬虫访问的自动屏蔽等。 7.6 日志审计 7.6.1 运行单位应制定安全审计制度,安全审计人员应定期对日志进行集中审查。 7.6.2 日志记录包括但不限于:平台运行日志、管理员操作日志、数据库读写日志等。 8 应急响应 8.1 运行单位应针对信用平台基础设施、软件系统和网络安全建立应急响应机制,并根据系统故障等 级编制应急预案。 8.2 应建立应急演练测试环境,由运行单位牵头每半年至少开展一次应急演练,熟悉操作规程,完善 应急预案。 8.3 应急响应具体内容和措施可参考 GB/T 28827.3。 11 DB32/T 4144-2021 参 考 文 献 [1] GB 17859 计算机信息系统 安全保护等级划分准则 [2] GB/T 20269 信息安全技术 信息系统安全管理要求 [3] GB/T 20273 信息安全技术 数据库管理系统安全技术要求 [4] GB/T 25058 信息安全技术 网络安全等级保护实施指南 [5] GB/T 25070 信息安全技术 网络安全等级保护安全设计技术要求 [6] GB/T 28448 信息安全技术 网络安全等级保护测评要求 [7] GB/T 28449 信息安全技术 网络安全等级保护测评过程指南 [8] GB/T 28827.1 信息技术服务 运行维护 第 1 部分:通用要求 [9] GB/T 28827.2 信息技术服务 运行维护 第 2 部分:交付规范 [10]GB/T 28827.3 信息技术服务 运行维护 第 3 部分:应急响应规范 [11]GB/T 28827.4 信息技术服务 运行维护 第 4 部分:数据中心服务要求 [12]GB/T 28827.6 信息技术服务 运行维护 第 6 部分:应用系统服务要求 [13]GB/T 9813.3 计算机通用规范 第 3 部分:服务器 [14]GB/T 34990 信息安全技术 信息系统安全管理平台技术要求和测试评价方法 [15]GB/T 36627 信息安全技术 网络安全等级保护测试评估技术指南 [16]GB/T 36958 信息安全技术 网络安全等级保护安全管理中心技术要求 [17]GB/T 36959 信息安全技术 网络安全等级保护测评机构能力要求和评估规范 [18]GB/T 37094 信息安全技术 办公信息系统安全管理要求 [19]GB/T 37095 信息安全技术 办公信息系统安全基本技术要求 [20]GB/T 37096 信息安全技术 办公信息系统安全测试规范 [21]GB/T 39477 信息安全技术 政务信息共享 数据安全技术要求 [22]中华人民共和国个人信息保护法(2021 年 8 月 20 日第十三届全国人民代表大会常务委员会第三十 次会议通过) [23]《关键信息基础设施安全保护条例》(中华人民共和国国务院令第745号,2021年4月27日国务院第 133次常务会议通过,自2021年9月1日起施行) 12