医疗行业信息化不断演变发展,数据成为驱动创新医疗应用场景不断落地的核心要素,但随着数据价值不断提升,数据流动应用场景日益丰富,导致数据资产不清晰,给数据安全管控和防护工作带来困难。有效实现数据的开放利用和数据安全之间的平衡,切实提高数据安全保护的效率和效果,数据分类分级成为数据安全建设过程中至关重要的基础工作内容。

西安国际医学中心医院是西安国际医学投资股份有限公司旗下集医疗、科研、教学、健康管理、康复保健为一体,按照JCI国际认证建设的国内最大单体综合性医院,截至 2023 年 9 月 25 日,医院 4 年累计服务门急诊患者 235 万人次。

近年来,随着信息化建设的不断推进以及业务的高速发展,医院业务系统和数据中心汇聚了大量且种类丰富的健康医疗数据,涉及交易数据、运营数据、医患数据和大量个人信息等。

哪些数据需要重点保护、需要如何保护、哪些数据可以开放共享、如何开放共享等问题,在数据安全新形势下,西安国际医学中心医院着手以数据为中心推进安全防护工作的建设,并开展数据分类分级工作,通过深度的剖析内部重要敏感数据情况,制定有效的防护措施。

一、现状分析

目前,西安国际医学中心医院内部数据,包括HIS、LIS、EMR、PACS、RIS、HRP、ERP、CDR、RDR、移动护理等结构化数据,同时也包括电子病案、图片和医疗影像等非结构化数据,以及心电、脑电等半结构化数据。

其中,核心HIS业务系统涵盖的数据范围广、数据量大,包括门诊管理、住院管理、药房管理、药库管理、院长查询、电子处方、物资管理等各类生产数据和高价值敏感信息,在内部完全不清楚核心数据、重要数据有多少数据量,具体存在于数据库的哪张表中,情况下极易造成重要数据与核心数据误用、滥用与泄露。

因此,按照“边试点边总结、小步快跑”的思路,本次项目范围以HIS系统这一典型系统开展,实现核心系统数据分级保护,同时探索形成可落地、可复制的分类分级实施路径和模式,为后续开展全院数据分类分级供参考思路和实践经验。

二、数据分类分级建设目标

数据分类分级工作的前提是明确数据分类分级工作的整体目标。为避免数据资产梳理落地过程中出现的无标准落地难、数据复杂难梳理、数据安全管理粗放、长效性难保证等问题,在项目开始之前,医院对数据分类分级整体目标制定,具体如下:

• 构建符合现状的数据安全分类分级标准体系

依据国家法律、医疗行业规范、数据安全规定与医院及专业领域等各层面的业务标准和技术标准,如《数据安全法》、《网络安全法》、《个人信息保护法》、《信息安全技术健康医疗数据安全指南》、《国家卫生健康委规划司关于征求卫生健康行业数据分类分级指南(征求意见稿)意见的函》《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》、《“数据要素×”三年行动计划(2024—2026年)》,结合医院各部门实际数据使用情况进行数据分类分级标准制定、审核、执行、反馈和争议协调等各项工作。

• 建立符合医院现状的数据安全分类分级标准管理机制

数据安全分类分级标准管理的工作目标是面向各业务域建立一套完整的通用数据安全分类分级标准及配套的数据安全分类分级标准管理机制,促进业务域内、业务域之间对数据的分类、分级、定义和理解一致,促进系统之间的有效的数据交换和共享。

• 确立行之有效的数据安全分类分级建设方法

根据确定好的数据安全分类分级标准体系,通过技术手段对现有数据进行智能识别和自动分类分级处理,确立一套标准可落地、过程可执行、效果可评估的行之有效的数据安全分类分级方法体系,保障数据安全分类分级工作稳步进行。

三、数据分类分级具体实施路径

根据数据分类分级整体目标,整个项目实施过程从规划到落地,包括需求调研、数据资源梳理、数据分类分级策略制定、实施落地四个阶段。

第一阶段:需求调研阶段

针对HIS系统数据相关战略规划、数据建设情况、业务需求、信息安全环境进行深入调研,分析HIS系统数据管理现状,以得出数据资产状况,指导数据安全分类分级工作。调研内容主要包括:

(1)数据资产调研:调研HIS系统数据建设情况,包括:数据类型、数据产生部门、数据分布、数据量、数据流转情况、数据共享情况等,整体摸排医院数据资产状态。

(2)业务流程调研:通过访谈、工作组形式与业务部门一同整理流程,识别流程中产生何种数、数据存储方式、存储位置、生命周期,编制成业务流程图和对应的数据流程图。

第二阶段:梳理数据资源

梳理和识别HIS系统数据表、数据项、数据文件等数据内容,整理和识别已收集的数据资源,对数据进行合并统一,形成数据资源列表,为后续数据分类分级工作做好准备。具体包括:

• 数据基础信息调研:资源提供方、所属目录资源分类、信息资源摘要、所属系统名称、信息资源格式、数据保存位置、数据量大小、主题分类、重点领域分类、更新周期、共享方式、英文表名、数据类型、中文名称、字段描述等20余项信息。

• 数据安全等级:目前的数据级别、级别标识、影响范围、影响程度以及判断标准等。

• 信息资源格式:电子文件、电子表格、数据库、图形图像、流媒体、其他等。

在这一过程中,西安国际医学中心医院以标准化的工具和规范完成数据资产的梳理和输出。例如在数据梳理过程中,除了采取实地访谈之外,还通过资产发现工具连接到业务系统,自动化识别数据资产现状,输出数据资产清单。

西安国际医学中心医院数据安全分类分级探索实践01(1).jpg

示例:资产发现清单

第三阶段:数据分类分级策略制定

在数据分类分级策略制定上,主要参考《数据安全法》、《个人信息保护法》、《医疗卫生机构网络安全管理办法》、《国家卫生健康委规划司卫生健康行业数据分类分级指南(征求意见稿)》、《GB/T 39725-2020 信息安全技术 健康医疗数据安全指南》及其他行业地方标准等,并充分结合自身安全诉求,最终形成数据分类分级大纲。

西安国际医学中心医院数据安全分类分级探索实践02(1).jpg

示例:分类分级大纲

1、数据分类策略

数据分类是基于已经梳理和识别完成的数据资源和业务条线梳理成果,然后按照数据性质(特定的数据性质有所区别)、重要程度(与其他数据相比重要程度有区别)、管理需求(因特行的管理目的)或使用需求(与其他数据之间使用范围/目的不同)等进行数据分类,进而得到数据一级分类,形成数据表、数据项、数据文件等不同的组合。一级子类划分完成后,按照组织实际需求进行下一步细分。

西安国际医学中心医院数据安全分类分级探索实践03(1).jpg

2、数据分级策略

数据分级影响因素较多,包括数据影响对象、影响范围、影响程度等,并且需结合数据体量、数据聚合、数据实效性等进行综合分析,完成数据定级。目前西安国际医学中心医院数据分级方法基于数据的敏感性、风险防控、等级保护等,结合自身业务情况,参考已有行业和数据安全分类分级指南的分级方法,量体裁衣。

数据分级方法参考:

• 基于风险防控的数据分级

A级:一般数据

B级:重要数据

C级:核心数据

• 基于数据敏感性的数据分级

极敏感级、敏感级、较敏感级、低敏感级

第四阶段:数据分类分级实施落地

为提升数据分类分级效率和准确率,本次项目以智能化数据安全分类分级平台辅助落地实施,平台入自然语言处理、统计模型、特征分析、机器学习等技术,可自动并快速识别发现数据,根据分类分级策略智能化处理分类分级标签,可视化呈现数据分类分级结果。

西安国际医学中心医院数据安全分类分级探索实践04(1).jpg

通过将医疗分类分级策略内置到工具中,在完成字段业务类型的识别后,平台自动实现对数据的分类和分级,且全程可视化,可以展示每个字段归属的分类、所属的安全等级,并以报告形式展示分类分级建设成果,包括敏感数据分布情况、数据分类情况、数据分级情况等。实施人员通过可视化界面,一键连接数据库,平台自动化完成分类分级的识别和打标工作,后续可以在产品层面看到数据字段和分类标签,并辅以人工复核打标结果。

西安国际医学中心医院数据安全分类分级探索实践05(1).jpg

西安国际医学中心医院数据安全分类分级探索实践06(1).jpg

示例:分类分级报告

四、项目成果

本次数据分类分级共涉及HIS系统数据库934张表,19790个字段,其中有分类层级:一级分类3个,二级分类10个,三级分类8个,四级分类19个,其中数据定级:1级字段共13个,2级字段共14146个,3级字段共5417个,4级字段共170个,为数据安全有序管理和防护提供针对性的决策依据。

在分类分级过程中,西安国际医学中心医院采用智能化工具+人工的方式,实现快速根据本院实际的数据安全分级诉求完成数据打标工作,输出数据分类分级报告,显著提高分类分级工作的效率与准确性,鉴于数据的流动属性和持续变化的特点,智能化工具的应用通过动态量级监测、DDL变更能力,实现对资产的动态、持续化感知,为数据分类分级工作动态化、持续性开展打下技术基础。此外,医院在工作开展中,沉淀行业知识、标准,形成完整的分类分级建设方法,形成数据分类分级标准指引,也为后续全院数据分类分级工作的开展提供参考思路和实践经验。

来源:数世咨询