2021年3月,十三届全国人大四次会议通过了《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》,其中明确了我国在未来五年智慧医疗方面的发展方向:“完善电子健康档案和病例、电子处方等数据库,加快医疗卫生机构数据共享。推广远程医疗,推进医学影像辅助判读、临床辅助诊断等应用。运用大数据提升医疗机构和医疗行为的监管能力。”短短三句话,数据一词出现了三遍,足以可见国家对医疗健康数据资源本身的重视,以及通过医疗健康数据激活整个智慧医疗的期望。
2021年9月1日,《中华人民共和国数据安全法》正式实施。作为数据安全领域的基础性法律和国家安全法律制度体系的重要组成,数据安全重要性得到了前所未有的重视。医疗卫生行业数据具有极高的敏感性与分析价值,也是国家重点关注的数据安全领域之一。
2021年11月1日,《中华人民共和国个人信息保护法》即将实施。同样,在各医疗机构中存储、处理的数据,除去机构本身的运营数据,很大一部分都是《个人信息保护法》定义的“个人信息”甚至“敏感个人信息”,如何保障公民个人信息安全,杜绝群众深恶痛绝的“母婴用品推销电话”等问题,成为行业的普遍思考的问题。
保障医疗健康数据的安全,就是保护智慧医疗的建设成果。本文试图通过观察医疗行业数据安全的现状,分析面临的挑战与威胁,并讨论解决思路与路径。
01
数据是撬动智慧医疗的支点
根据数据属性的不同,医疗健康数据主要包括个人属性数据、健康状况数据、医疗应用数据、医疗支付数据、卫生资源数据以及公共卫生数据等。智慧医疗的“智慧性”,则体现在不同的场景中,最大化地组合利用不同类型的数据,计算出群众、患者、医疗卫生机构、监管机构所需要的结果。例如,疾控中心能够利用个人属性数据、健康状况数据以及公共卫生数据构建重大卫生事件的监测预警与风险管控机制;医院能够利用病患完整的历史健康状况数据提升临床诊断质量,保障病患获取医疗服务的连续性与一致性;医保局等监管机构通过对健康状况数据与医疗支付数据统计分析,辅助完成审核监督、定点医疗机构布点、医保政策制定或更新等决策。
而这一切的前提是,数据需要流动起来。一直以来,医院是医疗健康数据的生产者与使用者。由于医院运营模式具有封闭性,数据自产自足,造成了数据烟囱林立的现状。可喜的是,以“互联网+医疗”为代表智慧医疗信息化正在各个层面打破行业内的数据烟囱,从医院信息的互联互通,到区域全民健康信息互联互通,再到医疗健康数据与居民其他数据在政府侧的融合,医疗数据价值在迅速提升。
然而,需要警惕的是,烟囱被打破了,很多情况下意味着之前保护数据的墙也被推到了。暴露面的迅速增大,使医疗健康数据的安全问题成为威胁智慧医疗推进的巨大风险。
02
医疗数据安全保护迫在眉睫
医疗健康数据具有真实性强、敏感度高、覆盖面广、规模庞大、结构形态多样、逻辑复杂等特点。正是由于这些特点,医疗数据成为恶意攻击者眼中的“发财密码”。此外,医院等医疗机构长期与外部网络隔离的信息化发展模式也造成了其信息安全防护水平参差不齐的现状。
医疗健康数据的泄露、破坏事件无论对医疗机构、患者、社会都会造成较为严重的经济损失和不良影响。例如,COVID-19或HIV病毒携带者病历数据被泄露,会造成病患就业困难等问题,甚至会被掌握数据者勒索;医疗机构会因为发生数据泄露事件造成自身声誉下降;而区域甚至国家级定向医学研究数据泄露甚至会成为政治事件。
根据对行业数据安全现状的观察,我们认为医疗健康数据安全风险存在于以下几个方面:
l 数据治理的复杂性过高导致数据很难得到分类分级保护
根据普遍经验,数据保护的基础在于数据治理。通过妥善的分级分类,不同属性、敏感度、来源的数据具有不同的类别与级别,之后即可对相应类别与级别实施相应的安全策略。然而,医疗健康数据由于其采集录入的手段千差万别,导致原始数据缺失不准确、格式不统一、结构不统一、元数据/主数据不统一等问题,造成数据治理很难开展,分级分类更是无从谈起。强安全策略会阻碍数据流通,弱安全策略又会导致核心数据无法得到相应的保护的问题尤为突出。
l 数据访问、交换过程是安全防护的薄弱环节
在数据产生后的整个生命周期,访问与传输过程是数据泄露事件最为频发的阶段。例如高权限人员泄露和窃取数据难以防范,原因在于业务处理过程中必然涉及到数据的使用、处理,一旦高权限人员滥用权限,医院或其他数据管理机构往往缺乏足够的手段去发现和追查。这里的高权限人员不仅仅指内部工作人员,也包括第三方运维人员等。
此外,医院在向其他合作医院、区域健康信息平台、科研院所共享数据时,由于安全防护策略仅仅在本地生效,数据共享的任何一方无法把握整个数据交换过程的安全性。例如,医院无法掌握数据共享通道是否安全、数据共享出去后是否被正常使用、甚至很难确定数据传输对象是否被冒名顶替。而数据接收方则无法确定接收的数据是否包含了恶意代码等安全风险。
l 传统数据保护手段面临大数据化后的挑战
智慧医疗的基础在于信息化的高速发展。云计算与大数据技术正在成为智慧医疗的基础设施。传统基于数据库审计与数据库访问控制技术的数据安全防护能力正面临前所未有的挑战。例如数据访问控制粒度的主体很难与用户关联起来,客体没有达到数据库表级或者文件级,则访问控制粒度过粗,存在未授权访问的风险。大量数据库直接暴露在互联网,并且存在弱口令或未授权访问漏洞。无法建立数据访问安全基线,描绘主体和客体间的数据访问关系,无法及时发现和预警黑客攻击、数据泄露等等。
03
解决思路与路径
l 在行业层面,构建科学清晰的数据标准与治理体系框架
医疗健康数据必须遵循统一的标准进行管理,才能保证医院各个部门、医院之间、医院与外部数据平台不同系统间数据的规范性、流通性及共享性,包括数据的分级分类、数据结构、数据模型、质量评估标准等。这需要行业内的主管单位、医疗卫生机构、企业、学会等各方的参与。《GB/T 39725-2020 信息安全技术 健康医疗数据安全指南》这类国家标准的逐步出台为医疗数据安全标准体系化开了一个好头,但距离安全地支撑智慧医疗还有很长一段路要走。
l 在医院及其他数据运营者层面,建设全生命周期的数据安全防护能力,重点关注数据访问、交换过程中的风险监测与管控。
数据保护是持续的,贯穿整个数据生命周期的。因此在医院及其他数据运营者的组织内建设全生命周期的数据安全防护能力是必要的。主要路径包括:
数据发现:部署数据发现类产品,利用网络嗅探技术,自动寻找发现网络环境中存在的海量数据和锁定保护对象,全方位扫描数据库和大数据平台,自动化完成数据测绘。
数据梳理:部署数据管理平台,在数据资产中精准区分敏感数据与非敏感数据,通过AI机器学习算法规则和行业法规标准,自动对其存储的数据进行分类、分级,并根据结果做进一步的安全防护,如细粒度访问控制、加密保存等。
数据保护:全维度防止系统层面、数据层面的攻击导致数据泄漏、或者疏忽导致数据泄漏,沉淀为各类数据安全能力,并将能力池化,为各行业用户打造一个具备快速迭代,更好地输出的安全能力域,并根据业务体系,持续应用到不同的场景之中。
监测预警:以数据自身的脆弱性指标以及暴露面为安全治理的核心,遵从行业的数据安全分级指南为安全策略,自上而下,充分结合数据的流动性,实时对数据安全风险做到监测、预警、防控。
安全运营:通过将数据安全产品全域联动实现一体化一站式管控,即统一账户、统一监控、统一展示、统一分析、统一告警、统一配置,变被动防护为主动防护,变单点防护为整体防护,实现有效的安全运营机制。
智慧医疗的“智慧程度”取决于医疗健康数据的数量与质量。保护好医疗健康数据,等同于保护好智慧医疗的基石与支柱。面对复杂的网络安全形势,医疗健康数据保护是一个持续的、庞大的、系统性的工作,无法一蹴而就。在行业顶层设计框架下,各参与方从零到一、从一到百的进行数据安全的建设与运营,才是智慧医疗生根发芽、开花结果的根基所在。