中华急诊医学杂志  2022, Vol. 31 Issue (1): 129-132   DOI: 10.3760/cma.j.issn.1671-0282.2022.01.028
重症医学专科大数据平台的建设及应用
许杰1 , 周瑜2 , 夏星球3 , 任贺3 , 王倩雯2 , 黄曼2     
1. 浙江大学医学院附属第二医院 IT 中心,杭州 310009;
2. 浙江大学医学院附属第二医院综合 ICU,杭州 310052;
3. 北京和兴创联健康科技有限公司, 北京 100176
摘要: 目的 基于医院各业务系统,建立重症医学专科大数据平台,支持人工智能和大数据应用,为临床科研提供数据基础和支持。方法 整合医院信息系统、电子病历系统、监护信息系统、检验信息系统、放射信息系统、手术麻醉临床信息系统等业务系统的数据,并对数据进行清洗,形成重症医学专科大数据平台。同时,基于重症医学专科大数据平台建立APACHE Ⅱ及SOFA自动评分系统。结果 重症医学专科大数据平台已纳入重症医学科近10年的历史数据,并持续补充新增数据,已上线试运行自动化评分系统、智能辅助诊断预测模型等人工智能和大数据应用,系统整体运行良好。结论 重症医学专科大数据平台能够高效利用临床上数据,并更好地服务于临床诊疗与临床科研,助力重症医学学科建设与发展。
关键词: 重症医学    大数据平台    大数据应用    自动评分系统    

随着计算机技术和数据应用的发展,大数据已成为新时代各大行业发展的热点,并已逐步上升成为国家战略[1-2]。在医疗领域,信息技术的应用也得到极高关注。2018年4月国家卫健委制定《全国医院信息化建设标准与规范(试行)》 [3],明确下一阶段医院信息化的建设内容和建设要求。其中,人工智能、大数据、物联网和云计算作为新兴技术,出现在三甲医院信息化建设的最顶层位置。

医疗大数据包括患者的基本信息、病程记录、检查检验、手术操作、费用信息和医嘱执行等多个方面。分析医疗大数据可为辅助诊疗和精准医疗提供有力的支持[4],优化患者的治疗路径[5],同时大数据的应用也有利于开展临床科研和医院管理[6-7]。重症患者在诊疗过程中需要密切监护,每日产生数量巨大、种类繁多的数据,亟需大数据分析提高数据利用度与工作效率,进而从多方面、多维度辅助重症医学的临床决策,让医院管理者、临床医生、科研人员、患者等多方受益。

基于此背景,浙江大学医学院附属第二医院综合ICU建立了重症医学专科大数据平台(以下简称“重症大数据平台”),并在此基础上建立重症自动化临床评估系统。本文通过阐述重症大数据平台及临床评估系统的建立方法,为大数据技术在临床的应用提供借鉴。

1 资料与方法 1.1 系统介绍

重症大数据平台系参考重症医学监护信息数据库(MIMIC-Ⅲ)进行设计构建而成(由北京和兴创联健康科技有限公司提供技术支持)。该大数据平台是具有重症医学学科特色的智能化大数据平台,可以从各个业务系统中收集并整合与重症医学科相关的医疗数据,并将所有数据标准化。同时,重症大数据平台能够作为人工智能应用及临床辅助决策的基础,为检索与统计、质量控制及临床科研提供有力地支持。该平台由专业人员定期进行维护与管理。

1.2 纳入人群

系统纳入2014年9月综合ICU建立以后所有入住患者的医疗数据,其相关临床资料均纳入到大数据平台中,包括历史数据和新增数据。

1.3 数据来源

数据主要包括重症患者在院期间的全过程资料,主要来源包括医院信息系统、电子病历系统、监护信息系统、检验信息系统、放射信息系统、手术麻醉临床信息系统等。

医疗业务信息系统收集患者在院的诊疗数据存储至对应的存储系统中,该库对于符合重症患者条件且已迁移至历史数据存储服务器上的早期患者数据一次性导入大数据平台的数据库中。对于医疗业务系统中不断产生的新数据,主要分为实时、T+1增量两种模式。实时采集模式主要用于临床评估系统,及时完成自动化的重症临床评估,为临床医生的决策提供辅助支持和参考依据。该部分数据的采集仅针对在院患者的部分数据,实时调用对系统影响几乎可以忽略不计。T+1增量采集模式根据医院实际系统运行情况,设定数据采集时间,避开医院系统工作高峰时间,使其对医院系统运行的影响降到最低。

1.4 数据内容

数据内容包括各类信息系统中的相关信息,主要包含患者入院信息、诊断、实验室检查、生命体征、手术基本信息、治疗信息(包括药物治疗、操作等)、住院时间、病程信息、护理记录等。数据的完善及详尽使其能够为医疗数据分析、大数据和人工智能应用、医院管理等功能提供支持。

1.5 数据库架构

重症医学大数据平台中的数据库为关系型数据库,不同的数据表存储不同内容的数据,每张表均由主键相互连接,每位患者的数据均有患者编号、就诊编号等的可识别标识符。在数据表中,每一列包含的数据类型是一致的,每一行记录该类型数据的具体内容。

1.6 数据处理

平台引入人工智能算法在数据处理流过程中,将异常与缺失数据通过异常检测算法及时发现,根据业务逻辑进行填补和矫正。基于人工智能的预测模型对数据错误比较敏感,而重症大数据平台包含多种数据源,每种数据源都可能出现数据不一致与脏数据的问题,本系统提供了一套基于机器学习的异常发现和处理流程(见图 1)。对于单一业务字段,先根据规则引擎,发现异常数据样式并予以修正; 接着根据数据值的统计信息,对异常值进行捕获和提示。对于多业务字段,使用基于高斯过程和决策树的模型,将部分难以排除的数据质量问题(如身高和体重填反)进行处理。序贯器官衰竭评估(SOFA)的自动化评分系统采用计算时刻前24 h内最近一次SOFA评分和最差SOFA评分两种机制,提供计算每日最差的SOFA评分以及增量式计算24 h在院ICU最近一次的SOFA评分。急性生理学和慢性健康评估(APACHE Ⅱ)自动化评分系统提供计算每日最差的APACHE Ⅱ评分以及增量式计算24 h内最近一次的APACHE Ⅱ评分。

图 1 数据处理流程图
2 结果 2.1 总体情况

重症大数据平台的数据库纳入自2014年9月所有入住综合ICU患者的医疗数据,并每日更新临床数据。重症大数据平台的数据库中相关数据采集过程及数据表结构如图 2所示。

图 2 重症大数据平台的数据采集流程
2.2 SOFA自动化评分系统

SOFA评分系统临床效果展示如图 3图 4所示,包含评分时各项指标的具体评分以及每日SOFA评分的变化曲线。同时,SOFA自动化评分系统还通过雷达图可视化地表现各个脏器在入院时及当下的评分情况,可直观了解患者病情变化的情况。

图 3 SOFA评分界面展示效果

图 4 SOFA评分柱状图及趋势图界面展示效果
2.3 APACHE Ⅱ自动化评分系统

APACHE Ⅱ评分系统临床效果展示如图 5所示,包含当下患者APACHE Ⅱ的急性生理评分、年龄评分、慢性健康评分及总分,同时可展示APACHE Ⅱ评分变化曲线。

图 5 APACHE Ⅱ评分展示效果图
3 讨论

本文基于信息系统初步建立重症大数据平台,介绍了重症大数据平台构建方法,并详细介绍了重症大数据平台的现状及应用情况。高质量的重症医学数据库可服务于数据分析、建模、解释、验证等,为临床诊疗及科研提供数据支持,并从中发现新的重症医学知识[8]。本研究中,重症大数据平台的建立整合了医院现有的各类信息系统中的资料,获得全面的医疗数据,有效服务于人工智能和大数据应用,从而能够提升临床医生决策能力和医疗质量[9],同时也为临床科研提供有力支持[10]

目前,国外已建立多个多中心的重症医学数据库,其中部分为公开数据库,如MIMIC-Ⅲ、远程医疗ICU(eICU)协作数据库、阿姆斯特丹大学医学中心数据库(AmsterdamUMCdb)等[11-14],但这些数据库尚未形成用于临床应用的大数据平台。国内所建立的医疗数据库多偏向于科研支持及信息化建设[15],具备临床人工智能和大数据应用基础的重症大数据平台建设还没有成熟的模式可供参考。现阶段的计算机技术中,机器学习技术现已广泛用于医学研究领域[16]。本研究中的数据库参考MIMIC-Ⅲ数据库建设而成,可为机器学习技术的临床应用提供基础。在计算机模型建立方面,建设一个拟MIMIC-Ⅲ的数据库有利于模型在公共数据库中的试运行,加快技术开发的效率。在数据更新的实时性上,本数据平台可以为疾病预测模型和临床应用系统的构建创造条件。

在重症患者的治疗过程中,脏器评分体系对患者预后的评价和治疗策略的制定有重要的作用。APACHE Ⅱ评分可有效估计患者的预后,但其评价过程复杂,在临床工作中耗时较多,难以做到每日评估,故往往仅作为重症患者入住时的初次评估。研究表明,在病情变化时,如发生呼吸机相关性肺炎时进行APACHE Ⅱ及时评估对预后判断有重要意义[17]。SOFA评分较为简易,动态评估对精确地判断疾病的预后很重要意义[18],但是该评分在临床应用中缺少可视化的评估分析,难以高效利用该数据。本研究以数据库为基础,建立APACHE Ⅱ和SOFA的自动评分系统,便于医护人员及时、准确、直观地了解患者的病情变化趋势。在重症医学的工作中,医护人员往往处在高负荷工作的状态[19],而高负荷的工作强度是出现医疗事故的独立危险因素[20]。应用临床数据库进行数据的自动采集和整合,可提高信息利用效率,有助于减轻医护人员的工作负担,同时也为患者有效、安全的治疗提供保障。

重症大数据平台仍有许多待完善之处:(1) 文本数据,包括病例记录、护理记录、检查报告等非结构化数据,受技术条件限制,尚无法高效利用这些数据; (2) 部分床旁设备未接入到医院系统,暂时无法纳入重症大数据平台; (3) 大数据的应用处于初步探索过程中,仍需在临床实践中不断改进和完善。在下一代的数据平台建设中,将把人工智能学习技术和自然语言分析技术融入重症大数据平台中,使得数据可以得到高效利用,并支持精准医疗的实现。

综上所述,基于医院的各业务系统,本团队初步建立重症大数据平台,并开展相关应用。随着数据库及其应用的不断完善,重症大数据平台将能够更好地服务于临床诊疗,为临床科研提供强有力的支持,推进临床质量的提升,助力重症医学学科建设与发展。

利益冲突  所有作者声明无利益冲突

参考文献
[1] 国务院. 《促进大数据发展行动纲要》[EB/OL]. (2015-08-31)[2020-12-14]. https://zycpzs.mofcom.gov.cn/html/nysczl/2018/9/1536891477862.html.
[2] 工业和信息化部印发《大数据产业发展规划(2016—2020年)》[J]. 电子政务, 2017: 49.
[3] 国家卫生健康委员会办公厅. 关于印发全国医院信息化建设标准与规范(试行)的通知[EB/OL]. (2018-04-13)[2020-12-14]. http://www.nhc.gov.cn/guihuaxxs/gongwen12/201804/5711872560ad4866a8f500814dcd7ddd.shtml.
[4] 王淑平, 梁颖. 大数据背景下医疗卫生行业数据应用研究[J]. 自动化技术与应用, 2020, 39(1): 54-57. DOI:10.3969/j.issn.1003-7241.2020.01.013
[5] 王潇, 张爱迪, 严谨. 大数据在医疗卫生中的应用前景[J]. 中国全科医学, 2015, 18(1): 113-115. DOI:10.3969/j.issn.1007-9572.2015.01.028
[6] 李海林. 在医院绩效管理中的应用探讨[J]. 现代信息科技, 2019, 3(10): 142-143. DOI:10.3969/j.issn.2096-4706.2019.10.055
[7] 王海星, 张靓, 杨志清, 等. 医疗大数据在临床科研中的应用探讨[J]. 中国医院, 2020, 24(7): 63-64. DOI:10.19660/j.issn.1671-0592.2020.07.19
[8] Wu PY, Cheng CW, Kaddi CD, et al. -omic and electronic health record big data analytics for precision medicine[J]. IEEE Trans Biomed Eng, 2017, 64(2): 263-273. DOI:10.1109/TBME.2016.2573285
[9] Sanchez-Pinto LN, Luo Y, Churpek MM. Big data and data science in critical care[J]. Chest, 2018, 154(5): 1239-1248. DOI:10.1016/j.chest.2018.04.037
[10] Andreu-Perez J, Poon CCY, Merrifield RD, et al. Big data for health[J]. IEEE J Biomed Health Inform, 2015, 19(4): 1193-1208. DOI:10.1109/JBHI.2015.2450362
[11] Johnson AE, Pollard TJ, Shen L, et al. MIMIC-Ⅲ, a freely accessible critical care database[J]. Sci Data, 2016, 3: 160035. DOI:10.1038/sdata.2016.35
[12] 李开源, 冯聪, 贾立静, 等. MIMIC数据库在急诊医学临床研究过程中运用的思考[J]. 中华危重病急救医学, 2018, 30(5): 494-496. DOI:10.3760/cma.j.issn.2095-4352.2018.05.021
[13] Pollard TJ, Johnson AEW, Raffa JD, et al. The eICU collaborative research database, a freely available multi-center database for critical care research[J]. Sci Data, 2018, 5: 180178. DOI:10.1038/sdata.2018.178
[14] Thoral PJ, Peppink JM, Driessen RH, et al. Sharing ICU patient data responsibly under the society of critical care medicine/European society of intensive care medicine joint data science collaboration: The Amsterdam University Medical Centers database (AmsterdamUMCdb) example[J]. Crit Care Med, 2021, 49(6): e563-e577. DOI:10.1097/CCM.0000000000004916
[15] 齐霜, 毛智, 胡新, 等. 基于专科信息系统建立的重症医学数据库: 大型三甲医院重症医学数据库的模式[J]. 中华危重病急救医学, 2020, 32(6): 743-749. DOI:10.3760/cma.j.cn121430-20200520-00393
[16] He JQ, Hu Y, Zhang XZ, et al. Multi-perspective predictive modeling for acute kidney injury in general hospital populations using electronic medical records[J]. JAMIA Open, 2019, 2(1): 115-122. DOI:10.1093/jamiaopen/ooy043
[17] Gursel G, Demirtas S. Value of APACHE Ⅱ, SOFA and CPIS scores in predicting prognosis in patients with ventilator-associated pneumonia[J]. Respiration, 2006, 73(4): 503-508. DOI:10.1159/000088708
[18] Raith EP, Udy AA, Bailey M, et al. Prognostic accuracy of the SOFA score, SIRS criteria, and qSOFA score for in-hospital mortality among adults with suspected infection admitted to the intensive care unit[J]. JAMA, 2017, 317(3): 290-300. DOI:10.1001/jama.2016.20328
[19] van Mol MM, Kompanje EJ, Benoit DD, et al. The prevalence of compassion fatigue and burnout among healthcare professionals in intensive care units: a systematic review[J]. PLoS One, 2015, 10(8): e0136955. DOI:10.1371/journal.pone.0136955
[20] Wen J, Cheng YZ, Hu XY, et al. Workload, burnout, and medical mistakes among physicians in China: a cross-sectional study[J]. Biosci Trends, 2016, 10(1): 27-33. DOI:10.5582/bst.2015.01175