为疫情预警大数据在疾控中的应用面面观钛
2023/2/10 来源:不详北京中科白癜风医院助力白斑圆梦征程 http://baidianfeng.39.net/a_zhiliao/210521/8976379.html
图片来源
视觉中国文
动脉网(ID:vcbeat),作者
陈鹏
不同于以往的情况,我国的科技水平如今已经有了大幅提升,甚至在某些领域 全球,尤其是云服务、大数据和人工智能技术等创新科技。在本次疫情防控工作中,我们用高科技武装自己,将这些技术变为应对疫情的有力武器,在疫情追踪溯源、路径传播、发展模型预测、资源调配等领域加以广泛应用。
本文中大数据在疾控中的应用(动脉网制图,仅供参考)
大数据究竟对本次疫情防控做出了哪些贡献?在未来的疾控中可以发挥什么样的潜在作用?动脉网对此进行了梳理。
大数据在疾控预警及监测中不可或缺,前提是“真实”数据
根据媒体的报道,年12月26日,医院呼吸内科主任张继先在电子病历系统中存储一个病例时惊讶地发现,当天上午已经有另外三条类似的数据都包含发热、咳嗽和华南海鲜市场三个相同的关键字。
经验丰富的张继先感觉出了异常,并于12月27日向副院长、院感及医务汇报。院方果断把数据上报武汉市江汉区疾控中心。到了12月29日,类似数据增长到7条,医院报告。医院立刻召开多部门会诊,随后,医院直接向湖北省及武汉市卫健委疾控处报告。
张继先被认为是“疫情上报 人”,医院则是 医院。
公开报道中最早的病例可追溯到年12月8日。这半个月期间,医院也陆续收到了类似的病例。根据报道,出于谨慎考虑,院方选择首先进行基因测序确定病原体再行上报。考虑到这是一种全新的病*,基因序列也需要时间,这也无可厚非。
不过,我们假设一下,如果当时有大数据及人工智能能够 时间抓取到这些早期的蛛丝马迹,情况是不是会向另外一个方向发展呢?
当然,也有人会提出质疑,为什么从年开始运行,当时耗资7.3亿元巨资建设的国家传染病与突发公共卫生事件网络直报系统(下文简称疾控直报专网)没有发挥预警作用?
根据动脉网的了解以及媒体的公开报道,疾控直报专网并非没有发生作用,但其数据来源完全取决于上报数据,由于种种因素,疾医院内部网络进行直接连通。采集不到数据,这一系统自然无从发挥。
2月3日,卫健委发布了《关于加强信息化支撑新型冠状病*感染的肺炎疫情防控工作的通知》。各地卫健委根据通知不断改进采集方式,医院开始采用网络直报的方式,总算逐渐发挥了专网的作用。
对于大数据来说,真实的数据来源是极其重要的一步。本次疫情的发展过程中我们可以清楚地发现,依据错误数据得出的结论与事实相差千里。如何获取真实可靠的、来自医疗机构一线的数据?电子病历系统(EMR)、实验室信息管理系统(LIS)、医学影像存档和通讯系统(PACS)医院信息系统(HIS)这几个主要的系统为我们提供了可靠的数据来源。
EMR是数据来源的最初一环,医院信息化升级中的一个核心系统。从年到年,国务院和国家卫健委总共有9条*策详细提到对于电子病历的硬性要求。年,全国总计有医院申报了国家的电子病历评级。
利用大数据及人工智能对EMR进行分析并运用于疾控并非无法实现,这是一个目前的热门话题。北京大数医达为南京市疾控中心建设的疾病与监测预警系统便直医院的EMR。
这一疾控监测预警系统应用了大数医达 的大数据和人工智能技术,对医学知识图谱建立模型,再直接提取EMR进行语义结构化,由人工智能匹配知识库判断EMR中是否包含新冠肺炎等传染病的关键词。一旦被人工智能判断为疑似或者是高度疑似则上报疾控部门,医院因故遗漏或者迟报。
系统医院的EMR,作为省市疾控中心的上报分析、数据汇总及预警分析系统。它具有很细的颗粒度,除了40种法定传染病,也支持各地区自己补充当地认定的多发性传染病。
大数医达区域疾病监测预警系统(所有显示仅为展示,不代表任何实际意义)
同时,系统结合历史疾控数据进行学习,并结合区域密度和人口流动率等大数据,可以对疑似数据对传染病的发展速度及分布区域等进行预测,从而为疾控决策给出参考数据。
总体来说,要把疫情防控工作做踏实做到位,需要借助AI+大数据技术,既要打通行业内“部-省-市-区县”自上而下的垂直领域数据,又要横向打通跨行业部门“信息孤岛”。从顶层设计就要实时结构化信息互联互通,业务联防联动。
大数医达为江苏省承建的这套系统原本是为春季流感高峰而准备,没想在这次更加严重的新冠疫情中发挥了作用。根据统计,如果以疫情爆发的中心城市武汉为原点,沿着高铁线路画一条半径约为2小时的圆圈,可以清晰地看到各个地区疾控水平并不一样。相对而言,江苏省的新冠疫情控制的就比周边要好很多。
专门从事传染病疾病智能监测的长沙双数科技则试图通过解决医生在当下传染病报卡中的痛点从而解决整个传染病监测的痛点。首诊医生负责制规定,凡发现传染病人,疑似病人病源携带者的均由首诊医生填写传染病报告卡,并作好记录备查。
传染病监控对传染病报告卡的数据质量要求较高,包括传染病报告的及时性、传染病报告数据的完整性和准确性都是重要指标。这本是一件好事,但客观上也使得医生在实际传染病报卡过程中会遇到很多问题。
首先是及时性。现行规定甲类传染病必须在2小时内,乙类传染病及丙类传染病须24小时内上报。然而,医生填写传染病报告卡信息需要花费较多时间,遇到就诊病人多时,就很容易出现疏漏造成没有及时上报,这样就会导致传染病的迟报和漏报情况的出现。
其次则是传染病报告数据的完整性和准确性。医院挂号系统中并没有完整的地址及电话等信息,在填报时无法满足传染病报卡对病人信息完整性的要求。医生只能现场询问并录入,过程耗费3-5分钟时间甚至更长,让人颇为头疼。
医生对传染病疫情是不是有足够意识也影响到传染病的监测。在疾控直报专网的传染病报卡中有“不明原因肺炎”的选项,实际上可以对应早期未明确的新冠肺炎。现实情况则是医生基本上都没有选择此项选择报告,因为上报就意味着后续需要完成一系列登记填表及调查工作,对于他们是额外的负担。或者,即使知晓有此选项,但缺乏明确的诊断也不敢轻易上报或无法通过现有系统的规则进行上报。
医院的传染病监测报卡系统不够智能、对医生的干预方案不够有效、医院传染病疫情管理部门对传染病迟报漏报筛查耗时耗力,这些都是传染病监测无法做到杜绝迟漏报的客观因素,也是传染病监测中的痛点所在。长沙双数科技经过熟练的实践,认为这些痛点可以利用大数据解决。
双数科技传染病疾病智能监测方案运行逻辑
在双数科技的传染病疾病智能监测解决方案中,首先汇集EMR、LIS、EMR及PACS四大系统诊疗数据,再运用双数传染病专家知识库、语义分析技术,对诊疗数据进行传染病疾病相关特征提取、标记。其后,使用传染病疾病分析模型对特征进行分析比对,从而认知传染病。
一旦认知到传染病病例,系统即时推送或延迟推送到具体医生电脑前端,并可强制锁死系统要求医生必须完成重要的传染病报告。
从实践来看,医生的确在初期不熟悉操作的情况会有一些微词;但是在医生填报卡过程中,双数利用大数据+人工智能技术实现了传染病的高 认知、待报卡信息的自动提示、病人信息的自动填充、地址信息到街道的智能解析认知和重复报卡的自动去重等一系列优化方案来实现明显的效率提升。 ,医生对此都予以接受和认可。
这一传染病智能监测解决方案还实现了关口前移,把疾控直报专网上报的校验逻辑全面前移到医生填写传染病报告的阶段。校验不过就完成不了上报,这样就有效解决了报卡完整性和准确性问题。
医生完成报告传染病报卡后,数据完整准医院传染病疫情报告人员审核后再上报至疾控直报专网,也解决了及时性的问题。
双数传染病监测平台(所有显示仅为展示,不代表任何实际意义)
在解决医生传染病报卡的基础上,双数科医院内网至疾控直报专网的一键直报功能。年5月,医院利用该系统医院内网一键直报功能,耗时不到3秒。这在当时也是极个别可以实现内网直报的案例。
目前除了湖南省的医院外,重庆医院和贵州医院均已采用内网一键直报的方案。
根据统计,利用大数据和人工智能的双数传染病监测方案可以将杜绝迟报漏报的有效率做到95%以上;将医生的平均传染病报卡所耗时间从以往的5-8分钟大幅降低到40秒以内;疾控直报专网上报所耗时间也从2-3分钟缩短至几秒钟。
事实上,医院也刚刚在去年采用双数传染病监测方案,并在后续的疫情报告效率上体现出了优势。不过,在突发性的未知传染病早期预警上,双医院的数据分析的结果、在说服力还是相对不足。
相对而言,双数科技认为区域一体化传染病疫情预警监测方案是应对区域重大传染病 的建设方案。目前,双数科技已经完成了区域一体化传染病疫情预警监测方案的研发,已经在其他省市加快部署计划,希望能为中国整体的传染病信息化进程探索新模式。
不要忽视院内数据快速采集,大数据运营需要可视化
随着疾控上报流程的理顺,疾控信息的上报变得简单了不少,但医院对于他们身边正在处理的患者数量、确诊疑似病例分布、内部科室人员配比、排班情况和防护物资等状况反而难以获取全貌。通过Excel打印纸质表单手写统计这种落后方式不得不重出江湖。
低效的数据工作给一线医护人员的工作带来了不少负担和危险,也让管理者难以获得全貌。主任和院长无法进行快速调度,甚至影响了正常排班。医院张文宏主任“让*员先上”的做法赢得一片喝彩,但其背后的原因之一恐怕也是因为紧急时刻使得理想的调度流程出现了问题。
实际上,绝大医院依赖厂商的服务,本身缺少快速开发数据采集和处理数据的能力。一旦遇到突发情况没有办法处理,信息化系统就变成了摆设。在不得已的情况下,手写表格也就变得可以理解。
医院获取的反馈,医院内部在疫情期间的数据堵塞点非常多,主要分为填报微系统、报表自动化和管理型数据应用三个方向。
填报医院的 需求之一。医院的信息系统已经相当复杂,但现有信息系统医院常规运行设计,对于很多可以运营的数据并未做额外采集。这导致许多临时性需求数据无法采集,一旦厂商工程师因故无法及时现场响应(比如疫情),医院基本只能抓瞎。
填报微系医院日常可能通过Excel进行收集的部分数据,或者将突发性、临时性的数据进行采集保留到数据库中以备紧急情况下使用,医院防护物资的临时管理。
第二个需求则是自动化报表业务,医院从复杂繁琐的报表任务中解脱出来。同时,自动医院自身情况快速调整和修改。在疫情过程中,医院工作负担上也发挥了不小的作用。
第三则是管理型的数据应用。医院EMR、HIS和LIS系统的数据,并与填报微系统采集的数据结合,医院管理者提供医院的运营状况和指挥发力点。
在这方面,帆软经过对长期实践经验的总结,为医院提供了多种填报微系统及自动化报表的模板,包括物资处理、健康状况报告及远程办医院运营指标模板,医院工作量、防护物资总览及疫情动态等三个方向共计数十个指标进行填报,医院的燃眉之急。
说到大数据的应用,多数应用的推广都离不开数据的可视化。除了常规的柱状图、折线图、饼图之外,疫情地图始终都是最让人