网站首页 | 网站地图

大国新村
首页 > 理论前沿 > 深度原创 > 正文

疫情防控实践中的大数据体系建设

核心提示: 当前,面对复杂的疫情形势,大数据技术发挥出了显著优势,具体体现在:数据收集速度提升;数据分析广度拓展;数据运行精度彰显。从此次疫情抗击出发,我们也深刻认识到,公共卫生安全事件的数据治理模式优化提升势在必行,亟待从以下几方面推进建设:建立标准化的数据采集机制、建立多元化的数据共享机制、建立专业化的数据应急体系、建立个性化的数据运行规范、建立系统化的数据生态体系等。

【摘要】当前,面对复杂的疫情形势,大数据技术发挥出了显著优势,具体体现在:数据收集速度提升;数据分析广度拓展;数据运行精度彰显。从此次疫情抗击出发,我们也深刻认识到,公共卫生安全事件的数据治理模式优化提升势在必行,亟待从以下几方面推进建设:建立标准化的数据采集机制、建立多元化的数据共享机制、建立专业化的数据应急体系、建立个性化的数据运行规范、建立系统化的数据生态体系等。

【关键词】新冠疫情 大数据 公共卫生事件 应急处置【中图分类号】D602 【文献标识码】A

2020年元旦前后突然暴发的新冠肺炎疫情是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件。经过两个多月的艰苦努力,目前疫情防控形势正在向好的态势发展,但是形势依然严峻复杂,防控正处在最吃劲的关键阶段。习近平总书记亲自部署、亲自指挥了这场前所未有的疫情防控战,他多次明确提出:要充分运用大数据分析等方法支撑疫情防控工作。党中央所给出的这个命题,需要我们在不断实践的过程中,重新认识和思考大数据在重大突发公共卫生事件中发挥的作用。

这场新冠肺炎疫情防控工作是一场多地区、多部门参与的狙击战、整体战, 疫情数据数量巨大,疫情数据类型复杂,数据服务需求多样,数据体系基础薄弱,因此,疫情的复杂性对大数据工作提出巨大挑战。此次疫情暴发的速度远远超出人们的想象。疫情暴发所产生数据量、数据种类和为防控疫情而需要的数据量都是巨大的;疫情防控期间,全国人民在政府的统一指导下,进行了严格的防控调查登记,这些大范围的防疫工作对大数据服务提出的需求也是多样而复杂的。此外,现阶段我国的大数据体系基础仍然较为薄弱。基础数据统筹准备不足,信息来源重复,质量不高;基础分析手段匮乏,分析不够全面;各地在处置突发公共卫生事件方面的数据运营经验基本是空白。

大数据在新冠疫情防控过程中发挥重要作用

“控而治之”是此次疫情处置应对的总要求。这就要求应对疫情除了“防治”,更要“防控”。从“治”到“控”一字之变,就把城市医疗卫生工作的重心从以社会服务为主,推向了社会治理的方向。城市一旦“漏控”就会暴露在“失治”的风险之中,所以建强用好疫情防控大数据系统势在必行。必须着力形成“汇集—分析—研判—推送—核查—反馈”的数据应用闭环,强化大数据在疫情防控中的场景应用,才能提高防控的精准性、有效性。

在这次防疫过程中,公安部门因为在“人口、交通、行业场所和网络通讯”等基础工作管理方面的数据优势,首当其冲投入到防疫数据体系的建设中。一批专业的大数据公司也参与其中,他们将前期在公安、金融、交通等多个领域已经形成的大数据技术优势和业务标准,运用到此次疫情防控工作中,迅速发挥作用。主要体现在以下三个方面:

首先,数据收集速度提升。应急处置工作中数据分析的对象群体越大,单一数据源的可信度就越低,对交叉验证的数据种类、数量的需求也就越大。作为疫情中心的武汉市依托公安大数据平台,迅速建成了跨平台、跨系统、跨数据库的疫情防控大数据系统,运作初见成效,在数据信息闭环建设上迈出了坚实步伐。这一系统实现了以下几方面功能:一是数据的快速接入。目前武汉市疫情防控分析平台接入了卫健、公安、交通、电信、市政等多个部门的系统数据144类100多亿条,同时,针对各基层工作点每日上报数据建立了专门的数据汇聚通道,实现了数据即时采集、即时接入。二是数据的快速清洗。大数据平台内置了数据漏填、错报和重复报送等一系列数据自动检查校验功能,以机器取代人力针对各部门接入的数据开展数据质量管理,极大地提高了数据分析的真实性、完整性和及时性。三是数据的快速加工。为了便于分析,一方面建立了防疫所需的人口、房屋、地址、场所、物品等基础数据库;另一方面建立了重点关注人员的身份特征、行为特征、关系特征等主题数据库。通过从数据到知识的加工转化,使数据迅速具备业务属性,方便迅速准确进行分析。

其次,数据分析广度拓展。大数据分析的主要工作原理是基于业务数据、针对业务问题将业务逻辑转化为数学模型,从而使得机器可以按照要求持续不断地输出业务决策所需的分析结果,因此,大数据技术十分强调基于数据建模和机器计算的重要性。数据建模支撑业务决策是数据驱动业务的本质所在。广东省在此次防疫的建模分析工程中,从三个方面突出“一切业务模型化”:一是紧盯态势全貌,通过建模工具快速搭建出关注人员、交通封控、隔离监管、医疗收治、舆情分析、治安警情、返程复工等一系列维度的态势类统计模型,输出相关统计图表、专题报告等,服务于本地防疫的趋势把控、决策制定和落地督察。二是紧盯区域共享。在各地市自主建模的基础上,分析共性,在全省平台的模型超市中展示和共享。这一经验互补的方法对迅速丰富防控措施、避免系统重复建设、完善防控机制起到了重要作用。三是紧盯个体关注。搭建了人员落位、人员监测、人员收治等针对个体的对象类摸排模型,能够提供覆盖地市、区县、街镇和社区村居四级的疫情防控分析服务,直接向一线工作人员提供准确的数据,支撑实战。

再次,数据运行精度彰显。以大数据技术支撑业务工作实体运行,从而实现数据驱动运营,是各地开展大数据建设的核心目的。数据运营是一个闭环过程,通过数据的汇集、分析和应用指导一线工作,再加强点对点、不间断、滚动式动态管理和数据及时更新,形成信息回路,进而促进数据更加准确、更具实效。上海、北京、江西等地都进行了有益的尝试。一是技术体系的精密化搭建。上海市在疫情暴发初始,充分利用原有的公共安全大数据平台,通过灵活调度现有的数据流、计算流、业务流等配置工具,迅速、精密地搭建起了一套疫情防控分析技术服务体系,实现了零系统搭建和零成本投入。二是数据指令的精准化到达。北京市朝阳区着力打通数据链的最后一公里,形成数据闭环。通过移动终端向一线人员推送指令的同时,灵活配置对应的业务反馈内容,使前方工作情况也能够第一时间返回防疫指挥部,形成了“即时分析、即时推送、即时处置、即时反馈”的闭环数据流程。三是动态数据的精细化把控。南昌市充分发挥个人健康码在社区住户、企业单位、场站馆所、检查站点四大阵地的采集作用,督促市民开展规范登记,开展不间断数据滚动摸排,通过网络监测随时掌握防控形势。

加强大数据在突发公共卫生事件应急处置的推进重点

建立标准化的数据采集机制。任何突发事件的本质特征是不可预知性,因此建立有针对性的、规范的、灵活的数据采集机制是下一步需要解决的重要问题。应加快推进在互联网、物联网、政务网和移动通讯网等多平台建立公共卫生安全应急数据采集标准,以立法的形式对相关大数据产品、服务、系统建设等设立强制标准,形成应急数据的采集保障机制。

建立多元化的数据共享机制。加快城市公共卫生安全数据体系的建设,不应把重点放在大一统的数据体系建设上,而应该按照“临时共享、按需接入”的原则,建立相关部门、单位的数据资源登记备案制度,做到数据、接口、服务、应用四个清楚,出台数据征调接入流程、接口技术标准和共享授权应用的配套标准,形成数据的共享保障机制。

建立专业化的数据应急体系。在建设基础系统平台之外,针对突发事件处置,要脱离过去项目建设型的应急系统建设思路,转为选择产品化程度高、通用化能力强、部署投用快、业务支撑活、运行体系全的大数据通用数据平台产品,整合关键装备、核心软件和运营平台等多种要素,从根本上提升应对响应的效率和能力。

建立实战化的数据运行规范。应制定针对实战的数据技术应急运行规范,除了明确相关要素的评选、备案、采购、核查等机制以外,应重点推动相关要素的运行维护、应急演练、战时征调等一系列运行工作规范的制定,确保人尽其责、物尽其用、能尽其显。

建立系统化的数据生态体系。鼓励相关科研院所、科技企业主动承担起公共安全应急社会责任,参考美国“9.11”后扶持Palantir等一批高科技企业的做法,综合运用好政府的投资、税收和政策支持,引导一批新型大数据公司和人工智能公司够脱颖而出,形成专业化人才、产品、技术梯队,提供系统的公共安全应急处置技术保障。

(作者为上海体育学院创新创业学院副院长)

责编/谷漩 美编/王梦雅

声明:本文为人民论坛杂志社原创内容,任何单位或个人转载请回复本微信号获得授权,转载时务必标明来源及作者,否则追究法律责任。

[责任编辑:李一丹]