基于贝叶斯优化SEIR模型的新型冠状病毒预测与分析

阅读: 评论:0

第35卷第6期2020年12月灵山风景区有哪些景点
安㊀徽㊀工㊀程㊀大㊀学㊀学㊀报J o u r n a l o fA n h u i P o l y t e c h n i cU n i v e r s i t y V o l .35.N o .6D e c .,2020
文章编号:1672G2477(2020)06G0083G08收稿日期:2020G04G05㊀基金项目:国家自然科学基金资助项目(61504055);湖南省教育厅科学研究基金资助项目(18A 253)作者简介:王㊀庆(1997G),男,安徽六安人,硕士研究生.通讯作者:何啸峰(1971G),男,湖南祁东人,副教授,硕士.基于贝叶斯优化S E I R 模型
新型冠状病毒预测与分析
王㊀庆1,陈俊熹2,熊东平1,何啸峰1
(1.南华大学计算机学院,湖南衡阳㊀421001;2.南华大学附属南华医院,湖南衡阳㊀421000
)摘要:通过建立传染病动力学S E I R 模型对疫情的趋势进行预测和分析.通过研究疫情数据系统地分析和预
测新型冠状病毒肺炎拐点,建立了S E I R 动力学模型,
并且运用贝叶斯优化方法选择最优的超参数,提高模型的效果.模型显示,国内在春运前后的峰值和拐点分别为79107人㊁2月27日和81314人㊁2月25日;
疫情拐点在管控后稍稍提前,并且在拐点之后感染人数下降速率加快,体现了管控所带来的影响.由于疫情初期
意大利并没有采取相应的管控,在此只进行预测,预测结果峰值和拐点为14万人㊁4月21日左右.通过贝叶
斯优化搜索出模型参数的最优解,增加模型的鲁棒性,该模型能够较好地拟合真实数据并对比国内采取管控
前后所带来的影响,对国外疫情起到一定的指导意义.
关㊀键㊀词:S E I R 模型;
贝叶斯优化;新型冠状病毒;国内外疫情中图分类号:T P 391㊀㊀㊀㊀文献标识码:A 新型冠状病毒肺炎(C o r o n aV i r u sD i s e a s e 2019,C O V I D G19),简称 新冠肺炎 ,是指2019年新型冠状
阿拉善盟地图全图
珠海外伶仃岛病毒感染导致的肺炎[1G2].国内外均受到了新型冠状病毒带来的巨大干扰,而该病毒与S A R S [3]㊁中东呼吸综合征(M E R S )[4]㊁H I V [5]等传染性疾病有所不同.S A R S 这类病毒主要表现为发病2~3天之后出现明显发热,发热程度比较高,病人呼吸困难,病情相对比较重,致死率相对较高.而新型冠状病毒肺炎的潜伏期一般在14天之内,病毒传染能力很强,传播能力比S A R S ㊁埃博拉病毒㊁H 7N 9强,
传染性较高导致防疫非常困难.通过国家卫生健康委员会[6]公布的数据,截至3月21日24时,全国现有确诊人数5549人,
现有疑似人数118人,累计治愈人数72244人,尚在医学观察10071人.由于国家采取了有效的管控策略,我国的疫情形势正在逐渐好转.目前国外疫情则令人关注,疫情形势相对较重,各个国家正在积极地应对,同时我国也派出了相关专家援助共同对抗疫情.1㊀相关工作旅游垂直搜索平台有哪些
从疫情开始至今,已有相关研究团队对新型冠状病毒展开建模并进行分析,范如国[7]等对新冠病毒展
开建模,对中国全境㊁湖北省尤其武汉市数据进行研究,分析了不同潜伏期天数对感染人数以及疫情拐点
到来的时间影响.耿辉[8]等研究了国家采取的防护措施对病毒传播带来的影响,对比了停工停学不限制
出行和限制出行对易感者㊁潜伏者㊁感染者和移除者的变化趋势.吉兆华[9]等用室模型拟合了全国及广
东㊁河南㊁江苏㊁湖北㊁浙江5个省份1月份报告发病情况,根据模型预测病例数对实际病例数的解释度和分析体防控度.张琳[10]则采用一般增长模型分3个阶段拟合了确诊人数,发现确诊人数在经历了初期
(1月15日~1月27日)的无障碍指数增长,中期(1月27日~2月6日)
的次指数增长后,已在2月6日进入了次线性增长阶段.周涛[11]等在对武汉新型冠状病毒感染肺炎基本再生数进行了预测,估计
C O V I
D G19的基本再生数在2 8~3 3之间.随着C O V I D G19疫情的发展与防控策略的不断加强,
新型冠状病毒肺炎传播机理还需进一步研究.因此,研究针对如何科学高效地管控疫情,分析了国内外
早期的疫情数据,对已有的数据进行数学建模,进而预测未来疫情的发展趋势,力图为疫情防控提供理论支持和实践指导.
48 安㊀徽㊀工㊀程㊀大㊀学㊀学㊀报第35卷2㊀基于贝叶斯优化S E I R模型的新冠肺炎疫情分析
2.1㊀数据来源
研究所使用的疫情数据来自于国家卫生健康委员会㊁湖北省卫健委[12]㊁湖南省卫健委[13]㊁安徽省卫健委[14]㊁陕西省卫健委[15]㊁甘肃省卫健委[16]以及根据g i t h u b上B l a n k e r l提供的数据接口(h t t p s:// g i t h u b.c o m/B l a n k e r L/D X YGC O V I DG19GD a t a)所获得的疫情数据.依据疫情发展情况的不同,国内分析1月20日~2月16日的疫情数据,而国外研究2月22日~3月22日的疫情数据.
2.2㊀模型参数分析
通过模型辨识和参数估计,对S E I R模型中关键参数进行了分析,参数k代表一个感染者平均接触人数,k值的变化能够体现国家采取的防护措施带给病毒传播的影响.比如延长春节假期㊁企业延迟复工㊁学校延期开学㊁限制出行㊁居家隔离等,这些措施最大化地扼制了病毒的传播.而影响我国疫情发展的重要影响因素就是春运,春运前后全国及各省感染者平均接触人数随时间的变化如图1所示.由图1可
以看出,1月24日之前完成的春运接触效果开始在1月25日之后显现,多地确实出现了春运带来的影响,k 值有所上升.总体来说,全国的k值相对比较平稳,k约为10 23人,可以作为平均接触人数的参考.但是在1月24日之后,随着疫情的发展,国家采取了 封城 举措,全国多地采取一级响应,数学建模的参数需要动态调整,采取分层抽样来计算出新的k值.根据病毒传染程度分成5个等级,一级为最严重,五级为轻微,然后进行加权平均,结果计算可得k_n e w约为8 70人.另外,还计算了国家采取的种种防控手段对平均接触人数带来的影响因子(k_c h a n g e d_r a t i o),利用公式k_c h a n g e dGr a t i o=k/k_n e w,计算得出k_c h a n g e d_r a t i o约为1 16.k_n e w的值相比春运之前的k值有所减小,说明国家采取的管控措施对病毒的抑制起到了一定的影响,并在之后效果会更加显著.疫情严重程度的关键是防控因子的研究,为疾病预防控制部门提供重要的决策依据.
图1㊀春运前后全国及各省感染者平均接触人数随时间的变化图
2.3㊀贝叶斯优化方法
(1)贝叶斯优化过程分析.针对研究需要解决预测疫情感染人数以及拐点到来的问题,提出了贝叶斯优化的方法,该方法能够有效快速地寻到所要解决问题的最优参数,省去了根据人工经验调参所花费的时间.贝叶斯优化主要面向的问题场景是:
X∗=a r g m a x f(x)(xɪS),(1)式中,S是x变量的候选集,即参数x可能取值的集合.目标从集合S中选取
一个x,使得f(x)的值最大或最小.这里f(x)具体公式形态可能无法得知,即黑盒函数.但是可以选择一个x,通过实验或者观察得出f(x)的值.贝叶斯优化的流程图如图2所示.
贝叶斯优化[17G18]有两个核心过程,先验函数(P r i o rF u n c t i o n,P F)与采集函数(A c q u i s i t i o nF u n c t i o n, A C),采集函数也叫效能函数(U t i l i t y F u n t c i o n).在贝叶斯决策理论的框架下,许多采集函数可以解释为在点x评估f相关的预期损失,然后通常选择具有最低预期损失的点.P F主要利用高斯过程回归,A C 主要包括E I㊁P I㊁U C B这几种方法,接下来简要介绍一下A C的几种常用方法.
P I(P r o b a b i l i t y o f I m p r o v e m e n t):假设fᶄ=m i n f这个fᶄ表示目前已知的f的最小值.接着定义采集函数如下:
图2㊀贝叶斯优化流程图u (x )=0㊀㊀i ff (x )>f ᶄ1㊀㊀i ff (x )ɤf ᶄ{,(2
)把u (x )理解成一个奖励函数,如果f (x )不大于f ᶄ就有奖励,反之没有.改进的采集函数作为变量x 的期望函数如下:a P I (x )=E [u (x )|x ,D ]=ʏf ᶄ-ɕN (f ;u (x ),K (x ,x ))d f =Φ(f ᶄ;u (x ),K (x ,x )),(3)最后a P I (x )的最大值即可求出基于高斯分布满足要求的变量x .E I (E x p e c t e d I m p r o v e m e n t ):上述的P I 函数的缺点是有可能到的是局部最优点,而不是全局最优点.而E I 函数则可以出全局最优点.f ᶄ的定义和上述一样,f ᶄ=m i n f .但是采集函数如下:u (x )=m a x (0,f ᶄ-f (x )),(4
)最终关于变量x 的采集函数如式(5)所示:a E I (
x )=E [u (x )|x ,D ]=ʏf ᶄ-ɕ(f ᶄ-f )N (f ;u (x ),K (x ,x ))d f =(f ᶄ-u (x ))Φ(f ᶄ;u (x ),K (x ,x ))+K (x ,x ))N (f ᶄ;u (x ),K (x ,x )),(5)通过计算使得a E I 值最大的点即为最优点.式(5)中有两个组成部分,要使得式(5)值最大则需要同时优化左右两个部分:左边需要尽可能地减少μ(x );右边需要尽可能地增大方差(或协方差)K (x ,x ).在探索(E x p l o r a t i o n )和利用(E x p
l o i t a t i o n )此类问题上是一个典型理论.U C B (U p p e rC o n f i d e n c eB o u n d ):U C B 可以简单地理解为上置信边界,U C B 通常采用最大化f 而不是最小化f 来描述.但是在最小化的情况下,采集函数将采取以下形式:
a U C B (x )=u (x )-βσ(x ),(6
)式中,β>0是一个策略参数,
并且σ(x )=K (x ,x )是f (x )的边界标准偏差.同样U C B 也包含了E x p l o i t a t i o n (u (x ))和E x p l o r a t i o n (σ(x ))模式.U C B 在某些特定的情况下可以收敛到全局最优值.(2)贝叶斯优化结果分析.为了提高S E I R 模型计算效率和分析精确度,
需要优化α和β这些主要参数.常用的调参方式有网格搜索(G r i dS e a r c h )和随机搜索(R a n d o m S
云南旅游必去的景点排名e a r c h ).G r i dS e a r c h 是全空间扫
58 第6期王㊀庆,等:基于贝叶斯优化S E I R 模型的新型冠状病毒预测与分析
68 安㊀徽㊀工㊀程㊀大㊀学㊀学㊀报第35卷描,但较慢.而R a n d o mS e a r c h虽然快,但可能错失空间上的一些重要的点,精度不够.因此,研究选择贝
叶斯优化方法来调整参数.该算法速度较快㊁效果较好.贝叶斯优化利用平滑性而无需计算梯度,可处理大量变量并行优化.研究分别分析我国和意大利的优化参数α和β,将二者迭代优化次数均设置为1000次,经过1000次的迭代优化之后可以得出我国和意大利α和β的参数结果随着时间步的变化分别如图3和图4所示.由图3可以看出,我国疫情随着参数α和β的迭代次数不断增加,α在0 26~0 30越来越密集,β在0 050~0 100越来越密集,等到1000次迭代优化之后,可以得出α和β的最优解分别为0 28和0 08.由图4可以看出,意大利疫情随着参数α和β的迭代次数不断增加,α在0 16~0 20越来越密集,而β在0 050~0 075越来越密集,等到1000次迭代优化之后,可以得出α和β的最优解分别为0 18和0 06.
图3㊀中国α㊁β随着时间步t 的变化图
图4㊀意大利α㊁β随着时间步t的变化图
2.4㊀基于贝叶斯优化的S E I R模型
在传染病S E I R模型中,种(P o p u l a t i o n)内的N个个体的状态可分为如下几类:(1)易染状态S (S u s c e p t i b l e),即健康状态,可被感染的个体;(2)潜伏状态E(E x p o s e d),处于传染病潜伏期的个体;(3)感染状态I(I n f e c t e d),处于感染状态的个体还能够感染健康状态的个体;(4)移除状态R(R e m o v e d,R e f r a cGt o r y o rR e c o v e r e d),为被隔离或因病愈而具有免疫力的人.传统的S E I R模型只是考虑了有潜伏者(E xGp o s e d)这种人,但是并没有考虑到潜伏者也具有传染性.为了适应C O V I DG19疫情发展与不断加强的防控策略,研究中的S E I R模型考虑潜伏者的传染性,根据春运防护前后病毒传播机制不同的实际问题,模型分为春运前后两个阶段,利用贝叶斯优化方法更新参数,改进的S E I R模型如图5所示,模型的微分方程如式(7)所示.
图5㊀改进的S E I R模型示意图
d S d t =-βS I N -σI E N
d E d t =βS I N +σI E N
-αE d I d t
=αE -γd R d t
=γI σ=r β
,(7
)式中,α为潜伏者被隔离的速率.国家卫健委专家组成员于1月21号接受采访表示,
新型冠状病毒肺炎的潜伏期在7天左右,本次新型肺炎的潜伏期的均值假定为7天.根据文献[19]的研究表明,可设定α为潜伏期的倒数,α为1/7,约为0 14;β为感染者的传染系数;
σ为潜伏者的传染系数;γ为治愈率,r 为σ和β的比值,即密切接触人数.由于系数β与每个人能够接触到的人数成正比,假设σ也与每个人能够接触到的人数成正比.因为用接触人数可以刻画σ和β的值,在每个阶段内σ和β的比值是定值r ,对于发病被迅速
隔离的人,其密切接触者会立即减小,设他能接触的只有4~5人(可解释为亲属和医务人员),则r 可取为5.对于我国新型冠状病毒,改进的S E I R 模型在春运前的参数α和β由贝叶斯优化得到初值α为0 28,β为
0 08,r 为5.根据官方公布数据计算得出σ为0 4,γ为0 02.春运后的关键参数α和β以及r 由于受到国家调控政策影响因子k _c h a n g e d _r a t i o 的影响会发生相应的改变.此时的α调控为α∗k _c h a n g e d _r a t i o =0 3248,β约为βk _c h a n g e d _r a t i o =0 06,r 约为r k _c h a n g
e d _r a t i o =4,并且根据已有数据计算σ为0 24,γ为0 06.意大利新型冠状病毒预测初值通过贝叶斯优化得出α为0 18,β为0 06,r 为5.根据官方公布数据计算得出α为0 4,γ为0 01.
3㊀结果与分析
新冠病毒治愈率㊁死亡率㊁重症率变化如图6所示.由图6可知,我国新冠肺炎的整体趋势随着时间
的推移㊁经验和手段的不断丰富㊁全国医院紧急驰援武汉,治愈人数比例有了明显的上升,重症和死亡人数比例在不断下降,感染人数不再上升,综合表明病毒疫情正在被逐渐控制.将所有省份按确诊人数进行新型冠状病毒感染情况等级的划分,一级为最严重,五级为最轻微,采用分层抽样的方法抽取了湖北㊁湖南㊁安徽㊁陕西和甘肃5个省份来进行分析.研究将针对各个省份的确诊人数㊁治愈率㊁确诊人数增长率等方面进行分析.4个省在1月20日~2月16日确诊人数变化图如图7所示.由图7可知,
湖南和安徽的确诊人数相较其他两省增长比较明显,原因和每个省份的地理位置密切相关,前面两省与湖北省接壤,地理位置比较靠近,所以病毒传播的比较快速,而后两省离得相对较远,所以传播速度慢,同时各个省份积极应对此次疫情,从图7中还可以看出,确诊人数慢慢变得平稳起来
.图6㊀我国新冠病毒治愈率㊁死亡率㊁重症率变化图
图7㊀4个省在1月20日~2月16日期间确诊人数变化图
成都旅游怎么旅游团截至目前,中国疫情形势正在逐渐好转,作为中国疫情发源地的武汉也已经连续多天新增人数为0,但相同时间的国外疫情变得非常严重,意大利㊁美国㊁法国㊁德国㊁伊朗等国家确诊人数在不断地攀升.研
78 第6期王㊀庆,等:基于贝叶斯优化S E I R 模型的新型冠状病毒预测与分析

本文发布于:2023-05-15 13:31:39,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/2/405419.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:疫情   人数   模型   优化   分析   参数
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图