全球新冠疫情在线可视化及分析系统
— 嘉应学院智能工作室 —
为了加强校企合作,促进产教融合及学生的创新创业活动,广州市泰迪公司和嘉应学院在今年4月联合创立了“嘉应学院智能双创工作室”,学生成员主要由嘉应学院数学学院信息与计算科学专业的30多个同学组成。内容包括:线上学习,组织参加竞赛、参与企业项目研发、产品运营。工作室由泰迪来提供平台营运,学校企业老师指导,学生参与的方式开展活动。通过泰迪智能双创工作室建设,结合工作室运营模式,以引导学生学习智能技术为导向,提高学生的创新能力和学习兴趣,让学生以“工作室”方式在学习过程中思考,综合运用不同学科的理论,实现跨领域的融合,并不断在设计中创造。通过各具特色、充满活力的教育工作室空间,通过教育与产业之间得联动,实现创新型大数据分析挖掘创业人才的培养目标。
新
冠
&
病
毒
2020年1月,一场突如其来的疫情,夺走了新年的喜庆与快乐,一眨眼,人们谈“新型冠状病毒”即色变。这场没有硝烟的战争关系着人民的健康。而之后疑似病例的减少也意味着关于疫情防控加强了重视。
接下来展示一下我们工作室对全球疫情情况分析的内容。(疫情数据可视化展示请点击链接:http://106.52.252.68/)
1
引言
数据新闻以可视化的方式呈现疫情相关数据,能给读者们更多的参与。利用数据挖掘等技术对所获取的数据进行可视化分析,让疫情相关数据以更直观、准确、快速的方式体现。挖掘目标如下:
2
数据准备
爬取数据前需要获取网页的源代码,不同的数据结构都有指定的URL,根据需要选择特定的URL;基于requests模块发起用于模拟浏览器获取到网页数据的请求;获取响应中的数据;网页的数据是以JSON格式储存的,需要对数据进行解析;保存数据。
3
任务分析以及实现
1.获取疫情数据
利用Python爬取网站疫情数据,掌握当前疫情状况。查看腾讯实时疫情网页源代码找到腾讯实时疫情网页的有关疫情数据的各个Request URL,分析这些疫情数据的资源结构,通过读取这些URL网页源代码获取所需要的数据,调用json.loads()将JSON格式数据转为字典类型,并将处理好的数据存储。
2.疫情数据分析
为了更直观地展示出中国各省份(地区)和外国各地区的疫情情况,我们针对部分疫情数据进行可视化,使用了Pyecharts库,对生成的图像进行了分析。
根据对数据的统计、分类和分析,我们绘制出了“中国每日新增信息”、“中国每日治疗率、死亡率”、“中国个省市(区)总体疫情信息”、“中国各省市(区)治疗率、死亡率”、“中国目前疫情信息”、“中国目前治疗率、死亡率”“世界总体疫情信息”以及“世界其他信息”的散点图。
3.每日疫情可视化
利用爬取的疫情数据,将可视化数据分析结果在前端展示。运用pyecharts对各种数据进行详细分析、生成HTML文件展示。
我们对每个国家,每个城市都进行了可视化,并重点中国各城市以及对一些重要的国家疫情进行详细分析。对疫情数据进行可视化后可以直观地了解到疫情发展的趋势,这对于疫情的防控等都具有可观的作用。
4.中国疫情地图可视化
为了更直观地展示中国当前确诊人数、死亡人数等情况,我们对部分爬取到的数据可视化,采用了map地图库,对生成的图像进行了分析。
根据对数据的统计、分类和分析,我们绘制出了“中国各省今日新增疫情情况”、“中国累计确诊人数线形图”、“中国疫情地图(累计确诊人数)”、“中国疫情地图(累计死亡人数)”、“中国疫情地图(累计治愈人数)”、“中国疫情地图(现存确诊人数)”、“中国疫情地图(新增确诊人数)”的分布图。通过对这些图像进行分析,能获取有用于疫情的信息。
5.世界疫情及地级市疫情地图可视化
通过绘制世界疫情以及地级市疫情一系列交互地图,以这种直观的方式,帮助我们更好的了解疫情发展变化,通过最直观清楚数据从总体上了解疫情的分布趋势,我们对爬取到的数据进行可视化,使用了Pyecharts库的Bar, Line, Map, Pie生成以图像并保存。
根据所获得的数据文件,绘制出了疫情信息地图和国内疫情走向折线图等图像,疫情信息地图分为世界、省级和县市级三级呈现。
4
疫情数据可视化及前端部署
在前端页面的部署上,利用了JQuery、Layui、EasyUI中现有的页面布局样式对前端页面进行美化,在网址首页,我们将疫情表格详情、中国疫情地图、中国地区疫情变化分析、世界疫情趋势以及其他信息作为主导航,每个主导航下有各自对应的副导航栏在页面左侧呈现,用户可以根据自己的需求进行个性化选择,从而浏览到对应页面所显示的疫情数据信息。其中,我们制作出的疫情数据可视化及前端部署网站链接为:http://106.52.252.68/
5
总结
本文利用腾讯新闻平台的公开的数据源,利用Python爬虫技术以及采用可视化工具对这次疫情的数据即使追踪。将这次疫情中体现的世界乃至全中国各个省份的现有确诊、累计确诊、累计治愈、等相关数据进行可视化,以一种更加直观的方式展示出来。与此同时,我们运用JQuery、Layui、EasyUI中现有的页面布局样式对前端页面进行美化,将数据以一种更加友好、简洁直观的方式部署到前端页面。
以上就是本工作室此次项目的大致内容,具体论文及源代码请点击此(Python爬虫助力疫情数据)下载。
成员安排
工作室每个成员都分配有不同任务,具体任务分配如下:
指导老师:黄可坤老师