首页 / PYTHON / Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)

Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2877字，纯文字阅读大概需要5分钟。

内容图文

python爬取国内新冠疫情数据及对其数据提取

要爬取的网页：
https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5.

文章目录

Python爬虫-新冠疫情时实数据

Python爬虫-新冠疫情时实数据

已经到来的2021年虽然没有去年疫情形势的那么严峻，但如今正值寒假期间，疫情还是会有所变化。宅在家的我，见不着好想见的人，唯有拓展其他技能来派遣无聊。

爬取的大致过程是先把爬取的数据以json文件形式保存，再对该文件进行数据分析和提取，并用csv库来展示爬取结果。

1.需要用到的库

import requests
import json
import csv

2.写入数据，保存本地json文件

# parse_text1.py
def parse_txt(url):
    headers = {
        'User-Agent':
        'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 QIHU 360EE'
    }
    response = requests.get(url, headers=headers)  # 发起请求
    words = json.loads(response.content)  # json字符串转换为Python类型
    # 响应对象保存为json格式文件
    with open("D:\\py\\feiyan_new.json", "w",
              encoding='utf-8') as f:
        f.write(json.dumps(words, indent=2, ensure_ascii=False))
        print("保存成功！")


if __name__ == "__main__":
    url = "https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5"
    parse_txt(url)

3.爬取国内疫情数据（csv文件保存）

# -*- Coding: UTF-8 -*-
# new_infLast.py
# @作者 love_WXD
# @创建日期 2021-01-20T21:44:37.668Z+08:00
# @最后修改日期 2021-01-21T00:52:12.308Z+08:00

import json
import csv

fp = open("D:\\VScode\\py\\新冠数据提取\\feiyan_new.json", "r", encoding='utf-8')
fp_read = fp.read()
st = json.loads(fp_read)
sta = json.loads(st['data'])

# 我国疫情总体情况
chinaTotals = "确诊人数: "+str(sta['chinaTotal']['confirm'])+" 疑似人数: " +    str(sta['chinaTotal']['suspect']) + " 死亡人数:" +    str(sta['chinaTotal']['dead'])+" 治愈人数: "+str(sta['chinaTotal']['heal']) +    " 更新日期:"+sta['lastUpdateTime']
print(chinaTotals)

# 获取中国各省名称，确诊人数，疑似人数，死亡人数，治愈人数
# 从爬取的信息中提取所需信息
china = sta['areaTree'][0]['children']
csvfile = open("D:\\VScode\\py\\新冠数据提取\\newIlness.csv", 'w', encoding='utf-8', newline='')

for i in range(len(china)):
    writer = csv.writer(csvfile)
    writer.writerow([china[i]['name']])
    # 打印目前为止已知的确诊人数
    print(china[i]['name'], '确诊:' + str(china[i]['total']['nowConfirm']), '死亡:' +
          str(china[i]['total']['dead']), '治愈:' + str(china[i]['total']['heal']))
    for city in china[i]['children']:
        # 写入市的名称，确诊、死亡、治愈的人数
        writer = csv.writer(csvfile)
        writer.writerow([city['name'], '确诊:' + str(city['total']['confirm']), '死亡:' +
                         str(city['total']['dead']), '治愈:' + str(city['total']['heal'])])
print("保存成功！")
fp.close()

4.爬取结果截图(2021.1.20)

Python爬取国内新冠疫情数据及对其数据提取(2021-01-21) - 文章图片

5.总结

经历了前期痛苦的改bug，发现了一个很有意思的现象，就是一个json字符串必须要loads两次才可以。虽然结果是好的，但过程真太曲折啦！尤其是分析json的对象和数组。emm…就到这了，兄弟萌，我要去洗洗睡了。

一般人我都不告诉他的（帅的人都喜欢点赞*）

内容总结

以上是互联网集市为您收集整理的Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)全部内容，希望文章能够帮你解决Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/609241.html

来源：【匿名】

【上一篇】情人节用python写个网站对ta表白吧！【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)】教程文章相关的互联网学习教程文章

python实现人人网用户数据爬取及简单分析【图】

这是之前做的一个小项目。这几天刚好整理了一些相关资料，顺便就在这里做一个梳理啦~ 简单来说这个项目实现了，登录人人网并爬取用户数据。并对用户数据进行分析挖掘，终于效果例如以下：1、存储人人网用户数据（户主的全部好友、户主好友的全部好友、户主及好友关注的公共主页）。2、信息可视化，绘制户主好友间的关系网络图；3、数据挖掘，通过分析户主好友关注的公共主页，向户主推荐公共主页。项目分为三个部分，各自是人...

python, 爬虫爬取彩票网数据，pandas分析数据并实现可视化饼图【代码】【图】

import lxml import requests from lxml import etreeurl = ‘https://datachart.500.com/ssq/history/newinc/history.php?limit=5000&sort=0‘ resp = requests.get(url) hm = etree.HTML(resp.text) # 在返回页面内容的任意位置查找id=tdata的tbody标签，并取其下所有的tr标签内容，赋给trs列表 trs = hm.xpath("//tbody[@id=‘tdata‘]/tr")f = open(‘data.csv‘, ‘w‘) # 将攫取的数据存到data.csv文件 for tr in trs:data_l...

从入门到自闭之Python--MySQL数据库的单表操作【代码】

单表查询：select * from 表 where 条件 group by 分组 having 过滤 order by 排序 limit n;语法：select distinct 字段1，字段2... from 表名 where 条件 group by 组名 having 筛选 order by 排序 limit 限制条数找到表:from拿着where指定的约束条件，去文件/表中取出一条条记录将取出的一条条记录进行分组group by，如果没有group by，则整体作为一组执行select（去重）：select * from 表名;将分组的结果进行having过滤将结果按...

Python的Django框架中的数据库配置指南【代码】

记住这些理念之后，让我们来开始 Django 数据库层的探索。首先，我们需要做些初始配置；我们需要告诉Django使用什么数据库以及如何连接数据库。我们假定你已经完成了数据库服务器的安装和激活，并且已经在其中创建了数据库（例如，用 CREATE DATABASE 语句）。如果你使用SQLite，不需要这步安装，因为SQLite使用文件系统上的独立文件来存储数据。象前面章节提到的 TEMPLATE_DIRS 一样，数据库配置也是在Django的配置文件里，缺省...

python连接mysql数据库

1.系统必须安装MySQL-python软件，否则python没有连接的模块(在Linux系统)yum install MySQL-python2.安装mysql数据库yum install mysql-server mysql[root@AY140528120357495c4bZ ~]# /etc/init.d/mysqld restartStopping mysqld: [ OK ]Starting mysqld: [ OK ][root@AY140528120357495c4bZ ~]#3.在mysql中创建数据库和表[root@AY1405...

4-Python数据类型之元组-字符串【代码】

目录1 元组概念1.1 元祖的特点1.2 元组的定义1.3 元组的访问1.4 元组的查询2 命名元组3 字符串3.1 字符串的基本操作3.1.1 字符串的访问3.1.2 字符串的拼接3.2 字符串分割3.3 字符串大小写3.4 字符串排版3.5 字符串修改3.6 字符串查找3.7 字符串判断3.8 字符串格式化3.8.1 C语言格式化3.8.2 format格式化3.8.3 对齐3.8.9 小数点与进制4 切片4.1 切片赋值1 元组概念????????元组（类型为 tuple）和列表十分相似,但是元组和字符串一样...

python 一维和二位数据的高斯模糊滤波【代码】【图】

高斯模糊一阶核函数:高斯函数二阶核函数：def calc(self,x,y=0):if self.level==1:return 1/((2*math.pi)**0.5*self.sigema)*math.exp(-(x**2/2/(self.sigema**2)))elif self.level==2:return 1/(2*math.pi*self.sigema*self.sigema)*math.exp(-(x**2+y**2)/2/self.sigema/self.sigema) σ为标准差定义一个模糊半径，通过上述公式获取到需要的核函数如半径r=1 ，σ=2一阶时为x=[-1,0,1],生成核为[0.176033，0.199471，0.176033]/d...

金融量化分析-python量化分析系列之---使用python获取股票历史数据和实时分笔数据【代码】

财经数据接口包tushare的使用（一）Tushare是一款开源免费的金融数据接口包，可以用于获取股票的历史数据、年度季度报表数据、实时分笔数据、历史分笔数据，本文对tushare的用法，已经存在的一些问题做一些介绍。一：安装tushare为避免由于依赖包缺失导致安装失败，请先安装anaconda,百度网盘地址：链接：http://pan.baidu.com/s/1qYDQUGs 密码：6wq8 安装直接一直下一步即可安装完成之后，anaconda会自动配置环境变量，直接就可...

python常用的数据类型【代码】

int_num = 7 float_num = 7.7 string = "python" a, b, c = 7, 7.7, "python"print(int_num, type(int_num)) print(float_num, type(float_num)) print(string, type(string)) print(a, b, c) print("a=%.6f"%a) print(len(c))运行结果：7 <class‘int‘> 7.7 <class‘float‘> python <class‘str‘> 7 7.7 python a=7.000000 原文：https://www.cnblogs.com/jumpkin1122/p/11503119.html

python基础，小数据池内存地址，is与==区别【代码】

内存地址 id() 总结：数字类型，字符串类型，元组，变量不同值相同的内存地址是相同的。列表，字典，反之。int类型#共同内存地址 a = 2345435436457656756 b = 2345435436457656756 print(id(a)) #id() 内存地址 print(id(b))结果：16521307949521652130794952float类型#共同内存地址 a = 234.5435436457656756 b = 234.5435436457656756 print(id(a)) print(id(b))结果：19538493853681953849385368str类型#共同内存地址 s...

python3生成随机数据，并存入sqlite3

#!/usr/bin/python #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/6/15 22:46 # @Author : Kwan # @File : insert_db.py # @Software: PyCharmimport sqlite3 import random import datetime# conn = sqlite3.connect('local.db') # # c = conn.cursor() # # c.execute("insert into system_cfg values(?,?,?)",(2,'test2',1)) # # conn.commit() # # conn.close()def make_date(): # def make_card_n...

python数据库操作【代码】

#!/usr/src/python# -*- coding:utf-8 -*-import pymysqlimport socket,structdef sql_exe(v_sql): conn = pymysql.Connect(host=‘192.168.110.133‘,port=3306,user="admin",password="mysql123",database="hostmgr",charset=‘utf8‘) cursor = conn.cursor() v = cursor.execute(v_sql) result = cursor.fetchall() # result = cursor.fetchone() # result = cursor.fetchmany(2) print(result) curso...

Python 复数数据类型详解（complex）[学习 Python 必备基础知识][看此一篇就够了]【代码】【图】

您的“关注”和“点赞”，是信任，是认可，是支持，是动力......如意见相佐，可留言。本人必将竭尽全力试图做到准确和全面，终其一生进行修改补充更新。目录1 复数数据类型概述2 从复数中提取实部和虚部3 相关函数 complex()3.1 complex() 函数概述3.2 注意事项4 文章其他地址4.1 微信公众号：码农阿杰4.2 CSDN 博客5 参考资料5.1 Python 3.8.2 documentation1 复数数据类型概述复数数据类型，简称复数类型。在 Python 中用comple...

python的基本数据类型【代码】

‘‘‘ int str bool list 存储大量的数据，用[]来表示 tuple 元组，不可以发生改变，用()来表示，和C++的元组是一样的 dict 字典，保存键值对，一样可以保持大量的数据，和C++的map一样 set 集合，内部数据不可以重复 ‘‘‘ 字符串的任何操作都不会改变它本身，所以需要提供另一个字符串来承装#字符串的截取片段 s1 = input("输入字符串：\n") a = input("输入开始截取的位置：\n") b = input("输入结束截取的位置：\n") a = int...

Python数据驱动(ddt)【代码】

import unittest import ddt #第三方库data=[[1,2],[3,4],[5,6]]@ddt.ddtclass MyTestCase(unittest.TestCase):#只有一个参数时@ddt.data(1,2,3)def test_01(self,a):print(a)@ddt.data(*data)#表示可参数，若传参是data,则后面的取值a=[[1,2],[3,4],[5,6]] @ddt.unpackdef test_02(self,a,b):print(a,‘----‘,b)@ddt.data([1,2],[3,4])#和上面的相似，这里未使用变量 @ddt.unpackdef test_03(self,a,b):print(a, ‘----‘...

首页 / PYTHON / Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)

Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)

内容导读

内容图文

文章目录

Python爬虫-新冠疫情时实数据

1.需要用到的库

2.写入数据，保存本地json文件

3.爬取国内疫情数据（csv文件保存）

4.爬取结果截图(2021.1.20)

5.总结

内容总结

内容备注

内容手机端

【Python爬取国内新冠疫情数据及对其数据提取(2021-01-21)】教程文章相关的互联网学习教程文章

python实现人人网用户数据爬取及简单分析【图】

python, 爬虫爬取彩票网数据，pandas分析数据并实现可视化饼图【代码】【图】

从入门到自闭之Python--MySQL数据库的单表操作【代码】

Python的Django框架中的数据库配置指南【代码】

python连接mysql数据库

4-Python数据类型之元组-字符串【代码】

python 一维和二位数据的高斯模糊滤波【代码】【图】

金融量化分析-python量化分析系列之---使用python获取股票历史数据和实时分笔数据【代码】

python常用的数据类型【代码】

python基础，小数据池内存地址，is与==区别【代码】

python3生成随机数据，并存入sqlite3

python数据库操作【代码】

Python 复数数据类型详解（complex）[学习 Python 必备基础知识][看此一篇就够了]【代码】【图】

python的基本数据类型【代码】

Python数据驱动(ddt)【代码】

PYTHON - 相关标签

数据 - 相关标签

提取 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程