【Python爬虫学习笔记6】JSON文件存储
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了【Python爬虫学习笔记6】JSON文件存储,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2667字,纯文字阅读大概需要4分钟。
内容图文
JSON简介
JSON(全称JavaScript Obejct Notation,JavaScript对象标记),基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式,通过对象和数组的组合来表示数据,构造方法简洁且其结构化程度高,是一种轻量级的数据交换格式。
在JSON中,支持很多数据类型,包括有对象、数组、整型、浮点型、布尔型、NULL类型以及字符串类型(由于是JSON基于ES,在python中,字符串必须要用双引号,不能用单引号),而这些多个数据之间使用逗号分开。不过从本质上来说,JSON就是一个字符串。
在这些所支持的数据类型里,对象和数组是比较特殊且常用的两种类型:
对象:在JavaScript中使用花括号{}包裹起来的内容,数据结构为{key:value…}的键值对结构,类似于python中的字典。
数组:在JavaScript中使用方括号[]包裹起来的内容,数据结构为[element1,element2…]的索引结构,类似于python中的列表。
JSON可以由以上两种形式自由组合而成,并且可以无限次嵌套,是数据交换的极佳方式。
例如,一个JSON对象可以写为如下形式:
[{
"username":"UnikFox",
"age":20,
"country":"China"
},{
"username":"Luna",
"age":16,
"country":"Britain"
}
]
为方便查看JSON数据,我们可以借助一个专门用于解析JSON数据的网址(https://www.json.cn/),将我们所要解析的JSON文本复制到左边的输入框,右边的显示框便会动态实时格式化显现,同时还能检查输入的文本是否符合JSON语法并给出提示。
JSON数据的写入和读取
在python中,我们可以很轻松地使用内置的json库来完成对JSON数据的相关操作。常用的操作是写入和读取,接下来我们对此分别进行介绍。
在此之前,我们先来做一些准备工作。
# 导入json库 import json # 设置一个用于JSON对象操作的列表 persons = [ { ‘username‘:‘UnikFox‘, ‘age‘:20, ‘country‘:‘China‘ }, { ‘username‘:‘Luna‘, ‘age‘:16, ‘country‘:‘Britain‘ } ]
1.JSON数据的写入
json库中提供了dumps()和dump()两种方法来进行数据写入,其中前者适用于将python对象转化为JSON字符串,而后者则可以将python对象写入json文件。
# #json库写入操作 # 利用dumps()方法将python对象转化为json字符串 json_str = json.dumps(persons) print(type(json_str)) #<class ‘str‘>print(json_str) #[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]# 利用dump()方法将python对象存储到json文件中 with open(‘person.json‘,‘w‘,encoding=‘utf-8‘) as fp: json.dump(persons,fp,ensure_ascii=False)
这里要说明的地方有两处:1.有时候我们的字符串为中文,因此在打开文件时需要设置编码encoding;2.json文件的写入默认为Unicode编码,在写入数据后会自动转化为unicode字符,为方便中文的显示,我们需要关闭其默认编码’ensure_ascii=False’。
person.json文件内容(这里我们可以看到,json写入时自动地帮我们格式化了数据,将原本地单引号转化为了双引号)
[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]
2.JSON数据的读取
和写入操作类似,json库提供了loads()和load()两种方法,前者为从JSON字符串转化为python对象,而后者则是从文件中获取python对象。
# #json库读取操作 # 使用loads()方法将json字符串转化为python对象 json_str = ‘[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "China"}]‘ persons = json.loads(json_str) print(persons) #[{"username": "UnikFox", "age": 20, "country": "China"}, {"username": "Luna", "age": 16, "country": "Britain"}]# 利用load()方法从json文件中读取数据并存储为python对象 with open(‘person.json‘,‘r‘,encoding=‘utf-8‘)as fp: persons = json.load(fp) print(type(persons)) #<class ‘list‘>print(persons) #[{‘username‘: ‘UnikFox‘, ‘age‘: 20, ‘country‘: ‘China‘}, {‘username‘: ‘Luna‘, ‘age‘: 16, ‘country‘: ‘Britain‘}]
以上便是有关JSON文件存储的简单介绍和基本使用,更详细的内容可以参考官方文档:https://docs.python.org/3.6/library/json.html
原文:https://www.cnblogs.com/Unikfox/p/9690476.html
内容总结
以上是互联网集市为您收集整理的【Python爬虫学习笔记6】JSON文件存储全部内容,希望文章能够帮你解决【Python爬虫学习笔记6】JSON文件存储所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。