python | 爬虫笔记(五)- 数据存储
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python | 爬虫笔记(五)- 数据存储,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2138字,纯文字阅读大概需要4分钟。
内容图文
![python | 爬虫笔记(五)- 数据存储](/upload/InfoBanner/zyjiaocheng/857/5af77f300beb42728ff323c068670554.jpg)
5.1 文件存储
先用request把源码获取,再用解析库解析,保存到文本1- txt
文本打开方式:file = open('explore.txt', 'a', encoding='utf-8') #a代表以追加的方式写入文本 file.write('\n'.join([question, author, answer])) file.write('\n' + '=' * 50 + '\n') file.close()r 只读 rb 二进制只读 r+ 读写 rb+ 二进制读写 w 只用于写入 wb 二进制写入 w+ 读写,存在覆盖,不存在新建 a?追加 a+ 追加读写
2- Json
JavaScript 对象标记,通过对象和数组的组合来表示数据,构造简洁但是结构化程度非常高,它是一种轻量级的数据交换格式。一切皆对象,常用的是对象和数组 ? 对象 数据结构为 {key1:value1, key2:value2, ...} 的键值对结构 数组 数据结构为 ["java", "javascript", "vb", ...] 的索引结构· 一个Json对象
[{ "name": "Bob", "gender": "male", "birthday": "1992-10-18" }, { "name": "Selina", "gender": "female", "birthday": "1995-10-18" }]· 读取Json loads() 方法将 Json 文本字符串转为 Json 对象,可以通过 dumps()方法将 Json 对象转为文本字符串。
data = json.loads(str) print(data) 读取json文件 with open('data.json', 'r') as file: str = file.read() data = json.loads(str) print(data)· 输出Json
3- CSV
写入import csv with open('data.csv', 'w') as csvfile: writer = csv.writer(csvfile) writer.writerow(['id', 'name', 'age']) writer.writerows([['10001', 'Mike', 20], ['10002', 'Bob', 22], ['10003', 'Jordan', 21]])
读取
import pandas as pd df = pd.read_csv('data.csv') print(df)
5.2 关系型数据库
rdb- 二维表存储;可通过主键外键关联1- MySQL存储
pymysql 内容包括:连接数据库、创建表、插入数据、删除、查询 ? 一般流程:import pymysql db = pymysql.connect(host='localhost',user='root', password='123456', port=3306) #connect()方法声明一个连接对象 cursor = db.cursor() sql = '' try: cursor.execute(sql, (id, user, age)) db.commit() except: db.rollback() #事务回滚,保证数据一致性 db.close()
关系型数据库属性:
5.3 非关系型数据库
NoSQL 是基于键值对的,而且不需要经过 SQL 层的解析,数据之间没有耦合性,性能非常高。 细分-![python | 爬虫笔记(五)- 数据存储 - 文章图片](/upload/getfiles/0001/2021/5/6/20210506071850870.jpg)
1- MongoDB
在 MongoDB 中,每条数据其实都有一个 _id 属性来唯一标识,如果没有显式指明 _id,MongoDB 会自动产生一个 ObjectId 类型的 _id 属性。insert() 方法会在执行后返回的 _id 值。![python | 爬虫笔记(五)- 数据存储 - 文章图片](/upload/getfiles/0001/2021/5/6/20210506071851751.jpg)
![python | 爬虫笔记(五)- 数据存储 - 文章图片](/upload/getfiles/0001/2021/5/6/20210506071852695.jpg)
内容总结
以上是互联网集市为您收集整理的python | 爬虫笔记(五)- 数据存储全部内容,希望文章能够帮你解决python | 爬虫笔记(五)- 数据存储所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。