首页 / 大数据 / 大数据微专业_1.Python基础_1.7_数据读写

大数据微专业_1.Python基础_1.7_数据读写

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了大数据微专业_1.Python基础_1.7_数据读写，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5862字，纯文字阅读大概需要9分钟。

内容图文

In [ ]:

'''

1.7.1 文件对象声明及基本操作

另一种数据格式：文件/文档

'''

In [3]:

# 本地文件的界定：指向一个本地存储的文件，是一个连接或一个映射

path1 = 'C:/Users/PC/Desktop/test.txt'   # 单个反斜杠：/
path2 = 'C:\\Users\\PC\\Desktop\\test.txt'   # 两个斜杠：\\(第一个是转义符)
path3 = r'C:\Users\PC\Desktop\test.txt'   # r用于防治字符转义
#路径书写格式

print(path1)
print(path2)
print(path3)

C:/Users/PC/Desktop/test.txt
C:\Users\PC\Desktop\test.txt
C:\Users\PC\Desktop\test.txt

In [8]:

# 读取文件：open语句

f = open(path2,'r')
print(type(f))
print(f)
print(f.read())  # 读取文件里面的内容
print('read complete')
# open('paht','mode', encoding = 'coding')
# mode: r: read document, by default;  w: write; a: append;
# 简单的读取方式：.read()方法读取后，光标会留在读取末尾，再次读取时则无任何内容
print(f.read())

# 解决办法之一：透过f.seek(0)函数，重新将光标移到开始的位置
f.seek(0)
print(f.read())
f.close()   # 读取完毕，应该close

<class '_io.TextIOWrapper'>
<_io.TextIOWrapper name='C:\\Users\\PC\\Desktop\\test.txt' mode='r' encoding='cp1252'>
12232
dfsd
read complete

12232
dfsd

In [ ]:

'''

1.7.2 系统模块下的路径操作

os模块：提供了非常丰富的方法用来处理文件和目录

'''

In [10]:

# os模块：系统模块 - 常用命令

import os   #导入模块
print(os.name) # 输出字符串指示正在使用的操作系统平台。如果是windows，则用nt表示，对linux/unix用户，他是'posix'
print(os.getcwd()) #函数得到当前工作目录，即当前Python脚本工作的目录路径
print(os.listdir()) #返回指定目录下的所有文件和目录名

# os.chdir('C:\\Users\\root\\Desktop\\')  #切换到目标路径
# print(os.getcwd())

# os.remove(test2.txt) #删除文件

print(os.path.split('C:\\Users\\PC\\Desktop\\test.txt'))  #返回一个路径的目录名和文件名
print(os.path.exists('C:\\Users\\PC\\Desktop\\test.txt'))  #用来检验给出的路径是否真的存在，如果不存在则输出False，存在返回True
print(os.path.exists('C:\\Users\\PC\\Desktop\\hehe.txt'))

nt
C:\Users\PC\Python_Study\Python_01
['.ipynb_checkpoints', '1-Python基础_1.3_字典映射.ipynb', '1.Python基础_1.1_变量与数据类型.ipynb', '1.Python基础_1.2_序列及通用操作.ipynb', '1.Python基础_1.4_条件判断及循环语句.ipynb', '1.Python基础_1.5_函数.ipynb', '1.Python基础_1.6_模块与包.ipynb', '1.Python基础_1.7_数据读写.ipynb', '1.Python基础_1.8_项目案例.ipynb', 'bigdata.csv']
('C:\\Users\\PC\\Desktop', 'test.txt')
True
False

In [15]:

# 相对路径与绝对路径

f1 = open('C:\\Users\\PC\\Desktop\\test.txt','r',encoding = 'utf8')  # 绝对路径

#切换到相对路径
os.chdir('C:\\Users\\PC\\Desktop\\')
f2 = open('test.txt',encoding = 'utf8')
print(f1.read())
print(f2.read())
f1.close()

12232
dfsd
12232
dfsd

In [ ]:

'''

1.7.3 文件的读取与写入

os模块：提供了非常丰富的方法用来处理文件和目录

'''

In [19]:

# 文件读取 - read

f1 = open('C:\\Users\\PC\\Desktop\\test.txt','r',encoding = 'utf8')  # 绝对路径
print(f1.read())
# 直接读取(这里光标默认会在最末尾)

# ANSI 用gbk编码
# 汉字用utf8编码

12232
dfsd

In [20]:

f.seek(0)
print(f.read(2))
# f.read(n):n代表读取多少个字符

In [29]:

f.seek(0)
print(f.readline())
print(f.readline())
print(f.readline(4))
# 读取行到字符串，一次读取一行
# f.readline(n): 读取改行的前n个字符
f.seek(0)
print(f.read())

12232

dfsd

3333
12232
dfsd
33333333333

In [34]:

f = open('C:\\Users\\PC\\Desktop\\test.txt','r',encoding = 'utf8')  #
print(f.readlines())  # 一次性读取全部内容，并生成一个列表，一般，f.readlines()用作遍历使用
f.seek(0) #每次读完，都要重新定位光标位置
for line in f.readlines():
    print(line)

['12232\n', 'dfsd\n', '33333333333']
12232

dfsd

33333333333

In [40]:

# 截取一段POI数据，将其分离成Json的形式

f = open('C:\\Users\\PC\\Desktop\\test1.txt','r')  
m = []   # 创建一个列表，方便后续读取使用
n = 0   # 为了建立读取文件
f.seek(0)

for line in f.readlines():
    n += 1
    st1 = line.split(':')
    name = st1[0]
    information = st1[1]
    st2 = information.split(',')
    lng = st2[0]
    lat = st2[1]
    add = st2[2].strip()
    data = [['name',name],['lng',lng],['lat',lat],['address',add]]
    m.append(dict(data))
    #print(data)
print(m[:10])
print('\n总共转换数据%i条'%n)

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-40-acdfe285f93b> in <module>()
     10     st1 = line.split(':')
     11     name = st1[0]
---> 12     information = st1[1]
     13     st2 = information.split(',')
     14     lng = st2[0]

IndexError: list index out of range

In [9]:

# 文件写入

path = 'C:\\Users\\PC\\Desktop\\test_write.txt'
f = open(path,'w',encoding = 'utf8')
f.write('hello world!')
# 执行后直接创建test_write.txt文件，并写入hello world
# 12代表输入了12个字符，但是文件内真的有写入吗？没有
f.close()  # 在执行了f.close()之后，内容才被真的输入

In [13]:

# 依次写入元素

path = 'C:\\Users\\PC\\Desktop\\'
f = open(path + 'test_write2.txt','w',encoding = 'utf8')
lst = ['a','b','c','d','e']
for i in range(len(lst)):
    lst[i] = lst[i] + '\n'
f.writelines(lst)
f.close() 
# 通过遍历每个元素，最后加上\n

In [14]:

lst1 = list(range(1,11))
lst2 = ['a','b','c','d','e','f','g','h','i','j']
path = 'C:\\Users\\PC\\Desktop\\'
f = open(path + 'test_write3.txt','w',encoding = 'utf8')
m = []
for i in range(len(lst1)):
    lst = [str(lst1[i]),',',lst2[i]+'\n']
    # lst = str(lst1[i]+','+lst2[i]+'\n')
    m.append(lst)
    f.writelines(lst)
f.close()
print(m)

[['1', ',', 'a\n'], ['2', ',', 'b\n'], ['3', ',', 'c\n'], ['4', ',', 'd\n'], ['5', ',', 'e\n'], ['6', ',', 'f\n'], ['7', ',', 'g\n'], ['8', ',', 'h\n'], ['9', ',', 'i\n'], ['10', ',', 'j\n']]

In [ ]:

'''

1.7.4 pickle模块的运用

pickle提供了一个简单的持久化功能，可以将对象以文件的形式存放在磁盘上
python的pickle模块实现了基本的数据序列和反序列化
通过pickle模块的序列化从操作，我们能够将程序中运行的对象信息保存到文件中永久存储
通过pickle模块的反序列操作，我们能够从文件中创建上一次程序保存的对象
 pickle.dump() / pickle.load()

'''

In [16]:

# 存储：pickle.dump(obj,file,[,protocol])
import pickle
data = {'a':[1,2,3,4],'b':('string','abc'),'c':'hello'}
print(data)   #创建一个字典变量data

pic = open('C:\\Users\\PC\\Desktop\\pkl','wb')
# 以二进制来存储：rb，wb，wrb，ab

pickle.dump(data,pic)
pic.close()
# 将一个字典数据存成了pkl文件，保持数据结构不变，比txt文件存储的信息更多一点

{'a': [1, 2, 3, 4], 'b': ('string', 'abc'), 'c': 'hello'}

In [17]:

# 读取
pic2 = open('C:\\Users\\PC\\Desktop\\pkl','rb')
data = pickle.load(pic2)
print(data)

{'a': [1, 2, 3, 4], 'b': ('string', 'abc'), 'c': 'hello'}

内容总结

以上是互联网集市为您收集整理的大数据微专业_1.Python基础_1.7_数据读写全部内容，希望文章能够帮你解决大数据微专业_1.Python基础_1.7_数据读写所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/719538.html

来源：【匿名】

【上一篇】大数据微专业_1.Python基础_1.8_商铺数据存取【下一篇】phpexcel导入大数据内存溢出的解决方法有哪些

更多 ►

【大数据微专业_1.Python基础_1.7_数据读写】教程文章相关的互联网学习教程文章

大数据基础

1、Bloom Filter 过滤器数据分片与路由分区算法：一致性哈希算法2、备份机制与一致性3、CAP理论4、幂等性：分布式系统状态管理基石5、一致性模型：强、弱、最终一致。6、备份机制：法7,Leader-Follower模式7、共识协议：一致性协议。Paxos或者Raft8、算法与数据结构9、LSM：学习和B+树的区别和优势10、压缩算法：主流压缩算法Snapppy,LZ4。11、Bloom Filter过滤器统计学1、集中趋势 2、变异性3、归一化4、正态分布5、抽样分布6、估...

大数据开发Linux基础篇网络配置和系统管理【图】

1. 查看网络IP和网关 1）查看虚拟网络编辑器 2）修改ip地址 3）查看网关 4）查看windows环境的中VMnet8网络配置 2 配置网络ip地址2.1 ifconfig 配置网络接口ifconfig :network interfaces configuring网络接口配置1）基本语法：ifconfig （功能描述：显示所有网络接口的配置信息）2）案例实操：（1）查看当前网络ip[root@hadoop100 桌面]# ifconfig2.2 ping 测试主机之间网络连通性1）基本语法：ping 目的主机（功能描述：测试当前...

大数据分析基础——维度模型【图】

1基本概念维度模型的概念出自于数据仓库领域，是数据仓库建设中的一种数据建模方法。维度模型主要由事实表和维度表这两个基本要素构成。1.1维度维度是度量的环境，用来反映业务的一类属性，这类属性的集合构成一个维度，也可以称为实体对象。维度属于一个数据域，如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容)。维度是维度建模的基础和灵魂。在维度建模中，将...

Spark修炼之道（基础篇）——Linux大数据开发基础：第五节：vi、vim编辑器（二）【代码】【图】

本节主要内容缓冲区的使用文件的存盘与读盘文本查找文本替换作者：周志湖微信号：zhouzhihubeyond 网名：摇摆少年梦1. 缓冲区的使用在利用vim进行文本编辑时，编辑修改后的文本不会立即保存到硬盘上，而是保存在缓冲区中，如果没有把缓冲区里的文件存盘，原始文件不会被更改。vim在打开文件时将文本内容读到缓冲区中，在进行文本编辑时，修改的文本保存在缓冲区，此时硬盘上的原文件不变。下面让我们来演示一下缓冲区的使用。...

《大数据技术全解：基础、设计、开发与实践》【图】

《大数据技术全解：基础、设计、开发与实践》基本信息作者：杨巨龙出版社：电子工业出版社ISBN：9787121223433上架时间：2014-2-21出版日期：2014 年1月开本：16开页码：376版次：1-1所属分类：计算机 > 数据库 > 数据库存储与管理更多关于》》》《程序员2013精华本》内容简介书籍计算机书籍　　“大数据”一词已成为当下最热门的词汇之一。人们热切期待大数据能给工作、学习和生活等方面带来前所未有的变化，而大数...

博学谷零基础大数据就业班2021

这 23 种设计模式的本质是面向对象设计原则的实际运用，是对类的封装性、继承性和多态性，以及类的关联关系和组合关系的充分理解。当然，软件设计模式只是一个引导，在实际的软件开发中，必须根据具体的需求来选择：对于简单的程序，可能写一个简单的算法要比引入某种设计模式更加容易；但是对于大型项目开发或者框架设计，用设计模式来组织代码显然更好。关于本教程本教程虽然命名为“Java设计模式”，但是设计模式并不是 Jav...

【大数据微职位笔记】模块01-Linux基础知识：（05-12）crontab定时命令详解【代码】【图】

周期执行的任务一般由cron这个守护进程来处理[ps -ef|grep cron]。cron读取一个或多个配置文件，这些配置文件中包含了命令行及其调用时间。cron的配置文件称为“crontab”，是“cron table”的简写。一、cron服务　　cron是一个linux下的定时执行工具，可以在无需人工干预的情况下运行作业。　　service crond start //启动服务　　service crond stop //关闭服务　　service crond restart //重启服务　　service crond...

真正的零基础，可以学习大数据吗

大数据这个行业成为很多小伙伴向往的行业，首先我想普及一下什么叫大数据，大数据顾名思义首先具有的特点是数据量多，指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据行业薪资高为此吸引了很多的小伙伴，但是零基础可以学习大数据吗?零基础如何学习大数据?针对这点小编首先介绍一下Java和大数据...

【原创】大数据基础之Drill（1）简介、安装及使用【代码】【图】

https://drill.apache.org/ 一简介Drill is an Apache open-source SQL query engine for Big Data exploration. Drill is designed from the ground up to support high-performance analysis on the semi-structured and rapidly evolving data coming from modern Big Data applications, while still providing the familiarity and ecosystem of ANSI SQL, the industry-standard query language. Drill provides plug-and-p...

【原创】大数据基础之Hadoop（3）hdfs diskbalancer【代码】

hdfs单个节点内多个磁盘不均衡时（比如新加磁盘），需要手工进行diskbalancer操作，命令如下# hdfs diskbalancer -help plan usage: hdfs diskbalancer -plan <hostname> [options] Creates a plan that describes how much data should be moved between disks.--bandwidth <arg> Maximum disk bandwidth (MB/s) in integerto be consumed by diskBalancer. e.g. 10MB/s.--maxerror <arg> Describes how...

学习大数据：Java基础篇之多态【代码】【图】

众所周知,Java有三大特性,封装,继承,多态,封装解决了数据的安全性问题,封装解决了代码的重用问题,多态解决了程序的扩展问题,今天我们就来剖析java基础核心机制之多态,了解什么是多态,以及多态的类别以及构成动态多态的条件.要理解多态,不妨我们来举一个例子,比如我们家养了一只宠物,它的名字叫毛毛,根据这段信息来看的话并不能得出这只毛毛是个什么动物,但是如果说它是发出喵喵喵的叫声,那么根据这个信息我们不难判断毛毛是一只猫咪...

Echarts助力大数据绘制可视化图表零基础入门-针对运维

前言因为语言能力比较差,个人只稍接触过python,php,shell(也算语言吧^^),突然遇到echarts javascripts语言类型,看了多遍官网也一直没有什么思路,网上找到的部分文章表示云里雾里,索引耐着性子钻研了会javascripts 和 echarts 感觉还是非常简单的。 Echarts简介 Echarts简介百度开源产品 Echarts主要用于数据汇总后的图表展示,基于zreader底层类库,通过创建坐标,图例,提示等组件,通过柱状图,散点图,拆线图,仪表图,地图等方式静态...

1、CM+CDH构建企业级大数据平台部署基础环境的安装【代码】【图】

一、台安装部署前各项准备 1、安装centos7系统，这个我在vmware里面安装的，具体怎么装这里就不多讲了，我建议安装桌面版本的 2、修改静态IP地址打开终端，首先我们配置动态IP，切换到root用户输入 vim /etc/sysconfig/network-scripts/ifcfg-ens33 然后保存退出，重启网卡，再检查我们的ip地址测试一下网络没有问题现在开始配置静态ip信息 TYPE=Ethernet PROXY_METHOD=none...

大数据新手的0基础学习路线，从菜鸟到高手的成长之路【图】

大数据作为一个新兴的热门行业，吸引了很多人，但是对于大数据新手来说，按照什么路线去学习，才能够学习好大数据，实现从大数据菜鸟到高手的转变。这是很多想要学习大数据的朋友们想要了解的。今天我们就来和大家分享下大数据新手从0开始学习大数据，实现菜鸟到高手的转变的学习路线。希望能够帮助想要学习大数据的朋友。如果你想要学好大数据最好加入一个好的学习环境，可以来这个Q群529867072 这样大家学习的话就比较方便，还能...

计算机网络管理基础服务安装+大数据时代的网络运维【图】

使用yum方式完成服务安装 ___By Nemo（仅供参考） Notice:Apache 安装好之后，我又改回桥接模式用rpm安装了。首先，让你的虚拟机上个网，所以需要把网卡设置成nat模式，在宿主机上先拨个号，设好后重启linux系统。650) this.width=650;" height="222" src="/upload/getfiles/default/2022/11/16/20221116074856009.jpg" width="554" /> 重启后，打开firefox，看是不是能上网。Ok，但nat模式默...

大数据 - 最热教程

python处理大数据你选什么工具? pandas...冲着这份大数据分析案例，我立马下载该...06-大数据性能优化- 长列表优化 /Objec...大数据学习总结（2021版）---shell windows下大数据开发环境搭建（1）——...Python：如何在未排序的列表中查找大于...Python如何处理大数据？3个技巧效率提升...你只知大数据的便利，却不知漏洞——ha...头歌Educoder——大数据Hadoop开发环境...spring boot集成mongodb 分片解决大数据...

首页 / 大数据 / 大数据微专业_1.Python基础_1.7_数据读写

大数据微专业_1.Python基础_1.7_数据读写

内容导读

内容图文

内容总结

内容备注

内容手机端

【大数据微专业_1.Python基础_1.7_数据读写】教程文章相关的互联网学习教程文章

大数据基础

大数据开发Linux基础篇网络配置和系统管理【图】

大数据分析基础——维度模型【图】

Spark修炼之道（基础篇）——Linux大数据开发基础：第五节：vi、vim编辑器（二）【代码】【图】

《大数据技术全解：基础、设计、开发与实践》【图】

博学谷零基础大数据就业班2021

【大数据微职位笔记】模块01-Linux基础知识：（05-12）crontab定时命令详解【代码】【图】

真正的零基础，可以学习大数据吗

【原创】大数据基础之Drill（1）简介、安装及使用【代码】【图】

【原创】大数据基础之Hadoop（3）hdfs diskbalancer【代码】

学习大数据：Java基础篇之多态【代码】【图】

Echarts助力大数据绘制可视化图表零基础入门-针对运维

1、CM+CDH构建企业级大数据平台部署基础环境的安装【代码】【图】

大数据新手的0基础学习路线，从菜鸟到高手的成长之路【图】

计算机网络管理基础服务安装+大数据时代的网络运维【图】

PYTHON - 相关标签

大数据 - 相关标签

大数据 - 最新教程

大数据 - 最热教程