首页 / PYTHON / Python笔记（三）：文件处理

Python笔记（三）：文件处理

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python笔记（三）：文件处理，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4752字，纯文字阅读大概需要7分钟。

内容图文

初识文件操作

基本要素：

　　1、文件路径：文件在哪

　　　　绝对路径：从根目录下一直找直到找到文件

　　　　相对路径：同一个文件夹下，文件名字

　　2、编码方式：gbk，utf-8.。。

　　　　文件以什么编码存储的，就要以什么编码打开

　　3、操作方式：读、写、追加、读写、写读。。。。

对文件进行操作：

1、打开文件，产生文件句柄

　　2、对文件句柄进行你想要的操作

　　3、关闭文件句柄

python处理文件

读文件：

            1 f = open(file=‘D:\Python3\Luffycity\兼职‘,mode=‘r‘,encoding=‘gbk‘)
2 data = f.read()
3 f.close()

            #
             语法解释
file=‘D:\Python3\Luffycity\兼职‘# 表示文件路径
mode=‘r‘# 表示只读
encoding=‘gbk‘# 表示将硬盘上的010101按照gbk的规则去“断句”，
# 再将“断句”后的每一段010101转换成Unicode的010101，Unicode对照表中有010101和字符的对应关系
# 此处的encoding必须和文件在保存时设置的编码一致，否则会造成乱码
f.read()    # 表示读取所有内容，内容是已经转换完毕的字符串
f.close()   # 表示关闭文件

rb模式读文件：

　　rb是二进制模式，数据读到内存里直接是bytes格式，如果想看内容，需要手动decode，因此在文件打开阶段，不需要指定编码

            1 f = open(file=‘D:\Python3\Luffycity\兼职‘,mode=‘rb‘)
2 data = f.read()
3 f.close()

            #
             语法解释
file=‘D:\Python3\Luffycity\兼职‘# 表示文件路径
mode=‘rb‘# 表示只读
f.read()    # 表示读取所有内容，内容是硬盘上原来以某种编码保存的010101，即：某种编码格式的字节类型
f.close()   # 表示关闭文件

            1 f = open(‘兼职‘,mode=‘rb‘)
2 data = f.read()
3f.close()
45print(data)    # 打印bytes类型   b‘\xd0\xd5\xc3\xfb\t ....‘  6 s = data.decode(‘gbk‘)
7print(s)    # 打印字符串      姓名        地区    身高

如果不知道文件编码，可使用chardet模块判断编码方式

            1
            import
             chardet

            2
            3 result = chardet.detect(open(‘兼职‘,mode=‘rb‘).read())
4print(result)
56# 结果7# {‘confidence‘: 0.99, ‘language‘: ‘Chinese‘, ‘encoding‘: ‘GB2312‘}

注意：

文件操作时，以‘r’或‘rb’模式打开，则只能读，无法写入

硬盘上保存的文件都是某种编码的0101011，打开时需注意：

　　rb，直接读取文件保存时原生的0101010，在python中用字节类型表示

　　r 和 encoding，读取硬盘的0101011，并按照encoding指定的编码格式进行断句，再将断句后的每一段0101010转换成Unicode的01001010，在python中用字符串类型表示

循环文件

            1 f = open(‘兼职‘,mode=‘r‘,encoding=‘gbk‘)
23for line in f:
4print(line)
56 f.close()

写文件

            1 f = open(‘兼职‘,mode=‘w‘,encoding=‘utf-8‘)
2 f.write(‘北大本科   50  微信：1234567‘)
3 f.close()

二进制写

            1 f = open(‘兼职2‘,mode=‘wb‘)
2 f.write(‘北大本科   50  微信：1234567‘.encode(‘utf-8‘))
3 f.close()

注意：

文件操作时，以‘w’或‘wb’模式打开，则只能写，并且在打开的同时会先将内容清空

写入到硬盘上时，必须是某种编码的010101，打开时需注意：

　　wb，写入时需要直接传入以某种方式编码的010101，即：字节类型

　　w 和 encoding，写入时需要传入Unicode字符串，内部会根据encoding指定的编码将Unicode字符串转换为该编码的0010011

追加

　　把内容追加到文件尾部

            1 f = open(‘兼职‘,mode=‘a‘,encoding=‘utf-8‘)
2 f.write(‘\n shanshan 北京 167 47 13333333333‘)
3 f.close()

            1 f = open(‘兼职2‘,mode=‘ab‘)
2 f.write(‘\nshanshan 北京 167 47 13333333333‘.encode(‘gbk‘))
3 f.close()

注意：

文件操作时，以‘a’或‘ab’模式打开，则只能追加，即：在原来的内容的尾部追加内容

写入到硬盘上时，必须是某种编码的0101010，打开时需要注意：

　　ab，写入时需要直接传入以某种编码的010110，即：字节类型

　　a 和 encoding，写入时需要传入Unicode字符串，内部会根据encoding指定的编码将Unicode字符串转换为该编码的0100100

读写模式

            1 f = open(‘兼职‘,mode=‘r+‘,encoding=‘utf-8‘)
2 data = f.read()
3print(data)
4 f.write(‘\n黑姑娘 北京 171 51 13333322222‘)
5 f.close()

　　f.read() 读原内容

　　f.write() 把要写的内容追加到最后面

写读模式

            1 f = open(‘兼职 - 副本‘, mode=‘w+‘, encoding=‘utf-8‘)
2 data = f.read()
3print(data)
4 f.write(‘\nnewline 1 哈哈‘)
5 f.write(‘\nnewline 2 哈哈‘)
67print("content", f.read())
89 f.close()

            #
             输出结果
            #
             这里是一个空行，是print(data)的结果
content   # 并没有读到什么东西，原因是 写完之后光标在最后，f.read()从光标开始读。。。。

　　w+会先把文件清空，再写新内容，相比w模式，之支持一个读功能，还要手动移光标才能读新写的内容，没什么用。。。。

文件操作的其他功能

             1 f = open(‘兼职 - 副本‘,‘r‘,encoding=‘utf-8‘)
 2 3 data = f.fileno()   # 返回文件句柄在内核中的索引值，IO多路复用时用到 4print(data)     # 3 5 6 data = f.flush()    # 把文件从内存buffer里强制刷新到硬盘  返回None 7print(data)
 8 9print(f.readable())     # 判断是否可读10print(f.writable())     # 判断文件是否可写1112 data = f.readline()     # 只读一行，遇到\r或\n为止13print(data)
1415print(f.seekable())     # 判断文件是否可以进行seek操作16 f.seek(7)   # 把操作文件的光标移到指定位置    按字节算17 data = f.read()     # 如果文件是中文，且光标移动到字符中间，会报错18print(f.tell())     # 返回当前文件操作光标位置19print(data)
2021 f.close()

            1
            #
             def truncate()    # 只能在可写的条件下，对原文件进行截取，按字节去截取
            2
            3 f = open(‘截取‘,‘w+‘,encoding=‘utf-8‘)
4 data = f.truncate(6)
56 f.close()

修改文件

　　当把文件存到硬盘上时，就在硬盘上划出一块空间，存数据，下次打开这个文件，seek到某个位置，每修改一个字，就是把原来的覆盖掉，如果要插入，是不可能的，因为后面的数据在硬盘上是不会整体向后移的

想要修改文件，

　　一个是把所有数据读到内存中，进行修改，然后再存到硬盘上；

　　另一个就是边读边改，即：打开旧文件时，同时生成一个新文件，边从旧文件一行一行读，边往新文件一行一行写，遇到需要修改的就修改后再写到新文件，这样不占内存，占硬盘

占硬盘方式

             1 f_name = ‘兼职白领‘ 2 f_new_name = ‘%s.new‘ % f_name
 3 4 old_str = ‘乔亦菲‘ 5 new_str = ‘[乔亦菲 Yifei Qiao]‘ 6 7 f = open(f_name,‘r‘,encoding=‘utf-8‘)
 8 f_new = open(f_new_name,‘w‘,encoding=‘utf-8‘)
 910for line in f:
11# print(line)12if old_str in line:
13         new_line = line.replace(old_str,new_str)
14else:
15         new_line = line
1617    f_new.write(new_line)
1819f.close()
20 f_new.close()

若要新文件覆盖原文件，使用os模块

             1
            import
             os

             2
             3 f_name = ‘兼职白领‘ 4 f_new_name = ‘%s.new‘ % f_name
 5 old_str = ‘乔亦菲‘ 6 new_str = ‘[乔亦菲 Yifei Qiao]‘ 7 8 f = open(f_name,‘r‘,encoding=‘utf-8‘)
 9 f_new = open(f_new_name,‘w‘,encoding=‘utf-8‘)
10for line in f:
11# print(line)12if old_str in line:
13         new_line = line.replace(old_str,new_str)
14else:
15         new_line = line
16    f_new.write(new_line)
1718f.close()
19f_new.close()
2021 os.replace(f_new_name,f_name)    # 把新文件名字改成原文件的名字，就把之前的文件覆盖掉了，Linux使用os.rename

占内存

             1 f_name = ‘兼职白领‘ 2 3 old_str = ‘乔亦菲‘ 4 new_str = ‘[乔亦菲 Yifei Qiao]‘ 5 6 f = open(f_name,‘r+‘,encoding=‘utf-8‘)
 7 8 data = f.read()
 9 new_data = data.replace(old_str,new_str)
1011f.seek(0)
12f.write(new_data)
1314 f.close()

原文：https://www.cnblogs.com/wuyinglianjianjue/p/10322899.html

内容总结

以上是互联网集市为您收集整理的Python笔记（三）：文件处理全部内容，希望文章能够帮你解决Python笔记（三）：文件处理所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1109332.html

来源：【匿名】

【上一篇】python glob.glob()【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python笔记（三）：文件处理】教程文章相关的互联网学习教程文章

自学python笔记冒泡法排序2【代码】

冒泡法排序延伸：# !user/bin/python3 # -*- coding:utf-8 -*- # Author:Guo Zhengbing 18-9-3import random‘‘‘ 冒泡排序算法及其优化冒泡排序的基本特征是只能交换相邻的元素。从下边界开始，一趟扫描下来，可以把当前最大值顶到上边界；如果没有发生交换操作，则表示数组是有序的。 ‘‘‘ # 算法一：基本冒泡排序 def BubbleSort_1(arr):# 外层循环累计排序轮数，同时控制待排序数组的上边界，即A[0..i]为待排序部分# 内...

python笔记14-三元运算符【代码】

a = 1b = 2#下面这个c = a if a>1 else b #和下面是一样的效果if a > 1: c = aelse: c = b#打印偶数s=[]nums = list(range(1,11))for i in nums: if i%2==0: s.append(i)#打印偶数print(s)三元写法：ss = [i for i in nums if i%2==0]print(ss)#这2种是一样的原文：http://www.cnblogs.com/flyskies/p/6958476.html

再识Python笔记（四）【代码】【图】

7.用户输入和while循环7.1函数input()函数input（）让程序暂停运行，等待用户输入一些文本。获取用户输入后，Python将其存储在一个变量中，以方便你使用。在使用函数input()时，都应指定清晰而易于明白的提示。在提示可能超过一行后，可以将提示存储在一个变量中，再将该变量传递给函数input()。其中，运算符+=表示在prompt中字符串末尾附加一个字符串。7.1.1int()获取数值输入函数int()将字符串转为数值，有利于比较。7.1.3求模运...

Python笔记（25）-总结

In [1]: a=1In [2]: b=1In [3]: id(a)Out[3]: 8060008In [4]: id(b)Out[4]: 8060008In [5]: a=1000In [6]: b=1000In [7]: id(a)Out[7]: 19040896In [8]: id(b)Out[8]: 19040824上面的例子可以看到a和b都为1时，他们对应的id是一样的，但是都为1000的时候为什么不一样了呢？这是因为小整数对象池起作用，[-5,257]之间的数字都是小整数对象池。python中为了减少系统资源占用，将常用的数字加入了小整数对象池，只要在这个池中的数字被...

[Python笔记]第十六篇:web框架之Tornado【代码】【图】

Tornado是一个基于python的web框架,xxxxx 安装python -m pip install tornado第一个Tornado程序安装完毕我们就可以新建一个app.py文件,放入下面的代码直接运行就可以了,然后在浏览器访问127.0.0.1:8888import tornado.ioloop import tornado.webclass MainHandler(tornado.web.RequestHandler):def get(self):self.write("Hello, world")application = tornado.web.Application([(r"/", MainHandler), ])if__name__ == "__main__"...

python笔记三（list、tuple、dict、set）【代码】

一、list　　list的增删改查#增， classmates.append("nadech") #在末尾追加一个元素 classmates.insert(1,"aguilera") # 在索引值为1的位置插入#删 classmates.pop() # 从末尾删掉一个元素 classmates.pop(1) # 从索引值为1的位置删掉元素#改 classmates[1] = "aguilera"#查 classmates[1] #查看索引值为1的元素 classmates[-1]#查看最后一个元素　　list的其他操作# 返回列表的长度len(classmates) # 将另外一个列表中的元素添加...

python笔记（1）

★>>> a=5>>> b=3>>> a+b8>>> a=‘5‘>>> b=‘3‘>>> a+b‘53‘ ★三重引号定义多行字符串long_string = """Sing a song of sixpence, a pocket full of rye,Four and twenty blackbirds baked in a pie.When the pie was opened the birds began to sing.Wasn‘t that a dainty dish to set before the king?"""所用的引号可以是双引号也可以是单引号 ★>>> print 3.0 / 21.5在 Python 2 中，做除法的方式称为“整除”（floor div...

python笔记38-使用zmail发各种邮件案例代码【代码】【图】

前言本篇介绍使用zmail发各种格式的邮件，并运行成功的代码，小伙伴们只需更换自己的邮箱就可以运行起来了content_text发送纯文本先从最简单的发送纯文本的邮件开始，调通发送邮件的代码。以腾讯的企业邮箱为例，smtp_host是发送邮箱的smtp服务地址，不同的邮箱不太一样。smtp_host:smtp.exmail.qq.comsmtp_port:465import zmail''' 作者：上海-悠悠 QQ交流群:717225969 ''' mail = {'subject': '邮件主题：Success!', # Anythin...

Python笔记之不可不知【代码】

Python软件已经安装成功有很长一段时间了，也即或多或少的了解Python似乎也很长时间了，也是偏于各种借口，才在现在开始写点总结。起初接触Python是因为公司项目中需要利用Python来测试开发的接口，于是开始了解这门解释性，面向对象，带有动态语义的高级语言，或是脚本语言，或是胶水语言。便在网上找了一个现成的Python爬虫，在本地测试运行成功，将新浪上面的所有博客地址扒取下来。真心想从基础学起，自己写个，于是，有了这份...

python笔记4-if..elif-else条件语句【代码】

python中条件判断使用if else来判断，多分支的话使用if elif ... else,也就是如果怎么怎么样就怎么怎么样，否则就怎么怎么这样，格式如下：#if是布尔类型判断，1个是真1个是假，True，Falses_name="niuhanyang" name2="dashixiong"#s_passwd="123456"name=input("请输入你的名字：")#passwd=input("请输入你的密码：")if s_name==name: #字符串操作：==等于；！=不等于；<大于；>小于；>=大于等于；<=小于等于;and同时满足；or满足...

【python笔记三】python脚本实战---数字密码小游戏

描述：A输入一个数值，输入时该数值已隐藏无法看到，让B猜该数字为多少，数值过小或过大都会提示，并会在最后猜对时统计出共猜了几次。脚本内容：#!/usr/bin/env python#FileName:while1.pyimport getpass #调用模块a = int(getpass.getpass(‘Enter A Number a:‘)) #模块赋值running = Truei = 0while running: b = int(raw_input(‘Enter A number b: ‘)) if a == b: print ‘\033[32mgood...

python笔记(17)--初识面向对象和三大特性（封装/继承/多态）【代码】【图】

内容目录面向对象基本用法好处和应用场景面向对象的三大特性内容详细1.面向对象基本格式# 定义类 class 类名:def 方法名(self,name):print(name)return 123def 方法名(self,name):print(name)return 123def 方法名(self,name):print(name)return 123 # 调用类中的方法 # 1.创建该类的对象 obj = 类名() # 2.通过对象调用方法 result = obj.方法名(‘alec‘) print(result)# 例子 # 定义一个类：Account class Account:# 方法def lo...

python笔记--内置模块【代码】

python常用内置模块类似于函数式编程，函数式编程则完成一个功能，其他代码用来调用即可，提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来说，可能需要多个函数才能完成（函数又可以在不同的.py文件中），n个.py文件组成的代码集合就称为模块。模块分为三种：自定义模块、内置模块、开源模块http://pypi.python.org一、导入模块方法：import module from module.xx.xx import xx from module.xx.xx import xx as rename...