首页 / PYTHON / python批量合并csv文件并筛选特定行存入txt文件

python批量合并csv文件并筛选特定行存入txt文件

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python批量合并csv文件并筛选特定行存入txt文件，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2618字，纯文字阅读大概需要4分钟。

内容图文

批量合并找到3种方式：

open的方式，先读后写入
pandas的concat方法
HDF5

对2文件前2种方式尝试了，第3种方式待试验。采用pandas的concat方法时合并的列会错行，还待进一步找到原因，第一种方式已实现。

1.有几个文件为xlsx格式，需要先转成csv文件。其他都为csv格式。转换代码：

import pandas as pd
import glob

def xlsx_to_csv():
    xlsx_list = [f for f in glob.glob('*.{}'.format("xlsx"))]
    for i in xlsx_list:
        rdata = pd.read_excel(i,index_col=0)
        rdata.to_csv(i.split('.')[0] + '.csv',encoding='gb18030')

if __name__ == '__main__':
    xlsx_to_csv()

2.批量合并文件代码

import os,sys
import time
import glob
import pandas as pd
import xlrd
from xlrd import XLRDError


class ArgsError():
	pass

class concatAndScreenData(object):
    def __init__(self , path =None):
        self.path = path
        self.person_list = []


    def set_path(self):
        if not self.path:
            self.path = os.getcwd()

    def concat_data(self):
        file_list = os.listdir(self.path)
        csv_list = [f for f in file_list if os.path.splitext(f)[1] == '.csv']
        # csv_list = [f for f in glob.glob('*.{}'.format("csv"))]  # 或者glob获取list
        # csv_concat = pd.concat([ pd.read_csv(i , encoding='gb18030') for i in csv_list ],axis=0,ignore_index=False)
        # csv_concat.to_csv('数据源.csv', index = 0 ,encoding= 'gb18030',sep= ',')  # concat合并存在列错位问题待解决
        for i in csv_list:
            fr = open(i, 'rb').read()
            with open('数据源.csv','ab') as f:
                f.write(fr)

    def read_person(self):
        lists = []
        if os.path.exists('人员名单.xlsx'):
            data = xlrd.open_workbook(self.path + '/人员名单.xlsx')
            table = data.sheet_by_name('ty')
            for i in range(table.nrows):
                col = table.row_values(i)
                lists.append(col)
        for i in range(len(lists)):
            self.person_list.append(lists[i][0])
        return self.person_list

    def screen_data(self):
        if os.path.exists('数据源.csv'):
            # df = pd.read_csv('数据源.csv',header= None ,chunksize= 100000 , encoding= 'gb18030',low_memory=False) #header= None 自动加列索引，从0开始
            df = pd.read_csv('数据源.csv',header= None ,chunksize= 100000, encoding= 'gb18030',low_memory=False) #header= None 自动加列索引，从0开始
            for chunk in df:
                chunk.rename(columns={2:'names'},inplace=True)
                filename = open("data.txt",'a',errors='ignore')
                mylist = ''
                for i in range(len(chunk)):
                    k = chunk.iloc[i]['names']
                    if k in self.person_list:
                        for m in chunk.columns.values:
                            mylist = mylist + str(chunk.iloc[i][m])
                            if m != 7:
                                mylist = mylist + ','
                        mylist = mylist + '\n'
                filename.write(mylist)
                filename.close()
        else:
            print(u'文件不存在！')

    def run(self, path = None):
        self.set_path()
        #concat data
        try:
            self.concat_data()
            time.sleep(100)
            self.read_person()
        except ArgsError:
            raise ArgsError(u'文件路径错误或未关闭')
        except IOError or WindowsError:
            raise ArgsError(u'文件路径错误或未关闭')
        # screen data
        self.screen_data()

app = concatAndScreenData()
if __name__ == '__main__':
	app.run(path = None)

内容总结

以上是互联网集市为您收集整理的python批量合并csv文件并筛选特定行存入txt文件全部内容，希望文章能够帮你解决python批量合并csv文件并筛选特定行存入txt文件所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/633191.html

来源：【匿名】

【上一篇】Python学习第三天【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python批量合并csv文件并筛选特定行存入txt文件】教程文章相关的互联网学习教程文章

使用Python模块儿csv快速处理csv文件【代码】

代码如下:1import csv 2 with open(‘test.csv‘,newline=‘‘) as f: 3 reader = csv.reader(f) 4 for row in reader: 5 print(row)原文：https://www.cnblogs.com/frisk/p/11567103.html

1. 打开csv文件import csv #打开csv文件 allElectronicsData = open("AllElectronics.csv","r",encoding=‘utf-8‘)这里的“AllElectronics.csv”是文件名2. 按行读取文件#按行读取文件 reader = csv.reader(allElectronicsData)3. 读取表格第一行的标题#读取第一行的表格title headers = next(reader) 这里区别于Python2#Python2中的写法 headers = reader.next()4. 将文件变成可查询的字典表格#将scv表格文件中的每一行元素转...

在Qt中调用python,读取csv文件，实现K近邻算法(一)【代码】【图】

目录：1.从Qt中调用py脚本里的一个无参函数，功能：打印"hello python"　　a)相关配置　　b)踩过的一些坑2.从Qt中调用py脚本里的一个有参函数并接收返回值，功能：实现 return a+b3.从py中读取csv文件，并进行一些切片分类处理4.在py中编写K近邻算法正文：1.首先在Qt中创建一个Qt Widgets Application(当然其他的也行) 我电脑里面的是python35，64位的，所以要用64位去编译它，不然会出错。这里我用的是 2.然后在项目中添加一个...

数学建模之Python操作csv文件【代码】

1.用Python通过csv文件里面的某一列，形成键值，然后统计键在其他列出现的次数。import pandas as pd import numpy as np import csv import codecs import sysdata_original = pd.read_csv('D:/csv_data_original.csv') data = pd.read_csv('D:/week1.csv') #data = data['retweeted_status_mid'].fillna('NOT PROVIDED',inplace=True) #data_transpond = data[data['retweeted_status_mid'] != 'NOT PROVIDED']#每条原创微博转发...

[Python Study Notes]pd.read_csv()函数读取csv文件绘图【代码】【图】

‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘ >>文件: pandas读取csv文件.py >>作者: liu yang >>博客： liuyang1.club >>邮箱: liuyang0001@outlook.com >>博客: www.cnblogs.com/liu66blog‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘...

用Python将处理数据得到的csv文件分类（按顺序）保存

用Python中的os和numpy库对文件夹及处理数据后得到的文件进行分类保存；import numpy as npimport osfor m in range(699,0,-35):　　cur_dir=‘F:/2019_09_01/‘　　folder_name=‘partdata_0_‘　　if not os.path.exists(cur_dir+folder_name+str(m)):　　　　os.mkdir(os.path.join(cur_dir,folder_name+str(m)))　　else:　　　　pass　　for j in range(4,11):　　　　np.savetxt(os.path.join(‘F:/2019_09_01/partdata_0_‘...

Python读取csv文件【代码】【图】

创建一个csv文件，命名为data.csv，文本内容如下：root,123456,login successfully root,wrong,wrong password wrong,123456,nonexistent username ,123456,username is null root,,password is null使用Excel打开如图：利用Python内置的csv读取内容：import csvwith open('data.csv', 'r', encoding='utf-8')as f:reader = csv.reader(f)for i in reader:print(i) 输出结果：['root', '123456', 'login successfully'] ['root', '...

python 实现将字典写入csv文件

shutdown={"yunfeiyang":{"username":"yunfeiyang","binding_house":{0:"1",1:"2"},"register_time":"2018-20"}}import csvcsvfile = file(‘csvtest.csv‘, ‘wb‘)writer = csv.writer(csvfile)writer.writerow([‘username‘,‘binding_hourse‘,‘register_time‘])list1=[]for i in shutdown.values(): s=tuple(list(i.values())) list1.append(s)writer.writerows(list1)原文：http://linuxnewstar.blog.51cto.com/6967359/1...

python读取csv文件示例(python操作csv)

复制代码代码如下:import csvfor line in open("test.csv"):name,age,birthday = line.split(",")name = name.strip(‘ \t\r\n‘);age = age.strip(‘ \t\r\n‘);birthday = birthday.strip(‘ \t\r\n‘); print (name + ‘\t‘ + age + ‘\t‘ + birthday)csv文件复制代码代码如下:alice, 22, 1992/03/05bob, 33, 1981/11/21cart, 40, 1974/07/13原文：http://www.jb51.net/article/47964.htm

在python中使用Hadoop处理大型csv文件【代码】

我有一个巨大的CSV文件,我想在Amazon EMR(python)上使用Hadoop MapReduce处理. 该文件有7个字段,但是,我只查看日期和数量字段."date" "receiptId" "productId" "quantity" "price" "posId" "cashierId"首先,我的mapper.pyimport sysdef main(argv):line = sys.stdin.readline()try:while line:list = line.split('\t')#If date meets criteria, add quantity to express keyif int(list[0][11:13])>=17 and int(list[0][11:13])<=...

方法示例Python如何把字典写入到CSV文件的【代码】【图】

【相关学习推荐：python教程】在实际数据分析过程中，我们分析用Python来处理数据（海量的数据），我们都是把这个数据转换为Python的对象的，比如最为常见的字典。比如现在有几十万份数据（当然一般这么大的数据，会用到数据库的概念，不会去在CPU内存里面运行），我们不可能在Excel里面用函数进行计算一些值吧，这样是不现实的。Excel只适合处理比较少的数据，具有方便快速的优势那么我们假设是这么多数据，现在我要对这个数据进行...

python中怎么读取csv文件【图】

Python读取CSV文件方法如下：如下是一个CVS文件使用Python打开CSV可以直接使用open函数打开，然后使用reader函数读取内容，实现代码如下：运行结果如下：更多Python相关技术文章，请访问Python教程栏目进行学习！以上就是python中怎么读取csv文件的详细内容，更多请关注Gxl网其它相关文章！

python怎么读取和写入csv文件【图】

Python读取与写入CSV文件需要导入Python自带的CSV模块，然后通过CSV模块中的函数csv.reader()与csv.writer()来进行CSV文件的读取与写入。写入CSV文件import csv # 需要import csv的文件包 out=open("aa.csv",wb) # 注意这里如果以‘w’的形式打开，每次写入的数据中间就会多一个空行，所以要用‘wb’ csv_write=csv.write(out,dialect=excel) # 下面进行具体的内容写入 ss=[a,3] csv_write.writerow(ss) #这样ss里...

python怎么读取csv文件【图】

Python读写csv文件前言逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条记录由字段组成，字段间的分隔符是其它字符或字符串，最常见的是逗号或制表符。通常，所有记录都有完全相同的字段序列....

Python如何读取csv文件【图】

逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。（推荐学习：Python视频教程）CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条记录由字段组成，字段间的分隔符是其它字符或字符串，最常见的是逗号或制表符。通常，所有记录都有完全相同的字...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python批量合并csv文件并筛选特定行存入txt文件

python批量合并csv文件并筛选特定行存入txt文件

内容导读

内容图文

内容总结

内容备注

内容手机端

【python批量合并csv文件并筛选特定行存入txt文件】教程文章相关的互联网学习教程文章

使用Python模块儿csv快速处理csv文件【代码】

Python3的学习笔记1：csv文件的相关操作【代码】

在Qt中调用python,读取csv文件，实现K近邻算法(一)【代码】【图】

数学建模之Python操作csv文件【代码】

[Python Study Notes]pd.read_csv()函数读取csv文件绘图【代码】【图】

用Python将处理数据得到的csv文件分类（按顺序）保存

Python读取csv文件【代码】【图】

python 实现将字典写入csv文件

python读取csv文件示例(python操作csv)

在python中使用Hadoop处理大型csv文件【代码】

方法示例Python如何把字典写入到CSV文件的【代码】【图】

python中怎么读取csv文件【图】

python怎么读取和写入csv文件【图】

python怎么读取csv文件【图】

Python如何读取csv文件【图】

PYTHON - 相关标签

文件 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程