【python – 如何删除CSV文件中的列?】教程文章相关的互联网学习教程文章

使用Python更新csv文件中的现有列和行【代码】

因此,我一直试图在Python中使用csv模块将数据添加到现有的行和列中,但仅将数据添加到每行的特定列中.因此,举个例子,假设我现有的csv文件具有以下内容:id, name, city, age 1, Ed,, 34 2, Pat,, 23因此,基本上每个人的城市都丢失了,所以我想用该人的城市更新每一行.但是,writerow方法似乎只替换了csv文件中的现有数据.将打开文件更改为追加模式只会将数据添加到新行.有什么方法可以跳过现有数据,而仅将城市添加到每一行? 谢谢解决...

python操作csv文件【代码】【图】

CSV(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。由于是纯文本,任何编辑器也都可打开。与Excel文件不同,CSV文件中: 值没有类型,所有值都是字符串 不能指定字体颜色等样式 不能指定单元格的宽高,不能合并单元格 没有多个工作表 不能嵌入图像图表 在CSV文件中,以,作为分隔符,分隔两个单元格。像这样a,,c表示单元格a和单元格c之间有个空白的单元格。依此类推。 不是每个逗号都表示单元格之间的分界。所以即使C...

如何在python的csv文件中识别空白字段?【代码】

我有一个5列的csv文件:1, 2312, "A", , 20 2, 8383, "B", "UK", 3, 3883, , , 45其中的列代表id,customerId,customerName,customerAddress和customerAge.我想在年龄为空白的地方输入0,在其他字符串类型属性为空白的地方输入”.但是我无法识别python中的空白字段.我尝试做一些事情,例如: > len(row [4])== 0>行[4] ==”>行[4] ==无> repr(row [4])==” 但这没用.我究竟做错了什么?解决方法:你不想用 0,None,False,”都不是Truei...

python-在App Engine上将大CSV文件写入GCS【代码】

我正在从Google App Engine数据存储区中提取大量数据(使用Python),并且需要将其写入GCS(Google云存储)上的csv文件中. 我通过使用迭代查询获取约1万个实体并推迟任务来完成此任务.不幸的是,GCS不支持附加到文件,因此,在每次任务运行中,我不得不打开并读取整个文件,将其关闭,然后将内容写入新文件并添加新获取的批处理文件.数据. 我正在使用UnicodeWriter / UnicodeReader处理类似于以下内容的csv文件:https://docs.python.org/2/li...

在Python3 Pandas中读取/导入CSV文件时出现编码问题【代码】

我正在尝试使用熊猫读取电影镜头数据集:http://files.grouplens.org/datasets/movielens/ml-100k/. 我正在使用Python 3.4版,并且正在按照“ http://www.gregreda.com/2013/10/26/using-pandas-on-the-movielens-dataset/”中给出的教程进行操作. 当我尝试使用此处提到的代码读取u.item数据时:# the movies file contains columns indicating the movie's genres # let's only load the first five columns of the file with usec...

Python:循环浏览多个csv文件并制作多个新的csv文件【代码】

我从Python开始,正在查看csv文件. 基本上我的情况是这样的: 我在csv中有X,Y,Z坐标.X Y Z 1 1 1 2 2 2 3 3 3我想通过将用户定义的偏移值添加到所有Z值,并使用已编辑的z值制作一个新文件. 到目前为止,这是我认为正确的代码:# list of lists we store all data in allCoords = [] # get offset from user offset = int(input("Enter an offset value: ")) # read all values into memory with open('in.csv', 'r') as inFile: # inp...

python-使用dask合并csv文件【代码】

我是python的新手.我正在使用dask读取5个大(> 1 GB)的csv文件,并将它们合并(类似SQL)到dask数据帧中.现在,我正在尝试将合并结果写入单个csv中.我在dask数据帧上使用了compute()将数据收集到单个df中,然后调用to_csv.但是,compute()在所有分区上读取数据的速度都很慢.我尝试直接在dask df上调用to_csv,它创建了多个.part文件(我没有尝试将那些.part文件合并到一个csv中).有没有其他选择可以将daf df放入单个csv中,或者可以使用任何参...

在python中合并具有相同类别的csv文件行【代码】

我熟悉用python读写csv文件的基本概念.但是我坚持要为这个问题弄个逻辑.我认为GROUP BY可以解决我的问题,但如何在python中做到Category Data A Once upon a time. A There was a king. A who ruled a great and glorious nation. B He loved each of them dearly. B One day, when the young ladies were of age to be married. B ...

Python-在特定目录中串联CSV文件【代码】

我正在尝试从桌面上的文件夹连接CSV文件:C:\\Users\\Vincentc\\Desktop\\W1 并将最终的CSV输出到:C:\\Users\\Vincentc\\Desktop\\W2\\conca.csvCSV文件没有标题.但是,当我运行脚本时没有任何反应,也没有错误消息.我是一个初学者,有人可以看看下面的代码,非常感谢!import os import glob import pandasdef concatenate(indir="C:\\Users\\Vincentc\\Desktop\\W1",outfile="C:\\Users\\Vincentc\\Desktop\\W2\\conca.csv"):os.chd...

在Python MatPlotLib中生成频率热图,从.csv文件读取X和Y坐标【代码】

我最近偶然发现了一个关于how to generate a heatmap of frequencies in Python using the MatPlotLib module的类似问题. 这篇文章非常有用,我可以让各个脚本运行并为代码固有生成的随机测试数据创建热图.但是,我在修改代码以为正在使用的数据创建热图时遇到麻烦.数据采用逗号分隔格式(.csv). 我目前在此.csv文件中保存了3788对平均质量评级.这些平均质量评级的范围均为0-5.我正在尝试创建一个热图,以x和y轴(0-.499,.5-.999、1-1.4...

在Python中附加到.csv文件【代码】

我正在尝试使用Python写入现有的.csv文件,但我不想将数据附加到现有文件的底部,而是想将新信息附加到.csv文件的新列.原因是我想“无限”遍历代码的读取数据部分,然后将每次循环迭代期间读取的数据添加到新列而不是行中.本质上,我想要以下内容:Row1Iteration1, Row1Iteration2, Row1Iteration3,..., Row1IterationX Row2Iteration1, Row2Iteration2, Row2Iteration3,..., Row2IterationX Row3Iteration1, Row3Iteration2, Row3Iter...

使用Python字典在Python中合并CSV文件【代码】

嗨,我正在尝试根据同一列或主键,通过合并两个CSV文件中的特定字段来创建新的CSV文件.我曾尝试在Powershell中执行相同的操作,但它确实有效,但是完成该过程非常缓慢-合并5000个行文件超过30分钟,因此请在Python中尝试.我是新来的,所以请放轻松. 因此,两个文件是infile.csv和checkfile.csv,创建的输出文件中的列将基于infile.csv中的列.该代码检查checkfile.csv中的值,创建outfile.csv,从infile.csv复制列,并需要根据checkfile.com中的...

如何使用Python打开和处理存储在Google Cloud Storage中的CSV文件【代码】

我正在使用Google Cloud Storage客户端库. 我正在尝试使用以下代码打开和处理CSV文件(已上传到存储桶):filename = '/<my_bucket/data.csv' with gcs.open(filename, 'r') as gcs_file:csv_reader = csv.reader(gcs_file, delimiter=',', quotechar='"')响应csv.reader的第一个参数(即gcs_file),出现错误“参数1必须是迭代器”.显然,gcs_file不支持迭代器.next方法. 关于如何进行的任何想法?我是否需要包装gcs_file并在其上创建一...

python-随机访问csv文件内容【代码】

我正在寻找一种以随机方式访问csv文件单元的方法.如果使用Python的csv模块,则只能遍历所有行,这很慢.我还应该补充一点,该文件非常大(> 100MB),并且我正在寻找响应时间短的文件. 我可以将文件预处理为其他数据格式,以便更快地访问行/列.也许有人以前这样做过,可以分享一些经验. 背景: 我想在Web服务器提供的屏幕上显示csv的摘录(取决于滚动位置).不能将文件保存在内存中.解决方法:我发现SQLite可以胜任此类工作.设置很容易,您可以在...

使用Pandas读取Python中的csv文件块【代码】

我有一个有关读取csv文件的片段的问题.当只使用读取文件时pd.read_csv(path,sep=';',na_values=[''],thousands='.',decimal=',',date_parser=[0])我得到:EUR 1Y 2Y 3Y 0 2013-09-25 0,198 0,307 0,485 1 2013-09-26 0,204 0,318 0,497 2 2013-09-27 0,204 0,306 0,487 3 2013-09-28 0,204 0,306 0,487 4 USD 1Y 2Y 3Y 5 2013-09-25 0,462 0,571 0,749 6 2013-09-26 0,468 ...