【Python bz2未压缩文件大小】教程文章相关的互联网学习教程文章

python-使用带有zip压缩的熊猫read_csv【代码】

我正在尝试在熊猫中使用read_csv从FTP服务器读取压缩文件.压缩文件仅包含一个文件(根据需要). 这是我的代码:pd.read_csv('ftp://ftp.fec.gov/FEC/2016/cn16.zip', compression='zip')我收到此错误:AttributeError: addinfourl instance has no attribute 'seek'我在熊猫18.1和19.0中都收到此错误.我是否缺少某些东西,或者这可能是一个错误?解决方法:尽管我不太确定为什么会收到错误,但是可以通过使用urllib2打开url并将数据写入...

在目录内迭代以使用python压缩文件【代码】

我需要遍历一个文件夹,并找到文件名相同(扩展名除外)的每个实例,然后将每个文件名压缩(最好使用tarfile)到一个文件中. 因此,我有5个文件名为:“ example1”,每个文件具有不同的文件扩展名.我需要将它们拉在一起并将其输出为“ example1.tar”或类似内容. 通过简单的for循环,这将很容易,例如:tar = tarfile.open(‘example1.tar’,”w”)for output in glob (‘example1*’):tar.add(output)tar.close() 但是,有300个“示例...

在python中压缩二进制文件【代码】

我正在尝试在zip文件中包含一个二进制文件,下面是代码段:首先,我将zip内容解压缩到一个临时位置,再添加几个文件,然后将其压缩回新的存档.import zipfiledef test(fileName, tempDir):# unzip the file contents,may contain binary filesmyZipFile=zipfile.ZipFile(fileName,'r')for name in myZipFile.namelist(): toFile = tempDir + '/' + namefd = open(toFile, "w")fd.write(myZipFile.read(name))fd.close()myZipFile.close...

python-比较两个压缩文件的每四行【代码】

我有2个大约1Gb的压缩文件.我想同时读取两个文件,并将两个文件的每四行相互比较.有没有比这更快捷的方法呢?import gzipfile1 = r"path\to\file1.gz" file2 = r"path\to\file2.gz"for idx, (line1, line2) in enumerate(zip(gzip.open(file1), gzip.open(file2)), start=1):if not idx%4:compare(line1, line2)解决方法:您仍然必须遍历两个文件,但这更加干净:import gzip from itertools import islice, izipfile1 = r"path\to\fi...

如何在Python中解压缩嵌套元组?【代码】

尝试从数据结构中将t =((“” foo“,),)的值分配给变量,我发现以下工作原理:((var,),) = t # or [[var]] = t我不知道它是如何工作的. Python是否在左侧创建元组/列表?在源中对相关部分的引用也将被理解.解决方法:Python将递归地从右侧解压缩值. 没有创建元组.而是由编译器解释左侧语法,以弄清楚如何从右侧分配序列. 要查看实际效果,请分解工作分配代码:>>> def foo(): ... ((var,),) = t ... >>> import dis >>> dis.dis...

在Python列表中压缩列表【代码】

我有一个清单清单big_list = [['a1','b1','c1'], ['a2','b2','c3'], ['a3','b3','c3']]如何在列表中压缩列表? 我想做的是zip(list1,list2,list3),但是要动态进行 我相信它必须与我不熟悉的args和kwargs有关,欢迎任何解释 谢谢,解决方法:使用* args参数扩展语法:zip(*big_list)*(闪屏)告诉Python将每个元素都放在一个可迭代的元素中,并将其作为单独的参数应用于函数. 演示:>>> big_list = [['a1','b1','c1'], ['a2','b2','c3'], ...

在Pillow Python中压缩后如何打开图像文件?【代码】

尝试在Pylow-PYTHON中打开和压缩图像时image = Image.open("some_image.jpg");fpath = io.BytesIO(); image.save(fpath,'JPEG',dpi=[300,300], quality=image_quality);compressed_image = Image.open(fpath.getvalue());打开压缩图像时出现以下错误TypeError: embedded NUL character知道我如何打开图像吗?解决方法:使用BytesIO对象本身:In [1]: from PIL import ImageIn [2]: from io import BytesIOIn [3]: image = Image.ope...

python-使用多处理读取,压缩,写入【代码】

我正在压缩文件.一个过程对其中的几个就可以了,但是我要压缩成千上万个过程,这可能(而且已经)花了几天的时间,所以我想通过多处理来加快速度.我有read,我应该避免让多个进程同时读取文件,而且我想我也不应一次写入多个进程.这是我当前运行的方法:import tarfile, bz2, os def compress(folder):"compresses a folder into a file"bz_file = bz2.BZ2File(folder+'.tbz', 'w')with tarfile.open(mode='w', fileobj = bz_file) as tar...

python-通过h5py在hdf5中进行blosc压缩【代码】

我正在使用h5py在python中创建hdf5文件,并且我想使用blosc作为压缩过滤器.我首先通过以下方式从源代码安装了c-blosc:wget https://github.com/Blosc/c-blosc/archive/v1.9.1.tar.gz tar -xvf c-blosc-v1.9.1.tar.gz cd c-blosc-v1.9.1 mkdir build cd build cmake -DCMAKE_INSTALL_PREFIX=/usr/local .. cmake --build . cmake --build . --target install(请注意,否则我将使用自制软件,因此我的/usr/local无需sudo即可写) 然后,我...

python-40GB tar.gz文件中的行数而不进行解压缩?

我在https://ghtstorage.blob.core.windows.net/downloads/mysql-2016-06-16.tar.gz处有超过40 GB的tar.gz文件如何在不解压缩可能在100 GB中的整个文件的情况下找到在tar.gz文件内压缩的CSV文件中的行数?解决方法:如果该tar.gz中只有一个csv文件,则可以将其作为bash一线式: tar -zxOf mysql-2016-06-16.tar.gz | wc -l 它使用tar将存档中的所有文件提取到标准输出(-O,大写o,而不是零),并使用wc来计数行数. 如果有更多文件,并且只...

10 行 Python 代码,批量压缩图片 500 张,简直太强大了【代码】【图】

原文链接:https://www.jianshu.com/u/8f2987e2f9fb这几天,我在用 Github page + hexo 搭建个人网站,为了延续风格,就想把配图与文章一起迁移过去。这时候就出现了一个难题:我所用的图片都是高清大图,放到网站上会严重拖慢加载速度。因此,需要先把图片压缩,再上传。 我把需求概括如下:批量压缩图片,现有约 200 张,后会再增是压缩,不是切割截取,不改变图片尺寸原图片大部分是 10M - 30M,目标是压缩成 1M 以内,越小越好...

在python中按块解压缩文件夹【代码】

我有一个很大的zip文件,其中包含许多文件,我想按块将其解压缩以避免浪费过多的内存. 我尝试使用python模块zipfile,但没有找到一种按块加载存档并将其提取到磁盘上的方法. 有没有简单的方法可以在python中做到这一点? 编辑 @ steven-rumbalski正确指出zipfile可以通过逐个解压缩文件而不加载完整存档来正确处理大文件. 我的问题是我的zip文件位于AWS S3上,我的EC2实例无法在RAM中加载这么大的文件,因此我按块下载它,我想按块将其解...

Python 压缩文件【代码】

def zipDir(dirpath, outFullName): """ 压缩指定文件夹 :param dirpath: 目标文件夹路径 :param outFullName: 压缩文件保存路径+xxxx.zip :return: 无 """ # time.sleep(50) zip = zipfile.ZipFile(outFullName, "w", zipfile.ZIP_DEFLATED) for path, dirnames, filenames in os.walk(dirpath): # 去掉目标跟路径,只对目标文件夹下边的文件及文件夹进行压缩 fpath = path.replace(dir...

使用Python轻松批量压缩图片【代码】【图】

在互联网,图片的大小对一个网站的响应速度有着明显的影响,因此在提供用户预览的时候,图片往往是使用压缩后的。如果一个网站图片较多,一张张压缩显然很浪费时间。那么接下来,我就跟大家分享一个批量压缩图片的方法,只需几行python代码,即可轻松实现图片压缩。 查看原文压缩算法 用到PIL库,PIL是Python平台事实上的图像处理标准库,支持多种格式,并提供强大的图形与图像处理功能。使用如下命令安装: pip install pillow 代...

在python中进行循环和压缩【代码】

我有一个我想理解的代码,我需要帮助.import numpy as np Class_numbers=np.array(['a','b','c']) students_per_class=np.array([10,20,30]) print("Students counts per class:\n{}".format( {x: y for x, y in zip(Class_numbers, students_per_class)}))输出:Students counts per class: {'a': 10, 'b': 20, 'c': 30}我的理解:1-我们使用{}和.format(…)将{}替换为… 这是我的问题: 问题1-我不了解“对于zip中的x,y(类别编号,...

压缩文件 - 相关标签