【扔掉压缩工具,让我们用Python管理压缩包,方便快捷】教程文章相关的互联网学习教程文章

Python:是否有语法级支持解压缩,从元组,到* anonymous *函数的参数?【代码】

假设我们有以下内容:args = (4,7,5) def foo(a,b,c): return a*b%cPython方便地允许元组解包:foo(4,7,5) # returns 3 foo(*args) # returns foo(4,7,5), i.e. 3所以我们不必这样做:foo(t[0], t[1], t[2]) # a repulsive, verbose, and error-prone synonym现在假设我们有一个类似的3元组列表,并希望每个元组t都有一个foo(t)列表.有“一种明显的方法”:list(map(lambda t: foo(*t), listoftuples))但现...

python – 如何在不解压缩内容的情况下查看.tar.gz存档中特定文件的内容?【代码】

对于前abc.tar.gz有 ABC / FILE1.TXTABC / FILE2.TXTABC / ABC1 / file3.txtABC / ABC2 / file4.txt 我需要读取/显示file3.txt的内容而不解压缩文件. 感谢您的任何意见.解决方法: import tarfile spam = tarfile.open( "abc.tar.gz" ) if "abc/abc1/file3.txt" in spam.getnames():with spam.extractfile( "abc/abc1/file3.txt" ) as ham:print ham.read()见tarfile.

Python元组列表,需要解压缩和清理【代码】

假设你有一个列表如 x = [(‘Edgar’,),(‘Robert’,)] 什么是最有效的方式来达到字符串’埃德加’和’罗伯特’? 例如,不要真的需要x [0] [0].解决方法:简单的解决方案,在大多数情况下最快.[item[0] for item in x] #or [item for (item,) in x]或者,如果您需要一个功能接口来索引访问(但稍慢):from operator import itemgetterzero_index = itemgetter(0)print map(zero_index, x)最后,如果序列太小而无法放入内存中,则可以迭代...

python – 压缩“n”时间对象成员调用【代码】

有没有非显式的方法来调用一个成员n次对象? 我正在考虑一些map / reduce / lambda方法,但我无法找到一种方法来做到这一点 – 如果有可能的话. 只是为了添加上下文,我正在使用BeautifulSoup,我正在从html表中提取一些元素;我提取了一些元素,然后是最后一个元素. 因为我有:# First value print value.text# Second value value = value.nextSibling print value.text# Ninth value for i in xrange(1, 7):value = value.nextSiblin...

如何在Python中压缩大文件?【代码】

我遇到的问题是存储文件的名称.存储的文件未使用原始/未压缩文件名命名.而是使用存档名称(附加的“.gz”扩展名)命名存储的文件. 预期结果:file.txt.gz {存档名称}…. file.txt {存储文件名} 实际结果:file.txt.gz {存档名称}…. file.txt.gz {存储文件名} 阅读gzip文档(https://docs.python.org/2.7/library/gzip.html)示例代码:import gzip import shutil with open('file.txt', 'rb') as f_in, gzip.open('file.txt.gz', 'wb'...

Python – 在数百个大型gzip压缩文件中搜索项目

不幸的是,我正在处理一个非常大的语料库,它实际上已经传播到数百个.gz文件中 – 价值24千兆字节(打包). Python真的是我的母语(哈)但是我想知道我是否还没遇到过需要学习“更快”语言的问题? 每个.gz文件包含一个纯文本的单个文档,大约56MB gzip压缩,大约210MB解压缩. 每一行都是n-gram(bigram,trigram,quadrigram等),右边是频率计数.我需要基本上创建一个文件,存储每个四字组的子串频率以及它的整串频率计数(即4个单字节频率,3个双...

使用Python压缩PDF

所以我在一个文件夹中有很多pdf,我想以递归方式(使用os.path.walk)缩小它们.我看到adobe pro有一个缩小尺寸的保存.我能用这个/你怎么建议我这样做. 注意:是的,我希望它们保留为pdf,因为我发现它是最常用和安装的文件查看器.解决方法:从用于pdfsizeopt的project’s GitHub page开始,这是用Python编写的:pdfsizeoft is a program for converting large PDF files to small ones. More specifically, pdfsizeopt is a free, cross-p...

python – 在带有列表和迭代的文件中压缩行【代码】

我想创建一个字典,其中的键是从列表键中获取的,值是从多个文本文件中获取的行列表.我们假设列表键和要读取的所有文件具有相同的行数. 如何同时迭代列表键和每个文件的行?我的想法是使用zip(),但这对我没用. 我知道我可以使用以下方法迭代文件中的行:currFile = open('myfile.txt', 'r') for line in currFile:# Do something而且我知道我可以同时迭代两个列表:for foo, bar in zip(foos, bars):# Do something但这不起作用:myD...

如何在python中压缩一个非常大的文件【代码】

我想使用python压缩一些可能达到99 GB左右的文件.请问使用zipfile库最有效的方法是什么.这是我的示例代码with gcs.open(zip_file_name, 'w', content_type=b'application/zip') as f:with zipfile.ZipFile(f, 'w') as z:for file in files:is_owner = (is_page_allowed_to_visitor(page, visitor) or (file.owner_id == visitor.id) )if is_owner:file.show = Trueelif file.available_from:if file.available_from > datetime.no...

python – Seaborn – 为零计数类别压缩小提琴图【代码】

在布置小提琴图时,是否有一种简单的方法可以忽略零计数类别.在下面的示例中,没有“是:红色”和“否:绿色”的情况,但小提琴图仍然会绘制“缺失”类别.我可以看到为什么这应该是默认行为,但有没有办法改变色调中使用的因子来抑制它并删除空格?df = pd.DataFrame({'Success': 50 * ['Yes'] + 50 * ['No'], 'Category': 25 * ['Green'] + 25 * ['Blue'] + 25 * ['Green'] + 25 * ['Red'],'value': np.random.randint(1, 25, 100)} )...

python – 信号压缩【代码】

我需要“压缩”代表信号的python数组的大小.信号如下图所示.signal = [[0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1], #time values[1,1,1,2,3,4,4,4,4,2,1,1] #function values]压缩后,信号应如下面的代码所示.signal_compressed = [[0.0,0.2,0.3,0.4,0.5,0.8,0.9,1.0,1.1], #time values[1,1,2,3,4,4,2,1,1] #function values]您会看到,如果存在具有常量值的区域,则仅存储该区域的第一个和最后一个值. 我写了以下算法来做到...

python – django css和js文件在heroku上压缩gzip

我正在尝试压缩我的css和js文件并作为gzip文件,但没有成功. 我尝试了所有方法,django-pipeline,django-compressor等. 我有django-compressor来创建gzip文件,但我不知道如何为它们服务.我使用GzipMiddleaware来压缩和提供我的html文件. 任何人都可以写一步一步指导gzip如何在heroku django上提供静态文件. 很抱歉要求详细的步骤,我不是要求用勺子喂,但是我现在已经坚持了这个问题将近24小时,尝试了许多解决方案,但似乎都没有. 仅供参...

python – 记录并压缩subprocess.call的输出【代码】

我想将subprocess.call(…)的输出重定向到xz或bzip2压缩文件. 我试过了 :with lzma.open(log_path, "x") as log_file:subprocess.call(command, stdout=log_file, stderr=log_file)但生成的文件不是有效的XZ压缩文件:$xzcat logfile.xz xzcat : logfile.xz: Format de fichier inconnu(用法语表示“未知文件格式”). 当我只使用cat时,文件显示正确,最后有一些奇怪的数据(在脚本中启动的命令是rsync):& cat logfile.xz sending i...

python – 压缩集合【代码】

如何在Clojure中压缩两个序列? IOW,Python zip(a,b)的Clojure等价物是什么? 编辑:我知道如何定义这样的功能.我只是想知道标准库是否已经提供了这样的功能. (如果没有,我会非常惊讶.)解决方法:您可以轻松定义Python的zip函数:(defn zip[& colls](apply map vector colls))在(zip a b)的情况下,这变成(地图矢量a b)

如何在python中将图像转换为16bit zip(deflate)压缩TIF?【代码】

我们从服务器中的工业传感器获得了50TB的16位无压缩TIF图像,我们希望使用python将它们压缩为无损压缩.使用python因为使用Python来传递我们的数据库更容易. 然而,经过数小时的搜索和文档阅读,我发现甚至没有一个成熟的python库可以将16位TIF转换为zip压缩的tif.最新的PIL无法将压缩的tif,OpenCV硬编码输出文件写入LZW,而不是zip(deflate).并且在smc.freeimage,PythonImageMagick中没有足够的文档,所以我不知道他们是否可以做到.我也...