【Python:从文本文件中过滤包含特定单词的行】教程文章相关的互联网学习教程文章

python – 从文本文件中检索匹配的字符串【代码】

我有以下文本文件,我想检索括号中的数字ID&number:Track_number(12930)_ ID&number:Track_number(394839)_ ID&number:Track_number(958236)_所以我试过这个import refile = open("text.txt", "r")text = file.read()file.close()pattern = re.compile(ur'Track_number(.*)_', re.UNICODE)string = pattern.search(text).group(1)print string但它只显示第一个结果:(12930).我想知道是否有可能列出所有匹配结果.谢谢解决方法:例如,...

从Python中复制多个文本文件中的列【代码】

我有大量的文本文件包含排列成固定数量的行和列的数据,列由空格分隔. (像.csv一样,但使用空格作为分隔符).我想从每个文件中提取一个给定的列,并将其写入一个新的文本文件. 到目前为止,我尝试过:results_combined = open('ResultsCombined.txt', 'wb')def combine_results():for num in range(2,10): f = open("result_0."+str(num)+"_.txt", 'rb') # all the text files have similar filename styleslines = f.readlines() # ...

使用Python从文本文件中提取数据【代码】

所以我有一个大文本文件.它包含以下格式的一堆信息:|NAME|NUMBER(1)|AST|TYPE(0)|TYPE|NUMBER(2)||NUMBER(3)|NUMBER(4)|DESCRIPTION|对不起,模糊不清.所有信息的格式如上,每个描述符之间是分隔符“|”.我希望能够在文件中搜索“NAME”并在其自己的标签中打印每个描述符,例如:Name Number(1): AST: TYPE(0): etc....如果我仍然感到困惑,我希望能够搜索名称,然后打印出每个被“|”分隔的信息. 有人可以帮忙吗? 编辑以下是文本文件...

Python,并行处理大型文本文件【代码】

样本记录在数据文件(SAM文件)中:M01383 0 chr4 66439384 255 31M * 0 0 AAGAGGA GFAFHGD MD:Z:31 NM:i:0 M01382 0 chr1 241995435 255 31M * 0 0 ATCCAAG AFHTTAG MD:Z:31 NM:i:0 ......>数据文件是逐行的>数据文件的大小从1G??到5G不等. 我需要逐行查看数据文件中的记录,从每一行获取一个特定值(例如第4个值,66439384),并将此值传递给另一个函数进行处理.然后一些结果计数器将被更新. 基本工作流程是这样的:...

python – 如何只读取文本文件中的特定行?【代码】

参见英文答案 > load a certain number of rows from csv with numpy 3个我正在尝试处理存储在文本文件中的数据,该文件看起来像这个test.dat:-1411.85 2.6888 -2.09945 -0.495947 0.835799 0.215353 0.695579 -1411.72 2.82683 -0.135555 0.928033 -0.196493 -0.183131 -0.865999 -1412.53 0.379297 -1.00048 -0.654541 -0.0906588 0.401206 0.44239 ...

Python搜索文本文件和替换【代码】

我想从textfile1.txt中获取一个单词列表,并将textfile2.txt上的单词“example”替换为第一行,第二行等文本的内容.我将如何做到这一点? 文本文件textfile1.txtuser1 user2 user3 user4 user5文本文件textfile2.txturl/example url/example url/example url/example url/example到目前为止我有什么#!/usr/bin/env python3 import fileinputwith fileinput.FileInput("textfile2.txt", inplace=True ) as file:for line in file:prin...

使用python从文本文件导入数据【代码】

我有一个包含行和列数据的文本文件(总共约17000行).每列的长度都是统一的字符数,“未使用的”字符用空格填充.例如,第一列长度为11个字符,但该列中的最后四个字符始终为空格(因此,当使用文本编辑器查看时,它看起来是一个很好的列).如果条目小于7个字符,有时它超过4个. 这些列不以逗号,制表符或空格分隔.它们也不是所有相同数量的字符(前两个是11,接下来的两个是8,最后一个是5 – 但是,有些是空格). 如果第二列在其中包含字符串’OW...

python – 在大文本文件中查找重复记录【代码】

我在Linux机器(Redhat)上,我有一个11GB的文本文件.文本文件中的每一行都包含单个记录的数据,该行的前n个字符包含记录的唯一标识符.该文件包含超过2700万条记录. 我需要验证文件中没有多个具有相同唯一标识符的记录.我还需要在80GB的文本文件上执行此过程,因此任何需要将整个文件加载到内存中的解决方案都不实用.解决方法:逐行读取文件,因此您不必将其全部加载到内存中. 对于每一行(记录),创建一个sha256哈希(32字节),除非您的标识符...

Python:如何将三个文本文件添加到一个变量中,然后将其拆分为一个列表【代码】

我正在使用Python 2.5并尝试创建一个名为total的变量并向其中添加三个文件.然后我压缩总数并将其转换为十六进制并将其拆分为最大长度为4096个字符的字符串列表. 目前我有一个文件列表,我以这种方式将它连接到总数filelist = ['debug.log', 'error.log', 'reclog.log']; total = '' for files in filelist:f = open(files, 'r');total = total + f.read();f.close(); compressedtotal = zlib.compress(total); hextotal = compresse...

python – 从web2py中的私人文件夹打开文本文件【代码】

我需要在web2py中为我的搜索引擎脚本打开一个数据库(.txt格式). 我无法访问在线数据库,因为我使用的是pythonanywhere的免费版本.import urllib infile=urllib.urlopen('http://database.net') for line in infile:现在我将数据库上传到“私有”文件夹,我想知道如何访问它.这看起来像一个简单的问题,但我似乎无法工作. 我需要这样的东西:infile = open('searchapp/private/database.txt') for line in infile:什么是好的解决方案?...

python – 文本文件之间的交集【代码】

如何根据原始文本计算两个文本文件之间的交集?解决方案是使用shell命令还是用Python,Elisp或其他常用脚本语言表达并不重要. 我知道comm和grep -Fxv -f file1 file2.两者都假设我对线的交叉感兴趣,而我对字符的交集感兴趣(在计算匹配所需的字符数上最少). 奖励点为效率. 例 如果文件1包含foo bar baz-fee和文件2包含fee foo bar-faa那我想看看 > foo吧>费用 假设最小匹配长度为3.解决方法:您正在寻找Python的difflib模块(在标准库中...

python – read()文本文件的不同输出【代码】

这段代码的结果:!/usr/bin/python from sys import argv script, file = argv apertura = open(file,'r')for a in apertura:print(apertura.read())是:quarta quinta sesta settima ottava nona我想用read()打印整个文件.上面的代码跳过一些行.为什么? 文件内容如下:prima seconda terza quarta quinta sesta settima ottava nona解决方法:问题是你混合了两种读取文件的方法.for a in apertura: # this reads in the ...

如何在程序结束后将控制台打印到文本文件(Python)?【代码】

我有一个程序通过print语句向控制台输出许多计算和结果.我想编写一些代码来将控制台的所有内容导出(或保存)到一个简单的文本文件中. 我搜索了StackOverflow和其他网站,但我找到了一些方法来重定向print语句直接打印到文件,但我希望程序正常工作,向控制台显示输出,然后在程序的所有操作后保存其内容完成. 如果重要的话,我正在使用PyCharm和Python2.7解决方法:好吧,通常要完成它,你必须重写python print内置函数.但是……有ipython,它...

Pythonic从这个文本文件中提取值的方法【代码】

我有一个遗留软件的输出文件,如下所示.我想从中提取值,例如,我可以将名为direct_solar_irradiance的变量设置为648.957,并将目标地面压力设置为1013.00. 到目前为止,我一直在提取单个行并像下面那样处理它们(对于我想要提取的不同值重复多次):values = lines[97].split() self.irradiance_direct, self.irradiance_diffuse, self.irradiance_env = values但是,我现在发现,当选择某些参数时,会在输出的中间添加额外的行.这意味着,当...

python – 无法将长JSON输出写入文本文件【代码】

我有一个长字符串(8,315个字符)的JSON,但我似乎无法使用Python将其写入.txt文件而不会被截断. 我将JSON写入文本文件,然后通过FTP上传,但我的系统上的.txt文件和FTP服务器上的.txt文件都被截断了. 这是代码: # Upload the results host = ftputil.FTPHost('ftp.website.com', 'username', 'password') jsonOutput = json.dumps(full_json) f = open('C:/Comparison.txt', 'w') f.write(jsonOutput) host.upload('C:/Comparison.txt...