【几行Python代码快速解析、整理上万份数据文件】教程文章相关的互联网学习教程文章

python – 具有空本地的exec中的列表解析:NameError【代码】

请考虑以下代码段:def bar():return 1 print([bar() for _ in range(5)])它给出了预期的输出[1,1,1,1,1]. 但是,如果我尝试在空环境中执行相同的代码片段(locals和globals都设置为{}),则会给出NameError:if 'bar' in globals() or 'bar' in locals():del bar # make sure we reset settingsexec(""" def bar():return 1 print([bar() for _ in range(5)]) """, {}, {})NameError: name 'bar' is not defined如果我调用exec(如exec...

使用python解析C代码

我有一个巨大的C文件(~100k行),我需要能够解析.主要是我需要能够从其定义中获取有关每个结构的各个字段的详细信息(如结构中每个字段的字段名称和类型).是否有一个好的(开源,我可以在我的代码中使用)方式来做到这一点?或者我应该为此编写自己的解析器.如果我必须自己写,有人可以提出一个好的起点吗?我之前从未使用过python. 谢谢解决方法:查看this link以获取可用于Python的广泛解析工具列表.具体来说,要解析c代码,请尝试pycparse...

如何用python和beautifulsoup解析html表并写入csv【代码】

我尝试解析html页面并获取货币值并写入csv.我有以下代码:#!/usr/bin/env pythonimport urllib2 from BeautifulSoup import BeautifulSoupcontenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily" soup = BeautifulSoup(urllib2.urlopen(contenturl).read())table = soup.find('div', attrs={'class': 'content'})rows = table.findAll('tr') for tr in rows:cols = tr.findAll('td')for td in c...

你会如何解析缩进(python风格)?

如何定义解析器和词法分析器规则来解析使用缩进来定义范围的语言. 我已经google了一下,通过在词法分析器中生成INDENT和DEDENT令牌,找到了一种解析它的聪明方法. 如果我谈到一些有趣的东西,我会更深入地研究这个问题并发表答案,但我希望看到解决问题的其他方法. 编辑:正如查理所指出的那样,there is already another thread very similar if not the same.我的帖子应该被删除吗?解决方法:这是一种假设,因为它取决于你的词法分析器...

python – BeautifulSoup解析器无法访问html元素【代码】

我试图刮掉所有列表的hrefs.我对beautifulsoup相当新,之前做过一些刮痧,但之前做过一些刮痧.但我不能为我的生活提取.见下面我的代码.运行此脚本时,容器的长度为零. 我也尝试选择价格(soup.findAll(“span”,{“class”:“amount”}),但它没有反映.欢迎任何建议:)import urllib.request import urllib.parse from bs4 import BeautifulSoupurl = 'https://www.takealot.com/computers/laptops-10130' headers = {} headers['Use...

python – 解析并计算仅包含数字的xml文本,包括e-00或e 01【代码】

我是一个Python新手.我试图解析xml文件并计算所有数字的文本输入,包括使用e或e的近似值.例如.鉴于下面的伪代码(jerry.xml),<data> <country name="Liechtenstein"><rank updated="yes">2</rank><language>english</language><currency>1.21$/kg</currency> <gdppc>141100</gdppc><gdpnp>2.304e+0150</gdpnp><neighbor name="Austria" direction="E"/><neighbor name="Switzerland" direction="W"/> </country> <country name="Sing...

python – 如何读取,从Superbible Opengl解析SBM文件格式【代码】

呼吁专家,大师和任何人帮助在python中读取和解析文件. 在第6版的第751页上.或第7版的第800页. Superbible OpenGL有附录B. SBM文件格式似乎在一定程度上解释了格式. 我试图在python中实现这种文件格式的读者. 好的,已经取得了进展.我已将Rabbid76惊人的代码合并到提供的源代码中.虽然我试图取得进一步的进展. 更新于2019年6月23日 – 重大进展,修复了关于glVertexAttribPointer的错误(i,…错误. 同一天,修复了Python无法找到变量的第...

Python中的列表解析中的多个If / else【代码】

我有这个s = ['son','abc','pro','bro'] b = ['son','bro'] c = ['pro','quo']预期的产出就是这个.如果输出中的项目是索引(item_in_s),则列表b中存在项目.或索引(item_in_s)10如果项目在c中.[0,12,3]我试过这个:index_list = [s.index(item) if item in b else s.index(item)+10 if item in c for item in s] print(index)但显然这是一个语法错误.所以我尝试了这个:index_list = [s.index(item) if item in b else s.index(item)...

用Python解析这个日期:2010年11月5日【代码】

我今天的日期解析和格式化时间很糟糕. 有人可以将这个日期格式解析为datetime.date或datetime.datetime的点(我不是太挑剔但我更喜欢.date): 2010年11月5日解决方法:使用dateutil:In [2]: import dateutil.parser as dparserIn [3]: date = dparser.parse('5th November 2010')In [4]: date Out[4]: datetime.datetime(2010, 11, 5, 0, 0)

试图用Python解析JSON. ValueError:期望属性名称【代码】

参见英文答案 > Single vs double quotes in JSON 8个我试图将JSON对象解析为Python dict.我以前从未这样做过.当我搜索这个特定错误时,(第一个char有什么问题?),其他帖子说加载的字符串实际上不是JSON字符串.不过,我很确定这是. 在这种情况下,eval()工作正常,但我想知道是否有更合适的方法? 注意:此字符串直接来自Twitter,通过ptt工具.>>> import json >>> line = '{u\'follow_request_sent...

Python配置解析器(重复密钥支持)【代码】

所以我最近开始为我正在研究的Python项目编写一个配置解析器.我最初避免使用configparser和configobj,因为我想支持这样的配置文件:key=value key2=anothervaluefood=burger food=hotdog food=cake icecream简而言之,这个配置文件将经常通过SSH命令行进行编辑.因此我不想对间距进行制表或挑剔(如YAML),但我也希望避免使用多个值(容易10个或更多)的行在vi中换行.这就是我想支持重复键的原因. 一个我理想的世界,当我向Python配置对象...

python – pyspark解析固定宽度的文本文件【代码】

试图解析固定宽度的文本文件. 我的文本文件如下所示,我需要一个行id,日期,字符串和整数:00101292017you1234 00201302017 me5678我可以使用sc.textFile(path)将文本文件读取到RDD.我可以使用解析的RDD和模式createDataFrame.这是在这两个步骤之间的解析.解决方法:Spark的substr功能可以处理固定宽度的列,例如:df = spark.read.text("/tmp/sample.txt") df.select(df.value.substr(1,3).alias('id'),df.value.substr(4,8).alias('d...

使用python中的引号解析逗号分隔的csv文件【代码】

下面我有一个字符串,表示从csv文件中提取的单行.每列用逗号分隔,值包含在“”中.解析python中每列的值的最简单方法是什么?"Mr","Bob","","Boberton","","President","","","","Blah, Inc. of Iowa","blah blah blah","","Grand Island","Hall County","NE","68801","7228","United States","308-111-1111","","","P.O. BOX 1111","","Grand Island","Hall County","NE","11111","1111","United States","","40.00000","-98.0000",...

Python – 解析JSON数据集【代码】

我试图解析一个看起来像这样的JSON数据集:{"data":[{"Rest":0,"Status":"The campaign is moved to the archive","IsActive":"No","StatusArchive":"Yes","Login":"some_login","ContextStrategyName":"Default","CampaignID":1111111,"StatusShow":"No","StartDate":"2013-01-20","Sum":0,"StatusModerate":"Yes","Clicks":0,"Shows":0,"ManagerName":"XYZ","StatusActivating":"Yes","StrategyName":"HighestPosition","SumAvai...

python解析http响应(字符串)【代码】

我正在使用python 2.7,我想解析我已经从文本文件中提取的字符串HTTP响应字段.什么是最简单的方法?我可以使用BaseHTTPServer解析请求,但无法找到响应的内容. 我的回答非常标准,并采用以下格式HTTP/1.1 200 OK Date: Thu, Jul 3 15:27:54 2014 Content-Type: text/xml; charset="utf-8" Connection: close Content-Length: 626提前致谢,解决方法:您可能会发现这很有用,请记住,HTTPResponse并非设计为“由用户直接实例化”. 另请注意...