【python中的列表解析和生成表达式】教程文章相关的互联网学习教程文章

python-用前缀的标记解析.xml? xml.etree.ElementTree【代码】

我可以读取标签,除非有前缀.我没有运气寻找上一个问题. 我需要阅读media:content.我尝试了image = node.find(“ media:content”).Rss输入:<channel><title>Popular Photography in the last 1 week</title><item><title>foo</title><media:category label="Miscellaneous">photography/misc</media:category><media:content url="http://foo.com/1.jpg" height="375" width="500" medium="image"/></item><item> ... </item> ...

如何使用jython / python ElementTree在Google Refine中解析xml【代码】

我试图使用Jython和ElementTree解析Google Refine中的一些xml,但是我一直在努力寻找任何文档来帮助我完成此工作(可能不是Python编码员也无济于事) 这是我要解析的XML的一部分.我正在尝试返回所有dc:indentifier的连接字符串:<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="ht...

解析Python模块文档字符串【代码】

是否可以使用AST解析模块级文档字符串? 我正在使用python documenter here并访问模块令牌,而抓取文档不会产生模块级docstring.到目前为止,我不得不求助于导入模块并获取其__doc__或使用inspect来获取文档. 我查看了pydoc module来源,以了解其他文档编制者如何解析docstrings的线索,并发现pydoc最终必须要做与我的文档编制者基本相同的事情才能获取模块级字符串. 我想念什么吗?是通过实际导入模块解析模块级文档字符串的唯一方法,...

python-$.ajax函数:发送json数据:在服务器端函数进行解析【代码】

我正在使用$.ajax函数将json数据发送到服务器端函数.var jsonObjects = [{id:1, name:"amit"}, {id:2, name:"ankit"},{id:3,name:"atin"},{id:1, name:"puneet"}];$.ajax({url: "{{=URL('myControllerName')}}",type: "POST",context: document.body,data: {students: JSON.stringify(jsonObjects) },dataType: "json",success: function(){alert('ok');}});在服务器端功能中,如何访问数据? 有人将grails的代码指定为:—//this c...

Python / ElementTree:解析内联元素并尊重周围的文字吗?【代码】

我需要解析一些包含内联元素的XML.例如,XML外观如下所示: < section>富巴,我是如此富巴,富巴甚至更多< fref bar =“ baz”> fubare< / fref>.还有更多fubar.< / section> 如果我现在用list(parent)中的elem遍历此结构,则… …我只能访问fref.如果我现在处理fref,则周围的文本当然会丢失,因为文本不是真正的元素. 有人知道正确解决此问题的方法吗?解决方法:下面显示了如何使用lxml实现此目的.>>> from lxml.etree import fromstri...

Python库/代码以解析dbpedia中的.nt文件【代码】

我想解析以.nt格式(N-Tuples)存在的dbpedia data.我已经下载了.nt文件,并且在我的本地磁盘中. 例如,我想找出所有实体及其主页. 我想做Python.现在,我唯一能做的就是做一个grep,或者遍历所有行并选择我想要的行.有没有什么好的图书馆可以帮助我做到这一点? 我看着RDFLib.但是所有示例都告诉您如何编写或创建.nt格式,而不是从中读取.解决方法:从rdflib docs.:>>> from rdflib.graph import Graph >>> g = Graph() >>> g.parse("dem...

如何使用Python解析Java的语法和代码约定?

我正在一个项目中,我想提供有关由初学者编写的Java代码的反馈.换句话说,我需要能够判断代码是否遵循约定,而不仅仅是它是否是有效的Java代码. 我已经研究了pyparsing、PLY和pyPEG之类的模块,看起来它们至少可以解析Java的大子集就可以了-很好.但是我对解析不是很有经验,所以我不确定是否也可以使用这些工具来检查代码约定?解决方法:这取决于您在谈论哪种类型的代码约定. >如果您正在谈论源语法中反映的约定和语义(例如,检查标识符约...

Python-从一行中的URL解析特定值【代码】

我设法使我的脚本根据行中的内容打印出一行文本:if "cvename" in line: CVE = list_of_line[4:5] print "The CVE number is ", ' '.join(CVE) print " "CVEfile.write("CVE-" + str(CVE) + '\n')输出:['http://cve.mitre.org/cgi-bin/cvename.cgi?name=1999-0016][Xref']但是我想要的只是值’1999-0016′ 我假设可以使用正则表达式来执行此操作,但是我在使用它们方面没有太多经验.我注意到的是,我要提取的值始终...

python-xml.sax解析器和行号等【代码】

任务是解析一个简单的XML文档,并按行号分析内容. 正确的Python包似乎是xml.sax.但是我该如何使用呢? 在对文档进行一些挖掘之后,我发现: > xmlreader.Locator接口具有以下信息:getLineNumber().> handler.ContentHandler接口具有setDocumentHandler(). 首先想到的是创建一个定位器,将其传递给ContentHandler,并在调用其character()方法等期间从定位器中读取信息. 但是,xmlreader.Locator只是一个框架接口,并且只能从其任何方法返...

使用Python解析ping输出【代码】

您将如何解析“ ping”输出,如下所示:root@m2m-probe1:~/M2M/src# ping -c 20 -q google.es PING google.es (173.194.34.247) 56(84) bytes of data.--- google.es ping statistics --- 20 packets transmitted, 20 received, 0% packet loss, time 19043ms rtt min/avg/max/mdev = 314.766/381.299/430.826/36.513 ms用Python?到目前为止,我发现的更好的是:output = subprocess.check_output('ping ' + host + " -c 5 -q | eg...

python-正则表达式从Multicraft解析行【代码】

我希望能够按照以下格式解析来自服务器控制台(Multicraft)的行:"source" <[ignore]"username"> "message"这是聊天的示例:[Server] <Johndonne> hello everyone! [Chat] <[VIP][Owner]bit2shift> hey [Chat] <[Mod]waisman> hello there [Chat] <[Builder]bluesniper> hey john xD我的第一个策略是使用此正则表达式:^(?P<source>\[[^\]]+\])?\s*<\[.+\](?P<sender>[^>]*)>\s*(?P<message>.*)$但是如果用户名前面没有[tag],则失败...

python-使用pyparsing解析嵌套结构【代码】

我正在尝试解析生物序列中位置的特定语法.这些职位可以采用以下形式:12 -- a simple position in the sequence 12+34 -- a complex position as a base (12) and offset(+34) 12_56 -- a range, from 12 to 56 12+34_56-78 -- a range as a start to end, where either or both may be simple or complex我想将这些解析为字典,大致像这样:12 -> { 'start': { 'base': 12, 'offset': 0 }, 'en...

python-os.walk().next()中类“ Iterable”的未解析属性引用“ next”【代码】

当我在PyCharm IDE 3.0.2社区版(Python 2.7.x)中键入类似内容时:directory = '/home/user/dir' samples_list = os.walk(directory).next()[1]我在类“ Iterable”的IDE未解析属性引用“ next”中得到警告. 因此,我想知道这是由于IDE(http://youtrack.jetbrains.com/issue/PY-11401)导致的错误,还是我应该对我的代码进行处理. UPD1:不幸的是,这是Pycharm PY-12017中的错误解决方法:您的IDE不正确,在Python 2迭代器(包括os.walk()之...

Python Beautifulsoup4网站解析【代码】

我正在尝试使用Beautifulsoup4从网站上抓取一些体育数据,但是在弄清楚如何进行操作时遇到了一些麻烦.我对HTML不太满意,而且似乎无法弄清楚必需的语法.解析完数据后,我将其插入Pandas数据框.我正在尝试提取主队,客队和得分.到目前为止,这是我的代码:from bs4 import BeautifulSoup import urllib2 import csvurl = 'http://www.bbc.com/sport/football/premier-league/results' page = urllib2.urlopen(url).read() soup = Beautif...

Python Pandas read_csv如何解析微秒【代码】

我有以毫秒为单位的csv文件.Time,Bid2014-03-03 23:30:30:224323224323,0.89252014-03-03 23:30:30:224390224390,0.8925252014-03-03 23:30:30:224408224408,0.8925252014-03-03 23:30:30:364299364299,0.892525如何使用read_csv()或其他函数将微秒解析为时间索引read_json也许? 谢谢!解决方法:在@Jeff的评论之后,您可以执行以下操作:In [29]: import pandas as pd # specifically set the Time column to object dtype df = pd...