【如何按类别和/或位置解析Facebook页面的FQL响应? (Python)】教程文章相关的互联网学习教程文章

如何在feedparser(Python)中解析多个URL?【代码】

我正在使用一些固定的供稿制作一个Web应用程序(已修复,您无法在Feedly或Google Reader中添加供稿) 我尝试了这个,没有运气RSS_URLS = ['http://feeds.feedburner.com/RockPaperShotgun','http://www.gameinformer.com/b/MainFeed.aspx?Tags=preview',]feed = feedparser.parse(RSS_URLS)for post in feed.entries:print post.title而且这没有运气RSS_URLS = ['http://feeds.feedburner.com/RockPaperShotgun','http://www.gameinfor...

读取文件时Python熊猫中的日期解析错误【代码】

提问至:Python pandas for reading in file with date 我无法解析以下数据框上的日期.代码如下:df = pandas.read_csv(file_name, skiprows = 2, index_col='datetime', parse_dates={'datetime': [0,1,2]}, delim_whitespace=True,date_parser=lambda x: pandas.datetime.strptime(x, '%Y %m %d'))OTH-000.opcXKN1= 0.500000E-01Y M D PRCP VWC1 2006 1 1 0.0 0.17608E+002006 1 2 6.0 0....

使用lxml.etree解析python alexa结果【代码】

我正在使用来自AWS的Alexa api,但发现解析结果以获得我想要的东西很困难 alexa api返回对象树< typelxml.etree._ElementTree> 我使用此代码来打印树from lxml import etree root = tree.getroot() print etree.tostring(root)我在下面得到xml<aws:UrlInfoResponse xmlns:aws="http://alexa.amazonaws.com/doc/2005-10-05/"><aws:Response xmlns:aws="http://awis.amazonaws.com/doc/2005-07-11"><aws:OperationRequest><aws:Reques...

使用Python对大数据进行XML解析【代码】

我正在尝试使用Python解析XML文件.但是问题在于XML文件大小约为30GB.因此,执行需要花费几个小时:tree = ET.parse('Posts.xml')在我的XML文件中,根有数百万个子元素.有什么方法可以使其更快?我不需要所有的孩子来解析.即使是第一个100,000,也可以.我需要做的只是为解析深度设置一个限制.解决方法:您将需要一种XML解析机制,该机制不会将所有内容都加载到内存中. 您可以使用ElementTree.iterparse,也可以使用Sax. 这是一个包含一些X...

python-解析日期时间字符串“ 09-11-2017 00:02:00”在位置8时出错【代码】

我用一列日期时间对象创建了一个数据框,对其进行了重新采样,但现在想将数据框变成一个列表列表-日期时间现在又是字符串.for i in range(1, len(dataf.index)):dataf["Time Stamp"][i] = datetime.strftime(dataf["Time Stamp"][i], '%m-%d-%Y %H:%M:%S')print(dataf["Time Stamp"][i])我不断收到错误(请注意,打印部分仅供我检查输出)ValueError: Error parsing datetime string "09-11-2017 00:02:00" at position 8但是据我所知,日...

python-从txt解析IP地址【代码】

我正在尝试下载一个txt文件,您可以找到here.下载文件不是问题:testfile = urllib.URLopener()testfile.retrieve(_proxy_list_download_, "proxies.txt")但是问题在于,下载后它表现得很奇怪.当我在任何txt编辑器中打开它时,都可以看到内容和IP地址,但是当我尝试将内容打印到控制台中时,它会显示以下内容:212.3.183.210:8080; 0; 0; anonymous proxy; Italy; ; a; in); an Jose); ree download proxy IP当我尝试从那里获取IP地址时...

Python无法使用额外的结尾逗号来解析JSON【代码】

这段代码:import json s = '{ "key1": "value1", "key2": "value2", }' json.loads(s)在Python 2中产生此错误:ValueError: Expecting property name: line 1 column 16 (char 15)Python 3中的结果类似:json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 16 (char 15)如果删除该结尾的逗号(在“ value2”之后),则不会出错.但是我的代码将处理许多不同的JSON,因此无法手动进行.是...

如何使用python SAX解析器获取标签之间的文本?【代码】

我需要的只是获取相应标签的文本并将其持久保存到数据库中.由于xml文件很大(4.5GB),因此我使用的是sax.我使用字符方法获取文本并将其放入字典中.但是,当我在endElement方法上打印文本时,我得到的是新行而不是文本. 这是我的代码:def characters(self,content):text = unescape(content))self.map[self.tag]=textdef startElement(self, name, attrs):self.tag = namedef endElement (self, name)if (name=="sometag")print self.m...

python中的XML解析:expaterror格式不正确【代码】

我正在使用Python的xml.etree.ElementTree对文件进行一些XML解析.但是,我在文档中途遇到此错误:xml.parsers.expat.ExpatError: not well-formed (invalid token): line X, column Y因此,我进入vim的X行,Y列,并看到一个带有红色背景突出显示的“&”号.这是什么意思? 而且它前面的两个字符是>&gt ;,所以关于>>&amp ;?也许有一些特别之处? 有人知道怎么修这个东西吗?解决方法:&是XML中的特殊字符,用于字符实体.如果您的XML具有&自...

python-在不知道键值的情况下解析JSON【代码】

我知道如何解析知道键值的JSON,但是现在我想从不是我的JSON中获取键值,因此我可以知道键名,例如我有这个JSON[{"id": 1,"name": "Leanne Graham","username": "Bret","email": "Sincere@april.biz","address": {"street": "Kulas Light","suite": "Apt. 556","city": "Gwenborough","zipcode": "92998-3874","geo": {"lat": "-37.3159","lng": "81.1496"}},"phone": "1-770-736-8031 x56442","website": "hildegard.org","company":...

Libclang的python绑定生成的AST无法解析C源代码中的某些标记【代码】

我正在使用Libclang的python绑定.我基本上有两个查询: >我想知道我们如何解析既不是由用户定义的,也不是为之包含库的库函数.例如当我有以下源代码时–char* a=(char *)malloc(4);> Libclang无法解析malloc(),因为此代码中既没有包含stdlib,也没有为malloc提供用户定义的定义. > Libclang的AST无法识别未使用构造函数定义的对象.例如,在源代码中-vector<int> color; color.push_back(1); color.push_back(2);push_back()语句将不会...

python-如何从父解析器获取argparse子解析器(以检查默认值)【代码】

假设我创建了一个带有默认值的解析器,然后给它提供了一个带有另一个默认值的子解析器.In [1]: parser = argparse.ArgumentParser(description='test')In [2]: parser.add_argument("--test", dest="test", default="hello") Out[2]: _StoreAction(option_strings=['--test'], dest='test', nargs=None, const=None, default='hello', type=None, choices=None, help=None, metavar=None)In [3]: parser.get_default("test") Out[3]...

在python的imaplib中解析括号列表【代码】

我正在寻找一种简单的方法将IMAP响应中的括号列表拆分为Python列表或元组.我想从'(BODYSTRUCTURE ("text" "plain" ("charset" "ISO-8859-1") NIL NIL "quoted-printable" 1207 50 NIL NIL NIL NIL))'至(BODYSTRUCTURE, ("text", "plain", ("charset", "ISO-8859-1"), None, None, "quoted-printable", 1207, 50, None, None, None, None))解决方法:pyparsing的nestedExpr解析器函数默认解析嵌套括号:from pyparsing import nested...

python-BeautifulSoup计数标签而无需深入解析标签【代码】

我考虑过以下while writing an answer to this question. 假设我有一个像这样的深度嵌套的xml文件(但嵌套得多,而且更长):<section name="1"><subsection name"foo"><subsubsection name="bar"><deeper name="hey"><much_deeper name"yo"><li>Some content</li></much_deeper></deeper></subsubsection></subsection> </section> <section name="2">... and so forth </section>len(soup.find_all(“ section”))的问题在于,在执行...

使用Python lxml和Iterparse解析大型XML文件【代码】

我正在尝试使用lxml和iterparse方法编写解析器来逐步执行包含许多项的非常大的xml文件. 我的文件格式为:<item><title>Item 1</title><desc>Description 1</desc><url><item>http://www.url1.com</item></url> </item> <item><title>Item 2</title><desc>Description 2</desc><url><item>http://www.url2.com</item></url> </item>到目前为止我的解决方案是:from lxml import etreecontext = etree.iterparse( MYFILE, tag='item'...