【python中的列表解析和生成表达式】教程文章相关的互联网学习教程文章

Python 3,解析json【代码】

请帮助,我收到此错误:with open('Data/language.json') as settings_file: TypeError: Required argument 'flags' (pos 2) not found我的代码是:import jsonwith open('Data/settings.json') as settings_file: Settings = json.load(settings_file)解决方法:看起来您是从os模块中导入open的,类似于:from os import openos.open与内置的open函数(您无需导入)不同.删除该导入,您将使用内置的open,默认为读取模式.

使用python的strptime用任何分隔符解析日期【代码】

我正在使用Python的datetime.strptime解析日期.日期采用%Y /%m /%d格式,但是我想对用于日期的分隔符-/,-,不了解.其他都很好. 现在,我正在使用一个try块,但这有点冗长. 是否有简单的方法接受任何给定的分隔符作为strptime?解决方法:您必须使用正则表达式来规范分隔符:import redatetimestring = re.sub('[-.:]', '/', datetimestring)将替换任何-.或:带斜线的字符. 或者,使用dateutil.parser.parse() function处理任意日期时间...

Python:使用正则表达式解析字符串中的数值【代码】

我正在编写python代码,使用正则表达式解析字符串中不同类型的数字,但遇到了一个我不理解的烦人的问题. 我的代码如下:import re test_string = "Distributions $54.00 bob $26 and 0.30 5% ($0.23) 2,333,450"num_values = re.findall(r"\(?\$?[0-9]+.?[0-9]*%?\)?|[0-9]+(?:,[0-9]+)*", test_string)输出为:['$54.00', '0.30', '5%', '($0.23)', '2,333', '450']因此,该代码对于除’2,333,450’字符串(由于某种原因被分割为两...

python-使用ElementTree和多个元素进行XML解析【代码】

我需要解析一个看起来像这样的XML:<tag>text1 text2 text3<some-tag/>More text<some-tag/>Some more text<some-tag/>Even more text </tag>使用ElementTree的head和tail方法,可以获得“ text1 text2 text3”和“ Even more text”. 但是,我无法提出一种到达中间文本的方法(“更多文本”和“更多文本”). 由于生成XML的软件的特殊性,我无法确定杂散标签,因此无法使用命令find(‘some-tag’). 有什么方法可以使用python解析此XML?...

在python中解析xbrl文件【代码】

我正在研究xml解析器.目标是解析多个不同的xml文件,这些文件中的前缀和标记保持一致,但名称空间却发生了变化. 因此,我正在尝试: >仅通过< prefix:tags>来解析xml.而不用名称空间解析(替换)前缀.每个文档的前缀保持不变.>自动加载名称空间,以便可以将标识符(< prefix:tag>)替换为适当的名称空间.>只需按标记解析xml 我已经尝试过xml.etree.ElementTree. 我也看了lxml我找不到在lxml中的XMLParser的任何配置选项可以对我有所帮助,...

使用python中的请求函数解析json数据……我无法访问对象【代码】

我的数据与此类似:{"id": "694543830607034","name": "Ankit Dhawan","accounts": {"data": [{"access_token": "a","category_list": [{"id": "192119584190796","name": "Event"}],"name": "Ignitron 2014", // I want to print this."id": "731808386867764","perms": ["ADMINISTER","EDIT_PROFILE","CREATE_CONTENT","MODERATE_CONTENT","CREATE_ADS","BASIC_ADMIN"]},我还想访问页面名称(GITM-IEEE,Ignitron14),我需要从JSON访...

模块来解析python中的简单语法【代码】

我的目标是使用Python 2.7.6在Linux下读取文件/ etc / os-release并获取字典.该文件在Ubuntu中如下所示:NAME="Ubuntu" VERSION="14.04.2 LTS, Trusty Tahr" ID=ubuntu ID_LIKE=debian PRETTY_NAME="Ubuntu 14.04.2 LTS" VERSION_ID="14.04" HOME_URL="http://www.ubuntu.com/" SUPPORT_URL="http://help.ubuntu.com/" BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"我想以这样的Python代码创建的字典结果结束:{ 'NAME': 'U...

在非本地时区中快速解析Python日期时间,以节省夏令时【代码】

我需要快速将ISO 8601日期时间字符串(该字符串中没有时区,但已知在美国/太平洋时区中)转换为一个numpy datetime64对象. 如果我的计算机在美国/太平洋时间,则可以简单地运行numpy.datetime64(s).但是,这假定没有时区的字符串在本地时区中.此外,我不能轻易以ISO 8601格式指定美国/太平洋时区,因为根据夏令时,有时是-0800,有时是-0700. 到目前为止,我拥有的最快解决方案是numpy.datetime64(pandas.Timestamp(s).tz_localize(tz =’US ...

使用Python解析非结构化文本文件【代码】

我有一个文本文件,其中的一些片段如下所示:Page 1 of 515 Closing Report for Company Name LLC 222 N 9th Street, #100 & 200, Las Vegas, NV, 89101 File number: Jackie Grant Status: Fell Thru Primary closing party: Seller Acceptance: 01/01/2001 Closing date: 11/11/2011 Property type: Commercial Lease MLS number: Sale price: $200,000 Co...

python-Scrapy没有输入解析方法【代码】

我不明白为什么这段代码没有输入parse方法.它与文档中的基本蜘蛛示例非常相似:http://doc.scrapy.org/en/latest/topics/spiders.html而且我很确定这可以在当天早些时候起作用…不确定是否修改了某些内容..from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium import webdriver from scrapy...

python-文本解析-日期识别器【代码】

有谁知道是否存在可识别嵌入日期的Python文本解析器?例如,给一个句子“bla bla bla bla 12 Jan 14 bla bla bla 01/04/15 bla bla bla”解析器可以选择出现两个日期.我知道一些Java工具,但是有Python工具吗? NTLK会大材小用吗? 谢谢解决方法:这是一种不确定性尝试(详尽阅读),试图解决在标记化文本中查找日期的问题.它列举了对句子进行分区的所有方式(作为标记列表),分区大小从minps到maxps. 每个分区都运行到解析器中,解析器输出...

如何在Python中解析时间表达式(特别是时间范围)?【代码】

我有一个包含3个组件的NLP任务.我尝试了几种方法(最后提到),但无法获得良好的结果. >在语句中检测时间表达>然后将其分类为时间戳,时间触发或时间段.>使每个表达式等于其DateTime等价物. 例: 以参考时间为2000小时,2015年7月20日,星期四 >时间戳: 我想从现在开始20分钟预定出租车Answer: [tStamp]2020 hrs, Thursday, July 20th>时间触发: 2之后的任何计时器都可以Answer: [tTrigger] - start - 0200 hrs,July 21st 20155点之前...

Python OOP继承:方法解析顺序(MRO)【代码】

当我使用方法分辨率顺序(MRO)时,输出会有变化.任何人都可以解释为什么这种结果差异.class A:def __init__(self):passdef abc(self):print("A") class B(A):def __init__(self):passdef abc(self):super().abc()print("B") class C(A):def __init__(self):passdef abc(self):super().abc()print("C") class D(B,C):def __init__(self):super().abc()print("D") obj=D() Output: A C B D//Using Method Resolution Order (MRO):print...

如何使用Python的CSV DictReader解析CSV输出?【代码】

我已经集成了Salesforce的Bulk API,用于在我的Python项目中获取记录.使用“ Content-Type”:“ text / csv; charset = UTF-8’标头,它返回CSV输出."Id","Name","CreatedById","Salary","Base_Salary","Type","Pay_cycle","Description","Code" "a0u90000003R4Y9AAK","Freelance Hadoop developer","005900000039GMdAAM","","","","","","" "a0u90000003R5UPAA0","Senior Hadoop developer","005900000039GMdAAM","","","","","","...

将reddit json解析为Python数组并从数组中打印项目【代码】

这是我头两周的编码;为一个基本问题道歉. 我设法解析了“ WorldNews” subreddit json,确定了各个子项(在我撰写本文时,其中有24个子项)并获取了每个新闻项的标题.我现在正尝试根据这些新闻标题创建一个数组.下面的代码确实每2-3次尝试将第五个标题([4])打印到命令行(否则提供下面的错误).它一次也不会打印多个标题(例如,如果我尝试[2,3,4],我将不断出现相同的错误). 我收到的错误无法编译:in <module> Children = theJSON["data"...