【python-将嵌套的json转换为pandas数据框】教程文章相关的互联网学习教程文章

python-在Pandas Dataframe中插入字典(JSON)【代码】

我有一个用例,需要将数据框的现有列转换为JSON并仅存储在一个列中. 到目前为止,我已经尝试过了:import pandas as pd import json df=pd.DataFrame([{'a':'sjdfb','b':'jsfubs'},{'a':'ouhbsdv','b':'cm osdn'}]) #Random data jsonresult1=df.to_json(orient='records') # '[{"a":"sjdfb","b":"jsfubs"},{"a":"ouhbsdv","b":"cm osdn"}]'但是我希望数据只是字典的字符串表示形式,而不是列表.所以我尝试了这个:>>>jsonresult2=df....

python-将嵌套的json转换为pandas数据框【代码】

我正在尝试将嵌套的json数组转换为熊猫数据框. 列表格式的数据如下所示:[{u'analysis': {u'active': u'Y',u'dpv_cmra': u'N',u'dpv_footnotes': u'AAN1',u'dpv_match_code': u'D',u'dpv_vacant': u'N',u'footnotes': u'H#'},u'candidate_index': 0,u'components': {u'city_name': u'City',u'delivery_point': u'Variable',u'delivery_point_check_digit': u'8',u'plus4_code': u'Variable',u'primary_number': u'Variable',u'stat...

python – 在pandas数据框中展平嵌套的Json【代码】

我正在尝试将json文件加载到pandas数据框.我发现有一些嵌套的json.以下是json示例:{'events': [{'id': 142896214,'playerId': 37831,'teamId': 3157,'matchId': 2214569,'matchPeriod': '1H','eventSec': 0.8935539999999946,'eventId': 8,'eventName': 'Pass','subEventId': 85,'subEventName': 'Simple pass','positions': [{'x': 51, 'y': 49}, {'x': 40, 'y': 53}],'tags': [{'id': 1801, 'tag': {'label': 'accurate'}}]}我使...

python – Pandas将Dataframe转换为嵌套的Json【代码】

我的问题基本上与这个问题相反: Create a Pandas DataFrame from deeply nested JSON 我想知道是否可以做相反的事情.给出如下表:Library Level School Major 2013 Total 200 MS_AVERY UGRAD GENERAL STUDIES GEST 5079 201 MS_AVERY UGRAD GENERAL STUDIES HIST 5 202 MS_AVERY UGRAD GENERAL STUDIES MELC 2 203 MS_AVERY UGRAD GENERAL STUDIES PHIL 10 204 ...

python – 将JSON API响应转换为pandas Dataframe【代码】

我正在努力将JSON API响应转换为pandas Dataframe对象.我已经阅读了类似问题/文档的答案,但没有任何帮助.我最接近的尝试如下:r = requests.get('https://api.xxx') data = r.text df = pd.read_json(data, orient='records')返回以下格式:0 {'type': 'bid', 'price': 6.193e-05, ...},1 {'type': 'bid', 'price': 6.194e-05, ...},3 {'type': 'bid', 'price': 6.149e-05, ...} etc数据的原始格式为:{'abc': [{'type': ...

python – pandas read_json:“如果使用所有标量值,则必须传递索引”【代码】

我在使用pandas导入JSON文件时遇到了一些困难.import pandas as pd map_index_to_word = pd.read_json('people_wiki_map_index_to_word.json')这是我得到的错误:ValueError: If using all scalar values, you must pass an index文件结构简化如下:{"biennials": 522004, "lb915": 116290, "shatzky": 127647, "woode": 174106, "damfunk": 133206, "nualart": 153444, "hatefillot": 164111, "missionborn": 261765, "yeardescri...

python – 将包含多行JSON的文件加载到Pandas中【代码】

我试图在JSON文件中读入Python pandas(0.14.0)数据帧.这是JSON文件的第一行:{"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandwiches and wraps are good but a little overpriced and the food items are the same. The chicken caesar salad wrap is my f...

python – Pandas MultiIndex(超过2个级别)DataFrame到嵌套Dict / JSON【代码】

这个问题类似于this one,但我想更进一步.是否有可能将解决方案扩展到更高级别的工作?多级数据帧’.to_dict()方法有一些很有前景的选项,但是大多数都会返回由元组索引的条目(即(A,0,0):274.0),而不是将它们嵌套在字典中. 有关我要完成的示例,请考虑此多索引数据框:data = {0: {('A', 0, 0): 274.0, ('A', 0, 1): 19.0, ('A', 1, 0): 67.0, ('A', 1, 1): 12.0, ('B', 0, 0): 83.0, ('B', 0, 1): 45.0},1: {('A', 0, 0): 254.0, ('...

python – Pandas to_json没有为NaT输出null【代码】

我正在使用Pandas 0.12.0并且在将系列或数据帧转换为json时看到一些与文档相矛盾的行为. 如果我创建一个包含一些包含空值的日期的系列,我会得到这样的结果:>>> s = pandas.Series(data=[datetime.datetime.now(), datetime.datetime.now(), None]) >>> s 0 2013-11-07 16:10:47.530771 1 2013-11-07 16:10:47.530782 2 None dtype: object根据http://pandas.pydata.org/pandas-docs/dev/io.html#w...

python – 从JSON文件创建的pandas数据帧中的UnicodeDecodeError【代码】

我在iPython笔记本上运行了一段代码,下载了一个JSON文件,然后将内容解析为Pandas DF.但是,如果我尝试检查DF,那么我会收到编码错误.output = r.json() columns_map = {'/people/person/date_of_birth': 'birth_date','/people/person/place_of_birth': 'birth_place','/people/person/gender': 'gender'} dF = pd.DataFrame(output['result']) dF.rename(columns=columns_map, inplace=True) dF.to_csv('file.csv',encoding='utf-8'...

python – 使用pandas解析JSON文档中的一个部分【代码】

我正在尝试用熊猫分析我的电费账单使用情况(以JSON格式下载的每小时数据!woot!).我能做到,但它比我想象的还要笨拙:import pandas as pd import jsonwith open('test1.json') as f:j = json.load(f) j2 = j['DailyBillingUsage']['RegisterCollections']['Channel'] s = json.dumps(j2) d = pd.read_json(s, convert_dates='ReadDate') d.ReadDate = pd.to_datetime(d.ReadDate)我当时希望能够做到这一点:d = pd.read_json('tes...

pandas处理json数据【代码】【图】

pandas处理json数据将json串解析为DataFrame的方式主要有三种:利用pandas自带的read_json直接解析字符串利用json的loads和pandas的json_normalize进行解析利用json的loads和pandas的DataFrame直接构造(这个过程需要手动修改loads得到的字典格式)由于read_json直接对字符串进行的解析,其效率是最高的,但是其对JSON串的要求也是最高的,需要满足其规定的格式才能够读取。其支持的格式可以在pandas的官网点击打开链接可以看到。然而...