首页 / PYTHON / 如何使用python从嵌套表结构中识别最终父级？

如何使用python从嵌套表结构中识别最终父级？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了如何使用python从嵌套表结构中识别最终父级？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2839字，纯文字阅读大概需要5分钟。

内容图文

我有下表：

我的问题是：如何以编程方式确定最终父母？

以下是通过示例说明的规则：

> id 5.0的父级是51.0. ID 51.0没有父母.因此,id 5.0的最终父代为51.0.
> id 6.0的父代是1.0. id 1.0的父级是10.0. ID 10.0没有父母.因此,id 6.0的最终父代为10.0.
> id 2.0没有父项.因此,2.0的最终parent_id为2.0

id字段中没有重复项,我也不知道id结构中可以嵌套多少层.

这是此示例的代码：

import pandas as pd
import numpy as np

original_df = pd.DataFrame({'id': pd.Series([5., 6, 2, 51, 1, 70, 10])
              ,'parent_id': pd.Series([51, 1, np.nan, np.nan, 10, np.nan, np.nan])})
original_df['ultimate_parent_id'] = ''
original_df

这是决赛桌的样子：

这是用于生成该文件的代码.

final_df = pd.DataFrame({'id': pd.Series([5., 6, 2, 51, 1, 70, 10])
              ,'parent_id': pd.Series([51, 1, np.nan, np.nan, 10, np.nan, np.nan])})
final_df['ultimate_parent_id'] = pd.Series([51., 10, 2, 51, 10, 70, 10])
final_df

如果可能的话,我对使用while循环的解决方案以及使用矢量化运算的解决方案都将非常感兴趣.

解决方法:

与@Vaishali的回答一样,这是一个使用Python遍历主要操作,但在数据帧内使用np / pd操作的版本：

import pandas as pd
import numpy as np

df = pd.DataFrame(
        { 'id': pd.Series([5., 6, 2, 51, 1, 70, 10]),
        'parent_id': pd.Series([51, 1, np.nan, np.nan, 10, 51, np.nan])
        }
    )

def find_ultimate_parents(df):
    # Make a copy of df, using 'id' as the index so we can lookup parent ids
    df2 = df.set_index(df['id'])
    df2['nextpar'] = df2['parent_id']

    # Next-parent-2 not null - fake it for now
    np2nn = df2['nextpar'].notnull()

    while np2nn.any():
        # Lookup df2[parent-id], since the index is now by id. Get the
        # parent-id (of the parent-id), put that value in nextpar2.
        # So basically, if row B.nextpar has A, nextpar2 has (parent-of-A), or Nan.

        # Set na_action='ignore' so any Nan doesn't bother looking up, just copies
        # the Nan to the next generation.
        df2['nextpar2'] = df2['nextpar'].map(df2['parent_id'], na_action='ignore')

        # Re-evaluate who is a Nan in the nextpar2 column.
        np2nn = df2['nextpar2'].notnull()

        # Only update nextpar from nextpar2 if nextpar2 is not a Nan. Thus, stop
        # at the root.
        df2.loc[np2nn, 'nextpar'] = df2[np2nn]['nextpar2']

    # At this point, we've run out of parents to look up. df2['nextpar'] has
    # the "ultimate" parents.

    return df2['nextpar']


df['ultimate_parent_id'] = find_ultimate_parents(df)
print(df)

循环防护检查np2nn.any(),它是布尔系列上的向量op.每次通过循环都会查找“下一个父级”,因此通过循环的次数将是任何子父链的最大深度.对于像1＞ 2＞ 3＞ 4…4…n的列表,O(N)中最坏的情况.对于没有父母的列表,最好的情况是0.

该循环使用na_action =’ignore’执行一个.map,以简单地传播Nan值.这是O(fast-N)乘以索引查找成本,应为O(1).

计算出nextpar2字段后,循环将使用一个简单的.notnull()重新计算np2nn,该值再次为O(fast-N).

最后,从nextpar2更新nextpar字段,该字段再次应为O(fast-N).

因此,最坏情况下的性能为O(slow-N * fast-N),即N²,但这是Pandas-N²,而不是Python-N².平均情况应为O(slow-m * fast-N),其中m是平均情况下的最大树深度,最好情况为1(1)快速通过行的O(fast-N).

内容总结

以上是互联网集市为您收集整理的如何使用python从嵌套表结构中识别最终父级？全部内容，希望文章能够帮你解决如何使用python从嵌套表结构中识别最终父级？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/684753.html

来源：【匿名】

【上一篇】为什么这个简单的python Toast通知不起作用？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【如何使用python从嵌套表结构中识别最终父级？】教程文章相关的互联网学习教程文章

把MySQL表结构映射为Python中的对象的教程

ORM mysql的表结构是二维表，用python的数据结构表示出来就是一个列表，每一个记录是一个tuple。如下所示： [(1, huangyi),(2, letian),(3, xiaosi)] 这一行并不便于看出表的结构，可以把它换成对象的形式。class User(object):def __init__(self, id, name):self.id = idself.name = name 得到：[ User(1, huangyi),User(2, letian),User(3, xiaosi) ] 这就是ORM(Object-relational Mapping)，把关系数据库的表结构映射到对象上。...

python3 django连接mysql，同步表结构

pip3 install PyMySQL 然后在工程目录的__init__.py中填写下面两句话 import pymysql pymysql.install_as_MySQLdb() 问题：安装过程中如果提示No module named ‘MySQLdb‘ 解决方法：python3使用上面的方法替代MySQLdb 原因：python3中，不再使用MySQLdb包了第二步：配置数据库和INSTALLED_APPS（app下的settings.py）配置数据库 DATABASES = { ‘default‘: { ‘ENGINE‘: ‘django.db.backends.mysql‘,#数...

Python数据库(三)-使用sqlalchemy创建表结构【代码】【图】

) #连接mysql数据库，echo为是否打印结果Base = declarative_base() #生成orm基类class User(Base): #继承生成的orm基类__tablename__ = "sql_test" #表名id = Column(Integer,primary_key=True) #设置主键user_name = Column(String(32))user_password = Column(String(64))class Admin(Base):__tablename__ = "admin"id = Column(Integer, primary_key=True)username = Column(String(32))password = Column(String(64))Base.met...

MySQL表结构映射为Python中的对象 python （SQLAlchemy）【代码】

User(object):def __init__(self, id, name):self.id = idself.name = name得到：[ User(‘1‘, ‘huangyi‘), User(‘2‘, ‘letian‘), User(‘3‘, ‘xiaosi‘) ]这就是ORM(Object-relational Mapping)，把关系数据库的表结构映射到对象上。我们可以用SQLAlchemy框架来进行映射。 SQLAlchemy#!/usr/bin/env python #-*-coding:utf-8 -*-from sqlalchemy import Column, String, create_engine from sqlalchemy.orm import sess...

在python中构建不同大小的字符串列表结构【代码】

使用什么数据结构来构建不同大小的字符串列表的串联？例如.,a_list = ['h','i'] b_list = ['t','h','e','r','e'] c_list = ['fr', 'ie','nd']理想结构：my_structure = [ ['h','i'],['t','h','e','r','e'],['fr', 'ie','nd']]然后用’null’字符串填充它以在每个列表中获得相同的大小：my_structure = [ ['h','i','null','null','null'],['t','h','e','r','e'],['fr', 'ie','nd','null', 'null']]解决方法:你可以使用itertools...

首页 / PYTHON / 如何使用python从嵌套表结构中识别最终父级？

如何使用python从嵌套表结构中识别最终父级？

内容导读

内容图文

内容总结

内容备注

内容手机端

【如何使用python从嵌套表结构中识别最终父级？】教程文章相关的互联网学习教程文章

把MySQL表结构映射为Python中的对象的教程

python3 django连接mysql，同步表结构

Python数据库(三)-使用sqlalchemy创建表结构【代码】【图】

MySQL表结构映射为Python中的对象 python （SQLAlchemy）【代码】

在python中构建不同大小的字符串列表结构【代码】

PYTHON - 相关标签

嵌套 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程