python – 基于条件对数据帧进行排序,并通过动态分配给随机向量来返回所有组
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – 基于条件对数据帧进行排序,并通过动态分配给随机向量来返回所有组,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2311字,纯文字阅读大概需要4分钟。
内容图文
![python – 基于条件对数据帧进行排序,并通过动态分配给随机向量来返回所有组](/upload/InfoBanner/zyjiaocheng/726/65c691fa02b14491aa8fc72662c6a1f4.jpg)
例如:INPUT DATAFRAME是: –
INPUT group
4000 1
4000 1
2000 2
3000 3
2000 4
2000 4
2000 4
输出: – 动态分配给任意随机向量并生成输出: –
具有最大重复组编号的第一个数据帧,具有重复组的第二高元素的第二个数据帧,依此类推……
OUTPUT
1.首先
INPUT group
2000 4
2000 4
2000 4
2.second
INPUT group
4000 1
4000 1
3.third
INPUT group
2000 2
4.fourth
INPUT group
3000 3
用更简单的词语 – 我想将数据帧划分为一些组,在结果中,我希望通过分配一些变量来按升序排列所有组.
到目前为止,我试过这个:
x<-setDT(df)[, group := rleid(df$INPUT)]
这将对小组进行排序.我又尝试了一次,即:
y<-x[x$group == which.max(tabulate(x$group)), ]
但这只返回具有最大重复组元素数的组.
解决方法:
我不确定你是否需要一次性输出所有产品.但这是一个可能有所帮助的想法.我正在使用dplyr包.首先让我重新创建您提供的数据集作为输入:
library(dplyr)
DF <- data.frame(INPUT = c(4000,4000,2000,3000,2000,2000,2000), group = c(1,1,2,3,4,4,4))
df <- tbl_df(DF)
df
产量
INPUT group
(dbl) (dbl)
1 4000 1
2 4000 1
3 2000 2
4 3000 3
5 2000 4
6 2000 4
7 2000 4
现在我将创建一个辅助表,告诉我每组有多少行,这个表已经从最大到最小排序:
aux <- df %>% group_by(group) %>% summarise(n = n()) %>% arrange(-n)
aux
产量
group n
(dbl) (int)
1 4 3
2 1 2
3 2 1
4 3 1
所以我们看到第4组出现3次,第1组出现两次,依此类推.
现在我可以轻松地“提取”我想要的组从max到min:
ymax <- df %>% filter(group == aux$group[1])
y2 <- df %>% filter(group == aux$group[2])
y3 <- df %>% filter(group == aux$group[3])
ymin <- df %>% filter(group == aux$group[4])
产量
ymax
INPUT group
(dbl) (dbl)
1 2000 4
2 2000 4
3 2000 4
y2
INPUT group
(dbl) (dbl)
1 4000 1
2 4000 1
y3
INPUT group
(dbl) (dbl)
1 2000 2
ymin
INPUT group
(dbl) (dbl)
1 3000 3
我希望这有帮助.
我只想补充一点,你当然可以立刻得到所有这些:
ylist <- lapply(1:nrow(aux), function(x) {filter(df, group == aux$group[x])})
产量
[[1]]
Source: local data frame [3 x 2]
INPUT group
(dbl) (dbl)
1 2000 4
2 2000 4
3 2000 4
[[2]]
Source: local data frame [2 x 2]
INPUT group
(dbl) (dbl)
1 4000 1
2 4000 1
[[3]]
Source: local data frame [1 x 2]
INPUT group
(dbl) (dbl)
1 2000 2
[[4]]
Source: local data frame [1 x 2]
INPUT group
(dbl) (dbl)
1 3000 3
内容总结
以上是互联网集市为您收集整理的python – 基于条件对数据帧进行排序,并通过动态分配给随机向量来返回所有组全部内容,希望文章能够帮你解决python – 基于条件对数据帧进行排序,并通过动态分配给随机向量来返回所有组所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。