如何在保持数据分布的同时从python中的列表中随机采样
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了如何在保持数据分布的同时从python中的列表中随机采样,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1126字,纯文字阅读大概需要2分钟。
内容图文
![如何在保持数据分布的同时从python中的列表中随机采样](/upload/InfoBanner/zyjiaocheng/667/0d43e0b7ae3e412799bdcb6a6c90c41d.jpg)
本质上,我想做的是从列表中随机选择项目,同时保持内部分布.请参见以下示例.
a = 17%
b = 12%
c = 4%
etc.
“ a”在列表中有1700个项目.
“ b”在列表中有1200个项目.
“ c”在列表中有400项.
我希望使用一个样本来模拟a,b,c等的分布,而不是使用所有信息.
所以最终目标是
从“ a”中随机选择170个项目
从“ b”中随机选择120个项目
从“ c”中随机选择40个项目
我知道如何从列表中随机选择信息,但是我无法弄清楚如何在强制结果具有相同分布的同时随机选择信息.
解决方法:
如果您的列表不是很庞大,并且内存不是问题,则可以使用此简单方法.
要从a,b和c中获得n个元素,可以将三个列表连接在一起,并从结果列表中随机选择random.choice个元素:
import random
n = 50
a = ['a'] * 170
b = ['b'] * 120
c = ['c'] * 40
big_list = a + b + c
random_elements = [random.choice(big_list) for i in range(n)]
# ['a', 'c', 'a', 'a', 'a', 'b', 'a', 'c', 'b', 'a', 'c', 'a',
# 'a', 'a', 'a', 'b', 'b', 'a', 'a', 'a', 'a', 'a', 'c', 'a',
# 'c', 'a', 'b', 'a', 'a', 'c', 'a', 'b', 'a', 'c', 'b', 'a',
# 'a', 'b', 'a', 'b', 'a', 'a', 'c', 'a', 'c', 'a', 'b', 'c',
# 'b', 'b']
对于每个元素,您将获得len(a)/ len(a b c)概率从a中获取元素.
您可能会多次获得相同的元素.如果您不希望发生这种情况,可以使用random.shuffle.
内容总结
以上是互联网集市为您收集整理的如何在保持数据分布的同时从python中的列表中随机采样全部内容,希望文章能够帮你解决如何在保持数据分布的同时从python中的列表中随机采样所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。