【python随机选取目录下的若干个文件】教程文章相关的互联网学习教程文章

python – 使用h5py随机播放HDF5数据集【代码】

我有一个大的HDF5文件(~30GB),我需要在每个数据集中随机输入(沿0轴).通过h5py文档查看我无法找到randomAccess或shuffle功能,但我希望我错过了一些东西. 是否有人熟悉HDF5,想到一种快速随机播放数据的方法? 这是我用我有限的知识实现的伪代码:for dataset in datasets:unshuffled = range(dataset.dims[0])while unshuffled.length != 0:if unshuffled.length <= 100:dataset[:unshuffled.length/2], dataset[unshuffled.length/2...

在Python 2中,从随机数字中创建一个随机问题【代码】

我希望我能得到一些帮助,我绝对没有运气在网上看.以及我是Python的新手. 我正在学习学习Python的艰难之路,我真的开始喜欢python了.所以我做了一个简单的小游戏.我正在寻找一种“欺骗死亡”的方法,我的想法是,为了逃避死亡,你需要回答一个数学问题,如果你做对了,你会回去开始(),或者如果你点错了,你会死的().所以这是迄今为止我对这个问题的代码:from random import shufflenumbers = [1, 75, 64, 80275, 2, 7]shuffle(numbers)def...

python – Django Unittests随机失败【代码】

我遇到了随机失败的单元测试这个奇怪的问题.我基本上测试Syndication Feeds 这是我的代码的相关部分:class ObjectFeedTests(PuppyTestCase):def test_object_feeds(self):site = Site.objects.get_or_create(id=site_id)[0]#Some preprocessing and initializationwith self.settings(ROOT_URLCONF='myapp.urls.something'):#Some more preprocessing is done hereshow = ShowFactory.create(slug=show_slug, title=show_name,sit...

python – 在给定比率上随机生成数字【代码】

我需要在指数分布后分布的正给定区间(a,b)上生成数字.使用逆向CDF方法,我创建了一个指数分布式的数字生成器.但是,当然,这个数字是一个正数,我希望它在给定的时间间隔内.我该怎么做只在间隔上生成? 使用逆cdf方法生成指数分布的数字的代码是in Pythonu = random.uniform(0,1) return (-1/L)*math.log(u)其中L是给定的正参数. 提前致谢解决方法:结果x的概率通常为L exp(-Lx).然而,当我们被限制在[a,b]时,[a,b]中x的概率被放大1 /在a...

Python设置随机化的程度如何?【代码】

首先,我知道我不应该尝试在这个问题中描述的内容,这纯粹是假设,所以请不要对我大喊大叫. Python集不维护顺序,因为它们是没有map部分的哈希映射.所以我想知道他们在随机化事情上有多好.显然这对于??加密来说是不够的,并且不能用于整数(因为Python哈希是整数上的身份),但它对于游戏和东西是否足够好? 有意义的是它可以正常工作,因为它在哈希上进行修改,但我不确定哈希是多么好以及它对随机化有多好. P.S:集合将始终为相同的值返回相...

python – 在pandas数据帧中随机播放一列【代码】

如何在pandas中只对一列数据进行洗牌? 我有一个包含生产数据的Dataframe,我想加载到dev进行测试.但是,数据包含个人身份信息,因此我想要对这些列进行随机播放. 列:FirstName LastName Birthdate SSN OtherData 如果原始数据帧是由read_csv创建的,并且我想将数据转换为第二个数据帧以进行sql加载但是将第一个名称,姓氏和SSN混乱,我原本希望能够这样做:if devprod == 'prod':#do not shuffle datadf1['HS_FIRST_NAME'] = df[4]df1[...

python – subprocess.Popen(..).communication(..)当与graphviz一起使用时随机丢弃数据!【代码】

我正在使用graphviz的点为Web应用程序生成一些svg图.我用Popen打电话给dot:p = subprocess.Popen(u'/usr/bin/dot -Kfdp -Tsvg', shell=True, stdin=subprocess.PIPE, stdout=subprocess.PIPE)str = u'long-unicode-string-i-want-to-convert'(stdout,stderr) = p.communicate(str)发生的事情是点程序抛出如下错误:Error: not well-formed (invalid token) in line 1 ... <tr><td cellpadding="4bgcolor="#EEE8AA"> ... in lab...

Python算法从正数据集中获取随机负数据集【代码】

我有一个包含独特蛋白质对的文件,即阳性数据集.我们称之为infile.下面是一个infile内容的例子:Q9VRA8 A1ZBB4 Q03043 Q9VX24 B6VQA0 Q7KML2条目以制表符分隔.随机数据集,我们称之为outfile,必须包含单个蛋白质的组合,其方式是它们无法以任何顺序匹配infile的内容.例如,对于上面的第一行,随机化的outfile不能包含以下对:Q9VRA8 A1ZBB4 A1ZBB4 Q9VRA8此外,生成的负数据集必须包含正数据集中完全相同数量的蛋白质对.为了解决这个...

python随机选取目录下的若干个文件【代码】

个人记录用. python模块random argparse shutil import argparse parser = argparse.ArgumentParser() parser.add_argument('num',type=int,help="img numbers to random") args = parser.parse_args()import random import os path="/home/train/disk/data/yulan_park_expand" imgs = [] for x in os.listdir(path):if x.endswith('jpg'):imgs.append(x) selected_imgs=random.sample(imgs,k=args.num) print(selected_imgs)from ...

python – 这个随机PCA操作会完成吗?

我试图在尺寸为(100000,1024)的矩阵上进行白化.我需要确定来自sklearn.decomposition的PCA或RandomizedPCA是否可以处理这个大小的问题,如果没有,我可以使用的最大数量的功能是什么,并且仍然在大约24小时内完成.实现没有并行化. 根据the documentation for sklearn.decomposition.PCA,PCA变换的时间复杂度是“O(n ** 3),假设n~n_samples~n_features”.但我不确定那符号是什么意思. 据说RandomizedPCA效率更高,因为它是近似值,但我不...

在Python中为科学实验选择随机种子的好方法是什么?【代码】

对于科学实验,我需要生成10个随机的,固定大小的列表子集.为了使实验具有可重复性,我想用已知种子初始化10个不同的random.Random()实例. How different do random seeds need to be?似乎暗示使用种子1到10可能是一个坏主意,因为结果可能是线性依赖的. 如果在这种情况下选择种子1到10是不好的做法,那么以可重复的方式选择种子的好策略是什么? 澄清:在程序运行时(使用特定数据集)始终使用相同的种子非常重要!最后,我的程序必须是确...

python – 将列表随机划分为两个互补的子列表【代码】

我有一个列表,我想随机分成两个已知大小的子列表,它们是彼此的补充.例如,我有[1,5,6,8,9],我想把它分为[1,5,9]和[6,8].我不太关心效率,只是想让它发挥作用.订单无关紧要. 我开始时:pop = [...] #some input samp1 = random.sample(pop, samp1len) samp2 = [x for x in pop if x not in samp1]但是,此解决方案因重复项而失败.如果pop = [0,0,0,3,5],并且长度为3的第一个选择是[0,3,5],我仍然希望samp2为[0,0],我的代码目前无法提供...

Java Apache Math3 MersenneTwister VS Python随机【代码】

我的任务是将一些python代码移植到Scala用于研究目的.现在我使用Apache Math3公共库,并且遇到了MersenneTwister的困难. 在Python中:SEED = 1234567890PRIMARY_RNG = random.Random() PRIMARY_RNG.seed(SEED) n = PRIMARY_RNG.randrange((2**31) - 1) #1977150888在斯卡拉:val Seed = 1234567890 val PrimaryRNG = new MersenneTwister(Seed) val n = PrimaryRNG.nextInt(Int.MaxValue) //1328851649我在这里错过了什么?两者都是...

具有首选方向的python numpy偏向概率随机向量【代码】

什么是生成偏差概率随机向量的最佳方法.换句话说,给定方向向量’D(dx,dy,dz)’,偏置随机向量生成器仍将在所有方向上生成随机向量,但更有可能在D方向上生成向量import numpy as np # generate 1000 vectors in all directions vectors = np.random.random((1000,3))-np.random.random((1000,3)) # generate biased vectors probability # proba argument gives the biasing intensity or probability to be close to D vector vecto...

Python模块——random随机模块

random()是Python中生成随机数的函数,是由random模块控制,random()函数不能直接访问,需要导入random 模块,然后再通过相应的静态对象调用该方法才能实现相应的功能。 1. random.random() random.random()方法返回一个随机数,其在0至1的范围之内,以下是其具体用法: import random print ("随机数: ", random.random()) 输出结果:0.22867521257116 2. random.uniform() random.uniform()是在指定范围内生成随机数,其有两个参...