首页 / PYTHON / python-如何限制str.contains的结果？

python-如何限制str.contains的结果？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-如何限制str.contains的结果？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1008字，纯文字阅读大概需要2分钟。

内容图文

我有一个> 1M行的DataFrame.我想选择某个列包含某个子字符串的所有行：

matching = df['col2'].str.contains('substr', case=True, regex=False)
rows = df[matching].col1.drop_duplicates()

但是这个选择很慢,我想加快速度.假设我只需要前n个结果.是否有办法在获得n个结果后停止匹配？我试过了：

matching = df['col2'].str.contains('substr', case=True, regex=False).head(n)

和：

matching = df['col2'].str.contains('substr', case=True, regex=False).sample(n)

但它们并没有更快.第二个语句是布尔值,并且非常快.我如何加快第一条陈述？

解决方法:

信不信由你,但是.str访问器很慢.您可以使用具有更高性能的列表推导.

df = pd.DataFrame({'col2':np.random.choice(['substring','midstring','nostring','substrate'],100000)})

测试平等

all(df['col2'].str.contains('substr', case=True, regex=False) ==
    pd.Series(['substr' in i for i in df['col2']]))

输出：

True

时间：

%timeit df['col2'].str.contains('substr', case=True, regex=False)
10 loops, best of 3: 37.9 ms per loop

与

%timeit pd.Series(['substr' in i for i in df['col2']])
100 loops, best of 3: 19.1 ms per loop

内容总结

以上是互联网集市为您收集整理的python-如何限制str.contains的结果？全部内容，希望文章能够帮你解决python-如何限制str.contains的结果？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/668151.html

来源：【匿名】

【上一篇】python-GeoDjango将MultiPolygon解释为LinearRing 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-如何限制str.contains的结果？】教程文章相关的互联网学习教程文章

python中字符串的contains怎么使用【图】

python的string对象没有contains方法，不用使用string.contains的方法判断是否包含子字符串，但是python有更简单的方法来替换contains函数方法1：使用 in 方法实现contains的功能：方法2：使用find函数实现contains的功能以上就是python中字符串的contains怎么使用的详细内容，更多请关注Gxl网其它相关文章！

python-Matplotlib path.contains_points对某些边上的点返回false,但对其他边不返回【代码】

我正在尝试使用Matplotlib查找多边形路径中包含的所有点,但似乎缺少一些.更具体地说,我的路径是一个矩形,并且这些点位于基本的统一网格上.在下面的测试脚本中,它不会将放置在多边形顶线上的点视为多边形的一部分,而是会考虑其余边缘上的点. 码：import matplotlib.path as mpltPathpolygon = [(5,5),(10,5),(10,10),(5,10)] width =11 height =11points = [[0,0],[1,0],[2,0],[3,0],[4,0],[5,0],[6,0],[7,0],[8,0],[9,0],[10,0],[1...

python-如何限制str.contains的结果？【代码】

我有一个> 1M行的DataFrame.我想选择某个列包含某个子字符串的所有行：matching = df['col2'].str.contains('substr', case=True, regex=False) rows = df[matching].col1.drop_duplicates()但是这个选择很慢,我想加快速度.假设我只需要前n个结果.是否有办法在获得n个结果后停止匹配？我试过了：matching = df['col2'].str.contains('substr', case=True, regex=False).head(n)和：matching = df['col2'].str.contains('substr', c...

python-如何搜索字符以及使用pandas.Series.str.contains【代码】

如何在pandas数据框列中使用“ pandas.Series.str.contains”搜索字符“”.我试过了df_noplus = df[df['column1'].str.contains('+',case=False)]它给我一个错误File "/home/anil/anaconda3/lib/python3.5/sre_parse.py", line 638, in _parsesource.tell() - here + len(this))错误：没有重复解决方法:请使用反斜杠berofe加：df = pd.DataFrame({'a': ['+1','+2','-4']})df['a'].str.contains('\+')结果：0 True 1 True 2...

python – contains如何为ndarrays工作？【代码】

>>> x = numpy.array([[1, 2], ... [3, 4], ... [5, 6]]) >>> [1, 7] in x True >>> [1, 2] in x True >>> [1, 6] in x True >>> [2, 6] in x True >>> [3, 6] in x True >>> [2, 3] in x False >>> [2, 1] in x False >>> [1, 2, 3] in x False >>> [1, 3, 5] in x False我不知道__contains__如何适用于ndarrays.我找的时候找不到相关的文档.它是如何工作的？它是否记录在任何地方？解决方法:我...

python – 使用str.contains将字符串的一部分替换为分隔符【代码】

在我转向excel宏的可怕世界之前,你是我最后的希望堡垒, 我有一个来自excel的庞大数据框架,我正在操纵,Pandas已被证明对编辑非常有用,因为excel非常挣扎. 我的最后一期如下：现在,我有一个列,列出超过100k行的用户兴趣.问题是数据从未经过验证,所以我有潜在的有用信息,我需要操作10个输出之一. 我发现使用str.replace和str.contains是非常有用的,我想我会构建一些dicts或列表来迭代来处理逻辑. 当我在列表中使用str.contains时,它会...

python – ARRAY_CONTAINS在pyspark中的多个值【代码】

我正在使用pyspark.sql.dataframe.DataFrame.我想基于多个变量而不是单个变量{val}来过滤堆栈的行.我正在使用Python 2 Jupyter笔记本.目前,我做了以下事情：stack = hiveContext.sql("""SELECT * FROM db.tableWHERE col_1 != '' """)stack.show() +---+-------+-------+---------+ | id| col_1 | . . . | list | +---+-------+-------+---------+ | 1 | 524 | . . . |[1, 2] | | 2 | 765 | . . . |[2, 3] | . . . | 9 ...

217. Contains Duplicate@python【代码】

Given an array of integers, find if the array contains any duplicates. Your function should return true if any value appears at least twice in the array, and it should return false if every element is distinct. 原题地址: Contains Duplicate 难度: Easy 题意: 判断数组中是否存在重复的数思路1: 排序, 遍历数组,比较前后两个数是否相等class Solution(object):def containsDuplicate(self, nums):""":type nums: ...

首页 / PYTHON / python-如何限制str.contains的结果？

python-如何限制str.contains的结果？

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-如何限制str.contains的结果？】教程文章相关的互联网学习教程文章

python中字符串的contains怎么使用【图】

python-Matplotlib path.contains_points对某些边上的点返回false,但对其他边不返回【代码】

python-如何限制str.contains的结果？【代码】

python-如何搜索字符以及使用pandas.Series.str.contains【代码】

python – contains如何为ndarrays工作？【代码】

python – 使用str.contains将字符串的一部分替换为分隔符【代码】

python – ARRAY_CONTAINS在pyspark中的多个值【代码】

217. Contains Duplicate@python【代码】

CONTAINS - 相关标签

PYTHON - 相关标签

TR - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程