2018.03.26 Python-Pandas 字符串常用方法
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了2018.03.26 Python-Pandas 字符串常用方法,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2598字,纯文字阅读大概需要4分钟。
内容图文
import numpy as np
import pandas as pd
1 # 字符串常用方法 - strip 2 s = pd.Series([‘ jack ‘,‘jill‘,‘ jease ‘,‘feank‘]) 3 df = pd.DataFrame(np.random.randn(3,2),columns=[‘ Column A‘,‘ Column B‘],index=range(3)) 4print(s) 5print(df.columns) 6 7print(‘----‘) 8print(s.str.lstrip().values)#去掉左边的空格 9print(s.str.rstrip().values)#去掉右边的空格10 df.columns = df.columns.str.strip() 11print(df.columns)
结果:
0 jack 1 jill 2 jease 3 feank dtype: object Index([‘ Column A‘, ‘ Column B‘], dtype=‘object‘) ---- [‘jack ‘ ‘jill‘ ‘jease ‘ ‘feank‘] [‘ jack‘ ‘jill‘ ‘ jease‘ ‘feank‘] Index([‘Column A‘, ‘Column B‘], dtype=‘object‘)
# 字符串常用方法 - replace 替换字符串 df = pd.DataFrame(np.random.randn(3,2),columns=[‘ Columns A‘,‘ Columns B‘],index = range(3)) print(df.columns) df.columns = df.columns.str.replace(‘‘,‘-‘) print(df.columns) df.columns = df.columns.str.replace(‘-‘,‘hehe‘,n=1)#表示用hehe去替换第一个‘ ‘print(df.columns)
结果:
Index([‘ Columns A‘, ‘ Columns B‘], dtype=‘object‘) Index([‘-Columns-A‘, ‘--Columns-B‘], dtype=‘object‘) Index([‘heheColumns-A‘, ‘hehe-Columns-B‘], dtype=‘object‘)
# 字符串常用方法 - split、rsplit 分成列表list的形式 s = pd.Series([‘a,b,c‘,‘1,2,3‘,[‘a,,,c‘],np.nan]) print(s) print(‘----‘) print(s.str.split(‘,‘)) print(‘----‘) #类似于字符串的splitprint(s.str.split(‘,‘)[0])#索引第一行print(s.str.split(‘,‘).str[0])#第一列print(s.str.split(‘,‘).str.get(1))#第二列 #可以使用get或者[]符号访问拆分列表的元素print(s.str.split(‘,‘,expand=True,n=1))#n为拓展数量print(s.str.rsplit(‘,‘,expand=True,n=1))#rsplit 从右到左分 #expand可以扩展此操作来返回DataFrame #n参数限制分数 #rsplit类似于split,反向工作,即从字符串的末尾到字符串开头print(‘dataframe:‘) df = pd.DataFrame({‘key1‘:[‘a,b,c‘,‘1,2,3‘,[‘,,,‘]], ‘key2‘:[‘a-b-c‘,‘1-2-c‘,[‘,-,-,‘]]}) print(df[‘key2‘]) print(df[‘key2‘].str.split(‘-‘))
结果:
0 a,b,c
1 1,2,3
2 [a,,,c]
3 NaN
dtype: object
----
0 [a, b, c]
1 [1, 2, 3]
2 NaN
3 NaN
dtype: object
----
[‘a‘, ‘b‘, ‘c‘]
0 a
1 1
2 NaN
3 NaN
dtype: object
0 b
1 2
2 NaN
3 NaN
dtype: object
0 1
0 a b,c
1 1 2,3
2 NaN NaN
3 NaN NaN
0 1
0 a,b c
1 1,2 3
2 NaN NaN
3 NaN NaN
dataframe:
0 a-b-c
1 1-2-c
2 [,-,-,]
Name: key2, dtype: object
0 [a, b, c]
1 [1, 2, c]
2 NaN
Name: key2, dtype: object
# 字符串索引 s = pd.Series([‘A‘,‘b‘,‘C‘,‘bbhello‘,‘123‘,np.nan,‘hj‘]) df = pd.DataFrame({‘key1‘:list(‘abcdef‘), ‘key2‘:[‘hee‘,‘fv‘,‘w‘,‘hjja‘,‘123‘,np.nan]}) print(s,‘\n-----‘) print(s.str[0])#取第一个字符串print(s.str[:2])#取前2个字符print(‘-----‘) print(df[‘key2‘].str[0]) #str之后和字符串本身索引方式相同
结果:
0 A 1 b 2 C 3 bbhello 4 123 5 NaN 6 hj dtype: object ----- 0 A 1 b 2 C 3 b 4 1 5 NaN 6 h dtype: object 0 A 1 b 2 C 3 bb 4 12 5 NaN 6 hj dtype: object ----- 0 h 1 f 2 w 3 h 4 1 5 NaN Name: key2, dtype: object
原文:https://www.cnblogs.com/jxzhu/p/8654096.html
内容总结
以上是互联网集市为您收集整理的2018.03.26 Python-Pandas 字符串常用方法全部内容,希望文章能够帮你解决2018.03.26 Python-Pandas 字符串常用方法所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。