python 字符串处理

简介:

介绍字符串相关的:比较,截取,替换,长度,连接,反转,编码,格式化,查找,复制,大小写,分割等操作

什么是字符串

python 字符串

字符串

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。 通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。

python 字符串相关特性

1 属于python基本数据类型和结构的一种。2 本身是不可变的数据类型。 3 有很多内置的方法

 

字符串连接

方法1: 用字符串的join方法

 

a  =  [ 'a' , 'b' , 'c' , 'd' ]
content  =  ''
content  =  '' . join( a)
print  content

 

方法2: 用字符串的替换占位符替换

 

a  =  [ 'a' , 'b' , 'c' , 'd' ]
content  =  ''
content  =  ' %s%s%s%s '  %  tuple( a)
print  content

 

想要了解更多,请看 python字符串连接
 

字符串截取

我们可以通过索引来提取想要获取的字符,可以把python的字符串也做为字符串的列表就更好理解

python的字串列表有2种取值顺序
1是从左到右索引默认0开始的,最大范围是字符串长度少1
s = 'ilovepython'
s[0]的结果是i

2是从右到左索引默认-1开始的,最大范围是字符串开头
s = 'ilovepython'
s[-1]的结果是n

上面这个是取得一个字符,如果你的实际要取得一段子串的话,可以用到变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾。

比如
s = 'ilovepython'
s[1:5]的结果是love
当使用以冒号分隔的字符串,python返回一个新的对象,结果包含了以这对偏移标识的连续的内容,左边的开始是包含了下边界,比如
上面的结果包含了s[1]的值l,而取到的最大范围不包括上边界,就是s[5]的值p

想要了解更多,请看 python字符串截取
 

字符串替换

字符串替换可以用内置的方法和正则表达式完成。
1用字符串本身的replace方法:

 

a  =  'hello word'
=  a . replace( 'word' , 'python')
print b

2用正则表达式来完成替换:

import  re
a  =  'hello word'
strinfo  =  re . compile( 'word')
=  strinfo . sub( 'python' , a)
print b
想要了解更多,请看 python 字符串替换
 

字符串比较

cmp方法比较两个对象,并根据结果返回一个整数。cmp(x,y)如果X< Y,返回值是负数 如果X>Y 返回的值为正数。

 

sStr1  =  'strch'
sStr2  =  'strchr'
print  cmp( sStr1 , sStr2) ##-1

 

 

字符串相加

我们通过操作符号+来进行字符串的相加,不过建议还是用其他的方式来进行字符串的拼接,这样效率高点。

原因:在循环连接字符串的时候,他每次连接一次,就要重新开辟空间,然后把字符串连接起来,再放入新的空间,再一次循环,又要开辟新的空间,把字符串连接起来放入新的空间,如此反复,内存操作比较频繁,每次都要计算内存空间,然后开辟内存空间,再释放内存空间,效率非常低。

 

sStr1  =  'strch'
sStr2  =  'strchr'
newstr  =  sStr1  +  sStr2
print  newstr

 

 

字符串查找

python 字符串查找有4个方法,1 find,2 index方法,3 rfind方法,4 rindex方法。

1 find()方法:

info  =  'abca'
print  info . find( 'a') ##从下标0开始,查找在字符串里第一个出现的子串,返回结果:0

info  =  'abca'
print  info . find( 'a' , 1) ##从下标1开始,查找在字符串里第一个出现的子串:返回结果3

info  =  'abca'
print  info . find( '333') ##返回-1,查找不到返回-1

 

2 index()方法:

python 的index方法是在字符串里查找子串第一次出现的位置,类似字符串的find方法,不过比find方法更好的是,如果查找不到子串,会抛出异常,而不是返回-1

 

info  =  'abca'
print  info . index( 'a')
print  info . index( '33')

 

 

字符串分割

字符串分割,可以用split,rsplit方法,通过相应的规则来切割成生成列表对象

 

info  =  'name:haha,age:20$name:python,age:30$name:fef,age:55'
content  =  info . split( '$')
print  content

 

 

字符串翻转

通过步进反转[::-1]

 

a  =  'abcd'
=  a [:: - 1 ] ##[::-1]通过步进反转
print b

 

 

字符串编码

通过字符串的decode和encode方法

1 encode([encoding,[errors]]) 
#其中encoding可以有多种值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict",意思是UnicodeError。可能的值还有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通过codecs.register_error注册的值。

 

S.decode([encoding,[errors]]) 下面是字符串编码应用:

a  =  '你好'
=  'python'
print  a . decode( 'utf-8') . encode( 'gbk') ##decode方法把字符串转换为unicode对象,然后通过encode方法转换为指定的编码字符串对象
print b . decode( 'utf-8') ##decode方法把字符串转换为unicode对象

 

 

字符串追加和拼接

通过字符串的占位符来进行字符串的拼接

 

#1 元组拼接
m  =  'python'
astr  =  'i love  %s '  %  m
print  astr

#2 字符串的format方法
m  =  'python'
astr  =  "i love {python}" . format( python = m)
print  astr

#3 字典格式化字符串
m  =  'python'
astr  =  "i love  %(python)s  "  %  { 'python' : m }
print  astr

 

 

字符串复制

通过变量来进行赋值

 

fstr  =  'strcpy'
sstr  =  fstr
fstr  =  'strcpy2'
print  sstr

 

 

字符串长度

通过内置方法len()来计算字符串的长度,注意这个计算的是字符的长度。

 

aa  =  'afebb'
bb  =  '你'
print  len( aa)
print  len(bb)

 

 

字符串大小写

通过下面的upper(),lower()等方法来转换大小写

S.upper()#S中的字母大写 
S.lower() #S中的字母小写 
S.capitalize() #首字母大写 
S.istitle() #S是否是首字母大写的 
S.isupper() #S中的字母是否便是大写 
S.islower() #S中的字母是否全是小写 

字符串去空格

通过strip(),lstrip(),rstrip()方法去除字符串的空格

S.strip()去掉字符串的左右空格
S.lstrip()去掉字符串的左边空格
S.rstrip()去掉字符串的右边空格

字符串其他方法

字符串相关的其他方法:count(),join()方法等。

S.center(width, [fillchar]) #中间对齐
S.count(substr, [start, [end]]) #计算substr在S中出现的次数
S.expandtabs([tabsize]) #把S中的tab字符替换没空格,每个tab替换为tabsize个空格,默认是8个 
S.isalnum() #是否全是字母和数字,并至少有一个字符 
S.isalpha() #是否全是字母,并至少有一个字符 
S.isspace() #是否全是空白字符,并至少有一个字符
S.join()#S中的join,把列表生成一个字符串对象
S.ljust(width,[fillchar]) #输出width个字符,S左对齐,不足部分用fillchar填充,默认的为空格。
S.rjust(width,[fillchar]) #右对齐 
S.splitlines([keepends]) #把S按照行分割符分为一个list,keepends是一个bool值,如果为真每行后而会保留行分割符。
S.swapcase() #大小写互换 

本文转自博客园知识天地的博客,原文链接:python 字符串处理,如需转载请自行联系原博主。



相关文章
|
19天前
|
Python
1167: 分离字符串(PYTHON)
1167: 分离字符串(PYTHON)
|
1月前
|
大数据 Python
使用Python查找字符串中包含的多个元素
本文介绍了Python中查找字符串子串的方法,从基础的`in`关键字到使用循环和条件判断处理多个子串,再到利用正则表达式`re模块`进行复杂模式匹配。文中通过实例展示了如何提取用户信息字符串中的用户名、邮箱和电话号码,并提出了优化策略,如预编译正则表达式和使用生成器处理大数据。
21 1
|
1月前
|
数据挖掘 开发者 Python
Python:字符串判断子串
Python:字符串判断子串
|
1月前
|
程序员 数据安全/隐私保护 Python
Python:翻转字符串
Python:翻转字符串
|
1月前
|
索引 Python
Python系列(14)—— 字符串运算符
Python系列(14)—— 字符串运算符
|
1月前
|
存储 自然语言处理 数据挖掘
Python:计算字符串中每个单词出现的次数
Python:计算字符串中每个单词出现的次数
|
3天前
|
Python
Python 字符串格式化指南
本文介绍了Python中的三种字符串格式化方法:1) 使用 `%` 操作符,如 `%s` 和 `%d`;2) `str.format()` 方法,通过 `{}` 占位符插入变量;3) Python 3.6 引入的 f-strings,直接在字符串内嵌入变量。此外,还提到了高级用法,如格式控制(如指定小数位数)。这些方法有助于更有效地处理和格式化字符串输出。
5 0
|
10天前
|
Python
python学习-函数模块,数据结构,字符串和列表(下)
python学习-函数模块,数据结构,字符串和列表
52 0
|
11天前
|
数据采集 Python
python学习9-字符串
python学习9-字符串
|
19天前
|
Java 索引 Python
Python标准数据类型-字符串常用方法(下)
Python标准数据类型-字符串常用方法(下)
22 1